데브코스 TIL/Web Scrapping
Web Scraping 기초 2-4. HTML의 Locator로 원하는 요소 찾기
예니ㅣ
2023. 10. 25. 10:59
강의
같은 태그를 사용하는 경우 원하는 요소만을 찾기 위해 "Locator"를 이용합니다.
- id : 하나의 고유 태그를 가리키는 라벨. 중복 불가
- class : 여러 태그를 묶는 라벨
# 스크래핑에 필요한 라이브러리를 불러와봅시다.
import requests
from bs4 import BeautifulSoup
## 또 다른 연습 사이트를 이용해봅시다.
# http://example.python-scraping.com/
res = requests.get("http://example.python-scraping.com/")
soup = BeautifulSoup(res.text, "html.parser")
## id 없이 div 태그를 찾아봅시다.
soup.find_all("div")
## id가 results인 div 태그를 찾아봅시다.
soup.find("div", id="results")
# class가 "page-header"인 div 태그를 찾아봅시다.
soup.find("div", "page-header")
# class가 "page-header"인 div 태그를 찾아봅시다.
find_result = soup.find("div", "page-header")
# 위 결과에서 text 값을 깔끔하게 가져와봅시다.
find_result.h1.text.strip()