데브코스 TIL/Web Scrapping

Web Scraping 기초 2-4. HTML의 Locator로 원하는 요소 찾기

예니ㅣ 2023. 10. 25. 10:59

강의

같은 태그를 사용하는 경우 원하는 요소만을 찾기 위해 "Locator"를 이용합니다.

  • id : 하나의 고유 태그를 가리키는 라벨. 중복 불가
  • class : 여러 태그를 묶는 라벨
# 스크래핑에 필요한 라이브러리를 불러와봅시다.
import requests
from bs4 import BeautifulSoup

## 또 다른 연습 사이트를 이용해봅시다.
# http://example.python-scraping.com/
res = requests.get("http://example.python-scraping.com/")
soup = BeautifulSoup(res.text, "html.parser")

## id 없이 div 태그를 찾아봅시다.
soup.find_all("div")

## id가 results인 div 태그를 찾아봅시다.
soup.find("div", id="results")

# class가 "page-header"인 div 태그를 찾아봅시다.
soup.find("div", "page-header")

# class가 "page-header"인 div 태그를 찾아봅시다.
find_result = soup.find("div", "page-header")

# 위 결과에서 text 값을 깔끔하게 가져와봅시다.
find_result.h1.text.strip()