강의
같은 태그를 사용하는 경우 원하는 요소만을 찾기 위해 "Locator"를 이용합니다.
- id : 하나의 고유 태그를 가리키는 라벨. 중복 불가
- class : 여러 태그를 묶는 라벨
# 스크래핑에 필요한 라이브러리를 불러와봅시다.
import requests
from bs4 import BeautifulSoup
## 또 다른 연습 사이트를 이용해봅시다.
# http://example.python-scraping.com/
res = requests.get("http://example.python-scraping.com/")
soup = BeautifulSoup(res.text, "html.parser")
## id 없이 div 태그를 찾아봅시다.
soup.find_all("div")
## id가 results인 div 태그를 찾아봅시다.
soup.find("div", id="results")
# class가 "page-header"인 div 태그를 찾아봅시다.
soup.find("div", "page-header")
# class가 "page-header"인 div 태그를 찾아봅시다.
find_result = soup.find("div", "page-header")
# 위 결과에서 text 값을 깔끔하게 가져와봅시다.
find_result.h1.text.strip()
'데브코스 TIL > Web Scrapping' 카테고리의 다른 글
Web Scraping 기초 3-1. 동적 웹 페이지와의 만남 (0) | 2023.10.25 |
---|---|
Web Scraping 기초 2-5. 원하는 요소 가져오기 || (0) | 2023.10.25 |
Web Scraping 기초 2-3. 원하는 요소 가져오기 | (0) | 2023.10.25 |
Web Scraping 기초 2-2. HTML을 분석해주는 BeautifulSoup (0) | 2023.10.25 |
Web Scraping 기초 2-1. 웹 브라우저가 HTML을 다루는 방법 (0) | 2023.10.24 |