강의
책 이름 모으기 - 사이트에 있는 책들의 이름 정보 스크래핑하기
http://books.toscrape.com/catalogue/category/books/travel_2/index.html
# 스크래핑에 필요한 라이브러리를 불러와봅시다.
import requests
from bs4 import BeautifulSoup
# 예시 사이트에 요청을 진행하고, 응답을 바탕으로 BeautifulSoup 객체를 만들어봅시다.
res = requests.get("http://books.toscrape.com/catalogue/category/books/travel_2/index.html")
soup = BeautifulSoup(res.text, "html.parser")
# <h3> 태그에 해당하는 요소를 하나 찾아봅시다
book = soup.find("h3") # 객체
# <h3> 태그에 해당하는 요소를 모두 찾아봅시다
h3_results = soup.find_all("h3")
# book_list에서 우리가 원하는 제목(title)만 추출해봅시다.
for book in h3_results:
print(book.a["title"])
'데브코스 TIL > Web Scrapping' 카테고리의 다른 글
Web Scraping 기초 2-5. 원하는 요소 가져오기 || (0) | 2023.10.25 |
---|---|
Web Scraping 기초 2-4. HTML의 Locator로 원하는 요소 찾기 (0) | 2023.10.25 |
Web Scraping 기초 2-2. HTML을 분석해주는 BeautifulSoup (0) | 2023.10.25 |
Web Scraping 기초 2-1. 웹 브라우저가 HTML을 다루는 방법 (0) | 2023.10.24 |
Web Scraping 기초 1-4. 윤리적으로 웹 스크래핑, 크롤링 진행하기 (0) | 2023.10.24 |