데브코스 TIL/Web Scrapping

Web Scraping 기초 2-3. 원하는 요소 가져오기 |

예니ㅣ 2023. 10. 25. 10:47

강의

책 이름 모으기 - 사이트에 있는 책들의 이름 정보 스크래핑하기

http://books.toscrape.com/catalogue/category/books/travel_2/index.html

# 스크래핑에 필요한 라이브러리를 불러와봅시다.
import requests
from bs4 import BeautifulSoup

# 예시 사이트에 요청을 진행하고, 응답을 바탕으로 BeautifulSoup 객체를 만들어봅시다.
res = requests.get("http://books.toscrape.com/catalogue/category/books/travel_2/index.html")
soup = BeautifulSoup(res.text, "html.parser")

# <h3> 태그에 해당하는 요소를 하나 찾아봅시다
book = soup.find("h3")		# 객체

# <h3> 태그에 해당하는 요소를 모두 찾아봅시다
h3_results = soup.find_all("h3")

# book_list에서 우리가 원하는 제목(title)만 추출해봅시다.
for book in h3_results:
  print(book.a["title"])