Web Scraping 기초 2-5. 원하는 요소 가져오기 ||

데브코스 TIL/Web Scrapping

Web Scraping 기초 2-5. 원하는 요소 가져오기 ||

예니ㅣ 2023. 10. 25. 11:21

강의

"페이지네이션"(Pagination)은 많은 정보를 인덱스로 구분하는 기법 입니다.

# 다음 User-Agent를 추가해봅시다.
user_agent = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36"}

# 필요한 라이브러리를 불러온 후, 요청을 진행해봅시다.
import requests
from bs4 import BeautifulSoup

# Pagination이 되어있는 질문 리스트의 제목을 모두 가져와봅시다.
# 과도한 요청을 방지하기 위해 1초마다 요청을 보내봅시다.
import time

for i in range(1, 6):
  rest = requests.get("https://hashcode.co.kr/?page={}".format(i), user_agent)
  soup = BeautifulSoup(res.text, "html.parser")

  questions = soup.find_all("li", "question-list-item")

  for question in questions:
    print(question.find("div", "question").find("div", "top").h4.text)

  time.sleep(0.5)

Hashcode 질문 가져오기

https://hashcode.co.kr/

# 다음 User-Agent를 추가해봅시다.
user_agent = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36"}

# 필요한 라이브러리를 불러온 후, 요청을 진행해봅시다.
import requests
from bs4 import BeautifulSoup

res = requests.get("https://hashcode.co.kr/", user_agent)

# 응답을 바탕으로 BeautifulSoup 객체를 생성해봅시다.
soup = BeautifulSoup(res.text, "html.parser")

# 질문의 빈도를 체크하는 dict를 만든 후, 빈도를 체크해봅시다.
import time

q_dict = {}

for i in range(1, 6):
  rest = requests.get("https://hashcode.co.kr/?page={}".format(i), user_agent)
  soup = BeautifulSoup(res.text, "html.parser")

  questions = soup.find_all("li", "question-list-item")

  for question in questions:
    q = question.find("div", "question").find("div", "top").h4.text

    if q in q_dict:
      q_dict[q] += 1
    else:
      q_dict[q] = 1

  time.sleep(0.5)

q_dict

저작자표시 (새창열림)

'데브코스 TIL > Web Scrapping' 카테고리의 다른 글

Web Scraping 기초 3-2. 브라우저 자동화하기, Selenium (0)	2023.10.26
Web Scraping 기초 3-1. 동적 웹 페이지와의 만남 (0)	2023.10.25
Web Scraping 기초 2-4. HTML의 Locator로 원하는 요소 찾기 (0)	2023.10.25
Web Scraping 기초 2-3. 원하는 요소 가져오기 \| (0)	2023.10.25
Web Scraping 기초 2-2. HTML을 분석해주는 BeautifulSoup (0)	2023.10.25

현재글Web Scraping 기초 2-5. 원하는 요소 가져오기 ||

프로그래머스 데이터 엔지니어링 데브코스 2기 수강생 입니다

_문제풀이, _Kafka, 프로그래머스, _Spark, _dbt, _SparkSQL, _sql, _설치, 프로그래머스데브코스, _selenium, 프로그래머스데브코스데이터엔지니어링, _머신러닝, _HTML, _실습, _DAG, _Docker, _redshift, _AWS, _Airflow, _소개,

Today :
Yesterday :

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

예니의 코딩일기

Web Scraping 기초 2-5. 원하는 요소 가져오기 ||

강의

Hashcode 질문 가져오기

'데브코스 TIL > Web Scrapping' 카테고리의 다른 글

'데브코스 TIL/Web Scrapping'의 다른글

티스토리툴바

Web Scraping 기초 2-5. 원하는 요소 가져오기 ||

강의

Hashcode 질문 가져오기

'데브코스 TIL > Web Scrapping' 카테고리의 다른 글

'데브코스 TIL/Web Scrapping'의 다른글

관련글

티스토리툴바