js-kkk 님의 블로그

  • 홈
  • 태그
  • 방명록

Web Crawling/BeautifulSoup 2

정적 웹 페이지 스크래핑 - requests, BeautifulSoup 활용

VScode에 02_static-web-page 폴더 만든 후 그 안에 01_request_bs.py 생성  (아래 코드에서는 selenium 설치는 필요없음, requests와 beautifulsoup4 만 설치할 것 )# 정적 페이지 웹 스크래핑 -> requests, beautifulsoup# 정적 페이지 : 요청한 url에서 응답받은 html을 그대로 사용한 경우 (Server Side Rendering)import requestsfrom bs4 import BeautifulSoupdef web_request(url): response = requests.get(url) print(response) # print("=========1=========") print(r..

Web Crawling/BeautifulSoup 2025.02.23

BeautifulSoup 이란?

2. BeautifulSoup2-1. BeautifulSoup 개요2-1-1. BeautifulSoup 이란💡Beautiful Soup은 Python 기반의 HTML, XML 파일을 파싱(parsing)하여 데이터를 추출하는 라이브러리이다.이미 다운로드된 HTML 문서를 파싱하여 DOM(Document Object Model) 트리를 생성하고, DOM 트리를 탐색하여 원하는 태그나 속성에 접근하고 데이터를 추출한다.웹 페이지의 구조를 이해하고 필요한 데이터를 정제하여 추출하는 데 적합하다. 2-1-2. BeautifulSoup 장단점장점가볍고 사용법이 간단하다.HTML 구조에서 특정 태그나 속성에 쉽게 접근 가능하다.빠른 파싱 속도를 제공한다.단점동적 웹 페이지(JavaScript 렌더링) 크롤링은 불..

Web Crawling/BeautifulSoup 2025.02.23
이전
1
다음
더보기
프로필사진

js-kkk 님의 블로그

개발블로그

  • 분류 전체보기 (86)
    • 자료구조 (0)
    • 알고리즘 (32)
      • 이것이 코딩테스트다 with python (3)
      • 24-25 겨울 코딩테스트 스터디 (21)
      • Binary search (0)
      • SK Networks AI 코딩테스트 스터디 (8)
    • SK Networks AI (25)
      • 일일 회고록 (21)
      • 주간 회고록 (4)
    • Python (1)
    • Streamlit (0)
    • Git (2)
    • Database (7)
      • Mysql (7)
      • ㅇ (0)
    • Web Crawling (13)
      • Web Crawling ? (7)
      • 실습 (2)
      • BeautifulSoup (2)
      • Selenium (2)
    • Data Analysis (4)
      • Data Analysis ? (4)
    • Deep learning (0)
    • Machine learning (0)
    • Project (0)
      • KKBox 음악 스트리밍 서비스 데이터 분석 (0)
      • 반려동물 행동분석 챗봇 (0)
      • 최종프로젝트(제목 나중에 수정) (0)
    • Django (1)

Tag

이코테, 백준 2447, 백준 2559, 파이썬, 백준 15652번, 슬라이딩 윈도우, 이것이 코딩테스트다,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바