본문 바로가기
(Python)파이썬/(Python)파이썬 실습

(Python)파이썬 실습-크롬 크롤링/파이썬 크롤링/파이썬 크롤링 기초

by 공부가싫다가도좋아 2021. 3. 4.
반응형

1. 크롬 버전 확인

크롬창에 " chrome://version/ " 를 치면

이렇게 나옵니다.

더보기

버전 확인 법:Chrome: 87.0 .... <- 제 크롬은 87버전 입니다.

 

2. 크롬 드라이버 설치

chromedriver.chromium.org/downloads

 

Downloads - ChromeDriver - WebDriver for Chrome

WebDriver for Chrome

chromedriver.chromium.org

사이트 접속하셔서 크롬과 맞는 버전의 드라이버를 설치합니다.

 

3.터미널 창에서

pip3 install webdriver-manager 와

pip3 install selenium  를 터미널에 쳐서 설치.

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager

driver=webdriver.Chrome(ChromeDriverManager().install())

try:
    driver.get('https://www.nate.com/') #네이트 이용
    elem=driver.find_element_by_id('newsTxt_li_0')   #id값 찾는법 아래 설명
    
    
    print(elem.text)

    input()
except Exception as e:
    print(e)
finally:
    driver.quit()

 

4. id값 찾는 법

네이트에 들어가서 F12를 누르면 아래 화면처럼 오른쪽에 소스코드들이 뜹니다.

저기서 id 값을 찾으면 되는데 중복되는 id 값말고, 유니크한 (검색해도 하나만 뜨는)id값을 쓰셔야 됩니다!

* 왼쪽 사진의 빨간색 동그라미를 친 버튼을 누르면, 마우스 커서가 짚고 있는

링크의 코드를 볼 수 있습니다.

더보기

위 코드 보시면 아시겠지만 "newsTxt_li_0."가 제가 찾은 id값 입니다. 

잘모르겠으면 F12를 누른후 ctrl+F 버튼의 검색을 활용해서 "newsTxt_li_0."를 입력하시고 보시면

이해가 되실 것입니다.

"newsTxt_li_0." 를 검색하면 1개의 검색 값밖에 나오지 않습니다.

이걸 유니크한 값이라고 표현했습니다.

 

반응형

댓글