반응형
오늘은 requests로 세션 쓰기와 PhantomJS + Selenium 설치를 공부해보도록 하겠습니다
웹페이지에는 로그인할때는 세션이 필요한데 requests모듈에는 session함수로 세션 생성을 할 수 있습니다.
그 생성된 세션을 가지고 get을 실행 할 수 있습니다
구글을 세션을 이용하여 get 요청을 날려보도록 하겠습니다
결과가 잘 나왔음을 알 수 있습니다
PhantomJS + Selenium 설치를 해보도록 하겠습니다
이번엔 도커 ubuntu:16.04 이미지를 사용하도록 하겠습니다.
그 다음에는 apt update를 실행시켜줍니다
그리고 나서 python3과 python3-pip를 설치하도록 하겠습니다
이제 selenium과 phantomjs를 설치하도록 하겠습니다
이렇게 이미지를 쓰고나서 또 docker commit을 통해 저장해보도록 하겠습니다.
느낀점
selenium 모듈은 이미 알고 있었지만 phantomjs 모듈은 써 본적이 없어서 기대가 되는 중입니다.
'Language > Python' 카테고리의 다른 글
[MACHINELEARNING]TIL7 XML과 JSON 형식 데이터 수집하기 (0) | 2018.12.05 |
---|---|
[MACHINELEARNING]TIL6 SELENIUM과 PHANTOMJS를 이용하여 네이버 로그인 해보기 (1) | 2018.11.30 |
[MACHINELEARNING]TIL4 네이버 금융과 뉴스 크롤링하기 (0) | 2018.11.28 |
[MachineLearning]TIL3 GET방식과 BS4를 사용한 크롤링 (0) | 2018.11.27 |
[MachineLearning]TIL2 웹에서 데이터 가져오기 (0) | 2018.11.26 |