[MACHINELEARNING]TIL7 XML과 JSON 형식 데이터 수집하기

오늘은 XML데이터와 JSON 데이터를 수집해보도록 하겠습니다

XML 데이터 특징

<태그> </태그>로 요소 element 구성

콘텐츠 넣기

<태그>{{콘텐츠}}</태그>

<태그> <태그></태그></태그>

속성

<태그 속성="값">{{콘텐츠}}</태그>

root태그는 하나

기상청 XML 데이터를 수집해보도록 하겠습니다

위의 코드로 XML 데이터를 들고오면 아래의 결과가 나옴을 알 수 있습니다

위의 출력된 데이터중에서 원하는 데이터만 뽑아 내도록 하겠습니다

location과 data , wf로 인덱싱하여 원하는 날씨만 뽑아내었습니다

json 특징

json = javascript object notation

6가지 데이터 타입을 넣을 수 있습니다

숫자 : 10, 273, 2.4

문자열 : "안녕하세여"

BOOL : true, false

null : null

배열 : [10,273]

객체 :

{

"키A" : 273,

"키B" : "값",

"키C" : true

}

이제 Json 데이터를 변환해보도록 하겠습니다

데이터가 위에는 파이썬 자료형인 list로 밑에는 json인 str로 잘 나옴을 알 수 있습니다.

이번엔 웹에 있는 json 데이터를 수집해보도록 하겠습니다

Json 데이터가 잘 수집해짐을 알 수 있습니다.

이제 원하는 데이터만 뽑아오도록 하겠습니다.

indexing을 통해 원하는 데이터만 깔끔하게 나옴을 알 수 있습니다.

느낀점

JSON과 XML 데이터를 자주 사용해봤지만 정확히는 모르고 있다고 생각이 들었습니다.

이번에 정확한 특징을 파악하게 되었고 웹에서 데이터를 가지고 와서 가공할 수 있게 되어 다행이라고 생각이 듭니다

[MACHINELEARNING]TIL9 scikit learn 기본 구성 (0)	2018.12.12
[MACHINELEARNING]TIL8 CSV와 EXCEL 데이터 수집하기 (0)	2018.12.06
[MACHINELEARNING]TIL6 SELENIUM과 PHANTOMJS를 이용하여 네이버 로그인 해보기 (1)	2018.11.30
[MACHINELEARNING]TIL5 requests로 세션 쓰기와 PhantomJS + Selenium 활용 (0)	2018.11.29
[MACHINELEARNING]TIL4 네이버 금융과 뉴스 크롤링하기 (0)	2018.11.28

티스토리툴바