오늘은 XML데이터와 JSON 데이터를 수집해보도록 하겠습니다
XML 데이터 특징
<태그> </태그>로 요소 element 구성
콘텐츠 넣기
<태그>{{콘텐츠}}</태그>
<태그> <태그></태그></태그>
속성
<태그 속성="값">{{콘텐츠}}</태그>
root태그는 하나
기상청 XML 데이터를 수집해보도록 하겠습니다
위의 코드로 XML 데이터를 들고오면 아래의 결과가 나옴을 알 수 있습니다
위의 출력된 데이터중에서 원하는 데이터만 뽑아 내도록 하겠습니다
location과 data , wf로 인덱싱하여 원하는 날씨만 뽑아내었습니다
json 특징
json = javascript object notation
6가지 데이터 타입을 넣을 수 있습니다
숫자 : 10, 273, 2.4
문자열 : "안녕하세여"
BOOL : true, false
null : null
배열 : [10,273]
객체 :
{
"키A" : 273,
"키B" : "값",
"키C" : true
}
이제 Json 데이터를 변환해보도록 하겠습니다
데이터가 위에는 파이썬 자료형인 list로 밑에는 json인 str로 잘 나옴을 알 수 있습니다.
이번엔 웹에 있는 json 데이터를 수집해보도록 하겠습니다
Json 데이터가 잘 수집해짐을 알 수 있습니다.
이제 원하는 데이터만 뽑아오도록 하겠습니다.
indexing을 통해 원하는 데이터만 깔끔하게 나옴을 알 수 있습니다.
느낀점
JSON과 XML 데이터를 자주 사용해봤지만 정확히는 모르고 있다고 생각이 들었습니다.
이번에 정확한 특징을 파악하게 되었고 웹에서 데이터를 가지고 와서 가공할 수 있게 되어 다행이라고 생각이 듭니다
'Language > Python' 카테고리의 다른 글
[MACHINELEARNING]TIL9 scikit learn 기본 구성 (0) | 2018.12.12 |
---|---|
[MACHINELEARNING]TIL8 CSV와 EXCEL 데이터 수집하기 (0) | 2018.12.06 |
[MACHINELEARNING]TIL6 SELENIUM과 PHANTOMJS를 이용하여 네이버 로그인 해보기 (1) | 2018.11.30 |
[MACHINELEARNING]TIL5 requests로 세션 쓰기와 PhantomJS + Selenium 활용 (0) | 2018.11.29 |
[MACHINELEARNING]TIL4 네이버 금융과 뉴스 크롤링하기 (0) | 2018.11.28 |