Rucrazia's Blog
[자동차] 판매량 분석 본문
자동차 판매량은 한국에서 거시적(산업)으로나 미시적(회사)인 내용을 분석하는데 있어서 중요한 데이터입니다.
자동차 판매량은 뉴스에서 자주 언급되며 브랜드의 흥망성쇠를 볼 수 있는 중요한 데이터이며, bmw 판매량의 감소 및 Benz의 판매량 상승과 같이 각 브랜드의 인기도를 비교하는데도 효과적입니다.
판매량 분석을 하려면 각 사의 차종별 판매량 데이터를 얻어야 합니다. Raw데이터는 한국자동차산업협회(KAMA)에서 얻을 수 있으나 회원만 가능하므로 다른 방법으로 얻어야 합니다.
컴퓨터 조립할 때 많이 이용했던 다나와에서 각 사의 판매량 데이터를 얻을 수 있습니다.
기간은 2012년 1월 1일 부터, 30~40개의 브랜드 별로 한국에서 판매하고 있는 차들의 판매량을 얻을 수 있습니다.
http://auto.danawa.com/auto/?Work=record&Tab=Model&Brand=303,304,331,332&Month=2019-05-00&MonthTo=
Raw데이터는 크롤링을 이용해서 얻어야 합니다. 파이썬을 이용해서 크롤링을 할 때 일반적으로 Selenium과 beautiful soup를 이용할 것입니다. Beautiful Soup는 HTML/XML 파서로서 정적 페이지를 크롤링할 때 좋습니다. 하지만 Beautiful Soup를 이용해서 크롤링을 하게 된다면 오류 메시지를 얻을 것입니다. 그래서 크롤링을 한다면 Selenium을 이용해서 얻는 것을 추천합니다.
'기술 - Data Science > 분석' 카테고리의 다른 글
[Python] Pandas 데이터 전처리 코드 백업 (0) | 2020.02.17 |
---|