Rucrazia's Blog

[자동차] 판매량 분석 본문

기술 - Data Science/분석

[자동차] 판매량 분석

DoyoungJ 2019. 5. 19. 20:27

자동차 판매량은 한국에서 거시적(산업)으로나 미시적(회사)인 내용을 분석하는데 있어서 중요한 데이터입니다.

자동차 판매량은 뉴스에서 자주 언급되며 브랜드의 흥망성쇠를 볼 수 있는 중요한 데이터이며, bmw 판매량의 감소 및 Benz의 판매량 상승과 같이 각 브랜드의 인기도를 비교하는데도 효과적입니다.

판매량 분석을 하려면 각 사의 차종별 판매량 데이터를 얻어야 합니다. Raw데이터는 한국자동차산업협회(KAMA)에서 얻을 수 있으나 회원만 가능하므로 다른 방법으로 얻어야 합니다.

컴퓨터 조립할 때 많이 이용했던 다나와에서 각 사의 판매량 데이터를 얻을 수 있습니다.
기간은 2012년 1월 1일 부터, 30~40개의 브랜드 별로 한국에서 판매하고 있는 차들의 판매량을 얻을 수 있습니다.

http://auto.danawa.com/auto/?Work=record&Tab=Model&Brand=303,304,331,332&Month=2019-05-00&MonthTo=

 

제네시스 기아 쉐보레 한국GM 쌍용 르노삼성 르노 SMART EV 캠시스 대창모터스 자일대우 카인드 2019년 05월 판매실적 | 자동차 백과 : 다나와 자동차

제네시스 기아 쉐보레 한국GM 쌍용 르노삼성 르노 SMART EV 캠시스 대창모터스 자일대우 카인드 2019년 05월 국산차/수입차 판매량, 판매실적

auto.danawa.com

Raw데이터는 크롤링을 이용해서 얻어야 합니다. 파이썬을 이용해서 크롤링을 할 때 일반적으로 Selenium과 beautiful soup를 이용할 것입니다. Beautiful Soup는 HTML/XML 파서로서 정적 페이지를 크롤링할 때 좋습니다. 하지만 Beautiful Soup를 이용해서 크롤링을 하게 된다면 오류 메시지를 얻을 것입니다. 그래서 크롤링을 한다면 Selenium을 이용해서 얻는 것을 추천합니다.

 

 

 

 

 

 

 

 

'기술 - Data Science > 분석' 카테고리의 다른 글

[Python] Pandas 데이터 전처리 코드 백업  (0) 2020.02.17