목록기술 - Data Science/분석 (2)
Rucrazia's Blog
# 한글로 적혀져 있는 곳에 해당 설명에 적합한 데이터를 넣으면 된다. 찾고 싶은 데이터가 어느 컬럼(column)에 있는지 알고 싶을 때. df.columns[df.isin([찾고 싶은 값]).any()] # return 'list' 데이터 타입 변환 df = df.astype(데이터 타입) # return dataFrame 특정 데이터 타입만 가져오고(또는 빼고) 싶을 때 df = df.select_dtypes(include=[데이터 형]) #특정 데이터 형만 가져오고 싶을 때. return dataFrame df = df.select_dtypes(exclude=[데이터 형]) #특정 데이터 형만 빼고 가져오고 싶을 때. return dataFrame 데이터프레임 안에 있는 데이터 타입 종류별 갯수 ..
자동차 판매량은 한국에서 거시적(산업)으로나 미시적(회사)인 내용을 분석하는데 있어서 중요한 데이터입니다. 자동차 판매량은 뉴스에서 자주 언급되며 브랜드의 흥망성쇠를 볼 수 있는 중요한 데이터이며, bmw 판매량의 감소 및 Benz의 판매량 상승과 같이 각 브랜드의 인기도를 비교하는데도 효과적입니다. 판매량 분석을 하려면 각 사의 차종별 판매량 데이터를 얻어야 합니다. Raw데이터는 한국자동차산업협회(KAMA)에서 얻을 수 있으나 회원만 가능하므로 다른 방법으로 얻어야 합니다. 컴퓨터 조립할 때 많이 이용했던 다나와에서 각 사의 판매량 데이터를 얻을 수 있습니다. 기간은 2012년 1월 1일 부터, 30~40개의 브랜드 별로 한국에서 판매하고 있는 차들의 판매량을 얻을 수 있습니다. http://auto..