Rucrazia's Blog
# 한글로 적혀져 있는 곳에 해당 설명에 적합한 데이터를 넣으면 된다. 찾고 싶은 데이터가 어느 컬럼(column)에 있는지 알고 싶을 때. df.columns[df.isin([찾고 싶은 값]).any()] # return 'list' 데이터 타입 변환 df = df.astype(데이터 타입) # return dataFrame 특정 데이터 타입만 가져오고(또는 빼고) 싶을 때 df = df.select_dtypes(include=[데이터 형]) #특정 데이터 형만 가져오고 싶을 때. return dataFrame df = df.select_dtypes(exclude=[데이터 형]) #특정 데이터 형만 빼고 가져오고 싶을 때. return dataFrame 데이터프레임 안에 있는 데이터 타입 종류별 갯수 ..
[출처 : Harvard Data Science Review, https://hdsr.mitpress.mit.edu/pub/5irjez4q] Abstract 데이터 과학이 사용하기 쉬운 도구를 통해 완전히 자동화되거나 비 데이터 과학자가 접근할 수 있다는 최근의 주장을 감안할 때, 나는 조직 내에서 데이터 과학의 다양한 역할을 설명한다. 그런 다음, 나는 데이터 과학이 실제 데이터 과학 프로젝트에서 얻은 완전한 경험뿐만 아니라 기초적인 방법에 대한 자세한 이해를 필요로 한다고 결론짓고, 성공적인 데이터 과학자들의 필요한 기술 세트와 그들이 어떻게 얻을 수 있는지에 대한 관점을 제공한다. 자동화나 사용하기 쉬운 도구를 사용하여 특정 분야에서 몇 가지 쉬운 승리를 거두었음에도 불구하고, 성공적인 데이터 과학..
공공데이터에서 사용하는 시군구코드(행정동/법정동)는 지역별 데이터를 합쳐서 분석할 때 유용하게 사용된다. 보통 행정동과 법정동을 주로 사용하는데, 가끔.. 기관코드를 시군구코드라고 적어놓는 곳도 있다. 법정동 코드 (사이트에 들어가서 '법정동 코드 전체 다운로드'를 누르면 저장 가능하다.) https://www.code.go.kr/stdcode/regCodeL.do 행정동코드 http://kssc.kostat.go.kr/ksscNew_web/kssc/common/AdCodeConnectionSearchList.do?gubun=1&strCategoryNameCode=019&categoryMenu=009 기관코드 (사이트에 들어가서 '기관유형선택' -> '자치행정조직'->'기관코드 조회자료' 누르면 저장 가..