Rucrazia's Blog
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/nSUT0/btqzBUdM2e2/cVzlcCEaC8K898EM66c4T1/img.png)
선형회귀분석를 이용한 모델의 성능을 판단할 때 사용하는 방법이 결정계수를 이용하는 것입니다. 결정계수는 설명할수있는부분의총합을변동의총합으로나눈 값 입니다. 즉, 얼만큼 이 모델이 학습 시킨 데이터를 설명하는지에 대한 것입니다. 결정계수는 0~1 사이의 값을 가지는데 만약 0에 가까우면 거의 설명을 못하는 것이며, 1에 가까우면 거의 모든 데이터를 설명 가능하다는 것입니다. 일반적으로 결정계수는 R^2를 쓰지만 논문을 써본 분들이라면 Adjusted R^2(수정된 R^2)를 사용하라는 말을 많이 들으셨을 것입니다. 수정된 R^2는 변수가 많아지면 자연스럽게 R^2가 높아지는 문제를 해결하기 위함입니다. 물론 변수를 많이 넣어서 R^2를 높이는 것이 좋긴 하지만, 변수의 갯수가 다른 모델하고 비교할때 과연 ..
ㅇ 데이터 사이언티스트는 분석, 통계, 프로그래밍의 기술을 활용해 대규모 데이터 셋을 모으고 분석하고 해석하는 직업으로, 경영 또는 운영의 난관에 대해 '데이터 주도형 해결책 (Data Driven Solution)'을 제시하는 것으로 요약 - 데이터 사이언티스트는 ① 조직 전반의 활동으로 조직의 데이터를 경영 솔루션으로 전환시킴으로써 사업기회를 포착하는 업무를 하며, ② 회사의 데이터베이스로부터 데이터를 캐고 분석해 제품 개발 향상과 마케팅 테크닉과 경영전략의 최적화를 이끌어 냄. - 아울러 ③ 새로운 데이터 소스 및 데이터를 모으는 방식의 정확도와 효과를 평가하며, ④ 데이터 모델을 커스터마이징하고 데이터 셋에 적용될 알고리즘을 개발 - 또한 ⑤ 예측 모델링(회귀분석 등) 기법을 이용해 사용자 경험,..
통계학에서, 회귀 분석(回歸 分析, 영어: regression analysis)은 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법이다. 하나의 종속변수와 하나의 독립변수 사이의 관계를 분석할 경우를 단순 회귀분석(영어: simple regression analysis), 하나의 종속변수와 여러 독립변수 사이의 관계를 규명하고자 할 경우를 다중회귀분석(영어: multiple regression analysis)이라고 한다. 1. Weak exogeneity(약한 외생성) - 외생성은 변수가 외적으로 영향 받아 만들어지게 되는 상태를 의미한다. - 독립변수들이 Random 변수가 아닌 고정적인 변수를 사용 가능하게 해 준다. - 고정적인 변수는 수준의 선택이 기술..