목록분류 전체보기 (70)
Rucrazia's Blog
ANCOVA(Analysis of Covariance, 공분산분석)는 ANOVA(분산분석)과 Regression(회귀분석)을 섞어놓은 분석 방법이다. ANOVA는 그룹 간에 평균 비교를 하기 위한 모델이고, Regression은 종속변수와 독립변수 간의 관계를 모델링하는 방법이다. 그렇다면, 이 둘을 합친 ANCOVA는 어떤 것을 위해서 하는 것일까? ANCOVA는 독립변수 이외의 잡음인자(noise)들이 종속변수에 영향을 미치는 것을 통제함으로써 독립변수 자체의 순수한 영향을 측정하는데 목적이 있다. 즉, 공변수를 통제 했을 때 집단 간 조정평균차이를 비교하는 분석법이다. 실제 실험에서는 독립변수 이외의 잡음인자를 통제하기 어렵기 때문에 공변수라는 것을 이용해서 독립변수에 대한 종속변수의 반응을 깨끗하..
ANOVA는 Analysis of Variance의 줄임말로 한국어로는 분산분석이라고 쓴다. ANOVA는 통계학에서 두 개 이상 다수의 집단을 비교하고자 할 때 집단 내의 분산, 총평균과 각 집단의 평균의 차이에 의해 생긴 집단 간 분산의 비교를 통해 만들어진 F분포를 이용하여 가설검정을 하는 방법이다. ANOVA 분석을 하기 전 데이터가 만족해야 하는 가정이 몇 개가 있다. 정규성 가정, 등분산성 가정, 독립성 가정이다. 자세한 내용은 아래의 포스팅을 참고바란다. https://rucrazia.tistory.com/85 [통계] ANOVA 가정에 대한 고찰 ANOVA(analysis of variance, ANOVA, 분산 분석)은 통계학에서 두 개 이상 다수의 집단을 비교하고자 할 때 집단 내의 분산..
선형회귀분석를 이용한 모델의 성능을 판단할 때 사용하는 방법이 결정계수를 이용하는 것입니다. 결정계수는 설명할수있는부분의총합을변동의총합으로나눈 값 입니다. 즉, 얼만큼 이 모델이 학습 시킨 데이터를 설명하는지에 대한 것입니다. 결정계수는 0~1 사이의 값을 가지는데 만약 0에 가까우면 거의 설명을 못하는 것이며, 1에 가까우면 거의 모든 데이터를 설명 가능하다는 것입니다. 일반적으로 결정계수는 R^2를 쓰지만 논문을 써본 분들이라면 Adjusted R^2(수정된 R^2)를 사용하라는 말을 많이 들으셨을 것입니다. 수정된 R^2는 변수가 많아지면 자연스럽게 R^2가 높아지는 문제를 해결하기 위함입니다. 물론 변수를 많이 넣어서 R^2를 높이는 것이 좋긴 하지만, 변수의 갯수가 다른 모델하고 비교할때 과연 ..
ㅇ 데이터 사이언티스트는 분석, 통계, 프로그래밍의 기술을 활용해 대규모 데이터 셋을 모으고 분석하고 해석하는 직업으로, 경영 또는 운영의 난관에 대해 '데이터 주도형 해결책 (Data Driven Solution)'을 제시하는 것으로 요약 - 데이터 사이언티스트는 ① 조직 전반의 활동으로 조직의 데이터를 경영 솔루션으로 전환시킴으로써 사업기회를 포착하는 업무를 하며, ② 회사의 데이터베이스로부터 데이터를 캐고 분석해 제품 개발 향상과 마케팅 테크닉과 경영전략의 최적화를 이끌어 냄. - 아울러 ③ 새로운 데이터 소스 및 데이터를 모으는 방식의 정확도와 효과를 평가하며, ④ 데이터 모델을 커스터마이징하고 데이터 셋에 적용될 알고리즘을 개발 - 또한 ⑤ 예측 모델링(회귀분석 등) 기법을 이용해 사용자 경험,..
통계학에서, 회귀 분석(回歸 分析, 영어: regression analysis)은 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법이다. 하나의 종속변수와 하나의 독립변수 사이의 관계를 분석할 경우를 단순 회귀분석(영어: simple regression analysis), 하나의 종속변수와 여러 독립변수 사이의 관계를 규명하고자 할 경우를 다중회귀분석(영어: multiple regression analysis)이라고 한다. 1. Weak exogeneity(약한 외생성) - 외생성은 변수가 외적으로 영향 받아 만들어지게 되는 상태를 의미한다. - 독립변수들이 Random 변수가 아닌 고정적인 변수를 사용 가능하게 해 준다. - 고정적인 변수는 수준의 선택이 기술..
ANOVA(analysis of variance, ANOVA, 분산 분석)은 통계학에서 두 개 이상 다수의 집단을 비교하고자 할 때 집단 내의 분산, 총평균과 각 집단의 평균의 차이에 의해 생긴 집단 간 분산의 비교를 통해 만들어진 F분포를 이용하여 가설검정을 하는 방법이다. ANOVA를 사용할 때 필요로 하는 조건이 몇개가 있다. 이것을 우리는 가정이라고 한다. 대표적으로 "정규성", "등분산성", "독립성"이 있다. The experimental errors of your data are normally distributed (정규성 가정) - 종속변수의 잔차는 정규분포를 띄어야 한다. - 중심극한정리로 n>30이면 데이터는 정규분포를 띈다고 가정 할 수 있다. Equal variances betwe..
내가 그녀를 도와줄 수 있으면 좋겠는데. I wish (that) I could help her. 점심을 잘 드시고 계시길 바랍니다. I hope (that) you are having a lunch. I wish는 뒤에 오는 문장의 반대를 원하는 것. I hope는 뒤에 오는 문장을 원하는 것. But, We wish와 같은 것이 있기 때문에 I wish와 I hope일때만 위의 말이 통용 된다. 출처 : youtube - 영어강사 에릭
어제 본 기사에 따르면 앞으로 삼성에서 CPU(엑시노스) 개발을 중단하고 NPU, GPU에 전념한다고 한다. https://m.sedaily.com/NewsView/1VQO2NL3UM#_enliple 자체 CPU 개발중단하고 中선 스마트폰 조직개편...삼성 '선택과 집중' 속도 삼성전자 자체 개발 CPU코어를 탑재한 ‘엑시노스 9810’ 모바일 애플리케이션 프로세서(AP). /사진제공=삼성전자삼성전자(005930)가 자체 중앙처리장치(CPU)코어 개발을 위한 ‘몽구스 프로젝트’를 중단하고 이를 .. m.sedaily.com 위의 기사에 따르면 '자체 중앙처리장치(CPU) 코어 개발을 위한 ‘몽구스 프로젝트’를 중단하고 이를 담당하던 미국 텍사스주 오스틴연구개발센터(SARC)에서 290여 명을 해고한다.'..
* 강의 내용 정리 + 개인적으로 알아본 내용이 추가되어 있습니다. Chapter 5. Random Walks Random walks 는 다양한 영역에서 중요하게 사용된다. 주식 시장, 물리학, 전파 모델링 등 다양한 영역에서 사용된다. Random walks의 정의는 - 시작 점이 있다. - 경로 상의 한 점에서 다음 점까지의 거리는 상수이다. - 경로 상의 한 점에서 다음 점으로의 방향은 특정 선호 조건 없이 임의로 선택된다. Random walks는 시뮬레이션을 어떻게 사용할지에 대한 좋은 예시가 된다. 본 강의에서는 시뮬레이션을 하나 이용해서 Random walks가 어떻게 작동하는지에 대해서 예시를 들었다. 시뮬레이션의 목적은 N번의 시행으로 원점과 X번 걸은 사람 간의 거리의 통계 값(평균, ..
데이터 사이언스를 공부하기 위해 필수로 공부해야 하는 분야 중 하나가 선형대수학입니다. 선형대수학을 공부하는 이유 중 하나는 선형 결합을 알기 위함입니다. 선형 결합은 '선형'회귀분석과 같은 통계학에서 나오는 '선형'을 이해하기 위함입니다. 선형 결합의 정의는 아래와 같습니다. 위의 식에서 (c1,v1), (c2, v2),... 를 아래와 같이 행렬로 만들어서 u = y라 하고, cn = a, vn = x라고 해보겠습니다. = a , = x y = a * x를 보면 1차 방장식이라는 것을 알 수 있습니다. 이렇게 간략화시키는 것을 선형 결합이라고 합니다. Ref. https://freshrimpsushi.tistory.com/512 https://ko.wikipedia.org/wiki/선형결합