'분류 전체보기' 카테고리의 글 목록 (2 Page)

Notice

Recent Posts

Recent Comments

Link

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록분류 전체보기 (70)

Rucrazia's Blog

[통계] ANCOVA (공분산분석)

ANCOVA(Analysis of Covariance, 공분산분석)는 ANOVA(분산분석)과 Regression(회귀분석)을 섞어놓은 분석 방법이다. ANOVA는 그룹 간에 평균 비교를 하기 위한 모델이고, Regression은 종속변수와 독립변수 간의 관계를 모델링하는 방법이다. 그렇다면, 이 둘을 합친 ANCOVA는 어떤 것을 위해서 하는 것일까? ANCOVA는 독립변수 이외의 잡음인자(noise)들이 종속변수에 영향을 미치는 것을 통제함으로써 독립변수 자체의 순수한 영향을 측정하는데 목적이 있다. 즉, 공변수를 통제 했을 때 집단 간 조정평균차이를 비교하는 분석법이다. 실제 실험에서는 독립변수 이외의 잡음인자를 통제하기 어렵기 때문에 공변수라는 것을 이용해서 독립변수에 대한 종속변수의 반응을 깨끗하..

기술 - Data Science/Data Science 2019. 11. 11. 22:08

[통계] ANOVA(분산분석)

ANOVA는 Analysis of Variance의 줄임말로 한국어로는 분산분석이라고 쓴다. ANOVA는 통계학에서 두 개 이상 다수의 집단을 비교하고자 할 때 집단 내의 분산, 총평균과 각 집단의 평균의 차이에 의해 생긴 집단 간 분산의 비교를 통해 만들어진 F분포를 이용하여 가설검정을 하는 방법이다. ANOVA 분석을 하기 전 데이터가 만족해야 하는 가정이 몇 개가 있다. 정규성 가정, 등분산성 가정, 독립성 가정이다. 자세한 내용은 아래의 포스팅을 참고바란다. https://rucrazia.tistory.com/85 [통계] ANOVA 가정에 대한 고찰 ANOVA(analysis of variance, ANOVA, 분산 분석)은 통계학에서 두 개 이상 다수의 집단을 비교하고자 할 때 집단 내의 분산..

카테고리 없음 2019. 11. 8. 21:43

[통계] 선형회귀분석(Linear Regression) 결정계수(R^2)에 대한 고찰

선형회귀분석를 이용한 모델의 성능을 판단할 때 사용하는 방법이 결정계수를 이용하는 것입니다. 결정계수는 설명할수있는부분의총합을변동의총합으로나눈 값 입니다. 즉, 얼만큼 이 모델이 학습 시킨 데이터를 설명하는지에 대한 것입니다. 결정계수는 0~1 사이의 값을 가지는데 만약 0에 가까우면 거의 설명을 못하는 것이며, 1에 가까우면 거의 모든 데이터를 설명 가능하다는 것입니다. 일반적으로 결정계수는 R^2를 쓰지만 논문을 써본 분들이라면 Adjusted R^2(수정된 R^2)를 사용하라는 말을 많이 들으셨을 것입니다. 수정된 R^2는 변수가 많아지면 자연스럽게 R^2가 높아지는 문제를 해결하기 위함입니다. 물론 변수를 많이 넣어서 R^2를 높이는 것이 좋긴 하지만, 변수의 갯수가 다른 모델하고 비교할때 과연 ..

기술 - Data Science/Data Science 2019. 11. 7. 21:45

[직무] 데이터 사이언티스트는 어떤 직업인가?

ㅇ 데이터 사이언티스트는 분석, 통계, 프로그래밍의 기술을 활용해 대규모 데이터 셋을 모으고 분석하고 해석하는 직업으로, 경영 또는 운영의 난관에 대해 '데이터 주도형 해결책 (Data Driven Solution)'을 제시하는 것으로 요약 - 데이터 사이언티스트는 ① 조직 전반의 활동으로 조직의 데이터를 경영 솔루션으로 전환시킴으로써 사업기회를 포착하는 업무를 하며, ② 회사의 데이터베이스로부터 데이터를 캐고 분석해 제품 개발 향상과 마케팅 테크닉과 경영전략의 최적화를 이끌어 냄. - 아울러 ③ 새로운 데이터 소스 및 데이터를 모으는 방식의 정확도와 효과를 평가하며, ④ 데이터 모델을 커스터마이징하고 데이터 셋에 적용될 알고리즘을 개발 - 또한 ⑤ 예측 모델링(회귀분석 등) 기법을 이용해 사용자 경험,..

기술 - Data Science/Data Science 2019. 11. 7. 00:55

[통계] 선형회귀분석(Linear Regression) 가정에 대한 고찰

통계학에서, 회귀 분석(回歸分析, 영어: regression analysis)은 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법이다. 하나의 종속변수와 하나의 독립변수 사이의 관계를 분석할 경우를 단순 회귀분석(영어: simple regression analysis), 하나의 종속변수와 여러 독립변수 사이의 관계를 규명하고자 할 경우를 다중회귀분석(영어: multiple regression analysis)이라고 한다. 1. Weak exogeneity(약한 외생성) - 외생성은 변수가 외적으로 영향 받아 만들어지게 되는 상태를 의미한다. - 독립변수들이 Random 변수가 아닌 고정적인 변수를 사용 가능하게 해 준다. - 고정적인 변수는 수준의 선택이 기술..

기술 - Data Science/Data Science 2019. 11. 6. 21:12

[통계] ANOVA 가정에 대한 고찰

ANOVA(analysis of variance, ANOVA, 분산 분석)은 통계학에서 두 개 이상 다수의 집단을 비교하고자 할 때 집단 내의 분산, 총평균과 각 집단의 평균의 차이에 의해 생긴 집단 간 분산의 비교를 통해 만들어진 F분포를 이용하여 가설검정을 하는 방법이다. ANOVA를 사용할 때 필요로 하는 조건이 몇개가 있다. 이것을 우리는 가정이라고 한다. 대표적으로 "정규성", "등분산성", "독립성"이 있다. The experimental errors of your data are normally distributed (정규성 가정) - 종속변수의 잔차는 정규분포를 띄어야 한다. - 중심극한정리로 n>30이면 데이터는 정규분포를 띈다고 가정 할 수 있다. Equal variances betwe..

기술 - Data Science/Data Science 2019. 11. 6. 20:10

I wish/I hope

내가 그녀를 도와줄 수 있으면 좋겠는데. I wish (that) I could help her. 점심을 잘 드시고 계시길 바랍니다. I hope (that) you are having a lunch. I wish는 뒤에 오는 문장의 반대를 원하는 것. I hope는 뒤에 오는 문장을 원하는 것. But, We wish와 같은 것이 있기 때문에 I wish와 I hope일때만 위의 말이 통용 된다. 출처 : youtube - 영어강사 에릭

학습/영어 2019. 11. 5. 23:44

[기사 바라보기] 삼성의 CPU(엑시노스) -> NPU, GPU 이동?

어제 본 기사에 따르면 앞으로 삼성에서 CPU(엑시노스) 개발을 중단하고 NPU, GPU에 전념한다고 한다. https://m.sedaily.com/NewsView/1VQO2NL3UM#_enliple 자체 CPU 개발중단하고 中선 스마트폰 조직개편...삼성 '선택과 집중' 속도 삼성전자 자체 개발 CPU코어를 탑재한 ‘엑시노스 9810’ 모바일 애플리케이션 프로세서(AP). /사진제공=삼성전자삼성전자(005930)가 자체 중앙처리장치(CPU)코어 개발을 위한 ‘몽구스 프로젝트’를 중단하고 이를 .. m.sedaily.com 위의 기사에 따르면 '자체 중앙처리장치(CPU) 코어 개발을 위한 ‘몽구스 프로젝트’를 중단하고 이를 담당하던 미국 텍사스주 오스틴연구개발센터(SARC)에서 290여 명을 해고한다.'..

기술 - Review/Hardware 2019. 11. 5. 22:06

[강의] MIT Introduction to Computational Thinking and Data Science 정리 - Chapter 5. Random Walks

* 강의 내용 정리 + 개인적으로 알아본 내용이 추가되어 있습니다. Chapter 5. Random Walks Random walks 는 다양한 영역에서 중요하게 사용된다. 주식 시장, 물리학, 전파 모델링 등 다양한 영역에서 사용된다. Random walks의 정의는 - 시작 점이 있다. - 경로 상의 한 점에서 다음 점까지의 거리는 상수이다. - 경로 상의 한 점에서 다음 점으로의 방향은 특정 선호 조건 없이 임의로 선택된다. Random walks는 시뮬레이션을 어떻게 사용할지에 대한 좋은 예시가 된다. 본 강의에서는 시뮬레이션을 하나 이용해서 Random walks가 어떻게 작동하는지에 대해서 예시를 들었다. 시뮬레이션의 목적은 N번의 시행으로 원점과 X번 걸은 사람 간의 거리의 통계 값(평균, ..

기술 - Data Science/Data Science 2019. 11. 5. 21:02

[통계] 선형 결합(Linear Combination)

데이터 사이언스를 공부하기 위해 필수로 공부해야 하는 분야 중 하나가 선형대수학입니다. 선형대수학을 공부하는 이유 중 하나는 선형 결합을 알기 위함입니다. 선형 결합은 '선형'회귀분석과 같은 통계학에서 나오는 '선형'을 이해하기 위함입니다. 선형 결합의 정의는 아래와 같습니다. 위의 식에서 (c1,v1), (c2, v2),... 를 아래와 같이 행렬로 만들어서 u = y라 하고, cn = a, vn = x라고 해보겠습니다. = a , = x y = a * x를 보면 1차 방장식이라는 것을 알 수 있습니다. 이렇게 간략화시키는 것을 선형 결합이라고 합니다. Ref. https://freshrimpsushi.tistory.com/512 https://ko.wikipedia.org/wiki/선형결합

기술 - Data Science/Data Science 2019. 6. 24. 20:11

이전 Prev 1 2 3 4 5 ··· 7 Next 다음

목록분류 전체보기 (70)

Rucrazia's Blog

티스토리툴바