Rucrazia's Blog

[인과추론] 코로나19의 사회과학 강의 Part 1. 정리 본문

기술 - Data Science/Data Science

[인과추론] 코로나19의 사회과학 강의 Part 1. 정리

DoyoungJ 2021. 7. 5. 13:21

* 본 포스팅은 https://youtu.be/8N9ife7fHKk 영상 정리입니다. 개인 스크랩 용으로 작성한 내용이기 때문에 강의 영상과 다른 내용이 있을수도 있으니 참고용으로만 읽어주세요. 영상 만들어 주신 분께 감사 인사드립니다.


사회과학 : 우리 주변(사회)에서 일어나는 일들에 대해서 연구하는 학문. 심리학, 행정학 등

ex) 연구 문제 : 군대 생활에 있어서 출신 지역이 중요한 역할을 할까? 가령, 도시 출신자와 시골 출신자 사이에 군생활 만족도에 유의한 차이가 있을까? 미군 The american soldier에 출간된 연구를 보면 2차 세계대전 때 복무했던 60만 명의 군인들에 대해서 연구.

예상되는 결과로
- 더운 곳에서 왔던 남부 출신자들이 추운 곳에서 왔던 북부 출신자들에 비해 피지에서의 무더위에 더 잘 견뎠다.
- 백인들이 흑인들보다 부사관이 되고자 하는 의지가 강했다.
당연하다고 생각되는 결과들이 나타났을 것이라고 생각할 수 있음. 그렇다면 많은 돈을 들여서 연구를 할 가치가 있을까?

실제 결과는 이와 반대로 나타났다.
- 추운 곳에서 왔던 북부 출신자들이 더운 곳에서 왔던 남부 출신자들에 비해서 피지에서의 무더위에 더 잘 견뎠다.
- 흑인들이 백인들보다 부사관이 되고자 하는 의지가 강했다

동일한 현상에 대해서도 다르게 해석할 수가 있다. 현대 사회는 분열의 사회라고 하는 것처럼 같은 현상을 반대로 주장하는 것을 많이 볼 수 있다. 

자연과학이라고 하면 보편적인 정답을 내줄 것이라 생각한다. 사회과학은 사회에 존재하는 자유로운 개인들의 상호작용으로 이뤄나는 것을 연구한 학문이기 때문에 어디서든, 누구에게나 적용되는 보편적인 정답을 내기에는 어렵다. 현대에 와서는 실증주의 학문 풍토가 main으로 자리 잡으면서 경제학을 기본으로 사회 현상들을 설명하려고 하는 노력들이 있다. 데이터를 기반인 실증주의 학문 풍조가 높은 경제학도 상황, 맥락에 따라 다르다. 경제학이 우리에게 가르쳐주는 것은 해당 조건 하에서 하나의 결론 혹은 그 반대의 결론이 옳게 되는 명시적 조건들이다.  경제 모델/이론은 필연적으로 조건성(contingency)을 가진다.
노벨 경제학상 수상자인 Jean Tirole 교수에게 본인의 연구 결과를 한마디로 설명해달라 라고 했을 때, 답변으로 "나의 연구를 한마디로 요약하긴 쉽지 않다. 산업에 따라 다르기 때문이다."라고 했다.

사회과학은 상황에 따라 다르기 때문에 명확한 정답이 나오기 힘듦. 현상에 따른 조건과 가정, 상황과 맥락을 먼저 고려해야 한다. 즉, 조건성(Contingency)를 먼저 생각해야 한다.

예측과 인과추론에 대한 몰이해와 오남용이 있다. 예측은 상관관계를 중심으로 분석하는 방법론이고, 인과추론은 인과관계를 중심으로 분석하는 방법론이다.
아래의 그림은 초콜릿 소비량에 따른 인구당 노벨상 수상인원을 표시한 그래프이다. 거의 직선이 그려질 정도로 우상향 하는 것을 볼 수 있다. 그러나, 이는 숨겨진 내용들이 있다.

 

아래의 D 그래프는 GDP에 따른 인구당 노벨상 수상자수를 표시한 그래프이다. 이를 보면 GDP가 커질수록 노벨상 수상자도 많아지는 것을 볼 수 있는데, 이는 GDP가 성장하며 과학기술에 대한 투자가 많아져서 이런 결과를 얻을 수 있다고 유추 할 수 있다.
E 그래프는 GDP에 따른 초콜릿 소비량을 표시한 그래프이다. GDP가 많아질수록 초콜릿 소비량이 많아진 것을 볼 수 있다. 즉, GDP가 증가할수록 초콜릿 소비량이 많아지고, 노벨상 수상자도 많아진 것을 볼 수 있다. 결국, 초콜릿 소비량이 많아질수록 노벨상 수상자가 많아진 다는 것은 인과관계가 있다고 보기보단 상관관계만 있다고 볼 수 있다.

데이터 과학 = 예측 방법론 + 인과추론 방법론.
현재 한국에선 예측 방법론(머신러닝)이 메인이고 인과추론 방법론에 대해서는 비중이 낮은 상황이다.

수업에선 인과추론 방법론에 대해서 집중적으로 살펴볼 것이며, 더 나아가서 예측 방법론 하고 어떻게 다르고 상호 보완적인가를 알아볼 것이다.