Yarkoni, T., & Westfall, J. (2017). Choosing prediction over explanation in psychology: Lessons from machine learning. Perspectives on Psychological Science, 143(5), 1-23. https://doi.org/10.1177/1745691617693393

저자들은 글의 마무리로서 심리학(사회과학)이 보다 예측 중심의 과학이 되어야 하며 어떻게 그렇게 할 수 있는지에 대해 이야기한다. 첫 번째는 예측 그 자체를 목적으로 삼아 (앞선 얘기대로) 교차 검증 결과를 보고하는 습관을 들이는 것이다. 둘째는 머신 러닝을 연구 속에서 다른 목적을 위한 도구로서도 사용할 수 있음을 인식하고 활용하는 것이다. 셋째는 전혀 다른 성격을 가진 모델들의 비교를 위해 예측 정확도를 사용하는 것이다. 넷째는 머신 러닝 모델의 해석가능성(interpretability)을 높이는 것이다(이를 위한 다섯 가지 방법이 간단히 제시되어 있지만 여기서는 생략한다).

다섯번째는 내가 개인적으로 가장 중요하다고 생각하는 것인데, 예측을 통해 해결할 수 있는 질문을 던지는 것이다(asking predictive questions). 앞선 포스팅에서 적었던 바와 같이, 설명 중심의 모델링 문화도 나름대로 오랜 역사를 가지고 있으며 그 역사를 통해 소위 ‘이론’이란 것으로 발전시켜왔다. 그 이론이 다시 설명 중심의 모델링을 뒷받침하고 있는 것이다. 따라서 연구를 통해 해결하고자 하는 질문 자체를 이론의 검증이나 확장이 아닌 예측 중심으로 바꾸는 것만이 설명 중심의 모델링 문화로부터 탈피할 수 있는 (거의) 유일한 길이라고 생각한다. 그리고 머신 러닝을 비롯한 딥러닝, 인공지능 등의 시대적 조류가 상징하는 변화가 바로 그러한 탈피의 필요성을 보여주는 것이라 생각한다. 잘 요약된 부분을 인용한다.

“Perhaps the biggest benefits of a prediction oriented within psychology are likely to be realized when psychologists start asking research questions that are naturally amenable to predictive analysis. Doing so requires setting aside, at least some of the time, deeply ingrained preoccupations with identifying the underlying causal mechanisms that are mostly likely to have given rise to some data—in other words, choosing complex prediction-focused models over simpler, theoretically elegant models. Although this may initially sound like a radical prescription, we argue that, often, only a slight shift in perspective is required.” (p.18)


이것으로 Yarkoni & Westfall (2017) 논문의 요약을 마친다. 세부적인 내용을 다시 읽으며 요약하니 처음 읽었을 때 느꼈던 충격과 감동이 다시 살아나는 듯 하다. 특히 바로 위에 제시된 마지막 부분의 내용이 매우 인상적이다. 나아가 나와 비슷한 생각을 하는 연구자가 (예상대로) 어딘가에 존재하고 있음에 매우 반가움을 느끼며, 앞으로 이 연구자의 논문을 관심있게 살펴볼 예정이다.