The Discovery of Regression to the Mean
골턴이 발견한 자연의 균형: 평균으로 회귀한다는 것
- Volume
- CCLXIII
- Date
- April 4, 2026
- Filed Under
- Expedition
1886년 영국의 박물학자 프랜시스 골턴(Francis Galton)은 부모의 키와 자식의 키 사이의 관계를 다룬 논문 한 편을 발표합니다. 이 논문이 통계학의 가장 중요한 개념 중 하나인 회귀 분석(regression analysis)의 출발점이 됩니다. 골턴이 발견한 것은 매우 키가 큰 부모의 자식이 평균적으로 부모보다 작다는 사실이었습니다. 이 단순한 관찰이 어떻게 현대 통계학의 토대가 되었는지를 본 호에서 다룹니다.
완두콩에서 시작된 발견
골턴은 처음에는 사람이 아니라 완두콩으로 실험을 시작했습니다. 1875년부터 그는 다양한 크기의 완두콩 씨앗을 선별하여 자라난 다음 세대의 씨앗 크기를 측정했습니다. 결과는 일관되었습니다. 매우 큰 씨앗에서 자란 완두콩의 씨앗은 부모보다 평균적으로 작았고, 매우 작은 씨앗에서 자란 완두콩의 씨앗은 부모보다 평균적으로 컸습니다.
이 발견을 인간으로 확장하기 위해 골턴은 런던에 인체 측정소(Anthropometric Laboratory)를 세우고 수천 명의 부모와 자식의 키를 측정했습니다. 데이터는 같은 패턴을 보였습니다. 양극단의 부모에게서 태어난 자식들은 평균에 가까워지는 경향을 보였습니다. 골턴은 이 현상에 평균으로의 회귀(regression toward mediocrity)라는 이름을 붙였습니다.
회귀라는 단어의 오해
회귀라는 표현 때문에 한 가지 흔한 오해가 발생합니다. 마치 자연이 어떤 평균을 향해 적극적으로 끌어당기는 힘을 가진 것처럼 들리지만, 실제로는 그렇지 않습니다. 평균 회귀는 무작위 변동이 결합된 측정값에서 자연스럽게 나타나는 통계적 현상이며, 어떤 인과적 메커니즘이 아닙니다.
예를 들어 부모의 키는 유전적 요인과 환경적 요인이 결합된 결과입니다. 매우 큰 부모는 유전적 요인뿐 아니라 우연히 좋은 환경 요인까지 겹쳤을 가능성이 높습니다. 자식 세대에서 환경 요인은 다시 무작위로 분포하므로, 평균적으로 보면 부모만큼의 양극단에 도달하기 어렵습니다. 이것이 회귀가 발생하는 통계적 이유입니다.
스포츠 일러스트레이티드 표지의 저주
평균 회귀는 일상에서도 자주 관찰되지만 거의 항상 잘못 해석됩니다. 가장 유명한 사례 중 하나가 스포츠 일러스트레이티드 표지의 저주(Sports Illustrated cover jinx)입니다. 이 잡지의 표지를 장식한 운동선수가 다음 시즌에 부진한 경우가 많다는 속설입니다.
심리학자 대니얼 카너먼(Daniel Kahneman)은 이 현상이 평균 회귀의 전형적 사례임을 지적했습니다. 표지에 실릴 정도의 성적은 그 선수의 평균 실력에 더해 우연히 좋은 컨디션, 유리한 일정, 운까지 겹친 결과일 가능성이 높습니다. 다음 시즌에는 우연 요소가 다시 무작위 분포로 돌아가므로, 통계적으로 부진할 수밖에 없습니다. 저주가 아니라 통계입니다.
같은 메커니즘이 신인상 수상자의 2년차 부진(sophomore slump), 갑작스러운 호황 뒤의 침체, 한 해 폭등한 종목의 다음 해 조정에서도 작동합니다. 평균 회귀에 대한 학술적 정의는 Wikipedia의 Regression toward the mean 항목이 비교적 잘 정리하고 있습니다.
골턴의 그래프와 상관계수의 탄생
골턴의 또 다른 기여는 이 회귀 현상을 시각화하는 방법을 만들어낸 것입니다. 그는 부모의 키를 가로축에, 자식의 키를 세로축에 배치한 산점도를 그리고, 데이터를 가장 잘 표현하는 직선을 손으로 그어보았습니다. 이 직선의 기울기가 1보다 작다는 사실이 회귀 현상의 시각적 증거였습니다.
골턴의 제자 칼 피어슨(Karl Pearson)은 이 작업을 수학적으로 정교화하여 상관계수(correlation coefficient)라는 개념을 정립했습니다. 두 변수 사이의 선형적 관계의 강도를 영하 1에서 영상 1 사이의 숫자로 표현하는 이 도구는 오늘날 거의 모든 정량 연구의 출발점이 되었습니다. 골턴 본인의 생애와 학문적 기여에 대한 정리는 Britannica의 Francis Galton 항목에서 확인할 수 있습니다.
평균 회귀가 가르쳐주는 것
골턴의 발견이 우리에게 가르쳐주는 것은 양극단의 사례를 일반화하지 말라는 경고입니다. 어떤 결과가 매우 좋거나 매우 나쁘게 나왔다면, 그 결과의 일부는 본질적 실력 때문이고 일부는 우연 때문입니다. 다음 관측에서는 우연 요소가 다시 무작위로 분포하므로, 결과는 평균에 가까워질 가능성이 높습니다.
이 원칙은 데이터를 다루는 모든 작업에 적용됩니다. 단일 관측에서 인과를 추론하지 않기, 양극단 사례에서 일반 법칙을 도출하지 않기, 충분한 표본을 확보하기. 우리가 Editorial Code의 세 번째 원칙으로 일반화에 대한 저항을 명문화한 이론적 근거가 바로 골턴이 19세기에 발견한 이 통계적 현상입니다.
다음 호에서는 위험을 다루는 또 다른 역사적 발명, 17세기 런던에서 탄생한 보험 제도의 기원을 추적합니다.