본문 바로가기
Socializing

독서 일지: 《차를 맛보는 여인》 1, 2장

by 앎의나무 2024. 6. 17.

『차를 맛보는 여인』(원제: The lady tasting tea)은 이태 전, AI 기반 언어 연구를 위한 스터디에서 통계의 청사진을 이해하기 위해 함께 읽었던 책이다.

지난 주말 책상 정리를 하던 중 우연히 책등이 눈에 띄어 당시를 떠올려 보았는데, 잡담한 내용이나 줌 스터디를 위해 들렀던 카페의 분위기 같은 것만 생각이 나고 주요 내용들이 잘 떠오르지 않았다... 그래서 다시 읽어 보기로 하였다.


 

Ronald Fisher 경의 일화로 시작

* 밀크티를 만들 때 잔에 우유와 홍차 중 어느 것을 먼저 따르느냐에 따라 맛이 다르다는 주장을 하는 여인에게, 5잔은 홍차 먼저, 5잔은 우유 먼저 따르고서 블라인드 테스트 방식으로 두 재료의 순서를 맞추게 했고 다 맞췄다면 이것은 우연이기 어렵고 이 여인이 정말 두 경우의 맛을 구분한다고 보는 것이 타당해 보인다.

* 어느 정도로 드문 확률이 일어날 때 드물다고 생각해야 하는가? 즉 어느 정도로 드문 분포를 보일 때 그러한 분포가 우연이 아니라고 생각해야 하는가? (cf. 유의도, p.)

 

Ronald Fisher (1935) The design of experiments / 과학적 실험의 절차와 유의사항 등을 정리한 책


Karl Pearson

* Carl이던 이름을 마르크스를 동경하여 Karl로 바꿈.

* 시대의 변화를 수용하여 여러 분야의 사람들과 교류하였음. 예컨대 The grammar of science라는 책을 써서 당시 지식인 공동체에 다양한 영감을 주었음
* 관찰 대상이 되는 세계는 확률 분포로 존재한다고 주장함
 - 분포함수: 이 분포를 설명 하는 수학 공식
 - 분포함수의 모수/parameter(para=almost, meter=measurement)
 -- 평균/mean, 표준편차/standard deviation, 대칭/symmetry, 첨도/kurtosis(tailedness, 극단값에 따라 커짐)
* Pearson적 혁명
 - 과학이라는 것은 관측가능한 것이 아니라 관측에 대한 확률로 기술하는 수학적 분포함수에 대한 것이라고 봄

Francis Galton
* K. Pearson의 스승
* 지문이 사람마다 다르다는 것을 발견한 사람
* 평균 회귀를 발견한 사람(신장으로써 보임)
* 두 집단에 대해 인과 관계가 불분명하자 상관 계수 공식을 찾아 설명하는 방식을 이용한 선구자
* Biometrical laboratory를 만들어 많은 통계 데이터를 축적함

Raphael Weldon
* 12 주사위를 26,306번 던진 것을 데이터화했고  이걸 이용해 K. Pearson이 카이제곱(χ²) 검증법을 마련함

위 세 사람이 Biometrika라는 학술지를 만들고 이 저널은 통계학사에서 지대한 역할을 함

 


* 일단 이렇게 이해되는 대로 정리해 놓기로 함.

* china(도자기)를 중국으로 오역한 부분이 있었음. 원본을 확인한 건 아니지만 내용상 분명해 보임.