본문 바로가기

전체 글1289

2024 한국어학회 여름 여름학술대회 기획 주제에 대한 메모 ________________기획주제발표에서*임베딩에 대해- 타깃 표현과 함께 나타나는 표현(친구들) 각각이 별도의 차원을 구성함 - 타깃 표현이 각 차원에 대해 가지는 점수가 부여됨 - 거대 차원의 공간에서 타깃 표현들 간 거리가 가까우면, 즉 함께 나타나는 표현들이 많이 겹치면, 분포의미가 가깝다고 보는 것 - (이도길 선생님이 보인 변형) 통시적인 변천을 보기 위해 차원을 구성하는 표현을 고정하고 타깃 표현의 위치 이동을 보이면 변화를 보다 직관적으로 나타낼 수 있음!!!!!*이도길 선생님 발표에서- 구글 북스 엔그램 뷰어 (뭐가 어떻게 돌아가는지 찾아 봐야겠다)- 전처리  > 문자 정규화: 화완 문자를 대표형으로 변환. 예) 金(금; U+F90A) → 金(김; U+91D1)  > 문장, 문단 구분.. 2024. 8. 22.
독서 일지: 《차를 맛보는 여인》 3장 고셋 씨께 3장 고셋 씨께 [ t-test의 창시자] William Sealy Gosset - 1899년 옥스포드에서 수학과 화학 전공을 졸업하고 기네스 맥주 회사에 화학자 몫으로 취직 - 1904년 매쉬에 있는 이스트 양과 그 변화 추이를 측정하는 데 푸아송 분포를 이용할 생각을 하고 실행에 옮김  : 푸아송 분포는 드물게 그리고 무작위로 일어나는 사건의 분포를 설명함  : 푸아송 분포에서 각 사건은 독립적이고, 외부 영향이 자료의 균질성에 영향을 주지 않아야 함 : 0과 1의 이산 분포 - 1906년 회사를 설득하여 Galton의 Biometric Laboratory에서 근무  : 피어슨의 적극적 권유로 매쉬의 이스트 양 측정에 푸아송 분포를 이용한 내용을 Biometrika에 게재  : 필명 Student를 .. 2024. 7. 10.
2024. 6. 25. 저녁 산책. 2024년 6월 25일 오후 6시경공주 구도심 제민천 산책로 2024. 6. 25.
독서 일지: 《차를 맛보는 여인》 1, 2장 『차를 맛보는 여인』(원제: The lady tasting tea)은 이태 전, AI 기반 언어 연구를 위한 스터디에서 통계의 청사진을 이해하기 위해 함께 읽었던 책이다.지난 주말 책상 정리를 하던 중 우연히 책등이 눈에 띄어 당시를 떠올려 보았는데, 잡담한 내용이나 줌 스터디를 위해 들렀던 카페의 분위기 같은 것만 생각이 나고 주요 내용들이 잘 떠오르지 않았다... 그래서 다시 읽어 보기로 하였다. Ronald Fisher 경의 일화로 시작* 밀크티를 만들 때 잔에 우유와 홍차 중 어느 것을 먼저 따르느냐에 따라 맛이 다르다는 주장을 하는 여인에게, 5잔은 홍차 먼저, 5잔은 우유 먼저 따르고서 블라인드 테스트 방식으로 두 재료의 순서를 맞추게 했고 다 맞췄다면 이것은 우연이기 어렵고 이 여인이 정말 .. 2024. 6. 17.