아래 글은 고대 국문과 대학원 음운론연구모임에서 공부하는책인
Papers in Laboratory Phonology V의 7장을 본인이 발제한 것입니다.
그림, 표, 피인용된 논문의 자세한 사항들은 생략한다.
요약 : 음운은 물론 변이음 수준의 소리형들까지도 음향적으로 어휘부에 표상된다. 음향적인 경험이 표상되는 뇌의 위치는 측두엽 부근이다.
______________________________________________________________________________
음운론 공부모임, 2006년 9월
Commentary: Where is coarticulation?
by John Coleman, in Papers in Laboratory Pholonogy, V.
번역, 각주 쟝
1부의 논문들은 LabPhon 학술대회에서 계속해서 논의되어 온 주제들로 음성학과 음운론의 관계에 대한 문제에서 핵심이 된다. 나는 좀 더 원대한 두 주제에 초점을 맞추었다 : 동시조음의 본성(nature) 그리고 조음이 표상되는 장소. 나는 두뇌에서 단어의 음운론적 형태가 조음적이지 않고 음향적이라고 주장한다. 그리고 동시조음과 운율 구조에 대한 민감성에 대해 이런 견해를 가지고 볼 때 이르게 되는 결과에 대해 논의할 것이다.
1 동시조음과 어휘 표상
Mulhall, Vatikiotis-Bateson & Kawato(이 책)는 동시 조음에 대한 두 부류의 설명 방식을 구분했다 : ‘조음 동작의 겹치기’ 그리고 ‘미리보기 기제’. 전자가 후자보다 좀 더 음성적이고 후자는 특정 음운론적인 관점 위에 놓여 있다. öhman 등 의 ‘겹치기’ 모델은 발화 체계의 산출물들을 독립적으로 구성하는 요소들을 연결시키기 때문에 좀 더 음성적이다. 대다수의 언어에서 모음은 자음에 독립적으로 발생할 수 있다.
비록 자음이 거의 모음에 독립적이지 않더라도, 겹치기 모델은 원칙적으로 독립된 단어에서 가져온 자음의 동시조음ㅡ가령 ‘자음-자음’ 연접ㅡ에 대한 모델링에 적합하다.
비록 운동 발화 산출의 영역을 넘어서는 어떠한 가정도 없이ㅡ가령 어휘 표상이나 음운론적인 성분 구조나 형태음운론적 교체를 참조하라는 요구 없이ㅡ기제를 계획하는 것을 상상하기는 쉽다고 해도, 이런 모델의 특정한 유형들, 가령 Henke의 모델이나 Kozhevnikov & Chistovich(1965)처럼 축소된 모델은 특정한 가설적 음운론적 요소, 가령 자질·분절음·음절을 참조하여 틀이 짜여졌다.
동시조음이 한편으로는 범주적이고 기호적인 층위에서 그리고 음운론적인 범주들의 관점에서 모델화되고 다른 한편으로는 연속적으로 변하는 측정가능한 물리적 변항의 영역에서의 기술들을 조합하여서 모델화된 하이브리드 모델을 생각할 수 있을 것이다. Klatt(1983)의 음성 합성 모델에서 취급한 자음-모음 동시조음이 훌륭한 본보기이다. Klatt 로커스 이론의 실행가능성, 곧 모음의 안정 구간 동안의 포만트 주파수와 자음의 identity(정체성)의 입장에서 정지음 폐쇄를 뒤따르는 유성음화되는 음절초1)의 포만트 주파수를 예측하는 데 단선적 모델의 실용성을 조사했다. 그는 중서부 출신 남녀 화자 각 3명에게 무의미한 CVC 음절 336 개를 읽게 하여 녹음하고 분석하였다. 그림 7.1은 그 중 일부이다. 이 자료와 정지음 개방(stop burst)에 대한 기존 연구 결과들의 수렴에 기초해 볼 때, Klatt에게 다음은 분명했다 : 간단한 단선 모델을 채용하기 위해서는 각 [자음] 음소를 2, 3 개의 하위 유형으로 구분할 필요가 있다. 왜냐하면 많은 자음들이 [그 locus가] 앞의 모음이 전설인지 후설 평순인지 후설 원순인지에 의해 변이음적으로 다르기 때문이다. Klattalk 합성 시스템에서 (Klatt 1976) 이 자음의 변이음을 구분짓는 것은 자질 복사 규칙-미리보기 기제-에 의해 모음 음소의 자질로부터 도출된다. 그렇지만 지금의 모델의 여기에 해당하는 부분에서는 미리보기를 사용할 필요가 없다. 한 가지 대안은, 자음이 [후설], [원순]에 대해 이미 명세화되어 있는, 변이음적으로 표상되는 어휘적 표상을 채용하는 것이다. 바꿔 말해, 문제의 자질을 CV단위 전체의 특성으로 취급할 수 있을 것이다. Klatt의 동시조음 모델이 작동하기 위해서는 그들[자질들]은 모음만이 아니라 자음에 의해서도 나타나야 한다. 그리고 후설성과 원순성의 음향적 구분은 CV 전체를 통해 할당된다. 이 것이 바로 Firthian 음율 음운론에서 보이는 동시조음에 대한 입장이다. 그들은 [후설성], [원순성] (흔히 y와 w로 불린다)을 음소적으로 다루기보다는 운율적으로 더 자주 다룬다.
locus 이론의 한계와 자음을 두 세 개의 하위 음소 범주로 구분할 필요성이 확인되자, locus 이론은 단선적 겹치기에 의해 ‘자음-모음 포먼트 전이’에 사용될 수 있게 되었다(그림 7.2). 겹치기는 동시조음의 동시간적인 측면을 모델링한다. 그런데, 음운론적인 측면은 몇몇 음운론적 단위의 음성적 실현이 또 다른 단위의 음성적 실현에 의존한다는 시각이다 ; 특히 조음적으로 음향적으로 모음에 의존적인 자음들. 가령, 1960년대에 리버만과 동료들이 다양한 모음들이 인접할 때 나타나는 /d/의 포만트 패턴의 다양함에 대해 설명했는데, 그 설명은 분명한 물리적인 차이에도 불구하고 /d/의 변이음들은 같은 것으로 여기는 반면, 그들[모음들]의 내재적 정체성에 따라 모음을 다르게 여긴다. 음운론적 단위들의 분절적 특성을 참조하는 이런 특정한 가정 없이는, 동시조음은 특기할 현상이 아니다(is non-phenomenon). 가령 CV 단위들은 나눠지지 않는 전체로 여긴 Kozhvnikov & Chistovich의 모델에서는 자음들의 다양성[다양한 이음을 보이는 것]은 다른 모음과 조합을 이루는 것에 기인하는 것이 아니라 모음에 대해 독립적인 단위로서의 자음이 존재하지 않는 것에 기인하는 것이다. [모음에 의존적이기 때문이다].
CV 단위들을 다른 단위와 비교하기 위해 ‘역동적 시간 씌우기’를 사용하면, 유사하거나 유사하지 않은 CV 단위들 사이에 나타나는 차이의 정도나 위치를 연구하는 것이 가능하다(Slater & Coleman). 표준적(baseline) 실례로서, “Can you utter ___ today”라는 프레임에서 단어 tea의 두 토큰으로부터 얻은 두 개의 시간정렬된 F2 트랙을 고려해보자(그림 7.3 위·왼쪽). (네모낳게 각진 신호는 성대진동의 확률의 계산된 추정치이고, 모음의 성대진동의 위치를 가리킨다.) 두 토큰의 F2 트랙 중 하나의 시간 코스가 조정되어 샘플:샘플의 F2 거리가 최소화될 때 두 토큰의 F2 트랙이 매우 가까워지는 것으로 해석될 수 있다. 모음 구간과 모음에 선행하는 동안 두 F2 트랙의 비율은 1에 가까워진다(그림 7.3 위·오른쪽)2). 비교가능한(남부 영국 영어에서 tour의 r은 발음되지 않는다) tea와 tour의 비교는 두 F2 트랙들 사이에 상당한 차이를 보여준다(그림 7.3 아래·왼쪽). 전체 4분의 1이 최대로 차이가 [나는데 그것은] 모음 구간에서 난다. 그 뒤에서는 이어지는 자음 타겟[locus]을 향해 수렴해 간다. 그러나 여기에서는, 그림 7.3(아래·오른쪽)에 나타나는 F2 비율이 1에서 벗어난 정도가 분명히 보여주듯 유성음화된 온셋 앞에서도 차이가 보인다.
자음 음향의 이러한 차이는 운동이론의 지지자들로 하여금 자음의 불변성을 기대하도록 이끌고 머리의 어휘부에서 소리-논리 표상은 조음적이라고 제안하게 이끌었다. 조음적 표상의 중요성과 조음적 목표 가설은, Harrington, Fletcher & Beckman(이 책)과 Byrd 등(이 책) 등을 포함하여 여러 번 제안되었고 고수되었다. 운동 산출을 이해하기 위해 이 작업이 중요하다는 것은 분명하다. 그러나 나는 머릿속에 있는 음운론적 어휘부에서의 조음적 표상 가설이 비록 특정 종류의 음향적 변이에 대해 설명력이 있음에도 십중팔구 사실이 아닐 것임을 시사하는 몇몇 증거들에 대해 논의할 것이다.
신경학에서 전통적 실어증 관련 연구들과 뇌의 피질에 전기적 자극을 주는 실험들, 언어 수행 중 대뇌 기능에 대한 양전자 방사 X선 단층촬영 연구들로부터 도출되는 수렴되는 증거들은 두뇌의 각 반구의 후상부 관자놀이 측두엽에, 곧 제1, 제2 음향 영역에 바로 인접한 부위와 뒤에 음운론적 어휘부의 복사가 있다는 것을 강력하게 시사한다(Wise, Chollet, Hadar, Friston, Hoffner & Frackowiad 1991, Koward, Patterson, Wise, Brown, Friston, Weiller & Frackowiak 1992와 거기서 인용된 논문들). 다른 양태로 저장된 기억들에 대해 알려진 사실들을 받아들이면, 이러한 지엽화(localization)3)는, 베르니케가 지적했듯이, 아마도 음운론적 목록들의 형식이 음향적이라는 것을 의미하는 것이다. 운동 표상이 이 부위에 저장되는 것은 거의 불가능하다. Wise 등(1991)에서 보인 그림 7.4는 다양한 연구들의 수렴되는 결과에서 확인되는 패턴을 보여준다. 음향적 처리 [때 보이는 활성화]를 넘어서는 관자놀이 측두엽의 활성화가, 분명히 어휘적인 접근과 이해를 요구하는 실험인, ked, pretch(A) 같은 영어 임시단어 듣기 실험, 쌍으로 주어진 명사들(B)과 동사(C)들의 의미적 관련성을 판단하는 실험의 피험자들에게서 발견된다. A-C에서 우리는, 운동 이론의 예측과는 반대로, 음향적 입력이 조음적 표상 속에 기록되어 있다는 어떠한 증거 없이도 발화의 지각과 어휘적 접근의 증거를 가진다. 이 연구에서, 앞부분의 활성화는 들려준 명사에 대하여 동사를 만들라고 피험자에게 요구했을 때에만 나타났다. 측두엽의 활성화는 입력이 말이 아니고 글인 어휘 탐색 활동의 특징이기도 하다.[!]
음향적 어휘부를 위한 측두엽의 위치는, 자발적 행위 특히 운동 표상에 대한 계획들은 전두엽에 저장된다는 전통 신경학적인 견해와 일치한다(Passingham 1993). 즉, 머릿속 어휘부가 조음적이라면 그것은 전두엽에 있어야 한다는 것이다. 브로카 영역에서의 활동이 몇몇 음성학적 연구에서 발견되지만, 우리가 아는 한, 어휘적 접근에서는 발견되지 않는다. 가령 Zatorre, Meyer, Gjedde & Evans(1996)에서 인용한 네 연구들은, 피험자들이 음향적으로 보여진 CVC 음절들의 쌍이 같은 자음으로 끝나는지를 판단하도록 한 실험에서 브로카 영역에 지엽화된 활동이 있음을 보였다(그림 7.5). 이 실험의 피질의 활동은, bag와 big의 음향적으로 구분되는 음절말 자음이 같은 음운론적 범주인지 아닌지를 결정하기 위해서는 그들이 조음적 표상ㅡ거기에는 그들의 설배 조음이 온전하게 존재할 것이다ㅡ에 기록되어야 한다는 견해와 일치한다. Paulesu, Frith & Frackowiak(1993)은 브로카 영역은 피험자들이 시각적으로 보여진 철자가 ‘b’와 라임을 이루는지 판단할 때 활성화된다는 것을 발견했다. 그러나 처음의 음소(혹은 철자)를 주시하는 것이 항상 브로카 영역을 활성화시키지는 않는다. 네 가지의 조금씩 다른 음소 주시 실험에서 Demonet, Price, Wise, & Frackowiak(1994)는 아마도 단순한 음소 주시 실험은 오직 상부 측두의 피질만을 활성화한다는 것을 발견했다 : 브로카 영역의 활성화는 앞 음절에 /d/가 있는 임시어 redobazu 같은, 단지 보다 복잡한 /b/ 주시 실험에서만 발견되었다(그림 7.5).
음소 주시에서만이 아니라, 브로카 영역은 단어를 생성하는 실험에서도 활성화된다(Wise et al. 1991, Martin, Wigggs, Underleider & Haxby 1996). 특히 단어 생성 전략이 음운론적인 측면을 가지고 있을 때 그런 것 같다. 가령 Mummery, Patterson, Hodges & Wise(1996)은 구분되는 활성화 지역들이 ‘철자주도(letter-initial) 단어 생성 vs. 의미적 발화 유창성’ (즉, 동물 이름의 목록을 만드는 것)에서 나타나는 것을 발견했다. 의미적 유창성은 브로카 영역을 활성화 시키지 않은 반면 철자주도 발화 유창성은 브로카 영역을 활성화시켰다. 의미적 유창성은 출력에서 브로카 영역을 포함하지 않는 어휘적 접근의 또 다른 예이다. 철자주도 단어 생성에서 브로카 영역이 활성화되는 것은 Hinke, Hu, Stillman, Kim, Merkle, Salmi & Ugurbil(1993)에서도 관찰되었다. Pujol, Vendrell, Deus, Kulievsky, Marti-Vilalta, Garcia, Junque & Capdevili(1996)은 좌·하·전부(즉 브로카 영역과 그 주변 영역)의 활성화가, 어휘적 출력을 포함하는 실험들에서 그렇지 않은 실험들에서보다, 화자들에게서 특히 더 강력하고 일치된다는 것을 발견했다 : (강한 순서대로)
1. 지정된 철자로 시작하고 그 철자가 두 번 나오는 단어를 소리내지 않고 생성하기 ;
2. 소리나지 않은 표준적인 철자주도의 발화 유창성 (후·중·전부의 뇌의 주름) ;
3. 소리나지 않은 의미적 발화 유창성 ;
4. 소리나지 않은 숫자세기(one, two, three ··· etc.)
모든 경우에서 하·전부의 활성화의 위치는 후·중·전부의 뇌의 주름(곧, 운동 피질의 바깥 지역 근처)이지 브로카 영역의 전통적 부위가 아니다(Brodmann의 44 지역). 그러나 브로카 영역은 음운론적인 어휘적 접근을 요구하는 모든 음운론적 실험에서는 활성화되지 않는 것으로 보인다. 가령, Larsen, Skinhoj & Lassen(1978)은 ‘자동적 발화’(가령, 20까지 세기 혹은 월화수목금토일)에서 브로카 영역으로 흘러가는 대뇌 혈류량이 늘어나지 않는다는 것을 발견했다. Petersen, Fox, Posner & Raichle(1988)은 양전자 방사 X선단층촬영(PET)을 이용하여 다음의 인지적 ‘대조’들을 연구했다 : (a) 수동적으로 단어를 듣는 것 vs. 쉼; (b) 들은 단어 말하기 vs. 수동적 듣기; (c) 주어진 단어를 실제로 사용해 보기 vs. 들은 단어 말하기. 브로카 영역 주변의 활성화는 (c)의 대조에서만 나타났다. (b)의 대조에서는, 발화 산출 실험에서 기대되는 것처럼, 선동작 피질, 보조적 운동 영역 그리고 입 영역을 포함하는 운동 피질 영역이 변별적으로 활성화되는 것으로 발견되었다. 이 활성화 위치는 양측면(bilateral)에 있고, 아마도 발화에만 특화된 것이 아닐 것이다. 왜냐면 Petersen 등에 의해, 이 활성화는 피험자들이 단순히 입과 혀를 움직이도록 지시받았을 때에도 발견되었기 때문이다. (a)의 대조에서는 단지 일시적 활성화만이 발견되었는데, 이는, 들린 단어가, 음향적 어휘가 있을 거라고 추측되었던 비음향적(periauditory4)) 위치인 바로 뇌의 앞부분의 활성화 없이 지각될 수 있다는 것을 보여준다. 그리고 이는 전두엽의 조음적인 구조들이 어휘부의 음운론적인 측면에 접근하는 모든 실험에서 꼭 필요한 것은 아니라는 것을 시사한다. 특정 조건의 단어 듣기, 특히 단어가 매우 느리게 제시될 때(6~15초)나, 대조가 들려준 단어를 다시 들려주는 것에 대해 이뤄질 때, 좌·하·전 부위가 포함된다는 것이[아마 활성화되는 것이] Price et al.(1996)에 의해 발견되었다. 말하기 없이 듣기만 할 때의 이러한 활성화는 특이한 것이므로, 늦은 속도의 발화에 대한 실험에서 피험자가 그들 스스로 그 단어를 가볍게 말할 시간이 가질 수가 있다.[고 생각해 볼 수 있다.] 그래서 브로카 영역의 활성화가 듣기 실험에서도 때때로 발견된다고 해도, 이 실험들이 보여주는 청사진은, 어휘적인 표상은 대체로 음향적이고, 조음적인 기록은 단지 표현적이고 내용이 풍부한 발화와, 일반적 발화 지각과 산출에 대해서는 그 관련성이 의심스러운 부자연스러운 실험(가령 음소 주시) 등의 몇몇 특별한 요구사항의 생성에서만 수반된다.
만약 다르게 동시조음되는 이음은 다르게 표상되어 있는, 음향적 표상을 포함하는 음운론적인 어휘부가 존재한다면, 이어지는 결과는 다음과 같다 : 첫째, 이는, Scobbie, Gibbon & Hardcastle(1995, 이 책)에서 보고된 것처럼, 원형이론이나 어린애 음운론에서 분절음을 그 이상으로 명세하는 어휘적 표상들처럼, 고도로 자세하게 명세된 어휘적 표상들에 대한 주장을 지지할 것이다. 실제로 이는 아이들이, 분리하여 조음하지 못하는 단어에 대한 어휘적 표상을 가질 수 있게 할 것이다 ; 둘째, 이는 단어 경계에서의 동시조음에 대한 모델링이 단어 내부의 동시조음에 대한 모델링과 달라져야 하는지에 대한 문제를 제기한다. 만약에 어휘적 표상이 음향적이라면, 단어 내부의 동시조음의 자세한 부분은 어휘적 표상의 일부로서 기억될 수 있을 것이다. 조음 계획 단계에서, 단어경계에서의 동시조음은 발화 산출 동안 보다 창조적으로 계획될지도 모른다. 이 경우에 청자가 단어 경계의 동시조음을 되돌리는 능력을 설명하기 위해 운동이론이 ‘부활’될 수도 있겠다. 그러나 또 다른 가능성이 있다 : 다양한 조합의 형태가 모두 저장된다 : 곧, ‘in’이라는 단어의 소리에 대한 기억들은 다양한 형태인 [im][in][iŋ][in̪][im̡] 등이 분절음적이지 않게 음향적 공간에 부호화된다. 비록 이 제안이 최대한 인색하고[경제적이고] 잉여성이 없는 음운론적인 표상을 위한 전통적 논의의 정면을 날아다니더라도[거스를지라도], 내가 알기로 인지 과학에 기초한 어떠한 강력한 논의도 그런 심미적인 원칙들을 더 이상 고수하지 않는다. Gaskell, Hare & Marslen-Wilson(1995)와 Gaskell & Marslen-Wilson(1996)은 음운론적 입력 대신 음성적 입력에 기초한 연결주의적 어휘적 접근 모델을 제시한다. 그 모델은 어휘적 접근의 산물로서의 음운적 표상을 도출하고 맥락 의존적으로 나타나는 동화된 조합형태를 배운다. 이 학회의 몇몇 다른 논문들도 어휘적 표상에서 음소가 그 이상 자세하게 나눠지는 것에 대한 증거를 제시한다5).
2 조음과 어휘 표상
Harrington 등은 강세 음절의 돋들림을 향상시키기 위한 두 가지 조음 전략을 실험했다 : (1) 강세받은 모음에서 턱을 더 많이 그리고 더 빨리 내리기. (2) 강세받지 않은 고모음에서보다 강세받은 고모음에서 혀를 더 올리고, 강세받지 않은 저모음에서보다 강세받은 저모음에서 혀를 더 수축시킴으로써 강세받은 고모음과 강세받은 저모음의 차이의 정도 늘리기. 고모음들의 경우에 이 두 전략들 사이에 긴장이 있다.[두 전략이 상충한다] 전략 (1)은 턱을 내리고 전략 (2)는 고모음에 있어서는 턱을 보다 높게 만든다. 흥미롭게도 그들은 한 피험자가 그들의 기대처럼 혀를 높이는 것이 아니라 혀를 내밀어서 고모음을 강조하는 것을 발견했다. (다른 피험자는 혀를 높였다.)
만약에 우리가 조음적이 아니라 청취·음향적으로 피험자들을 실험과제를 살펴본다면, 두 피험자들이 /i/를 조음할 때의 차이는 별로 중요하지 않다. 혀를 내미는 것과 올리는 것의 음향적인 동일성 때문이다. 만약 화자의 목표가 청자에 의해 청취적으로 동일하게 파악되는 특정한 음향의 산출이라면, 이 예에서 우리는, 혀를 올리는 것이 아니라 F2를 높이는 것이, 비록 사용하는 조음 전략은 다를지라도, 두 피험자에 의해 성공적으로 달성된 음성적 목표라고 제안할 수 있다. 이런 관점은 또한 우리에게 JMF의 F1 자료를 이해하게 해준다 : F1이 강세받지 않은 [i]에 비해 강세받은 [i]에서 유의미하게 낮다. 다른 모든 것이 같다면 이는 강세받은 [i]를 위해 보다 높게 혀를 높이는 동작을 나타내는 것으로 해석될 것이다. 반면에 자력계의 자료는 턱이 강세받은 [i]에서 더 낮음을 보여준다 : 그들이 주장하듯, 이것은 조음적 모순이다. 그러나 우리는 여기에서 조음적 모순이 어휘적(Harrington et al.은 이 에 대해 침묵한다)이라고 추론해선 안된다 : [i]의 어휘적 표상이 청취적으로 compact(즉 F1이 낮고)하고 acute(즉 F2가 높다)면, Lindblom(1990a)의 H&H 모델을 따라 우리는 아마 강세받은 [i]가 강세받지 않은 [i]보다 compact하고 acute하다고 기대할 수 있을 것이다. 특별히 compact하고 acute한 음향적 신호를 만듦으로써 강세받은 [i]를 청자가 청음적으로 지각하도록 한다는 의사소통의 목표는 다른 조음 전략을 사용하는 다양한 피험자들에 의해 달성된다. 청음은 어휘를 고려하지 않는다. [[i]의 조음적 모순은 어휘와 무관하다]
Harrington 등은 그들의 논의 중 일부를 비단선 음운론의 중복모음(geminate vowels)의 표상과 음성적 해석에 할애했다. 호주 영어에서 [i:], [a:]가 2모라라는 것은 분명하지만, 이들이 중복모음이라는 것은 밝혀지지 않았다. 많은 음운론적 분석이 영어의 [i:]를 이중모음이나 모음+활음으로 분석한다. 그러나 單모음적인 호주 영어의 [a:]는, 음소적으로 중복모음이 아니라 /a/와 [ə]의 조합일 것이다(표 7.1). [호주 영어의 [i:]는] 나의 [ɑ:]나 미국 영어의 [ɑɹ]처럼 중향(centering)이중모음체계에서 같은 자리를 차지한다. 음성적 실현의 차이에도 불구하고 호주 영어 모음 체계가 영국이나 미국 영어 모음 체계화 크게 다르다는 증거는 없다. 나는, [i:]와 [u:]의 활음은 [i:]와 [u:]의 핵(peak)에 대한 [+high] 명세를 향상시키는 잉여 자질 명세들이다(이 활음들은 변별적인 음운론적인 요소이다6)),라는 Harrington 등이 인용하고 있는 Stevens 등(1986)에 동의하지 않는다. (표 7.1)에서처럼 [i:]와 [u:]가 폐쇄(closing) 이중모음 체계를 완성시킨다.[체계에 참여한다]
높낮이와 전후설성 자질들은 이 이중모음들의 두 부류에 대해 순수하게 교차하지 않는다 : 이 체계에서 높낮이는 [이중모음의] 첫 번째 요소를 위해서만 변별적이고 전후설성은 두 번째 요소를 위해서만 변별적이다7). 후자의 주장을 살펴보자. /ow/의 앞부분의 전후설성은 다양한 변이를 가진다. [o], [ə], [e]. 유사하게 많은 화자가 /aw/, /aj/의 핵과 활음을 이화시킨다. ㅡ 전설 이중모음8) [ɑɪ]에서는 체계적으로 후설의 핵으로, 후설 이중모음 [aʊ]에서는 체계적으로 전설의 핵으로. 이런 분석은 공명도 핵(sonority peak)과 관련된 턱의 하강이 일시적으로, 활음의 [-back] 목표와 관련된 혀 올리기 혹은 혀 내밀기에 선행한다는 Harrington 등의 관찰과 부합한다. 그들이 공명도의 측정을 위해 RMS amplitude를 사용한 것 역시 문제가 있다. 그것을 측정하기 위해 성도의 틈[의 넓이]에만 기댄 것이 아니라 통제되지 않은 근원력(source power)9)에도 의존했기 때문이다.
Byrd 등의 근원력에 대한 논의 역시, 실험 역학 모델인 조음 이론에 참가한다. 그들의 경험적인 결과들은 안전하지만 다른 단순한 비단선 모델들ㅡ가령 Coker의 조음 합성기의 3차 다항식 모델, 다른 여러가지 시스템에 구축되어 있는 조정된 미분(short-time piecewise) 모델(Pierrehumbert & Pierrehumbert 1990 참조)ㅡ보다 포괄적인(mass-spring) 모델은 아니다. 실험 역학 모델의 중요성은, 그것을 사용하는 사람이, 관찰된 조음 동작에 가장 근접하기 위해 어떤 변항이 제공되어야 하는지 알도록 명시적인 숫자로 표현되는 모델을 갖게 된다는 점이다. 그러나 다른 변항도 그런 결과를 제공할 수 있기 때문에 변항 선택할 때의 실수를 조심해야 한다. 가령 입술이동의 수직적 구성요소가 생리적인 조음 변항이라는 것은 말도 안된다. 모델 선택에 중립적인 관점에서, 실험 역학의 언어가 보다 명쾌하게 표현될 수 있는 시간(timing)의 세 측면을 나열해 보겠다.
1. 상관적인 국면의 [조음] 동작의 협조를 기술하는 것은 [조음] 동작 구간의 비율의 관점에서의 記述에 필적한다. [같다] “혀끝 올리는 동작의 π/2 radian”은 “동작 전체의 25%10)”와 동의어이다.
2. Byrd 등은 자음 onset들 사이의 시간이 단어와 작은 구절을 가로질러서 일정하다는 것을 보인다. 그 결과는 라디안으로 제시된 것보다 명시적으로 초(sec.)로 진술된다.
3. C2 개방과 C1 폐쇄의 [시간적] 늘어남은 실험 역학 모델로 표현될 수 있지만, 그 사실이 그 모델을 지지하는 것은 아니다. 그 데이터가 다른 모델에서는 문제가 있음을 보여야지만 실험 역학 모델은 지지받을 수 있다.
조음만을 나타내는 모델로 여긴다고 해도 그것은 너무나 단순한 모델이다. 고유수용(固有受用11))적인 피드백은, 조음의 실제 실행에서 매우 중요함에도 불구하고, 이 모델에서 설 자리가 없고, 청취적 피드백(좀 덜 중요)의 기여는 무시될 것이다. 그러한 피드백 관계가 포함될 때 그런 모델은 더 이상 부차적이지 않다. 실험 역학 모델을 인간의 조음 계획 기제와 관련시킬 때의 주의가 요구된다.
어휘 표상 이론으로서 조음 음운론은 음?적이고 의사소통적인 목표를 게을리하여 더 많은 난관에 봉착하고 있다. Byrd 등에 의해 관찰된, 조음 계획의 편이를 위해 onset들 사이의 자음이 유지되는 동안, 두 자음 동작의 정점이 조음적으로 분리되는 것은 큰 구의 경계에서 이 두 자음의 겹침을 최소화하여 자음의 지각적 구분을 높이는 좋은 전략이다. 내 제안대로 어휘적 표상과 화자의 음운론적 의도가 조음적이지 않다면, 어휘 표상에 대한 조음적 다양성이 낳을 결과들에 대해 Keating이 논의한 것은 더 이상 생각할 필요가 없다.
3 운율 구조와 조음의 다양성
Harrington 등과 Byrd 등의 논문은 모두 다른 운율 맥락에서의 조음의 다양성에 초첨을 맞추고 있다. Byrd 등은 운율 맥락을 경계의 종류에 따라 기술하고 있다 ; Harrington 등은 단어, 음보, 음절, 모라 등 율격 구조로 기술하고 있다. 두 연구는 조음이 운율 맥락에 의해 변하지만 운율 구조와 조음적 조정 사이의 연결의 본질에 대해서는 말이 적다. 이 절에서 Kondo의 논문에서 먼저 시작된 이 문제에 대한 나의 견해를 제공할 것이다.
CV 전이에 대한 Klatt의 모델에서는 모음들은 자음에 독립적으로 [후설성] [원순성]을 지니는 반면 자음은 모음과 함께만 나타날 수 있기 때문에, 자음들은 이음적 자질인 [후설성], [원순성]이 후행하는 모음에서 도출되는 것으로 본다고 1절에서 언급했다. 그래서 이 경우에 동시조음의 의존성은 음운론적이고 분포적인 의존성을 반영하는 것이다. 전에(Coleman 1994) 이런 일반화는 음성학적 해석의 다양한 영역에 걸쳐 유효하다고 주장했다. onset 자음들의 예측적인 동시조음만이 아니라 의존성이라는 개념은 잠재적으로, 참자음-모음의 동시조음처럼 작동하는, 역행적인[예측적인] 모음-coda 동시조음·참자음-공명음·공명음-참자음의 동시조음을 설명한다. 그리고 음보 내에서 강제받지 않은 모음들이 음보의 head 모음과 동시조음을 나타내는 것도 설명한다. 원칙적으로 이런 설명은 Magen(1977)이 제시한 영어의 비강세 모음들의 양지향적 의존성의 어떤 예들과 Magen(1984)가 보고한 영어와 일어의 동시조음의 차이를 설명할 수 있을 듯하다(그림7.6)
일어에서 나타나는 강약 음절의 2분지 교체는 무성음화 환경(1)에서 고모음 연쇄의 무성음화 교체 패턴에 의해 입증되었다(Vance 1987, Zubizarreta 1982 이후). 그러나 약음절은 영어에서처럼 같은 정도의 질적 차이를 보이지 않는다. Kondo는 영어의 강세·비강세 음절에 각각 관련된, 주변모음 특질과 중심모음 특질 사이의 리드미컬한 교체를 언급하기 위해 ‘모음 약화 vowel reduction’라는 용어를 사용한다. 대조적으로 그녀는 “일어에 음운론적인 모음 약화는 없다. 일어의 엑센트는 모음의 특질과 거의 관련 없다.”고 한다. 모음의 조음을 고려하면 아마 맞을 것이지만, 다른 측면 특히 피치와 발성(phonation)에서, 일어는 엑센트 음절과 비엑센트 음절 사이에 음성적인 차이를 보인다. 그래서 일어의 엑센트는 ‘accent slide’(Haraguchi 1977)에서 보인 예들에서처럼 영어의 강세와 완전하게 다른 것은 아니다. 이 경우에 엑센트의 위치는 음절이나 다른 곳일 것이다 ; 영어에서 강세위치와 모음축약 사이의 이접현상과 유사하게, 엑센트를 받지 않으면 고모음은 엑센트부여와 모음의 무성음화 사이의 이접현상을 나타내면서 무성음화된다(Yohisoka 1981). 이 관찰은 (그림 7.6)처럼 율격으로 동시조음을 다룰 수 있도록 해준다. 일어 화자가 영어에 유창해지기 위해서, 영어 율격 구조만이 아니라 이 구조에 연관된 모음 의존성의 존재를 익혀야 한다. 그러나 7.6에 보인 모음 의존성 분석에는 몇 가지 문제가 있다. 동시조음을 구조에 연결했기 때문에, 이 그름은 영어를 배우는 일본어 화자가 어떤 지점에서 일어패턴에서 영어패턴으로 범주적인 스위칭을 할 것으로 예측한다. Kondo는 그렇지 않다는 것을 증명했다. 대신, 선후행하는 모음의 상대적인 영향이 서서히 변한다. 결론적으로, 현재 나는 두 가지 이산적인 율격 범주(s/w) 사이의 2지적 대립을 가지는 ‘고정된 위계의 율격구조’를 제안하는 일에 덜 집착한다. 그것 말고, Goldsmith와 Larson의 모델처럼 앞뒤 연결의 가중치가 부여된 네트워크가 Kondo가 관찰한 점진적 변화를 모델링하기 위해서 정통 율격 음운론보다 더 나은 구조체이다(그림 7.7). 이런 구조체에서, 상태들은 단어 [발화] 시간 과정에서 연속적인 지점들을 위한 저장 단위들을 표상한다. (여기에서는 그냥 아무렇게나 모음 단위들을 가정한 것이지만, 이 모델과 어휘부의 청취 상태-공간 이론을 짜맞추게 된다면 더 세세한 시간 나누기가 바람직할 것이다)
음운론적인 어휘부는 조음적 표상이 아니라 청음적 표상으로 구성된다는 나의 주장은 조음적 다양성에 대한 율격의 통제에 대한 근거에 상충되지 않는다. 운율의 측면과 단어의 조음의 세부사항들은 후어휘부적이다. Byrd 등은, 타밀어에서 억양구 안에서보다 억양구를 가로지를 때 어말과 후속 어두자음의 조음적인 분리가 더 강하다는 것을 발견했다. 보다 강한 분리의 조음적 징후들은 C1의 개방과 C2의 폐쇄가 더 길고, 크고, 늦다는 것 그리고 C1을 위한 동작과 C2를 위한 동작의 정점들 사이 시간적 분리가 더 길다는 것이다. 이러한 분리는 모음-모음 동시조음이 보이는 긴 영역들의 통합에 반대된다. 그것은 경계 앞뒤의 자음들 사이에 또는 억양구들 사이에 상정될 수 있는 어떤, ‘억제하는 연결’처럼 연결주의자의 접근법으로 모델링될 수 있을 것이다. Byrd 등은 운율 경계들을 조음 음운론에 조이는(bolting) 방식으로 Saltzman(1995)의 제안을 인용한다 : 비-트랙-변이(non-tract-variable) 유사-동작(pseudo-gestures)의 추가. 이것(추가하는 것)의 기능은 트랙-변이 동작의 활성화 정도와 다른 변항에 영향을 주는 것이다. 이론에 추가되는 이러한 사항은 배타적으로 조음적인 변이에 대한 강조를 훨씬 더 약화시킨다. 〔조음적 원인만으로 변이가 나타나는 것이 아니다〕그리고 (타당하게도) 조음 동작보다 더 추상적인 단위들의 재인(인지)에 무게를 실어준다. 발화 계확 시의 중요한 단위로서 억양구의 역할은 여러번 지적되었다 : 관련 논문들의 목록은 Dankovičova(1997:309)를 볼 것.
동시조음은 어디에 있는가? 그 대부분은 어휘부, 곧 어떤 단어의 소리로써 화자의 기억에 있다. 단어의 다양한 발음의 모든 토큰이 완전하게 연속적인 음성적 표상의 형태로 간단하게 저장되고 분절되지 않는다면, 모든 단어 내부의 동시조음은 평범하게 표상된다. 표상들 중 일부는 단어들 사이의 접착제인데, 이 역시도, 어휘 목록의 처음이나 끝에서의 약간의 차이를 가진 것으로 저장된다. 그렇지 않다면, 조음 계획 기제에 의해 발화 시(on-line)에 계산될 수도 있다. 본고에서 등장한 음운론적 표상의 관점은 어휘적 표상이 (i) 청음적이고, (ii) 지나치게 추상적이지 않고, (iii)연속적인 변이들을 인정하며, (iv) 경험에 따라 조정될 수 있는 가중치가 부여된 요소들 사이의 연결로 이뤄진다는 관점이다. 나는 여기에서 스스로가, Dell(이 책)이 주장하듯, 연결주의자들의 구조체를 인정하고 있는 것을 안다. 그러나 아마도 우리가 진지하게 인지의 신경 베이스를 고려한다면 이는 별로 놀라운 일이 아니다.
1)onset of vocing following a stop consonant closure
2)위 왼쪽 그림을 봐도, 각진 신호 기간 동안과 그 전에는 더 많이 일치하는데, 각진 신호 뒤에서는 덜 일치하는 것을 확인할 수 있다. utter tea today
3)소리와 관련되는 부위에서만 반응이 나타나는 것
4)peri 는 pref.와 같다. pref.는 ~에 대하여, ~로, ~에/ 非- 등의 뜻으로 쓰인다고 한다. (엠파스 사전)
5)details 참 해석하기 난해합니다. ㅜ_ㅜ
6)단선음운론에서는 활음을 음운론적으로 변별적인 요소로 보지 않기도 한다. 즉 ye와 e는 대등하다.
7)뒤집어 말하면, 높낮이는 오프글라이드 자리에서는 자유롭게 바뀌고, 전후설성은 그렇지 않다.
8)활음이 전설인 것을 말하는 듯하다.
9)음, 날숨의 세기를 말하는 것인지, 아니면 다른 것인지.
10)radian은 호와 관련된 각도의 단위이다, radian은 반지름의 길이와 호의 길이가 같아지는 각도이다. 따라서 ‘각도가 Radian인 호의 길이=반지름(r)’이다, 그런데 원둘레와 지름의 비율인 원주율이 일정하므로, 반지름과 원둘레의 관계도 일정하고, 반지름과 둘레의 길이가 같아지는 호의 각도 또한 일정하다. (반지름의 두 배에 상수인 원주율을 곱한 값을 둘레의 길이로 가지는 호의 내각이 항상 360이듯이) 즉 radian은 상수이다. 2πr*x=r의 x가 radian값이다. (호의 내각이 직각인 호의 길이는 2πr*0.25인 것과 같은 방식으로) 그리고 x=1/2π이다. (이를 360도 체계로 환산하려면 곱하기 360을 해주면 된다.) 그러므로 책에 나온 “π/2*radian”은 결국 “π/2*1/2π”이고 결과는 1/4(25%)이 된다. 결국 2πr이 원의 둘레이듯이 2πRadian은 360도에 해당한다.
11)‘자기 자극(自己刺戟)에 감응하는’
'Linguistics' 카테고리의 다른 글
음운 변화에 보이는 인지의 역할 (0) | 2006.10.22 |
---|---|
기능주의에 대한 소개 by Mithun (0) | 2006.10.18 |
노엄촘스키 방한, (0) | 2006.09.21 |
한글이전의 차자표기 자료 (0) | 2006.09.21 |
언어학과 선험 by Zeno Vendler (0) | 2006.09.10 |