next up previous
: 5. 議    論 : 円滑な話者交替はいかにして成立するか 会話コーパスの分析にもとづく考察 : 3. 方    法



4. 話者移行型の出現分布の予測

本節では,自律モデルおよびコードモデルに従って 話者の移行型の出現分布を予測し, そこで予測された出現傾向と実際の対話での 出現傾向とを比較する. その結果,自律モデルでは実データの分布傾向を かなり正確に予測できるのに対し, コードモデルでは同時開始や沈黙といった 非円滑な移行の予測に問題があることを示す.


4.1 自律モデルにもとづく分布予測


4.1.1 文末らしさと話者交替

まず,本稿で着目する6つの素性によって規定される文末らしさに 発話行動がどのように影響を受けているかを調べる.

たとえば,6つの素性全てが文末型の要素の場合と, 4つが文末型で残りが非文末型の場合とを比較すると, 前者の方がより文末らしさが強いと言えるだろう. そこで,発話対の最初のIPUの6つの素性値をもとに次式で文末度を定義する.
14#14

もし文末度が高い程 話し手が発話をやめ聞き手が発話を開始する傾向にあるならば, その組合せとしての交替と文末度との間には 正の相関が見られるだろう. そこで交替が生じる割合 (26#26交替/(交替24#24非交替))と文末度との間の相関を調べたところ, 両者の間に強い正の相関がみられた (27#27, 28#28, 29#29, 両側検定; 図 5). この結果は,発話行動が文末らしさに影響を受けていることを 示唆するものであり,次節以降の分析の妥当性を保証する.

図: 文末らしさと交替の出現率との関係
15#15


4.1.2 発話関数の算出

次に,話し手,聞き手の発話関数 12#12, 13#13を算出する.

ここで話し手,聞き手の発話,非発話という観点から 図 2 をながめてみよう. すると,非交替や同時開始は話し手が発話をしている状況に, 沈黙や交替は話し手が発話をしていない状況に 対応することがわかる. また同時開始や交替は聞き手が発話している状況に, 非交替や沈黙は聞き手が発話をしていない状況に生じる現象である. このことから,ある文末度30#30での 話し手の発話継続の確率 31#31とは, その文末度30#30における全移行の出現頻度のうち 非交替と同時開始が占める割合であると言える. また聞き手の発話開始の確率32#32は, 全移行で同時開始と交替が占める割合である. そこでこの方法で求めた 31#31, 32#32のプロット値から 発話関数12#12, 13#13を求める. 31#31, 32#32の各点をプロットしたものを 図 6 に示す.

前節の分析で求めた文末度と交替出現率との間の回帰直線から, 交替出現率が0.5となる, つまり交替と非交替との出現が同数になるのは, 文末度33#33よりも右にずれ 34#34付近であることがわかる(図 5). そこで12#12と13#13が35#35で交わるとして, 35#35を境に前後2本の直線で 最小自乗法によりプロット値を近似することで, 発話関数12#12, 13#13を求めた. 話し手,聞き手の発話関数(回帰直線)を図 6 の実線に示す.

図: 話し手(36#36),聞き手(24#24)の発話関数
15#15


4.1.3 移行型の分布予測

図: 移行型ごとの実測値(36#36)と予測値(24#24)
16#16

2.2 節に示した4つの移行型の出現を予測する式(5)に, 前節で算出した話し手,聞き手の発話関数を代入することで, 文末度2#2における各移行型の出現確率を求めた. 図 7 の(1a)〜(4a)に 出現確率の予測値(太線)および 実データから算出した出現確率の実測値(細線)を示す. 出現確率の実測値は, 各文末度における全移行型の出現頻度に対して 当該の移行型が占める割合によって求めた. また図 7 の(1b)〜(4b)には, 各移行型の出現頻度の予測値(太線)および 実測値(細線)をプロットしたものを示す. 出現頻度の予測値は, 当該の移行型の関数から各文末度での出現確率を求め, その文末度における全移行型の出現頻度と掛けあわせることで算出した.


4.1.4 予測分布と実データの分布との比較

図 7 (1a)〜(4a)に示した出現確率の予測値の分布から, (1) 交替(非交替)の出現確率は文末度が高くなる程高く(低く)なる, (2) 同時開始は全体的に文末度が高くなるにつれ出現確率も多少高くなる, (3) 沈黙の出現確率は文末度が0.0と1.0付近では小さく0.5付近で高くなる, という傾向が読みとれるが, これらはいずれも実測値の分布とかなり類似している. また図 7 (1b)〜(4b)に示した 出現頻度の予測値と実測値との間の相関を調べたところ, いずれの移行型に関しても高い相関がみられた (交替: 37#37, 38#38, 29#29; 非交替: 39#39, 40#40, 29#29; 同時開始: 41#41, 42#42, 43#43; 沈黙: 44#44, 45#45, 29#29). この結果は, 自律モデルにもとづく予測が 実データの出現分布の全体的傾向を かなり正確にとらえていることを示すものである.

しかしその一方で, 同時開始や沈黙といった非円滑な移行は, 予測値より実測値の方が若干少な目に, 反対に交替や非交替は多目になっている. この傾向をより詳細に検討するために, 文末度2#2に応じてデータを,
17#17
の3群に分け, 出現頻度の実測値および予測値を比較した(表 2). この表から,たしかに実データでは非円滑な移行は少な目に, 円滑な移行は多目になっていることがわかる. これは,同時開始や沈黙といった非円滑な移行は社会的に好まれないため, 生じそうになるとそれを回避する行動がとられることに関係するものと考えられる.


表: 実データ,(補正)予測データにおける 非文末群,曖昧群,文末群ごとの各移行型の出現頻度
   実データ   予測データ   補正予測データ  

同時開始について考えてみよう. 円滑な移行時のIPU間のポーズはばらつきが大きいため (平均: 52#52ms, 標準偏差: 53#53ms), 同時開始のように両話者が発話を開始する場合, 潜在的な発話開始のタイミングが双方で大きくずれることも少なくない. こういった場合,先に相手が発話を開始したのをみて, もう一方の人はたとえ自分の発話行動を「発話」と決めていた場合でも, 重複を避けるために発話を抑制するかもしれない. このため,実際に出現する同時開始は 潜在的に出現しうる同時開始よりも少ないことが予想される. 沈黙に関しても同様である. 発話開始のタイミングのピークは200ms付近とかなり早く, また652ms以内に全体の4分の3が含まれる. そのため,本研究で沈黙の閾値とした 1700msよりもずっと早い段階で発話の不在が認知でき, たとえ自分の発話行動を「非発話」と決めた場合でも, 沈黙を避けるために発話することが可能となるのである. このように,同時開始や沈黙の一部が回避された結果, 実際には予測した値よりも少ない頻度でしか出現せず, その分円滑な移行がより多く出現すると考えることができる.

そこで,こういった回避行動が各群で同確率で生じ, その結果,予測した同時開始,沈黙の総数である223, 265が 実測値の162, 166にそれぞれ減少した,という仮定のもとで, 54#54, 55#55を それぞれ同時開始,沈黙の実現率(56#56回避行動の出現率)とし, これを同時開始,沈黙の各群の値に掛けることで予測値の補正を行った. またこのように回避された分が, 予測比率である57#57の割合で交替,非交替に移動したと仮定し, 回避された同時開始,沈黙の分を各群ごとに 交替,非交替に振り分けることで, 円滑な移行の予測値の補正を行った. 結果を表 2 の補正予測データの欄に示す.

表 2 の実測値と補正予測値を比較すると, 分布の傾向がかなり類似していることがわかる. そこで両者の分布が等しいことを確認するために, データ群(実データと補正予測データ), 移行型(4つの型), 文末度(3つの群) の3要因を対象とした対数線型モデル分析を行った. 結果を表 3 に示す. この結果は, 2次の交互作用がないこと, 1次の交互作用として文末度×移行型のみ有意であることを示すものであり, この分布を説明する最適なモデルが 文末度×移行型の1次の交互作用のみを含めた モデルであることがわかる (適合度検定: 58#58, 59#59). このことから, 文末度と移行型の間の相関がデータ群の各水準において等しいこと, つまり実データと補正予測データとで 文末度×移行型の分布がほぼ等しいことが指摘できる.


表: 対数線型モデル分析の結果
(データ×文末度×移行型)
  削除する項 自由度 尤度比基準 有意確率 [-1ex]  

以上,自律モデルに従って話者の移行型の出現分布を予測し, 実際のデータとの比較を行った結果, (1) 自律モデルによって分布の全体的な傾向がかなり近似できること, (2) 非円滑な移行が実際の対話ではある程度回避される, という仮定を加えた場合, 実データと予測データの分布がほぼ一致することが明らかになった.


4.2 コードモデルにもとづく分布予測


4.2.1 移行型の分布予測

ここではコードモデルにもとづいた場合の 各移行型の分布予測について検討する. 議論を容易にするために, 文末度1.0付近を文末状況, 文末度0.0付近を非文末状況, 文末度0.5付近を曖昧状況とする.

コードモデルが完全に機能する理想的な状況では, 同時開始や沈黙などの非円滑な移行が生じることはなく, 文末状況では話者の交替が, 非文末状況では非交替が生じることが期待される. また相反する2種類のシグナルが利用されることはなく, 曖昧状況は存在しない. しかし実際には,非円滑な移行も生起するし, 2種類のシグナルが混在することもある. この原因として, 話し手の符号化エラーと聞き手の復号化エラーが考えられる. そこで両エラーを考慮した場合に 各移行型の分布がどのように予測されるかを検討する.

理想状態での交替,非交替の出現頻度を それぞれ62#62, 63#63とする. まず聞き手の復号化エラーについて考える. 復号化エラーが生じる状況とは, 話し手が文末状況(非文末状況)で シグナルを媒介に交替(非交替)を伝達したにもかかわらず, 聞き手は非交替(交替)と解釈してしまった状況のことである. 話し手が交替のシグナルを出したにもかかわらず, 聞き手が非交替と解釈した場合, 話し手は発話を停止し聞き手は発話を抑制することから, この状況では沈黙が生じる. 逆に非交替を交替と解釈した場合には同時開始が生じる. 交替,非交替で生じる復号化エラーが同確率であると仮定し, その確率を64#64とすると, 沈黙,同時開始の出現頻度はそれぞれ 76#76, 74#74となる(表 4 参照). また交替,非交替はその分減少し, 3#3, 4#4となる.


表: コードモデルにもとづく出現頻度の予測
  非文末 曖昧 文末 交替  

次に話し手が符号化に失敗した状況について考えてみよう. これは交替(非交替)のシグナルを伝えるつもりであったのに 非交替(交替)のシグナルを出してしまった状況のことである. ただし,複数ある素性のうち全てに関して 符号化に失敗することはまずなく, 一部の素性に関してのみ失敗すると予想されるため, このような状況では 相反するシグナルが混在して出現することになるだろう. これは上述の「曖昧状況」に対応する. このような状況では, 話し手はそもそも交替なり非交替なりを伝達しようと 意図していたわけであるから, 交替のつもりであれば発話を停止するだろうし, 非交替のつもりであれば発話を継続するだろう. 符号化エラーが両者同確率で生じると仮定すると, 曖昧状況での話し手の発話停止と発話継続の出現比率は, 交替と非交替の出現比率である77#77で近似することができる. 一方聞き手は,曖昧なシグナルからでは 話し手の意図を復元することができないため, 発話の開始と抑制とがランダムに出現すると考えられる. そのためこれらの出現比率も同様に 交替と非交替の出現比率(77#77)で近似することができる. 符号化エラーの確率を78#78とすると, 曖昧状況で交替,非交替,同時開始,沈黙が生じる頻度は, それぞれ表 4 の曖昧欄に示すものとなることが予測される. また文末,非文末の交替,非交替は, 78#78の確率でその出現が減少するため, 復号化エラー(確率64#64)とあわせることで, それぞれ表 4 に示すものとなる. この表にもとづいて,以下3つの予測を立てる.

予測1 文末,非文末状況の交替と非交替の出現分布は, 表 5「予測データ」欄に示すものとなる.


表: 予測データ,実データの,文末,非文末
状況における円滑な移行の出現分布
  予測データ 実データ  

予測2 文末,非文末状況の同時開始と沈黙の出現分布は, 表 6「予測データ」欄に示すものとなる.


表: 予測データ,実データの,文末,非文末
状況における非円滑な移行の出現分布
  予測データ 実データ  

予測3 曖昧状況での各移行型の出現分布は, 表 7「予測データ」欄に示すものとなる.


表: 予測データ,実データの,曖昧状況
における4つの移行型の出現分布
  予測データ 実データ 交替  


4.2.2 予測分布と実データの分布との比較

文末状況,非文末状況,曖昧状況をそれぞれ, 4.1.4 節で定義した 文末群,非文末群,曖昧群と考え, コードモデルにもとづく予測と実データとの比較を行う.

予測1 表 5 に示す 交替,非交替の比率を実データと予測データで比較すると, 予測では文末の非交替と非文末の交替が0になるのに対し 実データではある程度出現しているが, 文末の交替と非文末の非交替で 頻度が多くなるという傾向は両者一致している (実データのカイ2乗検定: 79#79, 29#29).

予測2 表 6 に示す 同時開始,沈黙の比率を 実データと予測データで比較すると, 予測では文末の同時開始と非文末の沈黙が0になるのに対し 実データではかなり出現していることが, また予測では文末の沈黙と非文末の同時開始で 頻度が多くなるという傾向がみられるのに対し, 実データではそういった偏りはみられないことがわかる (実データのカイ2乗検定: 80#80, 81#81).

予測3 理想状態での交替,非交替の比率77#77 を実データの交替,非交替の比率82#82 に等しいと仮定すると, 表 7 の予測データ欄に示す比率は, 83#83となる. これを実データの比率(約84#84)と比較すると, (1) 交替と非交替の比率は両者かなり類似(いずれも約85#85), (2) 同時開始と沈黙の比率は両者で異なる(86#86と87#87), (3) 円滑な移行と非円滑な移行との比率が異なる (予測の方が非円滑な移行の占める割合が大きい), という3点を指摘することができる.

予測1と予測3の(1)に示した結果から, コードモデルでは円滑な移行の出現傾向をある程度説明できるが, 予測2と予測3の(2), (3)の結果から, 非円滑な移行の出現傾向に関しては全く説明できないことがわかる. 予測3の(3)に示した, 非円滑な移行が実データより多目に予測されるという傾向は, 前節で指摘したように回避行動を考慮しない自律モデルでも見られる. しかし,自律モデルでは回避行動を考慮しない場合でも, 予測2と予測3の(2)に関しては, 実データと同じ傾向を示している (文末・非文末群の同時開始と沈黙の比率に関するカイ2乗検定: 88#88, 89#89; 曖昧群の同時開始と沈黙の比率: 約87#87). このことから,非円滑な移行の出現分布に関しては,コードモデルより自律モ デルの方がよりよく説明できると結論付けることができる.


next up previous
: 5. 議    論 : 円滑な話者交替はいかにして成立するか 会話コーパスの分析にもとづく考察 : 3. 方    法
日本認知科学会論文誌『認知科学』