: 3. 結果 : Elmanネットによる統語範疇の配列と格関係の学習 : 1. 序論

2. シミュレーション

2.1 ネットワークの構造

表: 文の生成規則
2#2

このシミュレーションに使われたElmanネットは，入力層 (ユニット数27)，隠れ層A (ユニット数10)，隠れ層CON (ユニット数70），隠れ層B (ユニット数10），出力層 (ユニット数29)の5層からなり，入力が与えられた後の隠れ層CONの活性パターンを文脈層と呼ばれるメモリに保持し，次の入力が与えられたときに隠れ層CONにフィードバックする (図)．入出力層の27個のユニットはそれぞれこのシミュレーションで使用される27個の単語，すなわち，ピリオド，関係詞who，4つの単数名詞 (cat，dog，boy，girl)，4つの複数名詞 (cats，dogs，boys，girls)，2つの固有名詞 (John，Mary)，2つの目的語不可の自動詞 (live，walk)，2つの目的語可能な動詞 (see，hear)，2つの目的語が必要な他動詞 (chase，feed)，そしてそれぞれの動詞の三人称単数形 (lives，walks，sees，hears，chases，feeds)，2つの助動詞 (do，does)，?に対応している．このなかで，do，does，?，以外の単語はElman (1991) がシミュレーションで使用したものと同じ単語である．入力層に単語が提示されると，ネットワークは提示された単語に対応するユニットを1に活性化させ，残りのユニットの活性値を0にする．出力層の残りの2つのユニットは主格ユニットと目的格ユニットで，ネットワークに単語の格関係を学習させるために使用する．

2.2 ネットワークに提示される文

表はElman (1991) のシミュレーションで使用されたネットワークに提示する平叙文の生成規則である．ネットワークに学習させる文を生成するときは，まずSを開始記号として生成してから 3#3 の左の記号を右の記号に置き換えるということを繰り返し，最終的に全ての記号が英単語かピリオドに置き換わるまで，上記の生成規則を適用する．(NP) とは，その場所でNPを生成してもしなくてもよいことを示す．かっこで囲まれた数値は左の記号がどのような確率で右の各記号列に置き換わるかを示している．例えば，PropN に 4#4 という規則を適用した場合，PropN が John に置き換えられる確率と Mary に置き換えられる確率はそれぞれ 5#5，5#5 となる．また，NPに 6#6 という規則を適用した場合，NPは，それぞれ 7#7，8#8，9#9 の確率で PropN，N，N RC に置き換えられる (ただし，これは複文が生成可能な場合．単文を生成する場合は PropN に置き換えられる確率と N に置き換えられる確率は，それぞれ 10#10 と11#11)．各 PropN，N，N RC がどんな割合で生成されるかは，Elmanの論文からは明らかではなかったが，なるべく該当する英単語を平等に生成するように決定した．また，動詞や目的語を生成するときは主語との単複の一致や動詞の自動詞，他動詞の区別に注意しなければならない．例えば，
John V.
という記号列に適用できる規則は
12#12
のみであり，
13#13
は適用できない．

この操作によって
boys who Mary chases feed cats .
といった，間に関係節を挟んで主語と動詞の単複を一致させるような複雑な文も生成することができる．また，今回のシミュレーションでは，平叙文の疑問形や，疑問詞whoによって主語，または目的語を問うような疑問文も生成する．それぞれの疑問文の特徴は以下の通りである．

疑問文

・: 主節の主語と対応する動詞は原形
・: 文頭にはdoもしくはdoesが付く
・: 文は？で終了する

疑問詞whoによって主節の主語を問う疑問文

・: 文頭に主節の主語の代わりにwhoがくる
・: whoと対応する動詞は三人称単数形である
・: 文は？で終了する

疑問詞whoによって主節の目的語を問う疑問文

・: 文頭に目的語を尋ねるためのwhoがくる
・: whoの後には主節の主語と単複の一致する助動詞``do''または，``does''がくる
・: 主節の主語と対応する動詞は原形
・: 主節の主語と対応する動詞は自動詞であってはならない
・: 文は？で終了する

疑問文は，平叙文の生成規則に，それぞれ上記の規則のうち生成したい種類の疑問文の上記の規則を加えることによって生成する．以上の規則を新しく加えると，例えば，
does boy who Mary chases feed cats ?
who feeds cats who dog chases ?
who does boy who Mary chases feed ?
といった関係節を含んだ複雑な疑問文も生成できるようになる．

2.3 学習

表で示した生成規則によって生成した文を構成する単語をネットワークに順番に１つずつ提示し，次に来る単語を予測するように学習させる．入力層の各ユニットはこのシミュレーションで使用する個々の単語と対応しており，単語が提示されると提示された単語と対応するユニットの活性値が1，その他のユニットの活性値が0となる．教師信号は，次に来る単語と対応するユニットの活性値を1にし，その他の単語と対応するユニットを活性値0にしたもので，さらに，現在の入力より一つ前の入力単語の格関係が主格なら主格ユニットを1，目的格ユニットを0に，目的格なら主格ユニットを0，目的格ユニットを1にした．

ネットワークは最初から関係節を含んだ複雑な文が提示されると，正しく文法を学習することができないことが知られている[ElmanElman1991]．よって学習の最初は関係節を含まない単純な文の学習から始め，ネットワークが単文を十分学習したところで徐々に関係節を含んだ複雑な文を学習させなければならない．ある50000個の文集合を通して1回学習させることを1エポックとし，次の4つのセットをそれぞれ5エポックずつ行う．

単文 50000個を学習
単文37500個，複文12500個を学習
単文25000個，複文25000個を学習
単文12500個，複文37500個を学習

一つの文は，1/3の確率で平叙文，1/3の確率で平叙文の疑問形，1/3の確率で疑問詞whoによる疑問文 (うち，主節の主語を尋ねる疑問文が生成される確率が1/6，主節の目的語を訪ねる疑問文が生成される確率が1/6) となる．つまり，50000個の文があれば，約16666個の文が平叙文となり，約16666個の文が平叙文の疑問形となり，約8333個の文が疑問詞whoによって主節の主語を尋ねる疑問文，約8333個の文が疑問詞whoによって主節の目的語を尋ねる疑問文となる．

学習は誤差逆伝搬法で，学習レートとモーメントはそれぞれ0.01と0.9．結合加重の初期値は14#14から15#15の範囲でランダムに初期化した．ただし，隠れ層CONからコンテクスト層へのネットワークの重みは全て1に固定した．また，ネットワークのシミュレーションと文生成のためのプログラムは全てC言語で書いた．

: 3. 結果 : Elmanネットによる統語範疇の配列と格関係の学習 : 1. 序論

日本認知科学会論文誌『認知科学』

2. シミュレーション

2.1 ネットワークの構造

2.2 ネットワークに提示される文

2.3 学 習

2.3 学習