チューリング・テスト:機械は人間と同じように話せるか?
要約
この記事では、1950年にイギリスのコンピュータ科学者アラン・チューリングが提唱した、人工知能の尺度であるチューリング・テストについて探求します。このテストは、人間の審判が見えない相手とテキストで会話することを含みます。相手の一人がコンピュータである場合もあります。テストに合格するには、コンピュータはプレイヤーの一人を置き換えても、結果に大きな変化がない必要があります。チャットボットの品質は時間の経過とともに改善されていますが、人間の会話をシミュレートすることは、単にメモリや処理能力を増やすことで捉えられる複雑な現象であることがわかっています。
目次
- チューリング・テスト
- ELIZAとPER:初期のチャットボット
- ローブナー賞とCleverbot
- 人間の言語の複雑さ
- 結論
チューリング・テスト
アラン・チューリングが人工知能を測定するために考えたアイデアは簡単でした:コンピュータは人間と同じように話せるか? これがチューリング・テストにつながります。人間の審判が見えない相手とテキストで会話することを含み、相手の一人がコンピュータである場合もあります。テストに合格するには、コンピュータはプレイヤーの一人を置き換えても、結果に大きな変化がない必要があります。チューリングは、2000年までに、100メガバイトのメモリを持つ機械が彼のテストを簡単にパスできると予測しました。しかし、今日でははるかに多くのメモリを持っていても、数少ないチャットボットしかテストに合格していません。
ELIZAとPER:初期のチャットボット
最初の成功を主張するプログラムはELIZAと呼ばれ、心理学者を模倣することで多くの人を惑わせました。別の初期のプログラムであるPERは、自分自身のプログラムされた妄想に会話を戻し続ける偏執的な統合失調症患者を模倣しました。ただし、人間は実際には知能を持たないものに知能を帰属する傾向があるという、テストの弱点を示しました。
ローブナー賞とCleverbot
ローブナー賞のような年次のコンペティションにより、審判があらかじめ自分の会話相手のいくつかが機械であることを知っている場合、テストはより形式的になります。ただし、多くのチャットボットのプログラマーは、ELIZAやPERと同様の戦略を使用しています。より最近の勝者であるEugene Goostmanは、13歳のウクライナの少年のペルソナを与えられたため、審判はその非常識な応答や不器用な文法を言語や文化の壁と解釈しました。一方、Cleverbotのような他のプログラムは、実際の会話の巨大なデータベースを統計的に分析して最適な応答を決定します。一部のプログラムは、以前の会話の記憶を保存して時間とともに改善します。Cleverbotの個々の応答は信じられないほど人間らしく聞こえるかもしれませんが、一貫した個性がないことや、新しいトピックに対処できないことは、すぐにバレてしまいます。
人間の言語の複雑さ
人間の会話をシミュレートするには、単にメモリや処理能力を増やすだけでは不十分です。人間の言語は、最大の辞書でも捉えることができないほど驚くべき複雑な現象であることがわかっています。チャットボットは、単純な休止や正しい答えのない質問にも混乱することがあります。そして、単純な会話文を解析するには、豊富な下位知識と直感が必要です。
結論
チューリング・テストは、人工知能にとって重要な課題のままです。チャットボットは、人間の会話をシミュレートすることで進歩していますが、最も基本的なスモールトークにも苦戦しています。チューリングの目標に近づくにつれて、私たちはやはり意識に関する大きな問題に対処しなければならないかもしれません。