恒星間ボトルメール

Interstellar Message in a Bottle

人工知能による文章読解

 人工知能はシークエンスモデルにより、固有表現抽出や機械翻訳をはじめとする様々な自然言語処理タスクをこなすことができます。人工知能がそれらのタスクをこなすとき、彼らは文章の意味を理解しているのでしょうか。標準的な見解では、人工知能は文章の意味を理解しているわけではないとされています。我々人類は文章の意味を理解するが、現在の人工知能は文章の意味を解さない。その違いは何なのでしょうか。そもそも、人間は文章の意味を理解しているのでしょうか。また、人間が文章の意味を理解しているというのは、どういう意味においてなのでしょうか。そして、人工知能はどこまで発展しても、文章の意味を理解できないのでしょうか。あるいは、人工知能が文章の意味を理解する日がいつかくるのでしょうか。

 

 まず、身も蓋もないことを言ってしまえば、人間にとっても文章読解して意味を理解するのは簡単なタスクではありません。たとえば、日本語の母語話者であっても大学入試の現代文の科目で得点することは簡単ではありません。現代文の試験では、文章の要旨と文章の構成、各段落の内容を見通しよく理解することが必要不可欠です。それは、文章読解と要約、内容説明の練習を繰り返し行わないと身に付かない能力です。そして、それらの能力を身に付けたとしても、文章読解は依然として雲をつかむような、輪郭を捉えきることが難しい作業です。

 

 このように考えると、人間は自分が思っているより意味理解ができていないと同時に、人工知能は人間が思っているよりも案外、意味理解ができている可能性も浮上してきます。こうなってくると、そもそも意味理解がどのようなものなのかを画定する必要がありそうです。しかし、意味を理解することがどのようなものなのかを画定するのは非常に困難な問題であることが予想されます。なぜならば、相手が人間であっても、人工知能であっても、相手の内面で置きていることは知りようがないからです。他者が文章の意味を理解しているかを直接、判断することはできません。この問題を切り抜ける方策がチューリングテストです。判定者と、人間のふりをした人工知能が会話をして、話し相手が人工知能であると判定者が見抜けないならば、その人工知能は意味を理解しているとみなしてよいだろうというのがチューリングテストのコンセプトです。

 

 近い将来に、チューリングテストをクリアする人工知能はきっと開発されることでしょう。人間の知能も結局は細胞の電気活動によって生じていると考えることができます。細胞という素子にできて、コンピュータにはできないことがあると考えるよりも、コンピュータにも人間並みの言語処理は可能であると考えるほうが自然です。そして、チューリングテストをクリアした人工知能には、「私」という「意識」が立ち上がっているのかもしれません。他者に意識があるかどうかは知りようがありませんが。 

 

 ニューラルネットワークによる自然言語処理の技術に関しては、斎藤康毅『ゼロから作るDeep Learning自然言語処理編』(オライリー・ジャパン、2018年)に詳しいです。

www.oreilly.co.jp

 本書のキーワードを以下に列挙します。ニューラルネットワーク、学習、推論、順伝播、逆伝播、損失関数、交差エントロピー関数、勾配、勾配降下法、GPUシソーラスコーパス、単語の分散表現、分布仮説、ウィンドウサイズ、共起行列、コサイン類似度、相互情報量、次元削減、特異値分解、word2vec、カウントベース、推論ベース、one-hot表現、CBOWモデル、エンコード、デコード、コンテキスト、ターゲット、skip-gramモデル、単語の埋め込み、embedding、Negative sampling、多値分類、二値分類、負例、転移学習、RNN、言語モデル、BPTT、ミニバッチ学習、RNNレイヤ、パープレキシティ、勾配消失、勾配爆発、勾配クリッピング、LSTM、記憶セル、GRU、過学習、正規化、文章生成、サンプリング、seq2seq、チャットボット、イメージキャプション、Attention、注意機構、双方向RNN。