人工知能と科学技術の未来
基幹理工学部 情報理工学科 石川 博

今の人工知能ブームは2012年に始まりました。写真の理解は人間には容易ですが、特定の物ではなく犬とか猫とかの種類を認識する一般物体認識は、機械には不可能でした。そのコンペティションで10年前、大差をつけて優勝したのがディープラーニングという、現在のブームの火付け役になった技術です。なぜ一般物体認識が難しいかというと、例えば犬に見えるということの、一般の犬にあてはまり猫には当てはまらないような定義、いわば犬猫分別の法則を見つけることが難しいからです。それは今でもできませんが、ではどうしたのかというと、定義することはあきらめて、多くの例を機械に見せて、こういうのが犬だとわかってもらった、つまり機械に学習させたのです。何十年も研究されてきた機械学習がついに結実したのがディープラーニングでした。その後、視覚だけでなく音声認識、自動翻訳などに広く使われるようになり、スマホなどに実用化されました。

人工知能は、人間の頭脳の代わりを機械にさせるという長年の夢に一歩近づいた応用ですが、一方で機械学習は意外なところにも使われ始めています。例えばタンパク質の構造予測で飛躍的な高性能を実現しました。タンパク質は、約20種類のアミノ酸が一定の配列でつながった鎖ですが、その立体的な形は、細長い鎖というより、折りたたまれて複雑にからみあった塊です。無限と言ってよいほど多様なタンパク質の化学的性質や医薬品としての機能は、立体形状で決まります。例えばウイルスはタンパク質でできているので、感染性の解析やワクチン開発には、タンパク質の立体構造を知ることが重要です。また人間もタンパク質でできていますが、その一部が「間違って」折りたたまれるため起こる病気もあります。アミノ酸配列は遺伝子配列から決まるため、遺伝子の効果を知る上でも、アミノ酸配列からの立体構造予測は重要です。タンパク質を合成し電子顕微鏡や核磁気共鳴装置で立体構造を解析するには膨大な時間とコストがかかるので、シミュレーションで予測したいのですが、それに機械学習が劇的な性能向上をもたらしたのです。

これが機械学習の応用として意外なのはなぜでしょうか。アミノ酸の鎖がある立体形状に落ち着くような物理的過程を予測するには、その過程をシミュレートするのが普通の考え方で、実際従来は物理・化学の多様な知見を用いて予測してきたのです。ところが機械学習では、科学的知見・手法をほとんど使わず、入力(アミノ酸配列)と出力(立体構造)の関係を「学習」させます。入力から答えを当てさせ、正解と比べて、より近い答えを出すように人工ニューラルネットワーク(図)のパラメーターを少しずつ変えていくのです。イメージ的には、入力と大量の数字をよく混ぜ、出てくるものを見て、いい方へその数字を変えていくというもので、そこには法則のようなものは何もないのです。人工知能では、法則を見つけることが難しく長年苦心した問題が機械学習で解決されたのですが、多くの法則が知られる物理や化学で、それらを使わない機械学習が、法則と人知を駆使した手法を凌駕したのが意外なのです。

しかしこのような例は他にも次々と出てきており、基礎物理学の分野でさえ機械学習の応用がされはじめています。一般に我々の未来予測は、短期的には変化を過大に、長期的には過小に評価する傾向があります。新技術の想像がつきやすい影響は過大評価し、思ったほどでもないとがっかりしがちですが、長期的な影響は我々が考えるよりも大きいと思うべきでしょう。今は想像もできない、工学の常識を無視したような人工知能による技術が、50年後の世界にはあふれているかもしれません。