特集
カテゴリー
タグ
メディア

10周年特集ーPAST ◀▶FUTURE

人間の代弁者になる? シーマン・斎藤由多加氏が考える「次世代日本語会話エンジン」

人間の代弁者になる? シーマン・斎藤由多加氏が考える「次世代日本語会話エンジン」
Image: Artram/shutterstock

「〇〇がおいしい店を探して」とスマホに話しかけ、「気分が上がる曲をかけて」とスマートスピーカーにリクエストする。

なんとなく便利になった気もしますが、スマホやパソコンにキーボード入力する代わりに、音声入力で指示を出しているだけとも言えます。

では、IoTを含めたテクノロジーの進化により、音声による人・モノ・サービスとのコミュニケーションは、私たちのこれからの生活をどのように変化させてくれるのでしょうか?

そこで、水槽の中にいる謎の生き物とマイクで会話しながら飼育するシュミレーションゲーム『シーマン ~禁断のペット~』を開発し、世界のゲーム業界に衝撃を与えた、斎藤由多加さんに、自身が現在開発している次世代日本語会話エンジンと、音声認識技術を基にしたこれからのコミュニケーションのあり方について聞いてみました。

saito_prof
斎藤 由多加(さいとう・ゆたか):ゲームクリエイター。 早稲田大学理工学部建築学科卒業後、株式会社リクルートを経て1994年オープンブック株式会社を創業。『The Tower』『シーマン ~禁断のペット~』などのゲーム作品を開発したことで知られる。2014年大手住宅メーカーの『喋る家』開発など先端技術分野に関与。2017年シーマン人工知能研究所設立(所長)。日本語口語の会話エンジンの開発を行なっている。アップル日本上陸の軌跡を綴ったノンフィクション「林檎の樹の下で」(復刊、光文社)ほか著書多数。
Photo: 木原基行

言葉に意味が宿っている、日本語会話エンジンとは?

communication_engine_02-1
Image: Sudowoodo , Nadia Snopek/shutterstock

── 人工知能(AI)が言語を話す「会話AI」の研究は、ディープラーニング技術により大きく進歩していると言われますが、斎藤さんは異なるアプローチから研究・開発されているそうですね。具体的には、どのような方法で、何を目指しているのでしょうか?

斎藤氏:音声コマンドで調べ物や買い物をするためにビッグデータで処理するものではなく、もっと人間の心の近くにあるような言葉。たとえば、「なんで振られたんだろう?」といった、ビッグデータには正解がない悩み相談にも答える、会話主流のエンジンをつくっています。

ポイントになるのは、日本語の会話特有の「省略補完ニュアンス」の3つを理解して、日本語を処理することです。

先ほどの「なんで振られたんだろう?」というつぶやきには主語がありません。省略しても意味を補完する文脈とニュアンスがあれば、「私は振られたんですが、なぜ私は振られたのですか?」と言わなくても、誰に対して、その理由を語らなくても、会話の意味が相手に伝わります。さらに、「なんで」を強調するなど、省略と強調が会話のリズムを生み出してメロディーとなり、そのメロディーが情報を持つ言葉になります。

また、日本語の会話は、語彙形成言語だと思っています。たとえば、語尾が「」と「」では、込められている思いみたいなものが変わります。医者が「〇〇(相手)さんは、ガンです」と告知した場合、聞いた相手がガンだと知らなかったことがわかります。しかし、「〇〇(相手)さんは、ガンですよ」と言うと、相手は自分がガンだと知っていたことになります。

こうした日本語による会話をニュアンスまで含めて認識して、どのような言葉で返すか。話しかけられた言葉をAIが人称変換・識別して言葉を返すわけですが、返す言葉そのものに意味が宿っているかがポイントになります。既存のAIとディープラーニング、ビッグデータでは対応できないので、そのための研究開発を進めているわけです。


人工知能が、日本人らしく会話するために必要な7つのキーワード


── 以前、斎藤さんとゲームAI研究者の三宅陽一郎さんとの対談で、三宅さんは海外発の人工知能は人間のサーヴァント(召使い)と語っていました。では、現在、研究開発を進めている日本語会話エンジンと人間は、どのような関係性になるのでしょうか?

斎藤氏:勝手に「1.2人称」と言っていますが、自分の分身のような人工人格を持つ代弁者です。

マンガ「ゲゲゲの鬼太郎」で、自らの知見で鬼太郎をサポートする目玉のおやじ。わかりやすく言えば、自分のことを一番理解している味方でありながら、1.2人称の0.2の部分で客観的で論理的な思考を持つ存在。一般的な職業でたとえれば、信頼関係にある顧問弁護士のようなものですかね。

自分を補ってくれる、1.2人称のAI代弁者とは?

communication_engine_04
Image: Sudowoodo , Nadia Snopek/shutterstock

── ではなぜ、1.2人称の代弁者が今後の私たちの生活に必要なのか? その存在意義とは?

斎藤氏:ネットの世界で、若い人たちはサブアカ(サブアカウント=同一人物が複数のアカウントを所有)を持っている人がいますよね。SNSのなかで、自分の別人格をつくって自分を擁護したり、リア充であること、自らの考えや嗜好を世界中に発信しています。しかし、その一方で、心の中に内在している本音みたいなものを話せるツールがない。

自分の傍らにいつもいて、ことあるごとに自分を補ってくれる。自分とはちょっと違う1.2人称の別人格が、自分の代わりに代弁してくれるニーズは高く、AIの世界で1つの大きなジャンルになると思っているからです。

たとえば、気まずい事情があり、音信不通でしばらく時間が経ってしまった相手に連絡を取りたいとします。リアルな世界では、そのまま諦めるか、偶然にゆだねて、再会した時に「お、よかった。元気ですか?」となることが多いわけです。

そこで、メールでも電話でもない、AI代弁者の登場です。自分の気持ちを託されたAI代弁者が、相手のAI代弁者に、「自分は代理人なんだけど、元気でいますか? 彼が話したがっているんだけど、どうでしょうか?」「わかった。そういうことね。伝えておくね」といったやりとりをするわけです。

実はこのやりとり。1999年の12月に、クリスマス期間限定で発売したゲーム『クリスマスシーマン 〜想いを伝えるもうひとつの方法〜』で試しているんです。

たとえば、伝えたいメッセージをシーマンに託して相手に送ると、「あいつは、会いたがっているんだけど...」と、シーマンが自分の声に人称変換して相手に伝え、「どうやら、もう会いたくないらしい」という相手の返事を聞いて、持ち帰ってくれるというものです。

communication_engine_02
人の顔をしたキモかわいい容姿とふてぶてしい態度に、人間は親しみを感じて話しかけるようになる。育成シミュレーションゲーム『シーマン』の知見が、どのように生かされるのか?
(c) 1998-2012 VIVARIUM Inc.

このときは、お互いが同じゲーム機とゲーム本体を持っていなければコミュニケーションできませんでしたが、いまならクラウド上のAIで動かすことができるので、会話のやりとりに制約がありません。

私たちには、ゲーム『シーマン』のシリーズを開発した知見があるので、『クリスマスシーマン 〜想いを伝えるもうひとつの方法〜』をリリースした1999年の20年後となる2019年12月までには、これまでお話したような片鱗を感じられるような日本語会話エンジンを、その1年前となる今年の12月には、よちよち歩きの赤ちゃんの会話かもしれませんが、動作証明だけは出しておきたいと思っています。

── 自分の分身に近い、1.2人称の代弁者がいれば、思い悩むことが減り、新しい人間関係が再構築されるなど、何かと便利な気がします。ただ、誰も手をつけていない分野だけに、その道のり・進化させる過程には、まだまだ時間が必要ということでしょうか?

斎藤氏:話しかけられた日本語に対して、まともに受け答えするのが第1フェイズ。笑ったり泣いたりといった豊かな感情で受け答えができたり、代弁者としての機能を発揮するのは第2フェイズからですね。

日本語の会話(口語)と真摯に向き合うと、課題解決すべき項目がいくつも出てきます。

たとえば、テキストにするのが難しい、笑いとかため息といった感情の本質をどのように認識すべきか? 相談された答えを持っていなくても、一緒に悩んだり、落ち込んだりする同調表現などですが、現在つくっている言葉のニュアンスやメロディーをくみ取れるストレッチャブルな日本語辞書が、進化する過程で課題が解決できればと思っています。

現在、医者が見落としそうなレントゲン写真やCTスキャンをAIが機械的な作業で間違いない判断をする時代に変わろうとしています。ただ、AIやディープラーニングの研究開発に関わっていると、ファンタジーの部分がまったく感じられないんです。僕はエンタテインメント業界の人間なので、あれこれ批判もあるでしょうが、おもしろいものは、絶対に受け入れてもらえると思ってやっています。

AIが社会を変革する時代のコミュニケーションとは?

communication_engine_03
Image: Nadia Snopek/shutterstock

── では、人と人の間に介在するAIコミュニケーションツールが登場することで、私たちの生活に何をもたらしてくれると思いますか?

斎藤氏:AIの話をすると仕事が奪われるとか、ディストピアみたいなことばかり言われることが多いですよね。AIが自動車を運転して、事務処理が自動化され、ロボットが畑を耕せば、それほど働かなくてもいい時代になる。でも、そこを起点に考えるべきだと思います。

人間が暇になる時代が来ると、競争原理で、忙しい人と暇な人に二分化されますけど、現在でも会社員の勤務形態が崩壊しつつあり、副業がOKになっているので、老後の不安はあっても、働き口や仕事について不安に感じることはないんじゃないですか。

ただ、働き方が変わると、人と人の接点が増えるというか、人間関係が複雑になりがちなので、人の心の領域やコミュニケーション、人間関係をサポートするツールは今以上に必要になると考えています。「人間関係保繕修復ペット」みたいなコミュニケーションツールがあったらいいなと思いますね。

── 最後に、もしかしたら、世界中のシーマン・ファンが気になっているかと思いますが、現在開発中の日本語会話エンジンは、ゲーム『シーマン』に搭載されることはあるんでしょうか?

斎藤氏:今は考えないようにしています。目指している日本語会話エンジンを完成させることに集中していますからね。


1.2人称のAI代弁者。人間関係保繕修復ペット。斎藤さんの話には、いつも驚かされるキーワードが登場します。しかし、テクノロジーの進化が想像を超えるワクワクした世界をつくり出すためには、常識にとらわれない発想と新しい価値を創造していくしかありません。今年の12月と、来年2019年の12月に斎藤さんが何を発表するのか? 期待してしまいます。


Image: Artram(1 , 2), Sudowoodo , Nadia Snopek(1 , 2)/shutterstock

取材協力:シーマン人工知能研究所

香川博人

swiper-button-prev
swiper-button-next