Botづくりを始める前に(2)

Botの機能の三つのタイプ

パーソナル・アシスタント・システムのボイス・インターフェースとしてのBotの役割は、機能面で大きく三つのタイプに分けられる。

第一のタイプは、もともとのハードウェアやアプリが持っていた、入出力インターフェースのボイス化を目的とするBotである。これは、問題(「会話」)のドメインも限られており、実装は比較的容易である。

第二のタイプは、「情報」や「知識」を、ボイスを通じて提供するタイプのBotである。現在の「音声検索」と共通の技術である。このBotを可能にするバックグラウンドの検索エンジンの開発は容易ではない。ただ、Bot(広くは人工知能技術)と検索の関係は、ディープ・ラーニングのブームの陰に隠されている感があるのだが、重要で深いものだ。

第三のタイプは、第一でも第二のタイプでもない、いわば、「汎用の会話Bot」である。多くのコンシューマが期待しているのはこのタイプなのかもしれないし、多くの企業と開発者が夢見ているのも、このタイプかもしれない。ただ、この1, 2年で、この機能を実現できることはないだろう。

第三のタイプでは、現時点で現実的に可能なことは、「ああいえば、こういう」という人の手による「シナリオ」を、できるだけ沢山かき集めることに帰着するだろう。

「人工知能」という触れ込みなのに、蓋を開けてみたら、中に沢山の小人さん(といっても、普通の人間)が詰め込まれていて、「ああ言われれば、こう言う」というシナリオづくりに汗をかいているだけという、笑えないことになる。(まあ、「戦争」に勝つには、それも必要なのかもしれないが。)

何から始めるべきか? 第一のタイプから。

僕がエンジニアに勧めたいのは、第一のタイプのBotでスキルを高めておくことだ。

Iotでハードを作っている人は、そのハードのインターフェースのボイス化に挑戦する。スマートフォン・アプリやWebアプリを作っている人は、そのアプリのインターフェースのボイス化に挑戦する。部分的なものでいいのだ。

ポイントは、二つあると思う。

一つは、自作ハードであれ、Webアプリであれ、スマートフォンからのコントロールを追求すること。様々な、ボイス・アシスタンスのアプライアンスが登場すると思うのだが、我々にもっとも身近なプラットフォームは、スマートフォンだ。

そうしたスマートフォンからのハード、アプリのボイス・コントロールに対する市場ニーズは、確実に存在するし、そこで得たノウハウは、あとできっと役に立つ。

もう一つのポイントは、ボイス・インターフェースにも、UX ユーザー・エクスペリエンスが存在するという観点を、きちんと持つことだと思う。

画面のデザインだけが、UI/UXである時代ではなくなるのだ。よりよいUXに対するニーズは、ボイス・インターフェースでも、基本的なものだ。新しい、知見と経験が生まれることを期待している。

コメント

このブログの人気の投稿

TPU論文の翻訳(1)

可微分ニューラルコンピュータとは何か(1) 概論

TensorFlow Foldについて