「Watsonの引き合いが多く、日本IBMでは対応しきれないほどの案件を抱えている。それも億を超える金額の案件ばかり」。IBMが提供するAIブランド「Watson」は、ビジネス向けソリューションとして、AI市場を牽引している。好調が伝えられる一方で、「期待した効果が得られず、利用を止めた企業が出てきている」というウワサも。真実はどこにあるのか。Watsonの現在地を追う。(取材・文/畔上文昭)
新卒採用選考にWatson
ソフトバンクは5月29日、新卒採用の選考にWatsonを活用すると発表した。人気企業には就職活動中に学生から応募書類が殺到し、人事担当者はその確認だけでも膨大な時間がかかる。書類選考通過の判断が遅れると、優秀な学生を他社にもっていかれてしまう。Watsonの活用により、書類確認の作業時間を短縮するのは、単なる作業負荷の軽減だけでなく、優秀な学生の獲得という点でも必要とされているのである。
採用選考をコンピュータが担うことに対しては、人間として危機感を覚えるが、ソフトバンクでは合格基準を満たす応募者かどうかの判断をWatsonに任せ、選外でも人事担当者が内容を確認し、合否の最終判断を下す運用になっている。Watsonの役割は作業負荷の軽減にあり、現時点の最終判断は人事担当者ということである。
新卒採用選考に使用されたWatsonは、ソフトバンクが保有する過去の採用データを学習。そのWatsonに応募者のエントリーシートデータを読み込ませ、自然言語分類サービス「Natural Language Classifier(NLC)」を使って内容を認識し、合格基準を満たすかどうかを判断する。NLCはWatsonの核となるサービスであり、IBMのクラウドサービス「Bluemix」上でAPIとして提供される。
二種類のWatsonブランド
「これは始まりに過ぎない」。Watsonが2011年2月16日、米クイズ番組「Jeopardy!」での勝利を振り返り、IBMのエンジニアが語った。以降、WatsonはAIのブランドとして地位を確実なものにしていく。
IBMは、そのブランド力を生かし、さまざまなサービスや製品において「Watson」の名前を付けている。そうしたなかで、Watsonは大きく二つに分けることができる。
一つは、Bluemix上でAPIとして提供されるWatson。ソフトバンクが日本国内の代理店として提供している。Watsonを採用したサービスや製品は、このWatson APIを一般的に活用している。
もう一つは、テキストマイニングツールの「Watson Explorer」。オンプレミス向け製品である。Watson Explorerの販売は、IBM経由で仕入れることになる。
Watsonの都市伝説は本当か
日本語版APIの提供開始を発表したのは2016年2月18日だが、Watsonは企業向けAIサービスとして圧倒的な知名度を誇る。それを妬んだのかどうかはともかく、Watsonにはいくつかの都市伝説がある。実際はどうなのか、Watson APIを活用したサービスや製品を提供しているエコシステム・パートナーに聞いた。
都市伝説 1
訓練データの用意が大変
日本IBM
林 克郎・ワトソン事業部
事業企画推進部長
ユーザーは、クイズ番組に勝利したときのWatsonをイメージして、同様の賢さを想像しがちである。例えば、Watsonに質問をしたら、世の中の膨大なデータから最適な答えを返すというもの。もちろん、そんなことはない。
「クイズ番組に勝利したWatsonは、番組に特化した学習をしている。どのクイズ番組でも勝利できるというわけではない」と、日本IBMの林克郎・ワトソン事業部事業企画推進部長は語る。Watsonには、答えを返すためのデータが必要である。とはいえ、コールセンターであれば、過去の問い合わせデータやマニュアルがある。自然言語検索を得意とするWatsonを活用し、業務を効率化したいと考えるのであれば、そうしたデータを保有しているのが一般的と考えていいだろう。
一方、訓練データ(トレーニング)の用意が大変との声がある。確かにWatsonの応答品質を左右する部分だけに、ある程度の作業負荷が発生すると予想できる。
アイアクトの西原中也・取締役COO 人工知能・コグニティブソリューション担当は、導入期間を例に作業負荷の大きさを次のように解説する。「Watsonを活用したチャットボットのシステムを構築するだけであれば、2日以内に実現できる。ただし、データの用意で2か月ほどかかる」。訓練データをどのようなかたちで用意するかは、重要なポイントになるという。
アイアクトの西原中也・取締役COO 人工知能・コグニティブソリューション担当。
同社は、Watsonの導入と開発の支援でビジネスを展開。
経験を生かし、Watson導入セミナーを開催している。自社開発でWatsonを採用したチャットボットプラットフォーム「Cogmo Attend(コグモアテンド)」をベースとしたシステム開発にも取り組んでいる
ウィルウェイの岩政 仁・未踏事業部事業部長は、「Watsonはとても簡単に使うことができるが、訓練データを用意するのは難しい。例えば、『ログインをしたい』という意味の問い合わせではカタカナとアルファベットのどちらを使うのかなど、ユーザーのオペレーションを想像したデータを用意しなければならない。同様に、一つの単語に対して、さまざまな言い回しを考える必要がある。とはいえ、これはWatsonだけでなく、他社サービスでも同様だといえる」と、訓練データの準備は一般的に大変だと指摘する。その一方で、「Watsonでは、ユーザーが訓練データを作成できる。データを用意し、CSVファイルでアップロードしてもいい。チューニングもやりやすく、手軽に利用できる」とも。その扱いやすさは、Watsonが支持される理由の一つになっている。
ウィルウェイの岩政 仁・未踏事業部事業部長。
同社は対話型のサイト内検索サービス「SQ-Easy(スクイージー)」でWatsonを採用。
また、WatsonのSTTを採用した「株主総会支援システム」を新たに開発。
事業の柱とすべく、販売に注力している
訓練データの作成が大変なことから、なかには「質問に対する答えを、一対一ですべて用意する必要がある」とのうわさがある。そのうわさが本当であれば、単なるマッチングシステムで済む話となり、AIの要素が皆無となる。「もちろん、一対一ではない。Watsonは質問の意図を理解する。受験勉強で過去問を解くときと同様で、経験しておけば別の問題も解けるようになる」と、IBMの林部長は都市伝説を否定する。
Watson 基礎用語
Speech to Text(STT)
音声データをテキスト化する「音声認識」サービス。すぐに利用を開始できるが、ディープラーニングにより、認識精度を向上させることもできる。ちなみに、テキストから音声を返す「Text to Speech」というサービスも提供されている。
Natural Language Classifier(NLC)
テキストを意図に応じて分類する「自然言語分類」サービス。NLCは、テキストの背後にある意図を解釈し、分類して戻す。その戻り値を使い、次のアクションにつなげる。利用にあたっては、分類したいテキストのサンプル(訓練データ)を用意して、学習させる必要がある。訓練データは、文章と、その文章が属する分類の種類を指定したCSVファイルで作成する。
Retrieve and Rank(R&R)
NLCの分類にもとづいて最適な回答を探し出す「検索およびランク付け」サービス。R&Rには、質問に対する回答候補となるデータ(論文やFAQ集、マニュアルなど)を投入しておく必要がある。
Watson Explorer
テキストマイニングツール。STTやNLC、R&Rなどは、Watson APIとしてIBMのクラウドサービス「Bluemix」上で提供されているのに対し、Watson Explorerはオンプレミス製品。自然言語解析などのWatsonの基本機能を搭載し、テキストマイニングの精度を上げている。日本IBMが開発し、世界に展開されている国産ツールである。
[次のページ]都市伝説 2 導入費用は億円を超える