ニュース

SPSS テキストマイニング分野進出 日本語版はユーザー会で公開

2002/06/17 16:21

週刊BCN 2002年06月17日vol.945掲載

 

 エス・ピー・エス・エス(イアン・スタンレイ・デュエル社長)は、仏レクシ・クエストの買収により、本格的にテキストマイニングツール分野に進出する。すでに本社がある米国では製品化が進んでおり、日本語版についても製品化がスタートしているという。「テキストマイニングツールを提供することで、SPSSの目標である解析ソリューション分野で最大のサプライヤへ近づく」と話す米本社のジャック・ヌーナンプレジデント&CEOに、テキストマイニング分野に進出することの狙いと、今後のビジネスの方向性について聞いた。

 テキストマイニングは、最近日本でも話題になり始めた新しい解析技術。これまでのデータマイニングは数値データによる構造データの分析だったが、テキストは非構造データ。分析を行うのは非常に難しかった。

 エンタープライズシステムに格納されているデータのうち約80%が非構造データで、保存されて読まれてはいるものの、分析は行われていない。テキストマイニングによって、新たなニーズが起こるとされている。

 ヌーナンCEOは、「データマイニングは5年前に騒がれるようになった。データを蓄積する業務システム、ウェアハウス、測定システムの3つが揃ったことで、今ようやくビジネスとして成立するようになった。テキストマイニングは、すでにたくさんのテキストデータが存在することを考えれば、データマイニングよりは早めにブレイクするだろう」と分析する。

 「レクシ・クエストは、今回の買収以前から協力関係をもっていた企業。2年前から2500万ドルの投資を行い、テキストマイニングツール開発のための研究を共同で行ってきた。買収に至ったのは、両社が最適な共同作業を行うにはどうすべきかを検討した結果である。レクシ・クエストは世界で最も効率的に非構造データのデータマイニングを行う技術をもっている」

 日本語版については、「開発することは決定している」(日本法人・村田悦子上級副社長)という。予定では10月初旬に開催するユーザー会での発表に向けて、開発が進んでいる。

 日本語のテキストマイニングについては、データマイニングツール「クレメンタイン 6.0」と奈良先端科学技術大学院大学が開発した日本語形態素解析のフリーソフト「茶筌(ちゃせん)」を連携させて利用できる形態のものを提供した経験がある。「本社の開発スタッフも茶筅をよく知っているので、それを利用していくべきかどうかを模索中」(村田上級副社長)という。

 クレメンタインの売り上げは日本がトップとなっているが、テキストマイニングについては「日本でもニーズが多いものの、成功例は欧米が先に出てくることになるのではないか」と予測している。
  • 1