書誌データベースに新風起こる
絞り込み中心の検索サービスとは一線画す
連想検索エンジンを駆使して図書検索の効率を飛躍的に高めるプロジェクトが国立情報学研究所の研究者を中心に進められている。関連や類似から検索対象を広げていく新しい手法で、数百年前の古書から現代の新書、文化財などを幅広く検索できる仕組みを構築。検索大手のグーグルやヤフーなど「絞り込み」中心のスタイルとは一線を画す新しい検索サービスの提供を目指す。(安藤章司●取材/文)
■「連想、類似、関連」を重視した、使い勝手のよい検索サービス 膨大な情報の中から必要な情報にアクセスするのは容易なことではない。国立情報学研究所の高野明彦教授を中心とする研究グループは、ユーザーの思考を支援しながら必要な情報に迫っていく純国産の高速検索エンジン「汎用連想計算エンジン(GETA)」を開発。情報へのアクセス効率を飛躍的に高めた。
出版業界などと連携した約1000万件の国内外の書誌データベースや神田古書店連盟から協力を得て構築した古書データベース、文化庁の文化遺産オンラインなどGETAの適用範囲を次々と拡大している。
図書館の蔵書や文化財などを検索するエンジンはこれまでにもあったが、GETAは従来のキーワード検索とは異なるユニークな構造を持っている。キーワード検索が「絞り込み」を基本とするならば、GETAは「連想、類似、関連」を重視する。調べたいテーマを単語や文章で入力すると複数の関連するトピックや類似するキーワードを表示。入力情報に関連するトピックやキーワードを的確に提示することで、ユーザーの連想や思考を支援する。
例えば、「東洋哲学 古典」をグーグルで検索してみよう。このテーマが教育機関のカリキュラムとして広く採り入れられていることから「研究業績一覧」「東洋哲学専修紹介」「開設授業科目」などのウェブページが出てくる。
これを国内最大規模の古書店街・神田神保町エリアの古書店約180店が参加する総合書籍案内サイト「ブックタウンじんぼう」に組み込まれているGETAで検索する。すると1943年に出版された「東洋政治哲学」などの書籍名が出てくるのに加え、「中国」「儒学」「大乗」「展望」「本質」など連想されるキーワードを複数表示する。このキーワードを選択して再度検索をかけると「漢文」「訳」「文庫」などさらに踏み込んだキーワードが表示される仕組みだ。キーワードの選択次第で表示される書籍名もより関連性が高いものに切り替わる。
一般の検索エンジンでは苦手とされる長文検索も可能だ。文章の構成要素を分析して、関連するキーワードを表示。これを足がかりに情報探求を進められる。グーグルなど検索精度に優れたエンジンは一見、便利に感じられるが、実際には「『絞り込み』すぎて、大切な情報を『絞り捨て』している」と高野教授は考える。連想検索によって探求の可能性を広げていくことが大切だと話す。
■売上減続く古書店業界 ネット活用で活性化を 2005年10月から本格的な運用を開始した「ブックタウンじんぼう」はとりわけ注目度が高い。古書関連の情報はインターネットに露出することが少なくこれまで検索することが極めて難しかった領域だけに、新しい検索世界を広げる取り組みと評価されている。実現のきっかけとなったのは、古書店業界に詳しいITコーディネータでソフト開発セカンドブレーンの青木隆平社長が開発した古書店専用のEC(インターネット通販)システム「Koshoten.net(コショテンネット)」だった。
古書店業界は大口顧客の図書館や公的研究機関の予算縮小などのあおりを受けて売り上げの減少傾向が続いており、ECの導入で打開を図る機運が高まっていた。コショテンネットへの引き合いが増え、ECサイトの開設となれば図書名や目次、概要などを紹介する情報がデジタル化される。
この動きにいち早く目をつけたのが高野教授だった。古書の概要は古書店が積み上げてきた知識が凝縮されている。これをGETAの新たなターゲットとすれば「古書店の頭脳を借りて、歴史上の人に迫れる」と直感した。さらに複数の古書店が持つ情報を横断的に検索できるようにすることで、GETA本来の関連や類似に基づく連想検索のパワーで、これまで触れる機会が少なかった情報へ次から次へとアクセスする道が広がる。
■グーグルなどでは見つけにくい稀少な書籍も見つかる 導入の過程では古書店のビジネスとの折り合いをどうつけるかが課題となった。ECや検索データベースへの対応などを進めることと、1点モノの古書の希少価値や店独自の値付けなどオープンにするには馴染まない側面がどうしても出てくるからだ。
青木社長は経営とITの橋渡しをするITコーディネータとしてのノウハウを生かし、「古書の一部でも連想検索の対象となれば古書店街への集客増につながる」と古書店1軒、1軒を回って説得。ネットを活用して新たな顧客層の開拓が求められていたこともあり、神田古書店連盟の全面的な協力を引き出すことに成功した。
神田古書店連盟幹部の東京都古書籍商業協同組合神田支部・中野智之副支部長(中野書店専務)は、「店主の世代交代もあり、デジタル化はより進む」と予測。「GETAのユーザーが増えることで、来店数の増加やネット通販の拡大が見込める」とビジネスの拡大に手応えを感じる。セカンドブレーンでは今後、コショテンネットを全国の古書店に展開することでGETAとの協調関係をさらに強化することを視野に入れている。
高野教授は05年12月に自らNPO法人・連想出版を立ち上げ、ブックタウンじんぼうの運営や新書案内サイトの「新書マップ」を新設するなど「自らGETAを活用した先進事例の創出」(高野教授)に取り組んでいる。将来的にはそれぞれのデータベースを横断的に検索できるようにすることで、グーグルやヤフーとは違う検索サービスの提供に力を入れる。これまでインターネットに露出することが少なかった知識資産の有効活用が期待されている。
 | 汎用連想計算エンジン(GETA) | | | | | GETAはユーザーが入力した情報から連想して、関連する確率が高い順に検索結果を表示。かつキーワードも出力する。これら提示された情報から、ユーザーが重要だと判断した項目にチェックを入れて再度検索をかける。こうした作業を繰り返すうちに必要な情報を |  | 浮き彫りにする仕組み。どの情報がより重要なのかを検索エンジンに判断させるのではなく、ユーザー自らが行う点がキーワード型の検索エンジンと大きく異なる。オープンソース方式で公開されており、ショッピングサイトなど通常の商用利用も進んでいる。 | | |