視点

グーグルが進める「知の新世紀」

2006/09/25 16:41

週刊BCN 2006年09月25日vol.1155掲載

 検索エンジンのグーグルが興味深いサービスを相次いでスタートさせている。米国の大学図書館や公共図書館と提携、著作権の切れた蔵書をデジタル化し、グーグルで検索できるようになった。

 アリストテレスからシェークスピアまで、だれでも無料で検索し、全文が読めるのだからすごい。全世界の知を整理するという同社の意気込みが感じられる。

 日本でのサービスも検討中だそうだが、和書をデジタル化するにあたって日本語をスキャンする技術的課題があり、サービスインはまだ先になるという。

 和書のデジタル化では、青空文庫が有名だ。ボランティアが、著作権の切れた本、著者が了承した書物をデジタル化し、無料で公開している。だが、グーグルが日本でサービスを始めたらひとたまりもない。もし、日本でサービスを始めるなら、彼らの努力を無にするような形で提供してはならないだろう。

 もうひとつは過去200年分の新聞記事が検索でき、全文が読めるニュース・アーカイブ・サーチである。米国のニューヨーク・タイムズ、ワシントン・ポスト紙、タイムなどのメディアと提携、サービスを始めた。検索結果が時系列で表示される。検索だけは無料だから、試しに東条英機で検索すると、1943年11月16日付のワシントン・ポストの記事がトップに出てくる。東条が戦時内閣の独裁者として地位を固めたという見出し部分が読める。本文は有料で、1本3ドル95セントかかる。4本まとめて購読すると10ドル95セントである。それ以前の東条関連記事は1938年までさかのぼれる。

 古い記事が見出しだけでも無料で、しかも世界のどこからでも読めることは確かにすごい。それに比べて日本はデジタル化で遅れている。朝日新聞は昭和元年からの紙面イメージをCDで販売しているが、ネットで検索できるのは1984年以降しかない。それも有料である。

 日本語の書物、新聞ともスキャナで自動的に読み込みデジタル化するのが難しい。旧字体があるし、ルビもふってある。だからといって、グーグルが進める全世界の知を整理する動きに日本が乗り遅れていいはずがない。グーグルがなぜこのような膨大な文化事業を推進できるのか謎だが、インターネットが知の新たな階段を上ったことは確かだ。

経産省が日の丸検索エンジン開発に莫大な予算を計上するだけで、知の新世紀を乗り切ることができるだろうか。
  • 1