視点

近代デジタルライブラリー

2002/10/21 16:41

週刊BCN 2002年10月21日vol.962掲載

 電子化に向けて、国立国会図書館が大きな一歩を踏み出した。

 去る10月1日に公開された「近代デジタルライブラリー」(http://kindai.ndl.go.jp/)からは、明治の本、3万冊分のページを、ウェブ経由で開くことができる。同館には、明治期の図書が都合、約16万8000冊あるという。著作権の消滅が確認されたもの、著作権関係の処理がすんだものを、今後引き続いて電子化し、公開していく予定だ。

 滅多にお目にかかれない本がならぶ書棚にウェブ経由でもぐり込み、検索機能を生かしてさまざまな角度から書籍を探し、その場で読みはじめられることの快感は、絶大だ。

 同館には、大正、昭和期の貴重な本も山ほどある。それらにも、著作権が切れたもの、切れていくものがある。明治に続き、大正、昭和へと、電子化の作業が、迅速に進んでいくことを願って止まない。

 近代デジタルライブラリーの一歩は、大きな意義をもつ。だが同時に、電子図書館の本道は、ここにはないとも思う。最終のゴールは、テキスト化だ。全文を機械可読の形に置き換えてこそ、電子化のメリットはフルに生きてくる。

 そこで、今回の成果を足場に、本道をさらに力強く歩んでいこうとしたとき、残念ながら、ここから提供されるページ画像の問題点が、浮かび上がってくる。文字のつぶれ。ざっと読み進むだけなら、それでも我慢ができる。だが、ページ画像をもとにテキスト入力を試みようとすると、途端に不満がわき出してくる。特に、問題はルビだ。

 私設の電子図書館、青空文庫の活動にかかわるなかで、本のスキャニングにも取り組んできた。

 今回採用された、解像度400dpiなら、ルビもほとんどつぶれない。にもかかわらず、提供される画像では、しばしば判読に迷う。マイクロフィルム化されたものをスキャニングしたという手順が、強いた結果だろう。貴重な実物の保護という観点から、やむを得ないとされたのだろう。

 だが、ページ画像は、デジタル環境においては、きわめて広く利用される、これこそが「本体」だ。腹を決めて、できうる限り書籍から直接スキャンし、長く使い続ける宝を、良い状態でサーバーにあげて欲しいと、切に願う。
  • 1