インターネットイニシアティブ(IIJ)グループで研究開発を担うIIJイノベーションインスティテュート(IIJ-II、浅羽登志也社長)は、独自のビッグデータ処理技術を応用して、オンライン百科事典「Wikipedia」の人気記事ランキングシステムを構築し、6月12日に一般公開した。

 2013年5月末時点で約171万ページに及ぶ日本語版「Wikipedia」のデータについて、1時間ごとの各ページビュー情報を取得し、アクセス数が多いページを順に表示。前日のデータ集計をもとにしたカテゴリ別のランキングを「急上昇TOP 10」「アクセス数TOP 10」「平均アクセス数TOP 10」などの分類で見たり、トラフィックの推移をグラフで確認したりできる。

 Wikipediaの記事は自由な複製・改変が認められ、再利用に際してライセンスに関わる懸念の少ないデータとして、自然言語処理やテキストマイニングなどの研究分野を中心に研究対象データとして広く活用されている。

 IIJ-IIは、構築したシステムでの成果を踏まえ、ビッグデータを効率的に解析するためのプラットフォームの開発を進めるとともに、技術の応用範囲を拡大していく。(ゼンフ ミシャ)