三井情報(MKI、下牧拓社長)は、SAPジャパンのインメモリデータベースソフトウェア「SAP HANA」を用いて、バイオサイエンス分野でのビッグデータ解析・検証に取り組んでいる。検証の第一弾として、癌研究のゲノム(全遺伝情報)解析と創薬開発プロセスの化合物データ解析に、ビッグデータ分析を活用する実証実験を進めている。R&Dセンター ITリサーチ室の濱本佳政室長とR&Dセンターバイオサイエンス室の菊池紀広室長に取り組みを聞いた。

 MKIは1975年、バイオサイエンス分野の研究開発に着手して以来、システム開発やコンサルティング、調査、多検体サンプル解析&マーカー探索ソフト「2DICAL」やハイスループット脂質同定システム「Lipid Search」などの開発・販売を手がけてきた。しかし、「最近は、事業が縮小気味だった。2011年にR&Dセンターを立ち上げて、てこ入れを図っている」(濱本室長)という。

三井情報の濱本佳政ITリサーチ室室長

 R&Dセンターが取り組むテーマの一つがインメモリ。「HANA」をデータ基盤とするリアルタイム情報分析手法を確立し、ビッグデータ解析への適用を目指している。菊池室長は、「『HANA』はデータをためながらリアルタイムに高速処理できる」と語る。

 バイオサイエンスの研究開発は、膨大なデータ処理の効率化が新薬の開発や疾病要因の特定に大きな影響を与える。研究データは今後大幅に増大することが予想されるので、新薬開発の時間短縮・コスト削減を実現するにはデータ解析の精度向上と高速化、可視化する仕組みが必要不可欠。その仕組みとして、「HANA」を採用した。

 現在取り組んでいる実証実験の一つが、癌細胞ゲノム解析だ。癌はゲノムの異常が原因で、癌化のメカニズムの解明や治療薬の開発にゲノムの変異解析が重要な役割を果たす。そこで、次世代シーケンサー(ゲノムの塩基配列を決定する装置)という技術を活用し、癌のゲノム全体の塩基配列を決定。膨大に生み出される癌細胞と正常細胞のゲノムを比較し、癌の原因となる遺伝子異常の探索を進めている。MKIは、「HANA」を解析に適用することで、癌遺伝子探索を効率化しようと試みているのだ。

 菊池室長は、「癌患者のゲノムデータを調べ、健常者との違いを見つけることで薬の投与や新薬の開発の可能性を探るのに、現状では一人あたり2日かかる。『HANA』でどの程度を短縮できるかはわからないが、遅くて1時間、できれば数分、数秒が理想だ」と話す。

菊池紀広バイオサイエンス室室長

 もう一つが創薬におけるデータ解析だ。製薬企業での新薬の開発は、数百万の化合物のライブラリから薬の候補となる化合物を選択。実験や臨床試験などの研究開発を経て、はじめて薬として市場に出る。化合物データベースをコンピュータで選別して化合物を選び出せば、研究開発の期間を短縮することができる。ただし、膨大な化合物データの解析を実施し、薬らしい化合物かどうかを予測する必要がある。MKIは「HANA」上で解析を実施し、予測時間の短縮を試みている。

 「研究機関は、これまでスーパーコンピュータを活用して限られた時間のなかでゲノム解析や創薬研究に取り組んできたが、もっと気軽で高速、安価にデータ処理できるようになる」と、濱本室長は「HANA」に期待と寄せる。

 今後、健康・保健分野への「HANA」適用を検討し、さらにその先も見据えている。濱本室長は、「これまで得意としてきた小売・流通分野で、これまではとても処理できなかった膨大なデータを、『HANA』を活用することで単に高速処理するのではなく、ビジネスに役立てられるようにする。親会社が商社という強みを生かして分析テンプレートを開発するなど、他社と差異化を図りたい」と説明する。

 すでにMKIは、SAP上海ラボとの共同研究体制の構築に着手している。「将来は、上海ラボと独本社に人員を常駐させることも検討したい」(濱本室長)という。ただし、「SAPジャパンはマーケティングのあり方やビジネスモデルを一緒に考えるという面では心強いが、技術者があまりおらず、技術面のサポートは乏しかった。それでも、今回は上海ラボで技術検証できるようにサポートを強化してくれている」という。これを契機に、バイオサイエンス分野でグローバル規模での事業展開を模索する。(信澤健太)