ニュース

ウイングアーク1st 10億件を1秒で処理するBI投入 Dr.Sum Ver.5.0の開発秘話、札幌で聞く

2017/09/28 09:00

週刊BCN 2017年09月25日vol.1695掲載

 ウイングアーク1st(内野弘幸・代表取締役社長CEO)は10月5日、6年ぶりにメジャーバージョンアップした主要BI(ビジネス・インテリジェンス)製品の集計・分析プラットフォーム「Dr.Sum Ver.5.0」を発売する。世界に挑み続けてきたDr.Sum。一方で、性能や市場拡大などに限界も見え始めていた。3年ほど前、開発トップが決断したのは、「100億件のデータを1秒で実行」できる製品を開発すること。新たにインメモリデータベースエンジンを採用するなど、徹底的にスピードを追求し、「もう一度世界に挑戦する」(内野社長)。そのための製品として、5.0は、そのデータベースエンジンを含め一から開発した。Dr.Sum開発の主軸拠点である「札幌オフィス」に乗り込み、3年余りの奮闘を取材した。(取材・文/谷畑 良胤)

ハイブリッド型が超高速を実現

Dr.Sum Ver.5.0は、全データをインメモリ化することなく運用可能。これにより、対象となるデータ集計の高速化が図れるほか、効率のよいサーバーリソースによる運用を実現。複数のインメモリサーバーで負荷分散することもできる。障害発生時など、インメモリのデータを利用できない際には、自動的に従来方式で応答する。「インメモリ化する」というチェックボックスを押せば、テーブル単位で設定ができる。

 ウイングアーク1stが9月5日に発表したプレスリリースにDr.Sum Ver.5.0には、こう説明されている。「数百億件のデータを高速集計できるインメモリデータベースエンジンと、Webブラウザ、Excelを利用した使いやすいインターフェースにより、集計・分析・レポート業務のスピードアップと効率化を支援する」。5.0のエンジンには、インメモリ方式を新たに採用したことがわかる。
 

Dr.Sum Ver.5.0の開発を主導した幹部陣
(左から、笹原徹・技術本部Dr.Sum開発部部長、
島澤甲・執行役員CTO技術本部本部長、内野弘幸・代表取締役社長CEO)


 ただ、世界で競合するSAP HANAなどインメモリ方式を採用する他社と異なるのは、ハードディスクとSSDに保存したデータから応答する従来方式と、インメモリ方式の両方を併用できる「ハイブリッド・インメモリエンジン」と呼ぶ仕組みにしたことだ。この新開発エンジンによって、従来製品比で数十倍の高速化を実現。「10億件のデータ集計を1秒で実行できる」までに性能が上がった。1テーブルあたり従来の4億件が20億件まで格納できるようになったため、数百億件のデータ集計にも対応できる。この核となるエンジンに帰着するまで、開発陣の試行錯誤が続いたわけだ。
 

札幌市にある「札幌オフィス」で、Dr.Sum Ver.5.0の開発に奮闘した開発陣

 Dr.Sumの現行バージョンは「Dr.Sum EA Ver.4.2」。最新バージョン(Dr.Sum Ver.5.0)の名称からは、現行にある「EA=Extended Architecture(拡張アーキテクチャ)」の文言が消えた。5.0は、「もはや、拡張アーキテクチャでない」(島澤甲・執行役員CTO技術本部本部長)ことや、何より「再ブランド化する」(同)という意思が込められているという。Dr.Sumの初期バージョンは、同社に統合される前の旧ディジタル・ワークスに在籍していた“天才開発者”の頭のなかにあるロジックで開発。そのコア部分は、世界に類をみない「カラムナ型データベース」の技術だった。Dr.SumのVer.1から現行の4.2までは、「このコア部分に付け足して新しいバージョンを継承してきた」と、札幌オフィスの笹原徹・技術本部Dr.Sum開発部部長は振り返る。

 よくも悪くも、初期バージョンに縛られていた。3年ほど前、島澤CTOは、札幌オフィスの開発陣に、「100億件のデータを1秒で実行できるDr.Sumにする」という開発方針を伝えた。机上の空論を焚きつけたわけではない。自らプロトタイプをつくってみせ、「無駄をそぎ落とすだけでも、速度は上がる」(島澤CTO)ことを実証。当初、札幌の開発陣からは、実現に悲観的な意見も出た。笹原部長は、「現行バージョンの延長戦上で考えていた」と述懐する。だが、島澤CTOがプロトタイプを示したことで、「100億件を1秒で」の目標が、笹原部長の目にも、おとぎ話ではなくなった。

スピードで目立つBIへ

 実は、Dr.Sumの兄弟製品である情報活用ダッシュボード「MotionBoard(MB)」でインメモリ方式を採用している。開発現場からは、「MBのロジックを参考にしよう」との声も出たが、島澤CTOの答えは「NO」だった。「Javaで開発したMBでは、このインメモリのアルゴリズムで性能を出せた。だが、同じアルゴリズムでC++で開発したDr.Sumの性能を引き出せるか疑問だった。Dr.Sumの場合、もっとCPUの能力にフォーカスし、集計という根源的な部分に集中すれば、もっと性能が出る」(同)と、判断したからだ。何より、「過去の遺産に縛られるのではなく、自らの言葉で語ることができる製品にしたい。真似事では成長できない」(同)という信念が根底にあった。

 Dr.Sumは、初期をリリースして10年が経つ。顧客からみた提供価値や期待値が固まっていた。Dr.Sumの開発を最小限にし、他の主力製品に投資を振り向けることも、経営陣は検討した。だが、「スピードでもう一度、目立ちたい」と、方針が決まり、経営と開発陣が知恵を絞り、5.0が生まれた。世の中のデータ量は爆発的に増えている。データを利活用するニーズは高まるばかりだ。「ビッグデータ時代に日本の底力を示す」(内野社長)と、5.0の開発に投資を振り向ける決断を下した。

  Dr.Sumの主戦場は中堅・中小企業だ。だが、開発当初の方針決定時には、「新たなレンジ(ターゲット)をねらう」(内野社長)ことも目標として掲げられた。100億件のデータを1秒で回せる製品は他にもある。数億円を投資し大量のサーバーを立て、演算性能を上げるスケールアップ型で構築すれば可能だ。しかしそれでは、「ユーザーが当社に期待することと乖離する」と島澤CTO。同社には、「分析をコモディティ化したい」との考えがある。

 一部の資金豊富な企業だけが実現できる分析ではなく、少ない投資で大量のデータ処理が実現できる方向性を見出し、顧客に負担を強いないスケールアウト型を突き詰めた。顧客は、分析部分の投資を抑え、データを利活用することに投資を回せる。顧客にDr.Sumを販売するITベンダーは、大量のデータを使ったソリューションに提案の軸を据え、インフラで稼ぐビジネスから脱却できる。

 すでに、Dr.Sum Ver.5.1を来年秋頃に出すことを計画している。理論上は「1000億件に耐えられる」(島澤CTO)製品にアップグレードする予定だ。「5.0の出荷を決めたのは1年ほど前。それまでは、集計バリエーションによっては、速度低下がみられた」(笹原部長)など、開発陣は3年余り七転八倒してきた。その経験があったからこそ、次の「1000億件」という途方もない目標を前にしても、怯むことがなくなった。
  • 1

外部リンク

ウイングアーク1st=http://www.wingarc.com/