データサイエンティストが抱える課題
●目的の明確化が大前提 
アクセンチュア
工藤卓哉
シニア・プリンシパル ここで、データサイエンスが抱える課題について触れてみよう。アクセンチュア経営コンサルティング本部アクセンチュアアナリティクス日本統括の工藤卓哉シニア・プリンシパルは、「ユーザー企業は、目的を明確にしないままでデータサイエンスを利用すると失敗する恐れがある。発射台と的をしっかりと定めておく必要がある」と指摘する。企業が経営改善を求めるにしても、何を使って実現したいのかがはっきりとしていなければ、データ分析は効果を発揮しないままに終わってしまう可能性が高い。例えば、商品Aの販売数を伸ばしたい場合に、商品Bのデータを懸命に分析しても意味がない。データサイエンスでは、設定した目的に応じて、抽出するデータや分析手法が変わってくる。これは、近年、スマートデバイスがはやっているからといって、目的意識がないいままにそれを導入した例と似ている。目新しさだけで飛びついても、問題意識がなければ結果はついてこない。
また、データサイエンス自体が聞きなれない言葉であるうえに、分析手法や統計学についてユーザー企業が知識を得ることは容易ではなく、ITベンダーが提供するサービスの違いが理解できないということも課題となっている。データ活用のコンサルティングでは、ただ単にデータを分析するだけでなく、その後のレポートの提出や、経営改善に導くためのアルゴリズムの設計、実際のシステム構築までのプロセスがある。それも、ソーシャルメディア分析や業務データ分析、レコメンドエンジンの生成など、活用するソリューションもさまざまだ。ユーザーがきちんと理解することは容易ではない。
●いかんともしがたい人材不足 何よりも、データサイエンスの分野で課題となっているのは、前述の通り、人材不足である。データサイエンティストは、ユーザー企業の内部にいる場合と、IT企業が受託というかたちでデータの活用を請け負う場合とがある。現状では、ユーザー企業が十分にデータ活用の人材を確保しているとは言い難い。むしろ、一部の先進事例を除いて、大多数の企業では、これまで蓄積してきた業務データを分析できていない状況だろう。
一方、ITベンダーの側でも、人材が十分に確保できている状況にはない。BI/BAツールや、DWHを販売している企業にとって、ユーザーへの説明力を高めるためには、ツールの使い方だけでなく、実際の仕組みまで知っておく必要がある。しかし、国内のデータサイエンティストは、約1000人といわれており、充足している状況にあるとはいえない。iAnalysisの倉橋代表は、「ユーザー企業だけでなく、IT企業からの案件も多い。データサイエンティストの需要は高く、当社では、1人月500万円で依頼交渉されても、断ることがある」という。
ITベンダーの取り組み
●企業買収や内部育成で人材を確保 
数理システム
中川慶一郎
取締役 ビッグデータの領域は、ITベンダーにとっては、まさに千載一遇のチャンスとなる。となれば、喫緊の課題はデータ分析ができる人材の確保だ。ITベンダー各社は、データサイエンティストをどのように確保しているのか。一つの手として、企業買収がある。国内最大手のSIerであるNTTデータは、2012年2月にデータ分析に強い数理システムを完全子会社化した。これによって、NTTデータグループのデータサイエンティストは、「数理システムが約80人、NTTデータが約40人」(数理システムの中川慶一郎取締役)となっている。ハードウェアメーカーのEMCでは、ヴイエムウェアと共同で、次世代プラットフォームのソリューションを手がけるPivotalを設立。ここで約50人のデータサイエンティストを採用している。
しかし、外部にいる人材を確保したとしても、市場自体が供給不足となっている以上、いずれ枯渇してしまう。そうなれば、もう一つの手は、自社で育成することだ。データサイエンスに詳しい多くの識者は、「ある程度活躍することができるデータサイエンティストに育成するには、最低でも3年はかかる」という。しかし、3年間育成するとなれば、企業は多額のコスト負担を覚悟しなければならない。需要はあるにしても、一度に100人単位で人員を育成することは現実的ではない。そこで、こうしたネックの解消を目指すビジネスが誕生しているのだ。
●育成事業が盛り上がる 
EMCジャパン
浜野崇
ソリューション
コンサルタント ニーズが高まるのに合わせて、データサイエンティストを育成するための講座を設ける企業が登場している。昨年5月には、EMCジャパンが、日本で初となるデータサイエンティスト養成講座「Data Science and Big Data Analytics」の提供を開始した。5日間の集中講座で、「ビッグデータの概要」「R言語の基本知識」など、データサイエンティストに必要な基礎的な知識を伝授する。価格は一人あたり30万円だ。
EMCジャパン エデュケーション・サービスの浜野崇ソリューション・コンサルタントは、「今年8月時点で、すでに約150人を育成した。受講者は、SIerなどのIT企業から、金融、通信事業者までさまざま」と説明する。また、EMCジャパンは、「データサイエンスチーム立ち上げ支援サービス」を提供している。EMCのデータサイエンティストが主導しながら、ユーザー企業がデータ分析を自社内でできるように組織づくりを支援するサービスだ。1500万円程度からの料金で提供している。
メーカーであるEMCが、こうしたデータサイエンティストを育成するためのサービスを提供している理由として、浜野ソリューション・コンサルタントは、「実は、この事業では売上高の面ではそれほど期待していない。それよりも、ビッグデータ時代に対応できる人材を増やして、市場の底上げを狙っている」と説明する。EMCジャパンとしては、ユーザー企業のなかにデータサイエンスに詳しい人が生まれることで、結果的に自社のDWHなどのビッグデータ関連製品の売り上げを高めることを狙っている。

ブレインパッド
佐藤洋行
ゼネラル
マネージャー データ分析ソリューションの専業ベンダーであるブレインパッドも、今年8月に「データサイエンティスト入門研修 SQLによる集計・分析」の提供を開始した。個人向けと団体向けの研修内容を用意しており、講師は実際のデータサイエンティストが務める。ブレインパッドアナリティクスサービス部の佐藤洋行ゼネラル・マネージャーは、「目標は、来年6月末までに、15回の研修を開催し、300人に対してサービスを提供すること」という。
また、ALBERTでも、今年7月に「企業向けデータサイエンティスト養成講座」を開始している。養成講座の価格は、6コマで100万円から(1コマ5人まで)と高価ではあるが、「後々のコンサルティングを前提とした講座となっている」(山川会長)。講座を受けた企業の担当者に、データサイエンスについての知識を身につけてもらい、その後のコンサルティングで、目的の明確化などの分析プロセスを進めやすくするという狙いがあるのだ。そのため、養成講座そのものでは、EMCジャパンやブレインパッドと同様に、大きな売り上げは期待していない。
●進む組織再編 データサイエンティストの需要の高まりに合わせて、組織を再編する動きもみられる。NTTデータは、7月1日、データサイエンスに対応するためにビッグデータビジネス推進室を設けた。これは、「これまでバラバラになっていた、ビッグデータ関連ソリューションの窓口を一本化した、かけこみ寺のようなもの」(数理システムの中川取締役)。ユーザー企業は、自社の悩みを解決するためにどのようなデータ分析をしたらいいのかということを、簡単には理解できない。そこで、窓口を一本化することで、顧客の要望をつかみやすくすることができるというわけだ。NTTデータは、2015年度(16年3月期)までに、ビッグデータビジネス推進室で200億円売り上げることを目標としている。
アクセンチュアも、アナリティクス事業を強化するために、6月15日、従来の「アナリティクス インテリジェンス グループ」を「アクセンチュア アナリティクス」に改編した。アナリティクスの専門集団として、約300人を組織して、そのうちの100人がデータサイエンティストとなっている。「アクセンチュア アナリティクス」では、ソーシャルメディア分析、レコメンドエンジン、M2Mアナリティクスなどの分析サービスのほか、育成サービスも提供。工藤シニア・プリンシパルは、「アクセンチュアのなかで、今一番伸びているのが、データサイエンスの領域だ」と説明する。将来的にはデータサイエンティストを300人に拡充する方針だ。

富士通
高梨益樹
シニアマネージャー 一方、富士通では、6月24日、同社のビッグデータ関連製品・サービスを「FUJITSU Big Data Initiative」として体系づけて、約800人体制で「ビッグデータイニシアティブセンター」を設けた。富士通は、データサイエンティストのことを「キュレーター」と呼んでおり、このうちの、約100人がキュレーターとなっている。そして、キュレーターが、顧客のデータを最短で2か月間で解析して、報告書としてまとめるサービス「データコンサルティング」を提供している。
次世代情報系ソリューション本部戦略企画統括部インテリジェントコンピューティング部の高梨シニアマネージャーは、「人間が仮説を立てられないところを人が助けるのがデータサイエンスだ。業務データとオープンデータを組み合わせたり、業務上の仮説によることなく、データの起点からアプローチすることで、これまで創造できなかった新たな価値をリデザインする」と説明する。
データコンサルティングは、料金が500万円からと高価だが、「これだけでは当社の利益にはならない」(高梨シニアマネージャー)という。そこで、富士通では、報告書としてまとめるだけでなく、後のユーザーのシステム導入につなげるところまでをサービス化していく方針だ。
記者の眼
データサイエンティストの領域で一番の課題は、人材不足である。これを解消するために、ITベンダーは、育成講座を開催するなどして、市場の底上げを図っている。ただ、こうした育成講座は価格が高い割に期間がかなり短く、これを受講するだけでは、データサイエンティストになるには十分とはいえない。また、数多くのベンダーがこうした講座を設けてはいるものの、データサイエンティストには資格制度がない。このため、仮に優秀なデータサイエンティストであるとしても、その品質は保証されず、逆にそれほど能力のない人材でもデータサイエンティストと名乗ることができてしまう。
このような事態に対処するため、7月15日、ブレインパッドとiAnalysisが発起人となって、データサイエンティスト協会が発足した。データサイエンティストの定義づけから始まり、カリキュラム作成や認定講座の選定、将来は認証制度の創設も検討している。
データサイエンティストは、わが国ではまだ注目され始めたばかり。困難も多いが、これを乗り越えて、日本をデータサイエンスの先進国にしてほしい。