ITの新たな潮流、「ビッグデータ」という概念の登場に合わせて、データの分析を専門に行う人材「データサイエンティスト」が注目を浴びている。ITベンダーとユーザー企業の双方でこの専門人材が不足しているといわれており、売り手市場となっている。注目を浴びる一方で、「データサイエンティスト」は、その明確な定義づけがなされておらず、言葉だけが先走りしている感が否めない。そこで、ITベンダー各社の取り組みや、実際の働き方を追った。(取材・文/真鍋武)
データサイエンティストを巡る市場の動き
●ビッグデータと表裏一体の関係 近年、センサや通信機器、インターネットの普及などの影響によって、データの量が急激に増大している。そして、こうした大量のデータを高速で分析処理することができるHadoopなどの技術が進展したことで、ビッグデータを分析・活用する需要が高まっている。総務省の2013年版「情報通信白書」によると、ビッグデータを国内で十分に活用した場合の経済効果は、年間およそ7兆7700億円に達するとみられる。データの活用にあたっては、まず分析して、自社に最適なアルゴリズムに基づいたシステムを構築したり、企業の経営改善に生かしたりすることができる人材がいることが前提となる。こうした事情から、データ活用の専門人材である「データサイエンティスト」が注目を浴びているのだ。米誌『ハーバード・ビジネス・レビュー』は、「データサイエンティスト」を「21世紀で最もセクシーな職業」と称しているほどだ。
●人材不足で売り手市場 データサイエンティストが注目される大きな理由がもう一つある。それは、人材不足が深刻になっていることだ。米マッキンゼーによると、米国では、2018年までに、高度なアナリティクス・スキルをもつ人材が14万~19万人不足し、さらにはビッグデータ分析を意思決定に活用できる人材が150万人不足すると見込まれている。
また、データ分析に関する才能をもつ大学卒業生の数(2008年)では、米国が2万4730人、中国が1万7410人、インドが1万3270人であったのに比べて、日本は3400人と少なかった。国際的にみても、日本は統計学など、データ分析に関する教育を受けることができる機関が少なく、統計学や数理学、機械学習やデータマイニングなど、データ分析に関わる一連の研究をしている機関は、情報・システム研究機構の統計数理研究所など、数が限られている状況にある。
これから先、ビッグデータを分析・活用する動きが活発になれば、データサイエンティストの需要も必然的に高まることになる。だが、現状のままでは、深刻な人材不足が待ち受けていることになるのは間違いない。
データサイエンティストとはどんな人材か
●求められる三つの能力 そんなデータサイエンティストだが、実は、明確な定義がなされているわけではない。また、統計学や数理学など、ユーザー企業だけでなく、IT企業にとってもあまりなじみのない学問が関わってくるとあって、わかりにくい。

ALBERT
山川義介
会長 ただ、共通していることが三つある。それは、「統計」「ITエンジニアリング」「ビジネス」の三つの能力を兼ね備えている人材ということだ。「統計」では、統計や確率、数理、データマイニング、機械学習などの知識や、BI/BAツールの使用方法、各種データの取り扱い方がわかる能力が求められる。「ITエンジニアリング」では、HadoopやR言語、DB、SQLなどの知識や、実際のプログラミングの経験、「ビジネス」では、業務知識や、マーケティング、プロジェクトマネジメントの力が求められる。
例えば、データ活用ソリューションを提供しているALBERTの山川義介会長は、「データサイエンティストは、ビッグデータを、(1)統計学を駆使して、(2)分析することによって、(3)ビジネスの問題解決に有用な知見を引き出すことができる人材」と定義している。
では、どのようなケースでデータサイエンティストを活用すれば、成果が得られるのか。ユーザーの事例とベンダーの事例を紹介する。
【ユーザーの事例】販促施策に貢献

iAnalysis
倉橋一成
代表 統計解析を事業とするiAnalysisは、大手自動車メーカーから売り上げを高めるためのデータの分析を請け負った。従来、その自動車メーカーは広告代理店に調査を依頼していたが、思うような成果が出ていなかった。iAnalysisのデータサイエンティストが、国内全店舗の売上データの分析を行った結果、売り上げの底上げに直結する新たなKPI(重要業績評価指標)を開発。それも、「KPIを1ポイント改善すると、1店舗あたりの売り上げを年間で1200万円、全店舗で約120億円増やすことができる」(倉橋一成代表)というものだった。
アナリスティクス事業を展開するブレインパッドは、信販系クレジットカード会社から、新規キャッシングの利用促進に関するダイレクトメール(DM)の反応率を引き上げるためのデータマイニングの案件を請け負った。その信販系クレジットカード会社は、これまで顧客に対していくらDMを送付しても、申し込みや問い合わせなどの反応がほとんどない状況だった。カード会社では、性別や年齢、勤務先の業種などの顧客の属性情報だけでなく、どのような業種の加盟店で利用が多いかといった顧客のカード利用傾向や趣向を、カードの利用履歴から特定することができる。そこで、ブレインパッドのデータサイエンティストは、データマイニングツール「KXEN」を駆使して新規キャッシングの利用者予測モデルを構築し、キャッシングサービスを新規利用する見込みの高い顧客を予測する分析作業を実施。この結果をもとにDMを送付したところ、反応率を従来の約3倍に改善することができた。
【ベンダーの事例】BI/BAにはない価値を提案
ITベンダーの側に立てば、データサイエンティストを活用することによって、従来のBI/BAツールでは実現できなかった新たな予測モデルを構築して提案することができるようになる。
BI/BAツールは、業務のノウハウに基づく仮説検証型のデータ分析となっている。例えば、ユーザー企業が売り上げデータをもとにBIツールを使用した場合、過去の成功事例をもとに、次の対策を打つことになる。つまり、BI/BAツールは、先例をテンプレート化しているわけで、革新的な発見に結びつくわけではない。一方、データサイエンティストは、顧客の目的にあわせて、売り上げデータだけでなく、必要となるデータを洗いざらい抽出・加工して分析する。それも、「業務ノウハウという観点を除外して、データを起点とした分析をする」(富士通の次世代情報系ソリューション本部戦略企画統括部の高梨益樹・インテリジェントコンピューティング部シニアマネージャー)。これによって、人間が考えるだけでは立てることができなかった新たな予測モデルをつくり出すことができるわけだ。
[次のページ]