データサイエンティストはどれくらい不足している?4つの背景と推進されている解決方法を紹介
はじめまして、エンジニアスタイル編集部です!
コラムページでは、ITフリーランスに向けてお役立ち情報を発信します。Twitterではホットな案件を紹介してまいりますので、ぜひフォローをお願いいたします!
本記事が、皆様の参考になれば幸いです。
経験がまだ少ない方にもわかりやすく説明するために、初歩的な内容も記載しております。記事も長いので、実務経験豊富な方は、ぜひ目次から関心のある項目を選択してください。
エンジニアスタイルは、最高単価390万円、国内最大級のITフリーランス・副業案件検索サービスです。データサイエンティストのフリーランス・副業案件一覧を以下からご覧いただけますのであわせてご確認ください。
目次
現状:データサイエンティストは3.4万人~5.5万人不足している
AIや機械学習の技術が向上したことで、AI人材の需要が増えています。AI人材ときくとAIエンジニアをイメージしますが、AIを活用して経営課題を解決するデータサイエンティストも、AI人材の1つです。
社内でデータサイエンティストを在籍させたい企業は多い一方で、専門的な教育が必要なため育成が難しいとされています。経済産業省の「AI人材供給の試算結果」によると、データサイエンティストを含むAI人材の不足数は2018年時点で33,516人、2020年時点で44,857人であると公表しています。また、AI人材自体は2020年から2025年にかけて約4万人の増加が見込まれるものの、需要数も8万人を超えると予想されます。
また、データサイエンティストの慢性的な不足は、各企業でも問題になっています。
データサイエンティストが1人以上いると答えた企業はわずか29%
一般社団法人データサイエンティスト協会によると、2019年時点で社内データサイエンティストが1人以上いる企業はわずか29%でした。さらに社内データサイエンティストの多くが、他部署からの異動してきた人材にデータサイエンス教育を行う形で補っています。
また、社内データサイエンティストが1人以上いると答えた企業のうち「3〜5人」「6〜10人」と答えた企業が半数を占めています。これらの結果から、企業におけるデータサイエンティストの分布に偏りがあることが分かります。
データを使って経営課題を解決したいけど、企業内にデータサイエンティストがいない場合は、社外に依頼する方法もあるでしょう。実際、データサイエンスを専門に扱う企業も存在しています。
一方、社内異動によってデータサイエンティストを在籍させる一番のメリットは、企業の事業背景について理解がある人材に経営課題を解決してもらえる点でしょう。また、社外のデータサイエンティストに依頼するよりもコストを抑えられる点、データ分析を内製化することでノウハウを蓄えられる点もメリットに挙げられます。
企業のDX化が進む中で、社内データサイエンティストの育成は各企業にとっての大きな課題といえるでしょう。
データサイエンティストが不足する4つの理由とは
データサイエンティストが不足している原因について、4つの理由から説明します。
前提:国内でデータサイエンスを学べる教育機関が少ない
データサイエンティストが不足している根源には、専門的に学べる教育機関が少ない点が挙げられます。しかし、少しずつデータサイエンスを学べる教育機関は増えてきています。
文部科学省では「数理及びデータサイエンスに係る教育強化」として全国の国公立大学6校(北海道・東京・滋賀・京都・大阪・九州)を拠点校に指定しました。拠点校ではデータサイエンスの基本とされす数理的思考やデータの分析・活用能力を網羅的に学び、手元にあるデータから「どのような課題を解決できるのか」「どのような価値を作り出せるのか」を習得できるようカリキュラムが組まれています。
また、文部科学省が指定した拠点校のほかに、横浜市立大学や名古屋市立大学などの市立大学や、武蔵野大学や中央大学、立正大学など私立大学もデータサイエンス学部を開設しています。
ITエンジニアを目指す方が学ぶ情報学科に比べると、データサイエンスを学べる教育機関の数はまだ少ない上、開設されて間もない大学が多いのが現状です。文部科学省の取り組み自体も平成28年より開始され、それに伴い教育機関でも取り組みが始まっています。そして、学生がデータサイエンスが学べる学部を修了するには4年以上の期間が必要です。
そのため、今後は専門的な教育を受けた人材は増えていき、データサイエンティスト不足も少しずつ解消されていくでしょう。
数学など理数系の素養が必要で知識を身につけることが難しい
データサイエンスを理解し、活用するには線形代数・微分積分・確率など数学の素養が必要です。さらに線形代数を学ぶにはベクトルや行列についての知識が必要になり、微分積分を学ぶには三角関数や数列などの知識が必要です。
一方で、文系出身でデータサイエンティストになっている方も多くいます。マイナビによると、新卒でデータサイエンティストになる条件を指定している企業はほとんど無いため、文系の方でも就職することは可能です。
また、滋賀大学データサイエンス学部のデータによると、学部生の約40%が文系出身者です。データサイエンティストになるには数学を学ぶ必要があるものの、その業務内容はコミュニケーションやコンサル的な要素など、文系の方が得意とする要素もあります。
統計学の知識が必要となるため
データサイエンティストを目指す方にとって数学の勉強は欠かせませんが、特に統計学に対して苦手意識を持つ方は多いでしょう。
一般社団法人統計質保証推進協会は、データサイエンティストの勉強をはじめた人に向けて、2021年よりDS検定(基礎)を設けました。DS検定(基礎)に出題される統計学の知識は、大学入試レベルが必要とされています。大学入試レベルの統計学を理解するには、例えば総和を表すシグマや微分積分、指数関数、対数関数などについて、1つずつ勉強しなければなりません。
さらに統計学は記述統計学と推測統計学に種類を分けることができます。記述統計学は正解が明白なのですが、推測統計学は推測者によって答えが変わってきます。そのため、推測統計学は、数学を得意とする人でも苦手に感じる場合があります。
AIの概念が複雑で難しい・技術進化が早くて難しい
データサイエンスと密接に関係するのが、AI(人工知能)の概念です。AIを活用するメリットは、ビッグデータなど膨大な量のデータを処理できるだけでなく、分析して得られたデータをビジネス課題の解決へと繋げる方法にも役立つ点です。
しかしAIの概念は複雑で、1つの単語でひとくくりにできません。データサイエンスにおけるAIは、主に機械学習のことを指します。機械学習を利用することで、膨大なデータから関連性を見出すことができたり、予測ができたりします。例えばクライアント企業が解決したい課題が「離職率を下げる」であれば、過去の人事データを活用し、採用する人の基準を決めるのにAI技術が役立ちます。
また、AIの技術進化のスピードは著しく早いです。データサイエンティストを目指す人材が、日々の勉強に加えてAIの知識を最新の状態にアップデートするのは困難を要します。
さらに、データ処理に使用するAIのほとんどは使い回しができず、プロジェクトによってデータサイエンティストが適宜調整を行います。AIの調整には、PythonやRといったプログラミング言語が必要です。
論理的思考・プレゼンテーション能力などのビジネススキルも求められる
データサイエンティストの最終的な目標は、クライアント企業の経営課題の解決です。つまり、データ分析から得られた結果をもとに、経営課題を解決する方法を見つけて提案するまでがデータサイエンティストの業務です。
クライアント企業にとって経営課題が何なのか、明白でないままデータサイエンティストに依頼する場合もあります。その際は、コミュニケーションの中で課題を察知する必要があります。
そして、分析によって得られた結果の内容や、その結果がどのように経営課題を解決できるのか、クライアントが納得できるように噛み砕いて説明するためのプレゼンテーション能力も、データサイエンティストが備えておきたいスキルです。
データサイエンティストの不足に対して今進んでいる解決方法とは
データサイエンティストの慢性的な不足を解決するために、政府や大学、企業が行っている取り組みについて紹介します。
政府が主導している「AI戦略」
データサイエンティスト不足を解消する措置として、政府も社会人を対象としてデータサイエンスを学べる機会を設けています。その一つが、経済産業省が認定している「第四次産業革命スキル習得講座(Reスキル講座)」です。Reスキル講座では、社会人がデータサイエンスやAI、IoT、クラウドについて専門的な素養を身につけ、将来的な雇用につながるような教育訓練を受講できます。
2023年時点では株式会社eftaxや株式会社ブレインパッドなど、10社以上の企業がデータサイエンスの講座を設けています。企業が開催しているReスキル講座では、例えば「現在社会人として働いており、業務でデータ分析を担当するようになった」「Pythonを使うとどのような分析ができるのか知りたい」という方を対象に、数日間のプログラムで学べるようになっています。
大学機関におけるデータサイエンス教育
平成28年以降は全国の大学機関でデータサイエンスの専門的な教育が受けられる学部の開設が進んでいます。また、学部生だけでなく学生全体がデータサイエンスを教養として受けられる大学もあります。
滋賀大学では平成29年に、国内初のデータサイエンス学部が開設されました。数学以外にもデータ分析やプログラミング、経済学、AI・機械学習など、データサイエンスに必要な教育を網羅できるカリキュラムになっています。
また、北海道大学では「数理・データサイエンス教育研究センター」が開設されており、文系や理系を問わず、全ての学生が一般教育プログラムで情報学や統計学、線形代数学、微分積分学などデータサイエンスに必要な科目を履修できます。
企業での人材育成
データサイエンティストが成長するのに大事なのは、企業のデータ分析チームに加わり実務経験をこなす事です。
データサイエンスの実務では、業種や職種により課題の大きさや種類が変わってきます。様々な実データや実課題を扱うことで、課題解決スキルや意思決定のサポート力が身につきます。
近年では自社の業務効率化のため、社内にデータ分析の専門部署を立ち上げる企業も増えてきました。まずはデータアナリストとしてデータの収集・集計・分析を行い、業務に慣れてきたらマーケターの意思決定をサポートできるような提案をプレゼンテーションすることで、自然とデータサイエンスのノウハウが身についてくるでしょう。
データサイエンティストに求められるスキルカテゴリ
一般社団法人データサイエンティスト協会では、データサイエンティストに必要なスキルセットはビジネス力・データサイエンス力・データエンジニア力の3点と定義しています。
ビジネス力
データサイエンティストにおけるビジネス力とは「ビジネス背景を理解した上で、数学的・統計的な課題まで落とし込み、解決へと導く力」を指します。
ビジネス力を鍛えるには、まずデータ分析を担当する業界についての知識を詳しく理解することから始まります。その上で、クライアントに対してヒアリングとコミュニケーションをとり、課題の仮説を立てられる力をデータサイエンティストは持ち合わせていなければいけません。
また、どれだけ高品質なデータ分析結果や解決法を発見したとしても、クライアントを納得させるだけのトーク力がなければ、その先の行動に結びつきません。例えばプレゼンテーション能力であれば、話の目的を明確にした上で、話すスピードや声の抑揚を意識する練習をこなしましょう。プレゼンについての書籍を利用し、伝えたい内容をフレームワークに落とし込んで構成を組むのもおすすめです。
データサイエンス力
データサイエンス力は「人工知能や統計学、情報処理のような専門的な知識を応用する力」を指します。データサイエンティスト人材が不足している大きな原因として、今までデータサイエンス力を鍛えるための専門機関が少なかったことが挙げられます。
データサイエンス力があれば、手元にあるデータが正しいのか判断できます。例えば平均年収のデータを見たとき、それが平均値である場合は、少数派である高年収の方が平均年収を上げている可能性があります。本当に知りたい平均年収は、極端な値を省いた中央値です。つまり、データサイエンス力は一般教養レベルで身につけたいスキルです。
また、データサイエンス力を高めると「現在取得できるデータの量で分析の目的が達成できるか」が分かり、データ収集の効率化を図ることもできます。
データエンジニアリング力
データエンジニア力は「データサイエンス力をもって、データを実際に使える形にする力」を指します。例えばExcelのようなオフィス統合環境ソフトを用いて、グラフやプロット図のように可視化する技術はデータエンジニアリング力の一つです。
データエンジニアリング力を鍛えるには、Excel以外にもPythonを扱えるようになると良いでしょう。PythonではExcelよりも高度なデータ集計を行うことができる上、Matplotlibのようなグラフ描画に特化したライブラリを用いることで、数値でしか捉えることができなかったデータを可視化できます。
また、データエンジニアリング力のほとpんどはプログラミング力と言っても過言ではありません。データ分析ではPython以外にもSPSS・SAS・Rなどを用います。従来はSPSSやSASがデータ分析に使われていましたが、今からデータサイエンティストを目指す方はRやPythonのようなオープンソースのプログラミング言語でデータ分析力を身につけた方が、企業からの需要が高いでしょう。
まとめ
今回は「データサイエンティストはどれくらい不足しているのか」について、4つの背景と共に、解決方法について紹介しました。
結論をいうと「データサイエンティストは3.4〜5.5万人不足しているが、不足を解消するための取り組みは進んでいる」です。データサイエンスを扱うには数学など専門的に勉強する必要があるものの、政府が大学や企業と連携して教育機関を設けています。
平成29年より各大学でデータサイエンス学部が開設されたことにより、今後は専門教育を受けたデータサイエンティストが増加すると予想されます。また、社会人でデータサイエンスを学びたい方は、企業のReスキル講座を積極的に活用しましょう。
- CATEGORY
- フリーランス
- TAGS
-
-
-
-
-
-
-
【コンサル】ドローン事業向け市場調査案件の 求人・案件
- 1,070,000 円/月〜
-
秋葉原・神田
-
【Power Platform】データ分析基盤検討支援のエンジニア求人・案件の 求人・案件
- 1,200,000 円/月〜
-
大阪府
-
【SQL】医療介護用品商社におけるECサイトのデータサイエンティストの 求人・案件
- 710,000 円/月〜
-
大阪府
- SQL
-
【ハイブリッドワーク】Linux|自動運転技術開発会社向けデータ解析案件の 求人・案件
- 700,000 円/月〜
-
その他
-
【オンラインゲーム】運用プランニング案件の 求人・案件
- 450,000 円/月〜
-
その他
-
【正社員切替前提】【データサイエンティスト】不動産会社の情報システム部門でのデータ活用推進の 求人・案件
- 500,000 円/月〜
-
その他
-
【コンサル/英語】IoT戦略検討支援案件の 求人・案件
- 1,850,000 円/月〜
-
その他
-
【GIS/フルリモート】交通政策立案におけるデータ解析案件の 求人・案件
- 560,000 円/月〜
-
その他
-
【Python(データ分析系)】ロボットアームのデータ同化アルゴリズム適用検証エンジニアの 求人・案件
- 600,000 円/月〜
-
その他
- Python
-
【Python(データ分析系)】データ利活用の分析支援|キャッシュレスサービス業界の 求人・案件
- 1,000,000 円/月〜
-
その他
- Python SQL
-
【Python(データ分析系)】データサイエンティスト(業務委託)|新サービス設計・データ分析担当の 求人・案件
- 1,000,000 円/月〜
-
その他
- Python SQL
-
【Python(データ分析系)】自治体向けバス運行ルート最適化対応可能なデータサイエンティストの 求人・案件
- 1,300,000 円/月〜
-
渋谷
- Python
-
【Python】幼稚園・保育園向けの新プロダクトのディレクターの 求人・案件
- 900,000 円/月〜
-
勝どき・晴海・月島
- Python
-
【Python】レコメンド機能やベクトル検索機能の開発の 求人・案件
- 870,000 円/月〜
-
その他
- Python SQL その他
-
【データサイエンティスト/一部リモート】製造業向けデータ分析案件の 求人・案件
- 950,000 円/月〜
-
その他
-
【Python】AIデータ分析ユースケース実施|保険会社DXプロジェクトの 求人・案件
- 800,000 円/月〜
-
その他
- Python
-
【Python】マルチクラウド機械学習プラットフォーム開発エンジニアの 求人・案件
- 600,000 円/月〜
-
渋谷
- Python
-
【PM/週5日/フルリモート◎】クライアントの保有する嗜好性に関するレコメンドモデルを改善するPJにおけるPM業務(jd01831)の 求人・案件
- 1,200,000 円/月〜
-
その他
-
【Java/JavaScript/基本リモート】自動車会社向け会計システム開発案件の 求人・案件
- 600,000 円/月〜
-
その他
- Java JavaScript
-
【Java/一部リモート】Javaシステム開発案件の 求人・案件
- 600,000 円/月〜
-
その他
- Java
-
【DTP】販促物デザインデータチェック案件の 求人・案件
- 350,000 円/月〜
-
その他
-
【PMO】外資系信託銀行向けシステム管理支援案件の 求人・案件
- 800,000 円/月〜
-
勝どき・晴海・月島
-
【コンサル/PM】新規システム業務支援案件の 求人・案件
- 850,000 円/月〜
-
その他
- Shell PowerShell
-
【PMO/英語】航空海上貨物作業システム展開案件の 求人・案件
- 800,000 円/月〜
-
その他
-
【Lunix/Solaris/一部リモート】レンタリースシステム老朽更新システム移行案件の 求人・案件
- 650,000 円/月〜
-
その他
- Shell
-
【フロントエンド(React/TypeScript)】ブライダル業界向けDX総合プラットフォーム案件の 求人・案件
- 700,000 円/月〜
-
五反田・大崎・目黒
- TypeScript
-
【C言語】車載系組込開発案件の 求人・案件
- 650,000 円/月〜
-
その他
- C言語
-
【リモート】日本最大級のプラットフォーム_UXディレクター(プランナー)の 求人・案件
- 750,000 円/月〜
-
その他
-
【AWS】決済基盤開発PJの運用設計支援/リモート併用のエンジニア求人・案件の 求人・案件
- 960,000 円/月〜
-
その他
-
【AWS】決済基盤開発PJのセキュリティ設計支援/リモート併用のエンジニア求人・案件の 求人・案件
- 960,000 円/月〜
-
その他
-
【DBエンジニア(SQL全般)】大手消費財化学メーカー向けデータレイク基盤、BIレポート作成の 求人・案件
- 800,000 円/月〜
-
その他
- SQL
-
【Kotlin】美容医療プラットフォーム向け開発案件の 求人・案件
- 1,050,000 円/月〜
-
恵比寿・代官山
- Kotlin
-
【C#】展示会用ソフトウェア開発支援案件の 求人・案件
- 650,000 円/月〜
-
その他
- C#
-
【PM】メガバンク向け情報管理システム支援案件の 求人・案件
- 800,000 円/月〜
-
その他
-
【ReactNative】位置情報共有サービス開発案件の 求人・案件
- 要相談
-
恵比寿・代官山
- TypeScript
-
【PL/上流】Salesforce開発保守支援案件の 求人・案件
- 900,000 円/月〜
-
その他
- Apex