CCCMKホールディングス TECH LABの Tech Blog

TECH LABのエンジニアが技術情報を発信しています

ブログタイトル

データサイエンスエキスパートに合格しました

データサイエンスグループの木下です。 この度、データサイエンスエキスパートという資格に合格いたしました。 この資格の説明と、勉強の仕方などに関して、記事を書いていこうと思います。

データサイエンスエキスパートとは

統計検定の試験の一つです。 データサイエンス〇〇 という試験は

  • データサイエンス基礎
  • データサイエンス発展
  • データサイエンスエキスパート

の3種類あります。

基礎と発展は2021年から存在しておりましたが、エキスパートは2023年にできたばかりの試験です。 内容に関して、公式サイトには下記のように書かれています。

計算、統計、モデリング、領域知識に関する大学専門レベルの内容

これだけではよくわからないですね。 では、出題範囲をみてみると、その範囲の広さに驚愕すると思います。このPDFを小項目までの情報でまとめ直したものが下記になります。

データサイエンスエキスパート出題範囲

大項目は①「統計基礎」、②「数学基礎」、③「計算基礎」、④「モデリング・AIと評価」の4つに分かれます。

  • ①「統計基礎」と②「数学基礎」は、統計検定準1級の範囲とほとんど同じです。
  • ③「計算基礎」はSQLやPythonの実装が問われるので、実務経験者が有利になります。
  • ④「モデリング・AIと評価」は機械学習全般の知識が問われます。また、一部は統計検定準1級の範囲と被ります。

勉強方法

実際の試験の内容に関しては、秘密保持契約の関係上、口外してはならないので、 どのような勉強をすればよいかをお伝えいたします。

前提として、データサイエンスエキスパートの公式テキストや問題集は本記事の執筆時点では存在していないので、 出題範囲を自力で勉強していく必要があります。

そこで、この出題範囲をカバーするために必要な参考書を紹介いたします。

統計学実践ワークブック​ & 統計検定準一級 公式問題集

ワークブックと問題集

  • ①「基礎統計」に対応
  • ②「数学基礎」に対応
  • ④「モデリング・AIと評価」の一部に対応

してします。 詳しくは、上記の出題範囲の画像の赤字部分になります。

統計検定準1級は、データサイエンスエキスパートの試験範囲の半分以上網羅することができるので、絶対に勉強してください。 できれば、合格することをお勧めいたします。 勉強期間は6か月程度は見込んだ方がよいかと思われます。  ワークブック1週目(必ず章末問題を解くこと)​ →問題集1週目(解説をしっかり読む)​ →ワークブック2週目​ →問題集2週目 という勉強方法で、全32章を勉強し、試験を受けて合格いたしました。 ワークブックは少し難しいと感じた部分については、あつまれ統計の森で適宜補完しました。

G検定 公式テキスト

G検定 公式テキスト

  • ④「モデリング・AIと評価」 の一部に対応

しています。

より詳しく言うと、その中の中項目である 「モデリング・AIによる課題解決」 「深層学習・ニューラルネットワーク」 に対応しています。

AI全般の知識を浅く広く習得することができます。 特に機械学習やニューラルネットワークに関する知識はしっかり身に着けるべきです。 こちらは1か月程度の勉強期間があればよいかと思われます。 また、こちらも合格する方が望ましいです。(私は2019年に取得しました。)

はじめてのパターン認識

初めてのパターン認識

  • ④「モデリング・AIと評価」 の一部に対応

しています。

より詳しく言うと、その中の中項目である 「教師あり学習」​ 「教師なし学習」​ 「深層学習・ニューラルネットワーク」 に対応しています。

統計検定準1級ではカバーしきれない小項目「決定木」や、 中項目「深層学習・ニューラルネットワーク」に関しては理論面を理解するために目を通しておくとよいと思われます。 一つ一つの式まで理解する必要は全くありません。

まとめ

データサイエンスエキスパートに合格するためには​

【必須】​

  • 統計検定準1級の対策をする(できれば合格する)​
  • G検定の対策をする(できれば合格する)​
  • SQL,Pythonの基礎が分かる(簡単な構文が書ければOK 1週間程度で習得可)​

【あると望ましい】​

  • 機械学習の実務経験がある​

実際に私は、データサイエンスエキスパートのための試験対策は何もしないで合格しました。 それはなぜかというと、

  • 1か月前に統計検定準1級を取得した
  • 過去にG検定に合格していた
  • データサイエンティストとして1年以上実務経験をしている

からです。

つまり、もしデータサイエンティストの実務経験がある方(+G検定レベルの内容が分かっている方)で、​ 統計検定準1級を取得していない方であれば、​まず統計検定準1級を取得しましょう。 そして、その後すぐにデータサイエンスエキスパートも受験しましょう。 そうすれば、特に対策もせず合格できると思われます。 ​ もし一度おちてしまっても、問題が変わるのであきらめずに何度か受けるとよいかと思います。