【データサイエンス入門】データ分析の初心者が中級者になるまでのSIGNATE活用方法

データサイエンス
ワタシ

ども、らーにゃです。今回はSIGNATEの活用について触れていきます。

突然ですが、SIGNATEというサイトはご存知ですか??

データサイエンスのお勉強!というと真っ先に思い浮かぶのは世界的なデータコンペサイトのKaggleです。

しかし、このKaggleというサイト、検索すれば分かりますが、調べてアクセスした瞬間

「全部英語…なんか、みんなすごそう…あ、もう無理や…」

と、私のようにデータ分析初心者にとっては非常にハードルが高いのも事実です。

そんな時、初心者でも手を出しやすい国産のデータコンペサイトのSIGNATEという存在があります。

これはいってみれば国内版のKaggleであり、データサイエンスの高まりから段々とユーザーが増えはじめています。

では、このSIGNATEなるサイトとはどんなものか?

そして、

データ分析の初心者が勉強の素材としてどのように使えうるのか。

実際に利用することで利活用のポイントが見えてきたので備忘録的にまとめます。

合わせて確認したい記事

データサイエンスを網羅的にコスパ良く実践的に学びたい時はこちらもオススメ!
>>データミックス使って感じたメリット・デメリット

今回の論点整理

まず最初に今回の結論ですが

「データ分析初心者が勉強をするにはSIGNATEはとても手ごろな勉強素材である」

というのが使ってみての感想です。

また、実際に使ってみて思ったことですが、このSIGNATEを有効活用するためには

自分が目指すゴールを考えた上で、そこまでの勉強方法として整理するとより、効果的だと感じました。

そのため、今回は以下の3点に論点を絞ってまとめていきます。

抑えドコ!
  • SIGNATEとは(データ分析の勉強素材)
  • 初心者が目指すべきデータ分析の状態目標
  • データ分析の力を上げる学習戦略

順に触れていきます。

SIGNATEの活用ポイント

SIGNATEとは何か/どう活用できるか

まず、SIGNATEとは何か。

端的にいえば国内でデータコンペを主催する大きな組織名でありサービス名です。日本版Kaggleといったようなものです。

では、このSIGNATEの特徴はどういったものか。

それはズバリ

データ分析の勉強をする敷居が低い

ということです。

ただ、初心者向けなのは勿論のこと、データ分析上級者向けの機能も実装されはじめております。

ざっくりとサイト内の機能の内訳は以下の通り。

SIGNATEの機能
  • 初心者向け機能
    ▷コンペの練習問題(お試し版)がある(無料)
    ▷初心者用のお勉強カリキュラムがある(有料)
  • 上級者向け機能
    ▷賞金付きのコンペが複数ある(無料)
    ▷分析実績を元にした転職支援がある(無料)

この通り一部有料コンテンツはあるものの、基本的に無料で勉強・実践に使えます。

また、私のようにデータ分析をかじりはじめの人には嬉しい専用のカリキュラムもあるので、うまく使うと敷居低くデータ分析の勉強が出来ます。

ワタシ

私みたいなレベルだと練習問題一つ解くのにかなりの時間を要してしまうので、有料を使ってでも分析のコツを先にインプットした方がよさげです。

初心者が目指すべきデータ分析のゴール

次に考えたいのが、目指したいゴール状態です。

ここで活用できるのがSIGNATEの提示するランクです。

まず、SIGNATEには下記の6つの称号(ランク)があります。

■ご参考リンク(称号の種類)

これを勝手に私の解釈で表すと以下のような整理になります。

称号(ランク) 条件 状態
1. Beginner 初期状態 Signateを知っているという状態
2. Intermediate コンペで上位60%の実績あり コードの組み方・コンペ活用ができるという状態
3. Advanced メダル1つ以上 基本的な分析の術が分かる状態  (Kaggleに手を出すレベル) 
4. Expert メダル2つ以上(うち1つが銀) 自分ならではの分析ができて懸賞付コンペで戦える状態 
5. Master メダル3つ以上(うち1つ以上が金) 懸賞も獲得し、転職でも有利になる実務力を有している状態
6. Grandmaster 金メダル3つ以上 (うち1つは個人実績) データサイエンティストとして名乗れる状態

上記を踏まえ、私のような初心者は当面のゴールをどこにセットするべきでしょうか。

いきなり6.Grandmasterを目標にしても、現状とのギャップから逆にやる気がなくなってしまいます。

そのため初心者の目指すゴールは3. Advancedあたりがちょうどよいくらいかなと思います。

ではどの程度の期間でこのレベルに到達できうるのか?

勉強時間にもよりますが感覚的には

  • 称号を1→2へランクアップするのに1~2か月
  • 称号を2→3へランクアップするのに2~3か月

くらいかと思います。

つまり、半年以内にはなんらかメダルを獲得し、3. Advancedになって懸賞付きコンペへの参画やKaggleへも着手しはじめる

これが現実的なゴール設定です。

ここで、「そもそも条件となっているメダルとは何ぞや?」と思うかもしれません。

こらの説明は下記ページに記載があります。

■ご参考リンク(メダルの位置づけ)

上記を確認すると、何らかのコンペで上位40%以上にはいっていければメダル獲得できるということが分かります。

つまり、データ分析初心者の人は一つでもいいのでこのメダルを獲得するためにコンペで上位40%に入ることが当面の分析の目標になります。

ではそのために、どのような手段を使ってそこへ到達すればいいのでしょうか。

データ分析の力を上げる学習戦略

上記のゴールに到達するためのデータ分析初心者の最短の学習戦略を考えます。

結論としては下記の2つに着手するのが得策です。

初心者に有効な学習方法
  1. Udemyを使った分析の基礎力構築
    ▷UdemyのコンテンツでPythonの基礎からデータ分析の基礎, SIGNATEの活用まで理解します。
  2. SIGNATEを使った分析の流れの会得
    ▷SIGNATEのコンペデータとその解説教材で実際のデータを元に手を動かして学びます。

ここで、他にも学習手段はあるのではないか?と思ったりもします。

ネット上を調べるとデータ分析・データサイエンス系のノウハウを学べるところは色々出てきます。

例えば下記のようにスクールについてまとめるサイトも多数あります。

■ご参考リンク(データサイエンティスト用のスクール7選)

ただ、上記を確認頂いて分かる通り、一通りのデータサイエンスの知識を学び実践力をつけるにはおよそ20万~80万程度の経費はかかります。

分析力を高めるのが急務でドンッと費用を払えるのであれば上記に通うに越したことはありません。

(お金を払ってスクールにいく強制力と仲間をつくってネットワーキングするという意味で効果は高いです)

ただ、いきなりそんなに出せない…ということであれば上記の組合せであれば1/10のコストでさほど時間もかけず学べます

ポイントは①→②の順番で基礎からスモールステップで積み上げることです。

①のUdemyはSIGNATEの方が教えられているもので、Pythonの使い方や基礎的なところからイロハを丁寧に教えてくれます。

基本的に言われた通りに手を動かせば、あまり考えずに基本が一通り分かりますし、気になることは質問もできるので最初の一歩としては敷居が低く初心者向けです。

>>SIGNATEを活用したデータ分析の講座

※たまにセールもやっているのでそこを狙うのもオススメ。

その上で②のSIGNATEのカリキュラムを活用するステップにつなげる必要がありますが、こちらはサブスクで月額の費用がかかります。

そのため②は基礎が分かる状態になった上で学ぶ目的を明確にした上で最小限の時間で活用するのがオススメです。(サブスクは短期集中利用がオトク)

こちらの活用は次回以降、触れていきたいと思いますが、まずは買い切りの①でどんなものかを掴むのが良いと思います。

データ分析を学んでいくためにどこから手をつけていくべきかを迷っている方がいればまずは①から実践するのをオススメします。

ワタシ

意図と各サービスの位置づけを把握することで、無駄なくコスパよく実践ができますね。

まとめ 

上記を活用する際に、理解しておくべきポイントは以下3点でした。

今回の抑えドコ
  • SIGNATEとは(データ分析の勉強素材)
    ▷データ分析の初心者から上級者まで仕える国内版データコンペサイト
  • 初心者が目指すべきデータ分析の状態目標
    ▷分析の流れや術が分かり何らかの実績が出来ている状態(メダル獲得)
  • データ分析の力を上げる学習戦略
    ▷SINGATEとUdemyの活用でハードルを下げた最短ルートを実践

現在では、データ分析・データサイエンスの文脈で多くのスクールや無料・有料のサービスが点在しています。

そのため、必要なことは、まず自分が目指すゴール状態を明確にすること。今の状態からどのサービスを使うのが一番ベストか自分に合ったものを選ぶこと。この2つです。

>>【初心者用】SIGNATEを活用したデータ分析の講座

(特に最初の第一歩はハードルを下げて買い切りのUdemyがオススメ)

スモールステップで自分だけのカリキュラムを作って、現実的に持続できる学習を実践して積み上げることで、新たな気づきや今後のキャリアに繋がっていきます。

誰でも最初は初心者ですので、今後なりたい自分の姿を想像しながら一緒に頑張っていきましょう!

ご精読頂きありがとうございました!
m(_ _)m

合わせて確認したい記事

データサイエンスを網羅的にコスパ良く実践的に学びたい時はこちらもオススメ!
>>データミックス使って感じたメリット・デメリット