ども、らーにゃです。今回はSIGNATEの活用について触れていきます。
突然ですが、SIGNATEというサイトはご存知ですか??
私のようなデータ分析の初心者にとっていきなりデータコンペに出るのはハードルが高いです。
そんな時、初心者でも手を出しやすい国産のデータコンペサイトのSIGNATEという存在があります。
データサイエンスの高まりから段々とユーザーが増えはじめています。
「では、このSIGNATEなるサイトとはどんなものか?」
実際に利用することで利活用のポイントが見えてきたので備忘録的にまとめます。
目次
今回の論点整理
まず最初に今回の結論ですが
「データ分析初心者が勉強をするにはSIGNATEはとても手ごろな勉強素材である」
というのが使ってみての感想です。
実際使ってみてこのSIGNATEを有効活用するためには
目指すゴールを踏まえて、活用の仕方を整理すると効果的です。
勉強の素材するにして押さえるべきは以下の3点です。
ビビっときたTipsや手帳術を発信します ٩( ᐛ )و
●資格:国家資格キャリアコンサルタント
●実績:手帳歴18年 | 自作歴10年| デジプラ歴1年
●属性:30代2児の父 | 7つの習慣の資格も保有
・初心者が目指すべきデータ分析の状態目標
・データ分析の力を上げる学習戦略
順に触れていきます。
SIGNATEの活用ポイント
① SIGNATEとは何か
まず、SIGNATEとは何か。
端的にいえば国内でデータコンペを主催する大きな組織名でありサービス名です。日本版Kaggleといったようなものです。
では、このSIGNATEの特徴はどういったものか。
それはズバリ
ということです。
ただ、初心者向けなのは勿論のこと、データ分析上級者向けの機能も実装されはじめております。
ざっくりとサイト内の機能の内訳は以下の通り。
- 初心者向け機能
▷コンペの練習問題(お試し版)がある(無料)
▷初心者用のお勉強カリキュラムがある(有料) - 上級者向け機能
▷賞金付きのコンペが複数ある(無料)
▷分析実績を元にした転職支援がある(無料)
この通り一部有料コンテンツはあるものの、基本的に無料で勉強・実践に使えます。
また、私のようにデータ分析をかじりはじめの人には嬉しい専用のカリキュラムもあるので、うまく使うと敷居低くデータ分析の勉強が出来ます。
私みたいなレベルだと練習問題一つ解くのにかなりの時間を要してしまうので、有料を使ってでも分析のコツを先にインプットした方がよさげです。
② 初心者が目指すべきデータ分析のゴール
次に考えたいのが、目指したいゴール状態です。
ここで活用できるのがSIGNATEの提示するランクです。
まず、SIGNATEには下記の6つの称号(ランク)があります。
これを勝手に私の解釈で表すと以下のような整理になります。
称号(ランク) | 条件 | 状態 |
1. Beginner | 初期状態 | Signateを知っているという状態 |
2. Intermediate | コンペで上位60%の実績あり | コードの組み方・コンペ活用ができるという状態 |
3. Advanced | メダル1つ以上 | 基本的な分析の術が分かる状態 (Kaggleに手を出すレベル) |
4. Expert | メダル2つ以上(うち1つが銀) | 自分ならではの分析ができて懸賞付コンペで戦える状態 |
5. Master | メダル3つ以上(うち1つ以上が金) | 懸賞も獲得し、転職でも有利になる実務力を有している状態 |
6. Grandmaster | 金メダル3つ以上 (うち1つは個人実績) | データサイエンティストとして名乗れる状態 |
上記を踏まえ、私のような初心者は当面のゴールをどこにセットするべきでしょうか。
いきなり6.Grandmasterを目標にしても、現状とのギャップから逆にやる気がなくなってしまいます。
そのため初心者の目指すゴールは3. Advancedあたりがちょうどよいくらいかなと思います。
ではどの程度の期間でこのレベルに到達できうるのか?
勉強時間にもよりますが感覚的には
- 称号を1→2へランクアップするのに1~2か月
- 称号を2→3へランクアップするのに2~3か月
くらいかと思います。
つまり、半年以内にはなんらかメダルを獲得し、3. Advancedになって懸賞付きコンペへの参画やKaggleへも着手しはじめる。
これが現実的なゴール設定です。
ここで、「そもそも条件となっているメダルとは何ぞや?」と思うかもしれません。
こらの説明は下記ページに記載があります。
上記を確認すると、何らかのコンペで上位40%以上にはいっていければメダル獲得できるということが分かります。
つまり、データ分析初心者の人は一つでもいいのでこのメダルを獲得するためにコンペで上位40%に入ることが当面の分析の目標になります。
ではそのために、どのような手段を使ってそこへ到達すればいいのでしょうか。
③データ分析の力を上げる学習戦略
上記のゴールに到達するためのデータ分析初心者の最短の学習戦略を考えます。
結論としては下記の2つに着手するのが得策です。
- Udemyを使った分析の基礎力構築
▷UdemyのコンテンツでPythonの基礎からデータ分析の基礎, SIGNATEの活用まで理解します。 - SIGNATEを使った分析の流れの会得
▷SIGNATEのコンペデータとその解説教材で実際のデータを元に手を動かして学びます。
STEP①: Udemyを使って流れを掴む
UdemyにはSIGNATEの社員が教えている学習コンテンツも存在します。
ここではSIGNATEのデータも使いながらPythonの使い方や基礎的なところからイロハを丁寧に教えてくれます。
基本的に言われた通りに手を動かせば、あまり考えずに基本が一通り分かりますし、気になることは質問もできるので最初の一歩としては敷居が低く初心者向けです。
>>【参考】SIGNATEを活用したデータ分析のPython講座
※たまにセールもやっているのでそこを狙うのもオススメ。
STEP②: SIGNATEを自分で試してみる
その上で②のSIGNATEのカリキュラムを活用するステップにつなげる必要がありますが、こちらはサブスクで月額の費用がかかります。
そのため②は基礎が分かる状態になった上で学ぶ目的を明確にした上で最小限の時間で活用するのがオススメです。(サブスクは短期集中利用がオトク)
こちらの活用は次回以降、触れていきたいと思いますが、まずは買い切りの①でどんなものかを掴むのが良いと思います。
さらに手っ取り早くやりたいのであれば、その他スクールを使うのもありです。
ただ、上記を確認頂いて分かる通り、一通りのデータサイエンスの知識を学び実践力をつけるにはおよそ20万~80万程度の経費はかかります。
(実際にスクーリングもしましたがスクールにいく強制力と仲間をつくってネットワーキングするという意味で効果は高いです)
ただ、いきなりそんなに出せない…ということであれば上記の組合せであれば1/10のコストでさほど時間もかけず学べます。
ポイントは①→②の順番で基礎からスモールステップで積み上げることです。
データ分析を学んでいくためにどこから手をつけていくべきかを迷っている方がいればまずは①から実践するのをオススメします。
意図と各サービスの位置づけを把握することで、無駄なくコスパよく実践ができますね。
まとめ
上記を活用する際に、理解しておくべきポイントは以下3点でした。
- SIGNATEとは(データ分析の勉強素材)
▷データ分析の初心者から上級者まで仕える国内版データコンペサイト - 初心者が目指すべきデータ分析の状態目標
▷分析の流れや術が分かり何らかの実績が出来ている状態(メダル獲得) - データ分析の力を上げる学習戦略
▷SINGATEとUdemyの活用でハードルを下げた最短ルートを実践
現在では、データ分析・データサイエンスの文脈で多くのスクールや無料・有料のサービスが点在しています。
そのため、必要なことは、まず自分が目指すゴール状態を明確にすること。今の状態からどのサービスを使うのが一番ベストか自分に合ったものを選ぶこと。この2つです。
(特に最初の第一歩はハードルを下げて買い切りのUdemyがオススメ)
スモールステップで自分だけのカリキュラムを作って、現実的に持続できる学習を実践して積み上げることで、新たな気づきや今後のキャリアに繋がっていきます。
誰でも最初は初心者ですので、今後なりたい自分の姿を想像しながら一緒に頑張っていきましょう!
ご精読頂きありがとうございました!
m(_ _)m
【参考】プログラミング初心者が押さえたいポイント集
プログラミングは色々な種類のものがありますが効率化を進めたいならばPythonがGoogle Apps Scriptがオススメ。
PythonとGoogle Apps Scriptどちらを深めようかを迷っていればこちらを参考にしてください!
Python(主にデータ分析・自動化)に関しては下記に実践したポイントをまとめています。
基本的にコピペするだけでそのまま使えます٩( ᐛ )و
業務効率化・自動化においてはGoogle Apps Scriptもセットで学ぶことをオススメ!
こちらもコピペしてすぐに使えます!
>>【関連】コピペしてそのまま使えるPythonの自動化プログラムまとめ