MENU
  • 手帳
    • 手帳 リフィル自作した手帳のリフィルを公開していきます!
    • 手帳 レビュー
    • 手帳 アイデア
    • 手帳 セルフコーチング7つの習慣セルフコーチング認定コーチとして、独自に培ってきたセルフコーチング×手帳のノウハウを備忘録的にまとめます٩( ‘ω’ )و
    • 手帳 ジャーナリング
  • 独学
    • 独学 キャリアコンサルタント国家資格キャリアコンサルタントの試験対策や学んだコトなどをまとめていきます!
    • 独学 プログラミング
    • 独学 リスキリング自分で楽しく効率よく学習するリスキリングのTipsや参考情報をまとめますᕦ(ò_óˇ)ᕤ
  • ワーク
    • キャリア 転職
    • マインドセット
    • マインドフルネス自分の気持ちを高めて、常に前向きに平常心でいるためのTipsや参考情報をまとめます!
    • ツール活用 効率化
人気の記事ランキングTOP 5!
  • 【自作手帳】自作リフィルのおすすめテンプレート10選!(PDF無料ダウンロード可!)
  • 【2026最新】ジャーナリングのおすすめ本10選!Unlimited対応も!
  • 【自作手帳】Word,Excelで出来る!A5システム手帳のリフィル自作方法
  • 【無料】Goodnotes6で使えるデジタルプランナー・テンプレート10選(PDFダウンロード可)
  • 【保存版】Goodnotes6の使い方まとめ!PDFの読み込み・PDF化・メモの書き方を徹底解説
手帳でキャリアも人生も自分らしく!
キャリアの実験室
  • 手帳
    • 手帳 リフィル自作した手帳のリフィルを公開していきます!
    • 手帳 レビュー
    • 手帳 アイデア
    • 手帳 セルフコーチング7つの習慣セルフコーチング認定コーチとして、独自に培ってきたセルフコーチング×手帳のノウハウを備忘録的にまとめます٩( ‘ω’ )و
    • 手帳 ジャーナリング
  • 独学
    • 独学 キャリアコンサルタント国家資格キャリアコンサルタントの試験対策や学んだコトなどをまとめていきます!
    • 独学 プログラミング
    • 独学 リスキリング自分で楽しく効率よく学習するリスキリングのTipsや参考情報をまとめますᕦ(ò_óˇ)ᕤ
  • ワーク
    • キャリア 転職
    • マインドセット
    • マインドフルネス自分の気持ちを高めて、常に前向きに平常心でいるためのTipsや参考情報をまとめます!
    • ツール活用 効率化
キャリアの実験室
  • 手帳
    • 手帳 リフィル自作した手帳のリフィルを公開していきます!
    • 手帳 レビュー
    • 手帳 アイデア
    • 手帳 セルフコーチング7つの習慣セルフコーチング認定コーチとして、独自に培ってきたセルフコーチング×手帳のノウハウを備忘録的にまとめます٩( ‘ω’ )و
    • 手帳 ジャーナリング
  • 独学
    • 独学 キャリアコンサルタント国家資格キャリアコンサルタントの試験対策や学んだコトなどをまとめていきます!
    • 独学 プログラミング
    • 独学 リスキリング自分で楽しく効率よく学習するリスキリングのTipsや参考情報をまとめますᕦ(ò_óˇ)ᕤ
  • ワーク
    • キャリア 転職
    • マインドセット
    • マインドフルネス自分の気持ちを高めて、常に前向きに平常心でいるためのTipsや参考情報をまとめます!
    • ツール活用 効率化
  1. ホーム
  2. 独学
  3. 独学 プログラミング
  4. 【Python入門】回帰分析や分類問題が使えるsklearnの使い方

【Python入門】回帰分析や分類問題が使えるsklearnの使い方

2024 11/21
独学 プログラミング
ワタシ

今回はPythonによる”回帰分析のやり方”について言及します。

回帰分析や分類問題は、データ分析による予測の基礎の基礎です。

Pythonではこれらの分析はSklearnというライブラリでほとんどが出来てしまいます。

そのため今回はライブラリの使い方として”回帰分析”を例にプログラム例を示します。

尚、裏でどのような仕組みがなされているのか、といった統計的な理解ポイントは下記にまとめております。

あわせて読みたい
【回帰分析】機械学習の仕組 | 重回帰分析、ロジスティック回帰の仕組とは ワタシ 今回は統計知識の“回帰分析”という概念について理解を深めます。 回帰分析は、データ分析による予測の基礎の基礎です。 ただ、回帰分析とググってみると、単回帰...
合わせて確認したい記事

Pythonを時短で基礎から応用まで一気に学びたい時はこちらもオススメ!
>>【Python】TechAcademyを実際に使ってみて学べたこと

目次

今回の論点整理

今回のアウトプット

下記のようにデータを読み込み、機械学習の専用ライブラリを通して計算して結果を可視化します。

今回は、あまり深く踏み込まずに、簡単な使い方だけサラッと触れていきます。あくまで今回は

何はともあれそれっぽい分析をしたい

ということをまずは前提にやっています。pythonはライブラリが多数用意されているので一つ分析の流れが分かれば後はさほど難しくないです。

今回の抑えドコ

そこで、今回は上記を実現する手順について下記に備忘録的にまとめたいと思います。

抑えドコ!
  • 今回の焦点
    ▷ライブラリを使って機械学習の手法を使える
    (想定場面:変数の多いデータセットの分析が必要な場合)
  • ポイント
    ▷機械学習とSklearn
    ▷回帰分析とは?
    ▷検証視点とは?

順に触れていきます。

今回のポイント

①機械学習とSklearn

まずは抑えるべき概念とライブラリを超ザックリと触れます。

まず、機械学習とはざっくりといえば、単純集計やクロス集計では出来ない高度な分析ができるもの。と捉えればよいと思います。(また今後まとめますが)

具体的な業務で考えた場合は、以下のようなことを言われたら利用する価値があるかなと思います。

機械学習の使い時
  • 「数ある要因の中でどれが一番効いてるの」
  • 「相関関係じゃなくて因果関係示せないの」
  • 「何等か予測とかできないの」

そして、Sklearnとは上記の声に応えるべく、サクッと高度な計算ができるように各種数式などをまとめたライブラリになります。

②回帰分析とは

さて、次は実際に分析を試してみようと思います。ここでは回帰分析を使います。

これまた、超ザックリいうと、「どの要因がどの程度影響しているか見る分析」とでも押さえておけばよいと思います。(これまた、どこかでまとめます。)

例えば、コンビニで売られている商品の売り上げ影響要因を考えた時に以下がどれほどなのかを機械が算出してくれます。

例:コンビニの売上要因
  • 商品の価格
  • ライバル店の価格
  • その日の天気
  • 商品のブランド
  • 商品の内容量
  • パッケージの色
  • 置かれている棚の位置
  • 周辺のイベント
  • 買われている顧客層

つまり、具体的な分析を想定すると、変数が3個以上あって人間の頭では到底判断するのが無理なものでも、そこを機械が求める値に合わせてぐるぐる数式を回転させながら計算してくれるような類です。

③検証視点とは

ここでは上記の回帰分析(重回帰)を実際にコードにいれて検証視点を考えます。今回も、前回同様、プリセットされているフリーデータ(ボストンの住宅価格データ)を使います。

# データの読み込み
from sklearn.datasets import load_boston

boston = load_boston()

dataset = pd.DataFrame(data = boston['data'], columns = boston['feature_names'])
dataset['price'] = boston['target']
dataset.head()

まずはデータを読み込み、求めたい値(目的変数)を価格(price)に設定します。そうすると以下のような値になると思います。

その後にこのデータを使って回帰分析の数式を読み込み、分析データをセットします。

# sklearn.linear_model.LinearRegression クラスを読み込み
from sklearn import linear_model
clf = linear_model.LinearRegression()

# 目的変数を指定
Y = dataset['price'].as_matrix()

# 説明変数にを設定
dataset2 = dataset.drop("price", axis=1)
X = dataset2.as_matrix()

数式の読み込みとデータのセットはこれだけ。あとはこの高度な分析を実施します。

# 予測モデルを作成
clf.fit(X, Y)

# 偏回帰係数
print(pd.DataFrame({"Name":dataset2.columns,
                    "Coefficients":np.abs(clf.coef_)}).sort_values(by='Coefficients') )

# 回帰係数
#print(clf.coef_)
 
# 切片 (誤差)
print(clf.intercept_)
 
# 決定係数
print(clf.score(X, Y))

分析自体もこれだけ実質の分析箇所はclf.fit()で終了です。結果はこのような形です。

あとはこの回帰係数の解釈ですが、基本的には影響度合いがどれくらいかを加味して数字通りの影響度があるとざっくり傾向を読めばOKです。

また、一番下の数字は決定係数と呼び、これらの変数全部でどれくらいを説明しきれているかを100%中何%かを示します。100ならいいというわけではないですが、一旦は高い程よいものだと捉えておけばよいと思います。

そして上記を踏まえ、じゃぁ一つ一つの変数をもう少し詳細に影響度合いを見たいとなった時には、以下のようにXの値を一つの数字に指定しなおし、かつ2軸の視覚化をすると分かりやすいです。

# matplotlib パッケージを読み込み
import matplotlib.pyplot as plt

#2軸で分析する変数を指定
Y = dataset['price'].as_matrix()
X = dataset.loc[:, ['RM']].as_matrix()

# 予測モデルを作成
clf.fit(X, Y)
 
# 回帰係数
print(clf.coef_)

# 散布図
plt.scatter(X, Y)
 
# 回帰直線
plt.plot(X, clf.predict(X))

# 決定係数
print(clf.score(X, Y))

今回の分析(単回帰)ではX(RM)とY(Price)それぞれ一つの値のため散布図など直感的に分かる図にすることが可能です。結果は以下の通り。

回帰係数と決定係数は上記と同じ見方をすればよく、散布図と近似直線を引いてどのような関係性かを視覚的にわかるようになっています。

上記から、実際のデータを使いましたが、注目するべきは以下の3点です。

注目すべき検証視点
  • 回帰係数の影響度合い
  • 決定係数での説明力
  • 散布図・グラフでの視覚化

まとめ

今回の学習のポイントは以下の通りでした。

学習のポイント
  • 機械学習とSklearn
    ▷人間ではわからない因果等の関係性を機械が数値化してくれる
  • 回帰分析とは?
    ▷機械学習の手法の一つで、多くの影響要因を定量化する
  • 検証視点とは?
    ▷回帰係数、決定係数、視覚化を意識

高度なことをするにも関わらず、やりたいこともやるべきことも実はシンプルです。それっぽい結果を算出することは誰でも簡単にできます。ただ、外してはいけないのが実務で使えるか?という視点だと思います。

そのため、まずは実際の実務データ(エクセル等)を読み込み、何がどのように影響しているかを実際に自分の手で動かして解釈するところから始めるのが良いかと思います。

身の回りのデータで自分の持つ知識を元に仮説を検証できると、難しい…というよりは面白い!という感覚になるので、上達するためにはこれの積み重ねなのだろうと思います。

ご精読頂きありがとうございました。
m(_ _)m

その他、Python初心者のお勉強のお供

上記の内容と併せて実務で活かすという視点では下記の参考図書も合わせて確認すると理解が深まります(-_-)

Python2年生 データ分析のしくみ 体験してわかる!会話でまなべる!
created by Rinker
¥2,178 (2026/02/22 22:22:41時点 Amazon調べ-詳細)
  • Kindle
  • Amazon
  • 楽天市場
  • Yahooショッピング
Marketing Python マーケティング・パイソン AI時代マーケターの独習プログラミング入門(できるビジネス) できるビジネスシリーズ
created by Rinker
¥2,376 (2026/02/23 09:59:56時点 Amazon調べ-詳細)
  • Kindle
  • Amazon
  • 楽天市場
  • Yahooショッピング
Python実践データ分析100本ノック
created by Rinker
¥2,376 (2026/02/22 22:22:41時点 Amazon調べ-詳細)
  • Kindle
  • Amazon
  • 楽天市場
  • Yahooショッピング

▼おすすめの動画学習(Udemy)▼

プログラミング言語の人気オンラインコース >>プログラミング講座はコチラから

※評価が4.0を超えて割引にもなっているコンテンツは特におすすめです!

【参考】Python初心者のお勉強のお供

上記の内容と併せて実務で活かすという視点では下記の参考図書も合わせて確認すると理解が深まります(-_-)

▼オススメの参考書籍(Kindle)▼

Python2年生 データ分析のしくみ 体験してわかる!会話でまなべる!
created by Rinker
¥2,178 (2026/02/22 22:22:41時点 Amazon調べ-詳細)
  • Kindle
  • Amazon
  • 楽天市場
  • Yahooショッピング
Marketing Python マーケティング・パイソン AI時代マーケターの独習プログラミング入門(できるビジネス) できるビジネスシリーズ
created by Rinker
¥2,376 (2026/02/23 09:59:56時点 Amazon調べ-詳細)
  • Kindle
  • Amazon
  • 楽天市場
  • Yahooショッピング
Python実践データ分析100本ノック
created by Rinker
¥2,376 (2026/02/22 22:22:41時点 Amazon調べ-詳細)
  • Kindle
  • Amazon
  • 楽天市場
  • Yahooショッピング

▼おすすめの動画学習(Udemy)▼

>>ゼロからPythonで学ぶ人工知能と機械学習 【2023年最新版】

>>現役シリコンバレーエンジニアが教えるPython 3 入門 + 応用

>>独学で身につけるPython〜基礎編〜【業務効率化・自動化】

【参考】Python初心者が抑えたいポイント集

Python(主にデータ分析・自動化)に関しては

下記に実践したポイントをまとめています。基本的にコピペするだけでそのまま使えます٩( ᐛ )و

あわせて読みたい
【Python入門】コピペしてそのまま使えるPythonの自動化プログラムまとめ ワタシ ども、らーにゃです。今回はPythonのプログラムについてまとめます。 Pythonをもっと身近なことに応用できないか? プログラミングをかじり始めた人で、こんなこ...

業務効率化・自動化においてはGoogle Apps Scriptもセットで学ぶことをオススメ!

こちらもコピペしてすぐに使えます!

あわせて読みたい
【GAS入門】コピペしてそのまま使えるGoogle Apps Scriptプログラム一覧 ワタシ ども、らーにゃです。今回はGASの活用についてまとめます。 身の回りのことをもっと自動化できないものか? 仕事でもプライベートでも忙しくなるほどに自動化の...

PythonとGoogle Apps Scriptどちらを深めようかを迷っていればこちら!

あわせて読みたい
【徹底比較】PythonとGASをどちらを学ぶべきか?実際に両方を学んで分かった違いとオススメ学習法 ワタシ ども、らーにゃです。今回はPythonとGASを比較していきます。 自分は非エンジニアだけど… 「もっともっと効率化したい!」 「プログラムを書けるようになりたい...
独学 プログラミング
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
  • 【Python入門】seabornでグラフ化 | データをうまく魅せる"ビジュアル化"7選
  • 【要約】2分でわかる「ライフシフト」のポイント解説!人生100年時代のキャリア戦略とは

この記事を書いた人

らーにゃのアバター らーにゃ

ビビっときたTipsや手帳術を発信します ٩( ᐛ )و

●家族:フルキャリ妻と子供2人

●資格:国家資格キャリアコンサルタント

●趣味:手帳歴20年 | 自作歴12年| デジプラ歴4年

関連記事

  • 【GAS】ショートカットを利用してApple Watch→スプレッドシートのデータ連携を行う
  • 【レビュー】ChatGPTの使い方 | プログラミング初心者の応用 (GAS/Python)
  • 【GAS】Google Fitのデータをスプレッドシートに引き抜くプログラムを考える
  • 【徹底比較】PythonとGASをどちらを学ぶべきか?実際に両方を学んで分かった違いとオススメ学習法
  • 【GAS】TogglのAPIを利用したデータ連携の仕様変更について
  • 【Python入門】コピペしてそのまま使えるPythonの自動化プログラムまとめ
  • 【Python自動化】GoogleスプレッドシートにPythonからデータを流し込む方法
  • 【Python自動化】タスクスケジューラで定時にPythonファイルを自動実行する方法

コメント

コメントする コメントをキャンセル

ブログの記事一覧
らーにゃ
国家資格キャリアコンサルタント
カナダでキャリコン/キャリアコーチをしながら理想のセカンドキャリアを作るヒントや考え方をブログやYouTubeで発信中!

●家族:
ーフルキャリの妻1人+子供2人
●趣味:
ー手帳歴20年 | 自作12年 | デジプラ3年
ーブログ歴8年 | YouTube歴1年
●資格:
ー国家資格キャリアコンサルタント
ー7つの習慣セルフコーチング認定コーチ
ーライフコーチ
人気の記事ランキングTOP5!
  • 【自作手帳】自作リフィルのおすすめテンプレート10選!(PDF無料ダウンロード可!)
  • 【2026最新】ジャーナリングのおすすめ本10選!Unlimited対応も!
  • 【自作手帳】Word,Excelで出来る!A5システム手帳のリフィル自作方法
  • 【無料】Goodnotes6で使えるデジタルプランナー・テンプレート10選(PDFダウンロード可)
  • 【保存版】Goodnotes6の使い方まとめ!PDFの読み込み・PDF化・メモの書き方を徹底解説
目次
検索
  • プロフィール
  • サイトマップ
  • プライバシーポリシー
  • お問い合わせ

© キャリアの実験室.

  • メニュー
  • ジャーナル
  • 自作手帳
  • アイデア
目次