【クラスタリング】自動で分類分けする仕組 | k-means法、エルボーメソッドとは
「クラスタリング」とは,データ間の類似度にもとづいて、データをグループ分けする機械学習の代表的な手法の1つです。 人によってはクラスターというと、病原菌が発生した地域みたいな負のイメージがあるかもしれませんが、ザックリい…
「クラスタリング」とは,データ間の類似度にもとづいて、データをグループ分けする機械学習の代表的な手法の1つです。 人によってはクラスターというと、病原菌が発生した地域みたいな負のイメージがあるかもしれませんが、ザックリい…
「分類問題」とは,データをそれぞれカテゴリに分類するもので,回帰問題と並ぶ機械学習の代表的な使い方の1つです。 この領域も具体例のイメージはわきやすいものの、手法としては直感的に分かりづらく、解説をうけても分かったようで…
回帰分析は、データ分析による予測の基礎の基礎です。 ただ、回帰分析とググってみると、単回帰分析、重回帰分析、ロジスティック回帰と色々なサイトがヒットしてわけがわからなくなります。 そのため今回はこのデータ分析の基礎にあた…
今回の内容は仮説統計・仮説検定という領域のものになります。 これは「とある仮説に対して、それが正しいのか否かを統計学的に検証する」という推計統計学の手法の一つです。 ただ、パッと見、専門用語がごちゃごちゃ出てきて混乱して…
回帰分析や分類問題は、データ分析による予測の基礎の基礎です。 Pythonではこれらの分析はSklearnというライブラリでほとんどが出来てしまいます。 そのため今回はライブラリの使い方として”回帰分析”を例にプログラム…
Pythonでデータ分析をしよう!と思った時に、実務レベルで考えると 綺麗なグラフってそれっぽい見た目で魅せられないか? と思う時が多々あります。結論からいうと、当然できる!話ですので、具体的な方法論・コードについて下記…
Pythonでデータ分析をしよう!と思った時に、実務レベルで考えると エクセルにピポットテーブル的なこと(クロス集計)ができないものか? と思う時が多々あります。結論からいうと、当然できる!話ですので、具体的な方法論・コ…
Pythonという言語やデータサイエンスという概念がブームを迎える中、そもそもPythonでのデータ分析はどこから着手するべきなのでしょうか? またここで、どのようなデータ分析であれ、データを読み込むという作業はあり、こ…
最近、iPadでもキーボードがつくようになりiPadOSでは複数のアプリも起動できたりマウスも使えたりともはやミニPCです。 そのため、家の中ではWindowsで、外出中はiPadで、データ分析環境が整えられるのでは?と…