統計

プログラミング・データサイエンス

【データサイエンス】経営に”データで示して”とエビデンスを求められた際の留意点

業務を遂行する中で、各種分析に関するレポート報告する場面が多々あります。 その際に問題になるのが前提としての報告対象が統計知識がゼロの上で、かつ事業・経営的なメリットを求めている場合が多いという点です。 そのため、単に分…

プログラミング・データサイエンス

【データサイエンス】確率分布(ポアソン分布、正規分布等)とは一体何なのか

統計の勉強をすると「確率分布」という言葉が頻出して出てきますが、なんど解説を聞いてもピンとこなかったりします。 とはいえ、ここの理解なくして、各種統計モデルの理解は難しいので、代表的な分布図をかいつまんで最低限のポイント…

プログラミング・データサイエンス

【クラスタリング】自動で分類分けする仕組 | k-means法、エルボーメソッドとは

「クラスタリング」とは,データ間の類似度にもとづいて、データをグループ分けする機械学習の代表的な手法の1つです。 人によってはクラスターというと、病原菌が発生した地域みたいな負のイメージがあるかもしれませんが、ザックリい…