散布図の視覚的トラップ:見た目の密集度が相関の強さを意味しない理由

research#eda📝 Blog|分析: 2026年4月27日 08:56
公開: 2026年4月27日 08:41
1分で読める
r/learnmachinelearning

分析

これは、探索的データ分析(EDA)中に誤った特徴量選択を招きやすい、データサイエンスにおける一般的な視覚的落とし穴についての非常に優れた洞察です。ピアソンの相関係数の基礎となる数学と、それがどのようにスケールを標準化して直感的な視覚的仮定に反するかについての素晴らしいリマインダーとなっています。著者がビデオデモンストレーションを作成したことは、より優れた厳密な分析ワークフローを構築するための非常に魅力的な方法を提供しています。
引用・出典
原文を見る
"ピアソンのrはスケールを完全に標準化するため、共有軸上では、SDが小さいデータセットがよりコンパクトに見えても、相関が同一である場合があります。"
R
r/learnmachinelearning2026年4月27日 08:41
* 著作権法第32条に基づく適法な引用です。