
Spurious Correlations 是由哈佛大学法学院学生、数据极客 Tyler Vigen 创建的一个趣味统计学网站。该网站的核心宗旨通过极其荒谬的数据图表来直观地展示一个统计学公理:“相关性不等于因果性(Correlation does not imply causation)”。Tyler 编写了一套算法,自动从美国人口普查局、CDC(疾控中心)等权威数据库中抓取成千上万组完全不相关的公共数据,然后强行寻找它们在数学趋势上的“完美同步”。
网站上展示的案例既严谨又荒诞。正如您所提到的,最著名的案例包括:**“尼古拉斯·凯奇每年的电影产量”竟然与“泳池溺亡人数”呈现高度正相关(相关系数 r=0.666);“美国在科学、太空和技术上的投入”与“上吊、勒死及窒息自杀人数”**的曲线几乎完全重合(相关系数高达 0.997)。此外还有“缅因州的离婚率”与“人造黄油人均消费量”成正比,“人均奶酪消费量”与“被床单缠住窒息死亡的人数”神同步等。这些数据都是真实的,但它们之间的联系纯属巧合或算法硬凑的“伪相关”。
这个项目最初只是为了让枯燥的统计学课程变得有趣,结果迅速在互联网走红,甚至出版了同名畅销书。它以一种幽默讽刺的方式警示人们:在大数据时代,如果我们只看图表趋势而不探究背后的逻辑,很容易被数据欺骗。它揭露了“数据挖掘”中的陷阱——只要数据量足够大,你总能找到两个毫无关联的事物在数学上产生联系,但这在现实逻辑中毫无意义。
Spurious Correlations is a satirical project created by Tyler Vigen designed to demonstrate that “correlation does not imply causation.” By using algorithms to find statistical matches between completely unrelated datasets—such as Nicolas Cage’s film appearances and pool drownings—the site generates hilarious graphs that are mathematically accurate but logically absurd. It serves as an entertaining yet educational reminder of the dangers of data dredging and the importance of context in statistical analysis.
关键词:
标签:
数据统计
相关导航


Wolfram|Alpha | 计算型知识引擎与专业数据分析平台

River Runner Global|地球水系的可视化之旅

AgeEye | 中国人文历史时空动态可视化探索平台

Passport Index | 全球实时护照排名与流动性情报权威

Surfer

Brilliant | 全球顶尖互动式STEM学习平台

