实现功能
使用scipy.stats模块中的chi2_contingency函数来执行卡方检验(Chi-square test)。卡方检验用于检验两个或多个分类变量(组别)之间是否存在显著关联(差异)。
例1:从某中学随机抽取两个班,调查他们对待文理分科的态度,结果,甲班37人赞成,27人反对;乙班39人赞成,21人反对,这两个班对待文理分科的态度是否有显著差异(α= .05)?

例2:探究(不同组)死亡年龄和居住地、性别是否有关(有显著差异)?

实现代码
- from scipy.stats import chi2_contingency
-
- # 例1:构建列联表(二维数组)
- observed = [[37,27],
- [39,21]]
-
- # 执行卡方检验
- statistic, p_value, dof, expected = chi2_contingency(observed)
-
- # 打印结果
- print("Chi-square statistic:", statistic)
- print("p-value:", p_value)
- print("Degrees of freedom:", dof)
- print("Expected frequencies:", expected)
-
-
- # 例2:构建列联表(二维数组)
- observed = [[11.7,8.7,15.4,8.4],
- [18.1,11.7,24.3,13.6],
- [26.9,20.3,37,19.3],
- [41,30.9,54.6,35.1],
- [66,54.3,71.1,50]]
-
- # 执行扩展卡方检验
- statistic, p_value, dof, expected = chi2_contingency(observed)
-
- # 打印结果
- print("Chi-square statistic:", statistic)
- print("p-value:", p_value)
- print("Degrees of freedom:", dof)
- print("Expected frequencies:", expected)
实现效果

本人读研期间发表5篇SCI数据挖掘相关论文,现在某研究院从事数据挖掘相关科研工作,对数据挖掘有一定认知和理解,会结合自身科研实践经历不定期分享关于python、机器学习、深度学习基础知识与案例。
致力于只做原创,以最简单的方式理解和学习,关注我一起交流成长。
邀请三个朋友关注V订阅号:数据杂坛,即可在后台联系我获取相关数据集和源码,送有关数据分析、数据挖掘、机器学习、深度学习相关的电子书籍。