为了使不同样本容量的数据有统┅的评判标准构造一个随机变量
其中n=a+b+c+d为样本容量。利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两個分类变量的独立性检验。
利用独立性检验来考察两个分类变量是否有关系并且能较精确地给出这种判断的可靠程度,具体做法是:
(1)根據实际问题需要的可信程度确定临界值k0;
(2)利用公式(1)由观测数据计算得到随机变量K2的观测值;
(3)如果k>k0,就以(1-P(K2≥k0))×100%的把握认为“X与Y有关系”;否则就說样本观测数据没有提供“X与Y有关系”的充分证据
1. 独立性检验的必要性(即为什么不能只凭列联表中的数据和由其绘出的图形下结论)
由列聯表可以粗略地估计出两个变量(两类对象)是否有关(即粗略地进行独立性检验),但2×2列联表中的数据是样本数据它只是总体的代表,具有隨机性故需要用独立性检验的方法确认所得结论在多大程度上适用于总体.关于这一点,在后面的案例中还要进一步说明
2. 独立性检验的原理及步骤
独立性检验是一种假设检验(先假设,再推翻假设)它的原理及步骤与反证法类似。
要证明独立性结论A想说明假设H 1(两个分类变量即两类对象有关)成立
在A不成立的前提下进行推理
在H 1不成立,即H 0(两类对象无关即相互独立)成立的条件下进行推理
推出矛盾,意味着结论A荿立
推出小概率事件(概率不超过α,α一般为0.001,0.01,0.05或0.1)发生意味着H 1成立的可能性很大(可能性为1-α)
没有找到矛盾,意味着不能确定A成立
没有推出小概率事件发生意味着不能确定H 1成立
内容提示:浅谈概率论中的独立性问题
文档格式:PDF| 浏览次数:15| 上传日期: 12:24:51| 文档星级:?????