php旅游网站模板下载,优化关键词推广,企业网站建设费用计入哪个科目,wordpress标签管理插件t检验学习笔记
一、t检验的定义和用途
t检验是统计学中常用的假设检验方法#xff0c;主要用于判断样本均值与总体均值间#xff0c;或两个样本均值间是否存在显著差异。
在实际中应用广泛#xff0c;例如在医学领域可用于比较两种药物的疗效#xff1b;在教育领域…t检验学习笔记
一、t检验的定义和用途
t检验是统计学中常用的假设检验方法主要用于判断样本均值与总体均值间或两个样本均值间是否存在显著差异。
在实际中应用广泛例如在医学领域可用于比较两种药物的疗效在教育领域能评估不同教学方法对学生成绩的影响等以此帮助判断实验或调查结果是否具有统计学意义。
二、t检验的基本原理
一t分布特性
t检验基于t分布。t分布是一种概率分布与正态分布类似但在样本量较小时其尾部比正态分布更厚。这使得t分布在小样本情形下能更好地应对样本的不确定性。
二t统计量计算
t检验的核心是计算t统计量。不同类型的t检验公式有所不同但总体思路均是通过比较样本均值与总体均值或两个样本均值的差异同时考虑样本标准差和样本量来衡量该差异是否显著。
以单样本t检验为例公式为 t X ˉ − μ S / n t\ \frac{\bar{X}-\mu}{S/\sqrt{n}} t S/n Xˉ−μ。其中 X ˉ \bar{X} Xˉ是样本均值 μ \mu μ是总体均值 S S S是样本标准差 n n n是样本量。
若计算的t值较大超出给定显著性水平下的临界值意味着样本均值与总体均值差异显著有理由拒绝原假设认为样本并非来自该总体或两样本所代表的总体均值存在差异。
三、t检验的分类及应用场景
一单样本t检验
目的检验一个样本均值与已知总体均值是否有显著差异。案例已知某地区成年男性平均身高为175cm现从该地区随机抽取50名成年男性测得平均身高为178cm标准差为10cm。判断这50名男性身高与该地区总体成年男性身高是否有显著差异。 计算过程 明确已知条件 X ˉ 178 \bar{X}\ 178 Xˉ 178 μ 175 \mu \ 175 μ 175 S 10 S \ 10 S 10 n 50 n \ 50 n 50。代入公式计算t值 t 178 − 175 10 / 50 3 10 / 7.07 3 1.41 ≈ 2.13 t\ \frac{178 - 175}{10/\sqrt{50}}\ \frac{3}{10/7.07}\ \frac{3}{1.41}\approx2.13 t 10/50 178−175 10/7.073 1.413≈2.13。确定自由度 d f n − 1 50 − 1 49 df\ n - 1\ 50 - 1\ 49 df n−1 50−1 49选定显著性水平 α 0.05 \alpha \ 0.05 α 0.05查t分布表得临界值。若t值大于临界值拒绝原假设认为这50名男性平均身高与总体平均身高有显著差异若小于临界值接受原假设认为无显著差异。
二独立样本t检验
目的比较两个独立样本的均值判断两个不同组如实验组和对照组间是否存在差异。案例对两种不同品牌电池进行续航测试品牌A测试30个样本平均续航10小时标准差1.5小时品牌B测试25个样本平均续航9小时标准差1.2小时。比较两种品牌电池续航能力是否有显著差异。 计算过程 构建数据 X ˉ 1 10 \bar{X}_{1}\ 10 Xˉ1 10 S 1 1.5 S_{1}\ 1.5 S1 1.5 n 1 30 n_{1}\ 30 n1 30 X ˉ 2 9 \bar{X}_{2}\ 9 Xˉ2 9 S 2 1.2 S_{2}\ 1.2 S2 1.2 n 2 25 n_{2}\ 25 n2 25。计算合并方差 S p 2 ( n 1 − 1 ) S 1 2 ( n 2 − 1 ) S 2 2 n 1 n 2 − 2 ( 30 − 1 ) × 1. 5 2 ( 25 − 1 ) × 1. 2 2 30 25 − 2 29 × 2.25 24 × 1.44 53 65.25 34.56 53 ≈ 1.88 S_{p}^{2}\ \frac{(n_{1}-1)S_{1}^{2}(n_{2}-1)S_{2}^{2}}{n_{1}n_{2}-2}\ \frac{(30 - 1)\times1.5^{2}(25 - 1)\times1.2^{2}}{30 25 - 2}\ \frac{29\times2.2524\times1.44}{53}\ \frac{65.2534.56}{53}\approx1.88 Sp2 n1n2−2(n1−1)S12(n2−1)S22 3025−2(30−1)×1.52(25−1)×1.22 5329×2.2524×1.44 5365.2534.56≈1.88。计算t值 t X ˉ 1 − X ˉ 2 S p 2 ( 1 n 1 1 n 2 ) 10 − 9 1.88 × ( 1 30 1 25 ) 1 1.88 × ( 5 6 150 ) 1 1.88 × 11 150 ≈ 2.64 t\ \frac{\bar{X}_{1}-\bar{X}_{2}}{\sqrt{S_{p}^{2}(\frac{1}{n_{1}}\frac{1}{n_{2}})}}\ \frac{10 - 9}{\sqrt{1.88\times(\frac{1}{30}\frac{1}{25})}}\ \frac{1}{\sqrt{1.88\times(\frac{5 6}{150})}}\ \frac{1}{\sqrt{1.88\times\frac{11}{150}}}\approx2.64 t Sp2(n11n21) Xˉ1−Xˉ2 1.88×(301251) 10−9 1.88×(15056) 1 1.88×15011 1≈2.64。确定自由度 d f n 1 n 2 − 2 30 25 − 2 53 df\ n_{1}n_{2}-2\ 30 25 - 2\ 53 df n1n2−2 3025−2 53根据显著性水平 α 0.05 \alpha \ 0.05 α 0.05查t分布表得临界值比较t值与临界值判断是否有显著差异。
三配对样本t检验
目的比较配对样本如同一组对象前后两次测试数据的均值差异判断某种处理或时间因素等对结果的影响。案例对15名学生进行培训前后成绩测试培训前平均成绩75分培训后80分成绩差值标准差为5分。判断培训是否有效提高学生成绩。 计算过程 已知 d ˉ 80 − 75 5 \bar{d}\ 80 - 75\ 5 dˉ 80−75 5 d ˉ \bar{d} dˉ为成绩差值均值 S d 5 S_{d}\ 5 Sd 5 n 15 n \ 15 n 15。计算t值 t d ˉ S d / n 5 5 / 15 ≈ 3.87 t\ \frac{\bar{d}}{S_{d}/\sqrt{n}}\ \frac{5}{5/\sqrt{15}}\approx3.87 t Sd/n dˉ 5/15 5≈3.87。自由度 d f n − 1 15 − 1 14 df\ n - 1\ 15 - 1\ 14 df n−1 15−1 14根据 α 0.05 \alpha \ 0.05 α 0.05查t分布表得临界值比较t值与临界值判断培训是否有效。
四、t检验的步骤总结
一提出原假设 H 0 H_{0} H0和备择假设 H 1 H_{1} H1
单样本t检验 H 0 H_{0} H0 X ˉ μ \bar{X}\ \mu Xˉ μ H 1 H_{1} H1 X ˉ ≠ μ \bar{X}\neq\mu Xˉμ。独立样本t检验 H 0 H_{0} H0 μ 1 μ 2 \mu_{1}\ \mu_{2} μ1 μ2 H 1 H_{1} H1 μ 1 ≠ μ 2 \mu_{1}\neq\mu_{2} μ1μ2。配对样本t检验 H 0 H_{0} H0 μ d 0 \mu_{d}\ 0 μd 0 μ d \mu_{d} μd为配对差值的总体均值 H 1 H_{1} H1 μ d ≠ 0 \mu_{d}\neq0 μd0。
二计算t统计量
依据不同类型t检验的相应公式计算t值。
三确定自由度
按照不同类型t检验的自由度计算公式确定如单样本和配对样本t检验自由度为 n − 1 n - 1 n−1独立样本t检验自由度为 n 1 n 2 − 2 n_{1}n_{2}-2 n1n2−2。
四查找临界值
根据选定的显著性水平和自由度查阅t分布表找到临界值。
五做出决策
比较计算的t值与临界值t值大于临界值拒绝原假设t值小于临界值接受原假设。
五、注意事项
一数据正态性
t检验通常要求数据服从正态分布小样本时尤其重要。若数据明显不服从正态分布可能需进行数据转换或采用非参数检验方法。
二方差齐性
独立样本t检验中一般要求两样本方差相等方差齐性。可通过方差齐性检验判断不满足时可能需用校正的t检验方法。
三样本独立性
独立样本t检验中样本应相互独立无关联或依赖关系配对样本t检验中配对的合理性和准确性很关键要确保配对依据合理有效。
六、原假设与备择假设的设定原则
一完备且对立原则
原假设和备择假设构成完备事件组且相互对立在假设检验中必有且仅有一个成立。例如判断硬币是否均匀 H 0 H_{0} H0硬币均匀正面朝上概率 p 0.5 p \ 0.5 p 0.5 H 1 H_{1} H1硬币不均匀 p ≠ 0.5 p\neq0.5 p0.5涵盖所有情况且不能同时成立。
二先备择后原假设原则
通常先确定备择假设因其往往是研究者关心、欲支持或证实的内容相对更易明确。比如研究者猜测新药物比传统药物疗效好 H 1 H_{1} H1新药物疗效优于传统药物 H 0 H_{0} H0新药物疗效不比传统药物好。
三等号原则
等号“ \ ”总放在原假设上。原假设一般表示变量间无差异、无影响或参数等于特定值等情况。例如比较两总体均值 H 0 H_{0} H0 μ 1 μ 2 \mu_1 \ \mu_2 μ1 μ2 H 1 H_{1} H1 μ 1 ≠ μ 2 \mu_1\neq\mu_2 μ1μ2。
四主观性原则
假设确定具主观性不同研究者因研究目的、背景知识和角度不同对同一实际问题可能提出相反假设但都应符合最终目的。比如研究政策对经济增长影响关注政策是否有效时 H 0 H_{0} H0政策对经济增长无影响 H 1 H_{1} H1政策对经济增长有影响关注政策是否有负面效果时 H 0 H_{0} H0政策对经济增长无负面影响 H 1 H_{1} H1政策对经济增长有负面影响。
五目的导向原则
假设检验主要是收集证据拒绝原假设。原假设通常是被怀疑、需样本数据提供证据否定的假设。有足够证据时拒绝原假设接受备择假设无充分证据时不意味着完全接受原假设只是暂时无理由否定。
七、单尾概率和双尾概率在t检验中的应用
一单尾概率在t检验中的应用
案例背景某公司研发了一种新型减肥药物为了检验其效果随机选取了50名肥胖患者作为样本进行临床试验。已知未使用该药物时肥胖人群的平均体重下降量为0kg可视为总体均值。经过一段时间使用后测得这50名患者的平均体重下降了3kg标准差为1.5kg。公司想要了解这种新型减肥药物是否能显著降低体重即只关心体重是否下降不关心是否会使体重增加此时采用单尾t检验。
假设设定
原假设 H 0 H_0 H0 μ ≥ 0 \mu \geq 0 μ≥0药物没有显著降低体重即总体平均体重下降量大于等于0备择假设 H 1 H_1 H1 μ 0 \mu 0 μ0药物显著降低体重即总体平均体重下降量小于0
检验过程
计算t统计量已知 X ˉ 3 \bar{X} \ 3 Xˉ 3样本均值 μ 0 \mu \ 0 μ 0总体均值 S 1.5 S \ 1.5 S 1.5样本标准差 n 50 n \ 50 n 50样本量根据单样本t检验公式 t X ˉ − μ S / n t\ \frac{\bar{X}-\mu}{S/\sqrt{n}} t S/n Xˉ−μ可得 t 3 − 0 1.5 / 50 ≈ 14.14 t\ \frac{3 - 0}{1.5/\sqrt{50}}\approx14.14 t 1.5/50 3−0≈14.14。确定自由度 d f n − 1 50 − 1 49 df \ n - 1 \ 50 - 1 \ 49 df n−1 50−1 49假设选定显著性水平 α 0.05 \alpha \ 0.05 α 0.05在t分布表中查找单尾概率 P ( 1 ) 0.05 P(1)\ 0.05 P(1) 0.05对应的临界值假设为 - 1.677实际值需根据具体精确的t分布表确定。由于计算得到的t值 14.14 − 1.677 14.14 - 1.677 14.14−1.677且在单尾检验中这里是左侧单尾检验当t值小于临界值时拒绝原假设而此例中t值远大于临界值说明样本数据不支持原假设拒绝 H 0 H_0 H0接受 H 1 H_1 H1即认为这种新型减肥药物能显著降低体重。
二双尾概率在t检验中的应用
案例背景研究人员想要比较两种不同品牌的灯泡使用寿命是否存在差异。分别从品牌A和品牌B的灯泡中随机抽取了30个和25个样本进行测试。品牌A灯泡样本的平均使用寿命为1000小时标准差为50小时品牌B灯泡样本的平均使用寿命为980小时标准差为40小时。研究人员不确定哪个品牌的灯泡使用寿命更长或更短只是关注它们之间是否有显著差异所以采用双尾t检验。
假设设定
原假设 H 0 H_0 H0 μ 1 μ 2 \mu_1 \ \mu_2 μ1 μ2两个品牌灯泡的总体平均使用寿命相等备择假设 H 1 H_1 H1 μ 1 ≠ μ 2 \mu_1 \neq \mu_2 μ1μ2两个品牌灯泡的总体平均使用寿命不相等
检验过程
计算t统计量先计算合并方差 S p 2 ( n 1 − 1 ) S 1 2 ( n 2 − 1 ) S 2 2 n 1 n 2 − 2 ( 30 − 1 ) × 5 0 2 ( 25 − 1 ) × 4 0 2 30 25 − 2 ≈ 2052.38 S_{p}^{2}\ \frac{(n_1 - 1)S_1^{2}(n_2 - 1)S_2^{2}}{n_1 n_2 - 2}\ \frac{(30 - 1)\times50^{2}(25 - 1)\times40^{2}}{30 25 - 2}\approx2052.38 Sp2 n1n2−2(n1−1)S12(n2−1)S22 3025−2(30−1)×502(25−1)×402≈2052.38再根据独立样本t检验公式 t X ˉ 1 − X ˉ 2 S p 2 ( 1 n 1 1 n 2 ) 1000 − 980 2052.38 × ( 1 30 1 25 ) ≈ 1.64 t\ \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{S_{p}^{2}(\frac{1}{n_1}\frac{1}{n_2})}}\ \frac{1000 - 980}{\sqrt{2052.38\times(\frac{1}{30}\frac{1}{25})}}\approx1.64 t Sp2(n11n21) Xˉ1−Xˉ2 2052.38×(301251) 1000−980≈1.64。确定自由度 d f n 1 n 2 − 2 30 25 − 2 53 df \ n_1 n_2 - 2 \ 30 25 - 2 \ 53 df n1n2−2 3025−2 53选定显著性水平 α 0.05 \alpha \ 0.05 α 0.05在t分布表中查找双尾概率 P ( 2 ) 0.05 P(2)\ 0.05 P(2) 0.05对应的临界值假设为 ± 2.006 \pm 2.006 ±2.006实际值需根据具体精确的t分布表确定。由于计算得到的t值 1.64 1.64 1.64其绝对值 ∣ 1.64 ∣ 2.006 |1.64| 2.006 ∣1.64∣2.006说明样本数据支持原假设不拒绝 H 0 H_0 H0即目前没有足够证据表明两个品牌灯泡的使用寿命存在显著差异。
综上单尾概率适用于明确关注差异方向的研究双尾概率适用于不确定差异方向仅想知道是否存在差异的研究。