统计学总体参数的估计(编辑修改稿)内容摘要:
定义为 , 统计量 取该值或更极端的值 的概率等于 a。 也就是说 ,“ 统计量的实现值比临界值更极端 ”等价于 “ p值小于 a”。 使用临界值的概念进行的检验不计算 p值。 只比较统计量的取值和临界值的大小。 167。 假设检验的过程和逻辑 • 使用临界值而不是 p值来判断拒绝与否是前计算机时代的产物。 当时计算 p值不易 ,只采用临界值的概念。 但从给定的 a求临界值同样也不容易 , 好在习惯上仅仅在教科书中列出相应于特定分布的几个有限的a临界值 ( 比如 a=, a=, a=,a=, a= ) , 或者根据分布表反过来查临界值 ( 很不方便也很粗糙 )。 • 现在计算机软件大都不给出 a和临界值 ,但都给出 p值和统计量的实现值 , 让用户自己决定显著性水平是多少。 167。 假设检验的过程和逻辑 • 在一些统计教科书中会有不能拒绝零假设就 “ 接受零假设 ” 的说法。 这种说法是不严格的。 • 首先 , 如果你说 “ 接受零假设 ” , 那么就应该负责任地提供接受零假设时可能犯第二类错误的概率。 这就要算出在备选假设正确的情况下错误接受零假设的概率。 但是 , 这只有在备选假设仅仅是一个与零假设不同的确定值 ( 而不是范围 ) 时才有可能。 • 多数基本统计教科书的备选假设是一个范围而根本无法确定犯第二类错误的概率。 167。 假设检验的过程和逻辑 • 在许多统计教科书中 , 往往把一系列不能拒绝零假设的检验当成接受这些假设的通行证。 • 比如不能拒绝某样本的正态性就变成了证明了该样本是正态的等等。 • 不能拒绝这些零假设 , 仅仅说明根据所使用的检验方法 ( 或检验统计量 )和当前的数据没有足够证据拒绝这些假设而已。 167。 假设检验的过程和逻辑 • 对于同一个假设检验问题 , 往往都有多个检验统计量;而且人们还在构造更优良的检验统计量。 • 人们不可能把所有的目前存在的和将来可能存在的检验都实施。 • 因此 , 只能够说 , 按照目前的证据 ,不足以拒绝零假设而已。 后面将会用例子说明 “ 接受零假设 ” 的说法是不妥当的。 167。 对于正态总体均值的检验 167。 根据一个样本对其总体均值大小进行检验 • 例 500g重的一包红糖 , 觉得份量不足 , 于是找到监督部门;当然他们会觉得一包份量不够可能是随机的。 于是监督部门就去商店称了 50包红糖 ( 数据在 ) ;其中均值 ( 平均重量 ) 是 ;这的确比 500g少 ,但这是否能够说明厂家生产的这批红糖平均起来不够份量呢。 于是需要统计检验。 可以画出这些重量的直方图 50包红糖重量的直方图 H i s t o g r a m o f S u g a r W e i g h tw e i g h tFrequency490 495 500 5050246810167。 根据一个样本对其总体均值大小进行检验 • 这个直方图看上去象是正态分布的样本。 不妨假定这一批袋装红糖有正态分布。 • 由于厂家声称每袋 500g( 标明重量 ) , 因此零假设为总体均值等于 500g( 被怀疑对象总是放在零假设 ) ; • 而且由于样本均值少于 500g(这是怀疑的根据 ), 把备选假设定为总体均值少于500g( 备选假设为单向不等式的检验称为单尾检验 ,为不等号 “ ≠” 的称为双尾检验 ) 01: 500 : 500HHmm 167。 根据一个样本对其总体均值大小进行检验 • 检验统计量就是第四章引进的作为对均值的某种标准化的 • 符号中的 m0通常表示为零假设中的均值 ( 这里是 500)。 在零假设之下 ,它有自由度为 n1=49的 t分布。 当然实际上不必代入这个公式去手工计算了 ,让计算机去代劳好了。 0/xtsnm167。 根据一个样本对其总体均值大小进行检验 • 计算结果是 t=( 也称为 t值 ) , 同时得到 p值为 ( 由于计算机输出的为双尾检验的 p值 , 比单尾的大一倍 , 应该除以2)。 看来可以选择显著性水平为 ,并宣称拒绝零假设 , 而错误拒绝的概率为。 O ne S a m pl e T e s t 2 . 6 9 6 49 . 0 1 0 1 . 6 5 2 8 0 2 . 8 8 4 7 . 4 2 0 9w e i g h tt df S i g . ( 2 t a i l e d )M e a nD i f f e r e n c e L o w e r U p p e r9 5 % C o n f i d e n c eI n t e r v a l o f t h eD i f f e r e n c eT e s t V a l u e = 5 0 05 4 3 2 1 0 1 2 3 4 500 . 0 50 . 10 . 1 50 . 20 . 2 50 . 30 . 3 50 . 4t v a l u eDensity of t(59)T a i l P r o b a b i l i t y f o r t ( 5 9 )t = 2 . 6 9 6p v a l u e = 0 . 0 0 5统计量 t=尾概率( p值) 167。 根据一个样本对其总体均值大小进行检验 • 上面例子的备选假设为小于( “ ”) 某个值。 同样也可能有备选假设为均值大于 ( “ ”) 某个值的情况。 • 取备选假设为均值大于或小于某个值的检验称为 单尾检验 (onetailed test, 也称为 单侧检验或单边检验 )。 下面举一个选假设为均值大于 ( “ ”) 某个值的例子。 167。 根据一个样本对其总体均值大小进行检验 • 例 ( ) 汽车厂商声称其发动机排放标准的一个指标平均低于 20个单位。 在抽查了 10台发动机之后 , 得到下面的排放数据: 、 、 、 、 、 、 、 、。 该样本均值为。 究竟能否由此认为该指标均值超过 20。 这次的假设检验问题就是 01: 2 0 : 2 0HHmm 167。 根据一个样本对其总体均值大小进行检验 • 和前面的例子的方法类似 , 可以发现 p值为 ( 计算机输出的双尾检验的 p值除以 2) , 因此 , 没有证据否定零假设。 这时的检验统计量 t=。 也可以画出类似于图 ( 图 ) 这时的 t分布的自由度为 9。 下面是结果的计算机输出: O ne S a m pl e T e s t1 . 2 3 4 9 . 2 4 9 1 . 1 3 0 0 0 . 9 4 2 2 3 . 2 0 2 2e x ht df S i g . ( 2 t a i l e d )M e a nD i f f e r e n c e L o w e r U p p e r9 5 % C o n f i d e n c eI n t e r v a l o f t h eD i f f e r e n c eT e s t V a l u e = 2 05 4 3 2 1 0 1 2 3 4 500 . 0 50 . 10 . 1 50 . 20 . 2 50 . 30 . 3 50 . 4t v a l u eDensity of t(9)T a i l P r o b a b i l i t y f o r t ( 9 )t = 1 . 2 3 4p v a l u e = 0 . 1 2 4 3t = 1 . 2 3 3 6统计量 t=尾概率( p值) 167。 根据一个样本对其总体均值大小进行检验 • 注意:在假设检验中往往也用带等号的不等式来表示零假设 , 比如上述的检验记为 • 但这里用于计算 p值的零假设还是m=20;但如果能够拒绝零假设 m=20,那么对于任何 m小于 20的零假设就更有理由拒绝了。 这和以拒绝零假设为初衷的假设检验思维方式是一致的。 01: 2 0 : 2 0HHmm 167。 根据一个样本对其总体均值大小进行检验 • 还有所谓的 双尾检验 (two tailed test,也称为 双侧检验 或 双边检验 )问题 , 即 • 在这种情况下 , 尾概率不仅是左边或右边的一个尾概率 , 而是两边尾概率之和。 因此如果是一个单尾检验问题 ,用了双尾检验的模式 , p值就比用单尾检验时大了一倍。 0 0 1 0::HHm m m m 167。 根据一个样本对其总体均值大小进行检验 • 如果上面发动机排放指标例子的检验问题改为是否该发动机的排放指标均值等于 20。 即 • 这时 t统计量还是取原来的值 ,但 p值为 2=。 图 变成图 01: 2 0 : 2 0HHmm 5 4 3 2 1 0 1 2 3 4 500 . 0 50 . 10 . 1 50 . 20 . 2 50 . 30 . 3 50 . 4t v a l u eDensity of t。统计学总体参数的估计(编辑修改稿)
相关推荐
有次品的个数及概率如下表 次品数 X = xi 0 1 2 3 概率 P(X=xi)pi 每 100个配件中的次品数及概率分布 求该供应商次品数的数学期望和标准差 iii px22( ) , ( ) 0 . 7 0 5 1 0 . 8 3 9 7iiiD X x p 167。 连续变量的分布 • 取连续值的变量 , 如高度 、 长度 、重量
数 1个主成分和原来的第一个变量 (人均 GDP)之间的线性相关系数。 这个系数越大 , 说明主成分对该变量的代表性就越大 12 29 统计学STATISTICS (第四版 ) 2020105 根据主成分分析模型和因子载荷 , 可以得到两个主成分与原来 6个变量之间的线性组合表达式如下 怎样解释主成分。 (主成分与原始变量的关系 )
i ,m inijGxGxkl dDljki ,m a x)()(2 lklkkl xxxxD ki liGx Gxijlkkl dnnD1lkmkl WWWD 213 27 统计学STATISTICS (第四版 ) 2020105 Nearest neighbor(最短距离法 )— 用两个类别中各个数据点之间最短的那个距离来表示两个类别之间的距离
的无偏估计时, 方差 越 小,无偏估计越有效。 ˆ 2)ˆ( Eˆ一致性 对于无限总体, 如果对任意 , 0>0)|ˆ(| nn PL im , 则称 是 的一致估计。 充分性 一个估计量如能完全地包含未知参数信息,即为充分量。 估计量 的 ˆ 区间估计 估计未知参数所在的可能的区间。 评价准则 随机区间 置信度 精确度 随机区间
累计频数) 向下累计分布:(变量下限,累计频数) 变量的组数无限增多时,折线便趋于一条光滑的曲线。 图形 0102030405060708090第一季度 第二季度 第三季度 第四季度0102030405060708090100第一季度 第二季度 第三季度 第四季度东部第一季度第二季度第三季度第四季度01020304050607080901000 2 4 6东部返回 综合指标概述 总量指标
025 1921 101835 310505 170094 2x2y xy解:( 1)绘制散点图 ( 2)建立简单直线回归方程: )1025(101835121921102517009412222 XXnYXXYnb 24121 02 54 20 121 92 11 XbYXbYna00ˆ bxay 其中 a=