标准正态分布的充分统计量样本下的次序统计量的平方和服从什么分布?

第五章 统计量及其分布_甜梦文库
第五章 统计量及其分布
第五章 统计量及其分布§ 5.1 总体与样本内容概要1 总体 在一个统计问题中,研究对象的全体称为总体,构成总体的每个成员称为个体若 关心的是总体中每个个体的一个数量指标,则该总体称为一维分布。若关心的是总体中的每 个个体的两个数量指标,则该总体称为二维总体,二维总体就是一个二维分布,余此类推。 2 有限总体与无限总体 若总体中的个数是有限的,此总体称为有限总体。若总体中的个数是无限的,此总体称为无限总体。 实际中总体的个体数大多是有限的。当个体数充分大时,将有限总体看作无限总体是一 种合理的抽象。 3 样本 从总体中随机抽取的部分个体组成的集合称为样本,样本的个体称为样本,样本 个数称为样本容量或样本量。 样本常用 n 个指标值 x1 , x 2 , K , x n 表示.它可看作 n 维随机变量,又可看作其观察值,这由 上下文加以区别。 4 分组样本 只知样本观测值所在区间,而不知具体值的样本称为分组样本。 缺点:与完全样本相比损失部分信息。 优点:在样本量较大时,用分组样本即简明扼要,又能帮助人们更好的认识总体。 5 简单随机样本 若样本 x1 , x 2 , K , x n 是 n 个相互独立的具有同一分布(总体分布)的随机变量,册称该样本为简单随机样本,仍简称样本。 若总体的分布函数为 F(x),则其样本的(联合)分布函数为∏ F (x ) ;i i =1 nn若总体的密度函数为 P(x),则其样本的(联合)密度函数为∏ p( x) ;i =1若总体的分布列为{p(x i )},则其样本的(联合)分布列为∏ p( x) ;i =1n1 习题与解答 5.11. 某地电视台想了解某电视栏目(如:每晚九点至九点半的体育节目)在该 地区的收 视率情况,于是委托一家市场咨询公司进行一次电话访查。 (1)该项研究的总体是什么? (2)该项研究的样本是什么? 解:(1)该项研究的总体是该地区全体电视观众; (2)该项研究的样本上一该地区被电话访查的电视观众。 2. 为了了解统计学专业本科毕业生的就业情况,我们调查了某地区 30 名 2000 年毕业生 的统计学专业本科生实习期满的月薪情况。 (1)什么是总体? (2)什么是样本? (3)本量是多少?解:(1) 总体是该地区 2000 年毕业的统计学专业本科生实习期满后的月薪; (2) 样本是被调查的 30 名 2000 年毕业的统计学专业本科生实习期满后的月薪; (3) 样本量为 30。 3.设某厂大量生产某种产品,其不合格品率 p 未知,每 m 件产品包装为一盒。为了检查 产品的质量,任意抽取 n 盒,查其中的不合格品数,试说明什么是总体,什么是样本,并指出样本 的分布。 解: 总体为该厂生产的每盒产品中的不合格品数; 样本是任意抽取的 n 盒中每盒产品的 不合格数; 样 本 中 每 盒 产 品 中 的 不 合 格 品 数 为 x1 ,…, x n , 因 xi ~b(m,p),i=1,2,…,n, 所 以 样 本 (x1,x2,…,xn)的分布为? n ? m ?? ? m ? xi ? ? p (1 ? p )m? xi = ? ∏ ? ? ? p t (1 ? p ) nm ?t , 其中t = x1 + L + x n . ∏? x ? ? ? x ?? i =1 ? i ? ? i ?1 ? i ? ?n4. 假设一位运动员在完全相同的条件下重复进行 n 次打靶,试给出总体样本的统计描述。 解: 若以 P 记运动员打靶命中的概率,并以“1”记打靶命中,记“0”记打靶未命中,则总体为 运动员打靶命中与否,该总体可由一个二点分布表示: X P 0 1-p 1 p样本为由 n 个 0 或组成的集合,若记 xi 为第 i 次打靶命中情况,则 xi ~b(1,p),i=1,2,…,样本2 (x1,x2,…,xn)的分布为∏Pi =1nxi(1 ? p )1? xi = p t (1 ? p ) n ?t ,其中 t= x1 + L + x n 。5. 某厂生产的电容器的使用寿命服从指数分布,为了解其平均寿命,从中抽出 n 件厂品测 其实际使用寿命,试说明什么是总体,什么是样本,并指出样本的分布 解: 总体是该厂生产的电容器的寿命,或者可以说总体是指数分布,其分布为 Exp( λ ); 样本是该厂中抽出的 n 个电容器的寿命; 记第 i 个电容 器的寿 命为 xi , 则 xi ~ Exp( λ ),i=1,2,… ,n,样 本 (x1,x2, …,xn)的分布 为∏ λe λi =1n? xi= λn e ?λt ,其中 t= x1 + L + x n 。6. 美国某高校根据毕业生返校情况记录,宣布该校毕业生的资为五万美元,你对此有和 评论。 解: 毕业生返校记录是全体毕业生中的一个特殊群体 (子总体) 的一个样本,它只能反映 该子总体的特征,不能反映全体毕业生状况,故此说法有骗人之嫌。 7. 设有 N 个厂品,其中有 M 个次品,进行放回抽样。定义 xi 如下:?1, 第i次取得次品, xi = ? ?0, 第i次取得正品。求样本 x1 , x 2 , L , x n 的联合分布。 解: 总体的分布列为P ( X = 1) =xM M , P ( X = 0) = 1 ? , N N1? x也可以写成?M ? ? M ? P ( X = x ) = ? ? ?1 ? ? N? ?N? ?, x = 0,1.因此样本 x1 , x 2 , L , x n 的联合分布列为?M ? ? M ? p ( x1 , x2 ,L , xn ) = ∏ ? ? ?1 ? ? N? i =1 ? N ? ?nxi1? xi?M ? ? M ? = ? ? ?1 ? ? N? ?N? ?tn ?t, xi = 0,1,其中 t = x1 + x2 + L + xn . 8.设离散总体的分布列为 P ( X = k ) = 为样本, x =1 , k = 1,2, L , n. 现进行不返回抽样,(x1,x2,…,xn) N_ 1 n 。 xi 为样本均值,求 E ( x) 与 Var ( x ) (表示成 N 的函数) ∑ n i =13 解: 由于 N 有限,抽样是不返回的,所以样本 x1 , x 2 , L , x n 中诸 xi 的分布列与总体的分布 以下我们先求诸 xi 的期望,方差与 列相同,但诸 xi 间不相互独立,即此样本不是简单随机样本。 协方差:E ( xi ) = ∑k =1Nk 1 N ( N + 1) N + 1 = ? = , i = 1, 2,L n, N N 2 2 k 2 ? N +1? ?? ? ? 2 ? k =1 NN 2 2Var ( xi ) = E ( xi2 ) ? [ E ( xi )]2 = ∑N ( N + 1)(2 N + 1) ? N + 1 ? N 2 ?1 = ?? = , i = 1, 2,L , n, ? 6N 12 ? 2 ? Cov( xi , x j ) = E ( xi x j ) ? E ( xi ) ? E ( x j ) = ∑k ≠1 Nk l ? N +1 ? ? ?? ? , N N ?1 ? 2 ?2其中N N 2 ( N + 1) N ( N + 1)(2 N + 1) ? N ? 2 ∑ kl = ? ∑ k ? ? ∑ k = 4 ? ? 6 k ≠1 k =1 ? k =1 N = ( N + 1)( N ? 1)(3 N + 2), 12 N 2代回原协方差表达式,可得N ( N + 1)( N ? 1)(3 N + 2) ( N + 1) 2 Cov( xi , x j ) = ? 12 N ( N ? 1) 4 N +1 , i ≠ ji, 且j = 1, 2,L , N , =? 12_由此可得样本均值 x 的期望与方差E(x ) = Var ( x ) = =1 n2∑ E(x ) =i =1 inN +1 2N ? 1 ? n Var ( xi ) + ∑ Cov( xi , x j ) ? 2 ?∑ n ? i =1 i≠ j ?1 ? n( N 2 ? 1) N + 1? 1 ? n(n ? 1) ? ( N + 1)( N ? n). ?= 2 ? n ? 12 12 ? 12n4 5.2 样本数据的整理与显示内容提要1. 经 验 分 布 函 数 若 将 样 本 观 测 值 x1 , x 2 , L , x n 由 小 到 大 排 列 , 得 有 序 样 本x(1) ≤ x( 2) ≤ L ≤ x( n ) , 用有序样本定义如下函数? 0, ? Fn ( x) = ?k / n, ? 1, ?当x & x(1) , 当x ( k ) ≤ x & x( k +1) , k = 1,2,L, n ? 1, 当x ≥ x( n ) ,则称 Fn (x ) 为该样本的经验分布函数 。 格里纹科定理 设 x1 , x 2 , L , x n 是取自总体分布函数为 F ( x)的样本,Fn ( x)是 该样本?∞& x &∞的经验分布函数,则当 n→∞时: P ( sup | Fn ( x ) ? F ( x ) |) = 1 。 此定理表明: n 相当大时,经验分布函数 Fn ( x)是总体分布函数F ( x)的一个 良好的近似, 当 它是经典统计学的一块基石。 2. 频数频率分布表 有样本数据 x1 , x 2 , L , x n 制作频数频率分布表的操作步骤如下: 确定组数 k; 确定每组组距,通常取每组组距相等为 d; 确定每组组限; 统计样本数据落入每个区间的频数,并计算频率。 综合上述,列入表中,即得该样本的频数频率分布表,该表就是一个分组样本,它能简明扼 要的样本特点表示出来。不足之处是该表依赖于分组,不同的分组方式有不同的频数频率分 布表。 3. 样本数据的图形表示 (1)直方图 利用频数频率分布表上的区间(横坐标)和频数(纵坐标)可作出频数直方图; 若把纵坐标改为频率就得频率直方图; 若把纵坐标改为频率/组距,就得到单位频率直方图。这时长条矩形的面积之和为 1 此三种直方图的差别仅在纵坐标的设置上,直方图本身无变化。 (2)茎叶图5 把样本中的每个数据分为茎与叶,把茎放于一侧,叶放于另一侧,就得到一张该样本的茎 叶图,比较两个样本时,可画出背靠背的茎叶图。 茎叶图保留数据中的全部信息,当样本量较大时数据很分散,横跨二,三个数量级时,茎叶 图并不实用。习题与解答 5.21. 以下是某工厂通过抽样调查得到的 10 名工人一周内生产的产品 149,156,160,138,149, 153,153,169,156,15.试由这批数据构造经验分布函数并作图。 解:此样本容量为 10,经排序可得到有序样本;x(1) = 138, x( 2 ) = x(3) = 149, x( 4 ) = x( 5) = 153, x( 6) = x( 7 ) = x(8) = 156, x(9 ) = 160, x(10) = 169其经验分布函数及其图形分布如下?0, ?0.1, ? ?0.3, ? Fn ( x) = ?0.5, ?0.8, ? ?0.9, ? ?1, x & 138, 138 ≤ x & 149, 149 ≤ x & 153, 153 ≤ x & 156, 156 ≤ x & 160, 160 ≤ x & 169, x ≥ 169.Fn(x)1 0.9 0.8 0.5 0.3 0.1O 138 149
图 5.1 2. 下表是经过整理后得到的分组样本; 组序 分组区 间 频数 1 (38,48) 3 2 (48,58) 4 3 (58,68) 8 4 (68,78) 3 5169x(78,88) 2试写出此分组样本的经验分布函数。 解: 样本的经验分布函数为x & 37.5, ? 0, ?0.15, 37.5 ≤ x & 47.5, ? ? ?0.35, 47.5 ≤ x57.5, Fn ( x) = ? ?0.75, 57.5 ≤ x & 67.5, ? 0.9, 67.5 ≤ x & 77.5, ? ? 1, x ≥ 77.5, ?6 3.假如某地区 30 名 2000 年某专业毕业生实习期满后的月薪数据如下:909 5 914 999 7
775 738 30 2 971 950 96 871 1164808 (1)该批数据的频率分布表(分 6 组)(2)画出直方图。 ; 解:此处数据最大观测值为 1572,最小观测值为 738,故组距近似为:d=确定每组区间端点为1572 ? 738 = 140 , 6a 0 , a 0 + d = a1 , a 0 + 2d = a 2 , L , a 0 + kd = a k , ,此处可取 a 0 = 735 ,于是分组区间为 (735,875],(875,1015],(],(],(],(]. 其频数频率分布如下: 组序 1 2 3 4 5 6 合计 其直方图如图 5.2. 分组区间 (735,875] (875,1015] (] (] (] (] 组中值 805 945 65 1505 频数 6 8 9 4 2 1 30 频率 0.20 0.27 0.30 0.13 0.07 0.03 1 累计频率/% 20 47 77 90 97 100频率 9 8 6 4 2 1 O 805 945 5 1505 图 5.2 月薪所需时间/min 0~10 10~20 20~30 30~40 40~50频率 0.10 0.240.18 0.144. 某公司对其 250 名职工上班所需时间进行了调查,下面是其不完整的频率分布表:7 (1) 试将频率分布表补充完整;(2) 该公司上班所需时间在半小时以内有多少人? 解:(1)由于频率和为 1,故空缺的频率为 1-0.1-0.24-0.18-0.14=0.34. (2)该公司上班所需时间在半小时内的人所占频率为 0.1+0.24+0.34=0.68,该公司有职 工 250 人,故该公司上班所需的时间在半小时以内的人有 250×0.68=170. 5. 40 种刊物的月发行量如下(单位:百册): 26 47
4 38 40 3 52 618353
13304(1) 建立该批数据的频率分布表,取组距为 1700 百册;(2) 方图. 解 : 处 数 据 最 大 观 测 值 为 14667, 最 小 观 测 值 为 353, 由 于 组 距 为 1700, 故 组 数 为: k ≥14667 ? 353 = 8.42, 所以分 9 组.接下来确定每组区间端点,要求 1700a 0 & 353, a 0 + 9 ×此处可取 a 0 =300,于是可列出其频数频率分布表. 组序 1 2 3 4 5 6 7 8 9 合计 其直方图为频率 10分组区间 (00,2000] (] (700,5400] (0,7100] (]组中值 50 50
14750频数 12 6 5 6 3 0 1 4 3 40频率 0.3 0.15 0.125 0.15 0.075 0 0.025 0.1 0.075 1累计频率/% 30 45 57.5 72.5 80 80 82.5 92.5 100(] (](](1 ]5050 50 750 图 5.3销量8 6.对下列数据构造茎叶图 452 400 418 409 381 425 382 392 428 443 447 366 372 430 441 377 425 418 413 433 341 399 374 405 399 369 398 385 381 379 412 423 439 403 386 399 384 408 469 387解:取百位数与十位数组成茎,个位数为叶,这组数据的茎叶图如下: 34 35 36 37 38 39 40 41 42 43 44 45 46 1 6 2 1 2 0 2 3 0 1 2 9 9 4 1 8 3 3 5 3 37 2 9 5 8 5 9 79 4 9 8 8 85 9 9677. 根据调查,某集团公司的中层管理人员的年薪数据如下(单位:千元) : 40.6 38.6 38.9 37.1 试画出茎叶图。 解:取整数部分为茎,小数部分为叶,这组数据的茎叶图如下: 34 35 36 37 38 39 40 41 7 1 2 0 3 2 0 7 39.6 39.6 37.9 37.7 37.8 40.0 37.0 39.2 36.2 34.7 35.1 36.9 38.8 41.7 36.7 38.37 1 6 6 69 7 8 68 998.设总体 X 的分布函数为 F ( x ) ,经验分布函数为 Fn ( x ) ,试证 E[ Fn (x)]=F(x),Var[ Fn (x)]=1 F(x) [1- F(x)]. n证:设 x1 , x 2 , L , x n 是取自总体分布函数为 F(x)的样本,则经验分布函数为9 ? 0, 当x & x(1) , ? Fn (x)= ?k n , 当x( k ) ≤ x & x( k +1) , k = 1,2, L , n ? 1, ? 1, 当x ≥ x ( n ) . ?若令 y i =I {X i ≤ x} ,i=1,2, L , n ,则 y1 , y 2 , L , y n 是独立同分布的随机变量,且 E(yi)= P ( x1 ≤ x ) =F(x), 于是 Var( y i )=F(x )-[F(x)] = F(x)[1- F(x)]. 又 F n ( x ) 可写为 F n ( x ) =2E( y12 ) = P ( x1 ≤ x) =F(x),1 n∑yi =1ni,故有E[ Fn (x)]= E ( y1 ) = F(x),Var[ Fn (x)]=1 nVar( y i )=1 F(x) [1- F(x)] n10 5.3 统计量及其分布内容概要1. 统计量 不含未知参数的样本函数称为统计量。统计量的分布称为抽样分布。 2. 样本均值 样本 x1 ,..., x n 算术平均值称为样本均值,记为 x 。 分组样本均值: x =? ?1 k ∑ xi f i ,其中 n 为样本量,k 为组数, xi 与 f i 为第 i 组的组中值与频 n i =1数,分组样本均值是完全样本均值的一种较好的近似。 样本均值的性质: (1)∑ (xi ?1ni? x) = 0 ,样本数据 xi 对样本均值 x 的偏差之和为零;???(2)样本数据 xi 与样本均值 x 的偏差平方之和最小,即对任意的实数 c 有∑ ( xi ? x ) 2 ≤ ∑ ( xi ? c ) 2i =1 i =1n?n(3)若总体分布为 N( ? , σ 2 ) ,则 x 的精确分布为 N ( ? , σ 2 / n) ; (4)若总 体分布 未知 ,但其期 望 ? 与方 差 σ 存在 ,则当 n 较大时 , x 的 渐近分 布为2??N ( ? , σ 2 / n) ,这里渐近分布是指 n 较大时的近似分布。 3. 样本方差与样本标准差 样本方差有两个,样本方差 s 与样本无偏方差 s*2 *2s *2 =1 n∑ ( xi ? x ) 2 ,i =12n?s2 =1 n ?12∑ ( xi ? x ) 2 。i =1n?实际中常用的是无偏样本方差 s ,这是因为:当 σ 为总体方差时,总有 E( s )=*2?2n ?1 2 σ , E( s 2 ) = σ 2 . n2 2这表明:s 有系统偏小的误差,而 s 无此系统偏差。 今后称 s 为样本方差。s = 样本标准差。s2 为s 2 的计算有如下三个公式可供选用:11 (∑ xi ) 2 1 1 1 2 2 s = ∑ ( xi ? x ) = n ? 1[∑ xi ? n ] = n ? 1 [∑ xi 2 ? nx 2 ]. n ?12在分组样本场合,样本方差的近似计算公式为s2 =1 k 1 k ∑ fi ( xi ? x )2 = n ? 1[∑ fi xi ? nx ], n ? 1 i =1 i =1其中 k 为组数, xi , f i 分别为第 i 个区间的组中值与频数, x 为分组样本的均值。 4. 本矩及其函数 (1) 样本的 k 阶原点矩 a k =1 n k ∑ xi ,样本均值 x 为样本的一阶原点矩; n i =1 1 n ∑ ( xi ? x )k ,样本方差 s 2 和 s *2 都为样本的二阶中心矩; n i =1(2) 样本的 k 阶中心矩 bk =(3) 样本变异系数 Cr = s / x ; (4) 样本的偏度 γ 1 = b3 / b2 (5) 样本的峰度 γ 2 =3/ 2;b4 ?3; 2 b25. 次序统计量及其分布 设 x1 ,..., x n 是取自某总体的一个样本, x (i ) 的每次取值是将 每次样本观测值由小到大排序后得到的第 i 个观测值。x(1) = min{x1 ,..., x n } 称为该样本的最小次序统计量; x(1) = max{x1 ,..., x n } 称为该样本的最大次序统计量;( x (1) , x ( 2 ) ,..., x ( n ) ) 称为该样本的次序统计量。 设总体 X 的密度函数为 p(x),分布函数为 F(x), x1 ,..., x n 为样本,则有 (1) 样本第 k 个次序统计量 x (k ) 的密度函数为p k ( x) =n! ( F ( x)) k ?1 (1 ? F ( x)) n? k p ( x) ; (k ? 1)!(n ? k )!(2) 样本第 i 个与第 j 个次序统计量的联合密度函数为12 pij ( y, z ) =n! [ F ( y )]i ?1[ F ( z ) ? F ( y )] j ?i ?1 (i ? 1)!( j ? i ? 1)!(n ? j )!? [1 ? F ( z )]n ? j p ( y ) p( z ), y ≤ z.6. 样本中位数与样 本分位数 设 x1 ,L , xn 是取自某总体的样本, x(1) ≤ x(2) ≤ L ≤ xn 为 样本中位数与样本分位数 样本的次序统计量,则样本中位数 m0.5 定义为n为奇数, ? x n +1 , ? (2) =? 1 ? ( x( np ) + x( np +1) ), n为偶数, ?2m0.5而样本的 p 分位数 m p 定义为? x([ np +1]) , 若np不是整数, ? mp = ? 1 ? 2 ( xnp + x( np +1) ), 若np是整数, ?其中[x]表示小于或等于 x 的最大整数。中位数对样本的极端值有抗干扰性,或称有稳健 性。 样本分位数的渐进分布: 设总体的密度函数为 p(x) , x p 为总体的 p 分为数。 p(x)在 x p 若 处连续且 p( x p )&0 则当从分大时,有 m p ~ N ? x p ,? ? ?? ? 1 p (1 ? p ) ? ? , m0.5 ~ N ? x0.5 , ?. 2 2 ? 4np ( x0.5 ) ? np ( x p ) ? ?7. 五数概括与箱线图 五数概括是指用样本的五个次序统计量x min = x(1) , Q1 = m0.5 , Q2 = m0.5 , Q3 = m0.75 , x max = x( n ) .大致描述一个样本的轮廓,其图形表示称为箱线图。 当样本量较大时,箱线图可用来对总体分布形状进行大致的判断。习题与解答 5.31. 在一本书上我们随机地检查了 10 页,发现每页上的错误数为 4 5 6 0 3 1 4 2 1 4试计算其样本均值,样本方差和样本标准差。 解: 样本均值 x =x1 + x 2 + L + x n 4 + 5 + L + 4 = = 3, n 10样本方差 s 2 =1 n 1 ∑ ( xi ? x ) 2 = 9 [(4 ? 3) 2 + (5 ? 3) 2 + L + (4 ? 3) 2 ] = 3.78 n ? 1 i =113 样本标准差 s= x =1.94 2. 证明:对任意常数 c,d, 有2∑ (xi =1 nni? c )( y i ? d ) = ∑ ( xi ? x )( y i ? y ) + n( x ? c )( y ? d ).i =1 nn证:∑ ( xi ? c)( yi ? d ) = ∑ ( xi ? x + x ? c)( yi ? y + y ? d ).i =1 i =1 n=∑ ( xi ? x )( yi ? y ) + ∑ ( x ? c)( yi ? y ) +i =1 i =1n∑ ( xi ? x )( y ? d ) + ∑ ( x ? c)( y ? d ).i =1 i =1nn由∑ (xi =1ni? x ) =0, ∑ ( y i ? y ) =0,得i =1n∑ ( xi ? c)( yi ? d ) = ∑ ( xi ? x )( yi ? y ) + n( x ? c)( y ? d ).i =1 i =1nn因而结论成立。 3. 设 x1 L x n 和 y1 , L y n 是两组样本观测值,且有如下关系:y i =3 xi -4,I=1,2,…,n,试求样 本均值 x 和 y 间的关系以及样本方差 s x 和 s y 间的关系。 解: y =2 21 n 1 n 3 n y i = ∑ (3 xi ? 4) = ∑ xi ? 4 = 3 x ? 4, ∑ n i =1 n i =1 n i =1 1 n ∑ ( yi ? y ) 2 n ? 1 i =11 n ?122 sy ==∑ (3xi =1 2ni? 4 ? 3 x + 4) 2 =1 n ∑ 9( xi ? x ) 2 = 9s x2 n ? 1 i =1因而得 y = 3 x ? 4 与 s y = 9 s x 4. 记 x n =1 n 1 n 2 xi , s n = ∑ ∑ ( xi ? xn ) 2 , n=1,2,…证明 n i =1 n ? 1 i =1 1 ( x n +1 ? x n ), n +12 s n +1 =x n +1 = x n +n ?1 2 1 sn + ( x n +1 ? x n ) 2 , n n +114 证: x n +1 =x1 + x 2 + L + x n + x n +1 nx n + x n +1 (n + 1) x n + x n +1 ? x n = = n +1 n +1 n +1= xn +2 s n +1 =1 ( x n +1 ? x n ), n +11 n +1 1 n ∑ ( xi ? xn+1 ) 2 = n [ ∑ ( xi ? xn+1 ) 2 + ( xn+1 ? xn+1 ) 2 ] n i =1 i =1 1 n=∑ (xi =1ni? x n + x n ? x n +1 ) 2 +1 ( x n +1 ? x n +1 ) 2 n=2 1 n ∑ ( xi ? x n ) 2 + n n i =1∑ (xi =1ni? x n )( x n ? x n +1 ) +1 1 n ∑ ( xn ? x n+1 ) 2 + n ( xn+1 ? xn+1 ) 2 n i =1由∑ ( xi ? x n ) =0 ,i =1n1 n∑ (xi =1nn? x n +1 ) 2 = ( x n ? x n +1 ) 2 , x n +1 = x n +1 ( x n +1 ? x n ) 得 n +12 s n +1 =1 1 n 1 n ∑ ( xi ? x n ) 2 + ( n + 1) 2 ( xn+1 ? x n ) 2 + n ( n + 1) 2 ( xn+1 ? x n ) 2 n i =1 n ?1 1 × n n ?1=∑ (xi =1ni? xn ) 2 +1 ( x n +1 ? x n ) 2 n +1=n ?1 2 1 sn + ( x n +1 ? x n ) 2 n n +15.从同一总体中抽取两个容量分别为n, m的样本,样本均值分别为 x1 , x 2 ,样本方差分2 别为 s12 , s 2 ,将两组样本合并,其均值、方差分别为 x , s ,证明:2 nx1 + mx2 (n ? 1) s12 + (m ? 1) s2 nm( x1 ? x2 ) 2 , s2 = ? n+m n + m ?1 (n + m)(n + m ? 1).2x=证 : 设 取 自 同 一 总 体 的 两 个 样 本 为 x11 , x12 , x13 , K ; x1n ; x 21 , x 22 , K , x 2 m . 由x1 =x11 + x12 + L + x1n x + x 22 + L + x 2 m , x 2 = 21 ,得 n m x= x11 + L + x1n + x 21 + L x 2 m nx1 + mx 2 = . n+m n+m15 由 s12 =1 n 1 m 2 ( x1i ? x ) 2 , s 2 = ∑ ∑ ( x2i ? x ) 2 ,得 n ? 1 i =1 m ? 1 i =1s2 =m 1 ?n ? ∑ ( x1i ? x ) 2 + ∑ ( x2i ? x ) 2 ? ? n + m ? 1 ? i =1 i =1 ?m 1 ?n 2 2? = ?∑ ( x1i ? x1 + x1 ? x ) + ∑ ( x 2i ? x 2 + x 2 ? x ) ? n + m ? 1 ? i =1 i =1 ? m 1 ? n ? ( x1i ? x1 ) 2 + n( x1 ? x ) 2 + ∑ ( x 2i ? x 2 ) 2 + m( x 2 ? x ) 2 ? ?∑ n + m ? 1 ? i =1 i =1 ?==(n ? 1) s + (m ? 1) s + n + m ?12 1 2 2n( x1 ?nx1 + mx 2 2 nx + mx 2 2 ) + m( x 2 ? 1 ) n+m n+m n + m ?12 (n ? 1) s12 + (m ? 1) s 2 nm( x1 ? x 2 ) 2 = + . n + m ?1 (n + m)(n + m ? 1)6. 设有容量为难道样本 A,它的样本均值为 x A ,样本标准差为 s A ,样本极差为 R A ,样本中 位数为 m A ,现对样本中每一个观测值施行变换 y = ax + b, 如此得到样本 B,试写出样本 B 的 均值、极差和中位数。 解:妨设样本 A 为 {x1 , x 2 , L , x n } ,样本 B 为 { y1 , y 2 , L y n } ,且 yi = axi + b, i = 1, 2,L , n ,yB =y1 + y 2 + L + y n ax1 + b + ax 2 + b + L ax n + b = = ax A + b , n n 1 n 1 n 2 ( yi ? y B ) 2 = ∑ ∑ (axi + b ? ax ? b) 2 = a 2 s A , n ? 1 i =1 n ? 1 i =12 sB =因而 s B = a s A .R B = y ( n ) ? y (1) = ax( n ) + b ? ax(1) ? b = a ( x( n ) ? x(1) ) = aR A ,y n +1 , n为奇数, ? 2 ? mB = ? 1 ? ( y ( n2 ) + y ( n2 +1) ), n为偶数 ?2ax( n +1 ) + b, n为奇数, ? 2 ? = ?1 ? (ax( n ) + b + ax( n +1) + b), n为偶数 2 2 ?216 7.证明:容量为 2 的样本 x1 , x 2 差为: s =21 ( x1 ? x 2 ) 2 . 2证: s = ( x1 ? x ) + ( x 2 ? x ) = ( x1 ?2 2 2x1 + x 2 2 x + x2 2 ) + ( x2 ? 1 ) 2 2=( x1 ? x 2 ) 2 ( x 2 ? x1 ) 2 ( x1 ? x 2 ) 2 + = . 4 4 28. 设 x1 , L , x n 是来自 U (?1,1) 的样本,试求 E (x ) 和 Var (x ) . 解: 均匀分布的均值和方差分别为 0 和,该样本容量为 n,因而得E ( x ) = 0, Var ( x ) =1 . 3n9.设总体二阶距阵存在, x1 , L x n 是样本,证明 xi ? x 与 x j ? x (i ≠ j ) 的相关系数为? (n ? 1) ?1 .对此你能够给予解释吗?证: 不妨设总体的方差为 σ ,则2ρ ( xi ? x , x j ? x ) =Cov( xi ? x , x j ? x ) Var ( xi ? x ) Var ( x j ? x ).由 Cov ( x i ? x , x j ? x ) = Cov ( xi , x j ) ? Cov ( x i , x ) ? Cov ( x j , x ) + Cov ( x , x ), 由于,Cov( xi , x j ) = 0, Cov( x , x ) =σ2n,Cov( xi , x ) = Cov( x j , x ) = Cov( xi ,1 n σ2 xi ) = , ∑ n i =1 n因而Cov( xi ? x , x j ? x ) = ?σ2n, (n ? 1) x1 ? x 2 ? L x n ) nVar ( xi ? x ) = Var ( x j ? x ) = Var ( x1 ? x ) = Var ((n ? 1) 2 σ 2 + (n ? 1)σ 2 (n ? 1)σ 2 = = n n2所以 ρ ( xi ? x, x j ? x) = ?( n ? 1) .?1 _ _17 由于∑ ( xi ? x) = 0 故其中任意一个偏差 xi ? x 的增加,都会使另一个偏差 x j ? x 减少i =1n___的机会增加,因而两者的相关系数为负. 10.利用切比雪夫不等式求抛均匀硬币多少次才能使正面朝上的频率落在(0.4,0.6)间的 概率 至少为 0.9.如何才能更精确地计算这个次数?是多少? 解: 均匀硬币正面朝上的概率 p=0.5,设 x n 为 n 次抛硬币中正面朝上的次数,则有x n ~ b(n,p).据题意选取次数 n 应满足p(0.4 &xn & 0 .6 ) ≥ 0 .9 , n此式等价于 p (| xn ? 0.5n |≥ 0.1n) ≤ 再由不等式n × 0.5(1 ? 0.5) 25 = (0.1n) 2 n,25 ≤ 0.1 可得粗糙的估计 n ≥ 250 .即抛均匀硬币 250 次后可满足要求. n事实上,利用 x 的渐近正态性可以得到更精确的结论.由中心极限定理知,样本均值x=xn n, n ( x ? 0.5) / 0.5 × 0.5 & N (0,1) ,故P (0.4 & x & 0.6) = P ( n | x ? 0.5 | / 0.5 & n / 5) = 2Φ( n / 5) ? 1 ≥ 0.9即 Φ ( n / 5) ≥ 0.95 ,故 n / 5 ≥ 1.645 ,这就给出较精确的上界 n ≥ (5 × 1.645) 2 = 67.65 , 这表明只需抛均匀硬币 68 次就可满足要求。 两个结果差异很大,说明切比雪夫不等式是一个 较为粗燥的不等式,在能够使用大样本结果的情况下应尽量使用中心极限定理。 11.从指数总体 exp(1/θ)中抽取了 40 个样品,试求 x 的渐进分布。 解:由于指数总体 exp(1/θ)的均值为θ,方差为θ2,于是 x 的渐进分布为 N (θ , θ ) 。 40212.设 x1 ,L x25 是从均匀分布 U(0,5)抽取的样本,试求样本均值 x 的渐进分布25 解: 均匀分布的均值和方差分别为 5 和 12 ,样本容量为 25,因而样本均值 x 的渐进分布为 2?5 1 ? N ? , ?. ? 2 12 ?13. 设 x 1 , L , x 20 是从二点分布 b(1,p)抽取得样本,试求样本均值 x 的渐近线分布。 解:二点分布 b(1,p)的均值和方差分别为 p 和 p(1-p),样本容量为 20,因而样本均值 x 的18 渐近分布为 N ? p,? ?p (1 ? p ) ? ?。 20 ?14:设 x1 , L , x8 是从正态总体 N(10,9)中抽取得样本,试求样本的值 x 的标准差。 解 来自正态分布的样本均值仍服从正态分布,均值保持不变,方差为原来方差的 1/n,此 处总体方差为 9,样本容量为 8,因而 Var( x )=9/8, x 的标准差为 3 2 /4=1.06。 15. 切尾均值也是一个常用的反映样本数据的特征量,其想法是将数据的两端的值舍去, 而用剩下的当中的值来计算样本均值,其计算公式是x=x([ na ]+1) + x([ na ])+ 2) + L + x([ n ?[ na ]) n ? 2[na], 其中 0 & a & 1/ 2 是切尾系数,x ≤ x( 2) L ≤ x( n ) 是有序样本,现我们在某高校采访了 16 名大学生,了解他们平时的学习情况,以下数据是大学生每周用于看电视的时间: 15 4 12 9 20 4 17 26 15 18 6 10 16 15 5 8取 α =1/16,试计算其切尾均值。 解:将样本进行排序得 χ (1) = 4, L χ (16 ) = 26, 当 α = 1 / 16 时,由题意得,切尾均值x1/16 =16.有一个分组样本如下: 区间?χ (2) + L + χ (15)14= 180 = 12.86 。 14组中值 150 160 170 180频数 4 8 6 2(145,155) (155,165) (165,175) (175,185)试求该分组样本的样本均值,样本标准差,样本片度和样本峰度。 解:计算过程列表如下: 组中值 x 150 160 170 180 和 频数 f 4 8 6 2 20x? f600 0 3260( x ? x )2 f676 72 294 578 1620( x ? x )3 f-58 ( x ? x )4 f
196340因而可得样本均值,样本标准差、样本偏度和样本峰度分别为19 x=? = 163, s = = 9.23, 20 19γ1 =340 20 = 0.198, γ 2 = ? 3 = ?0.742 32 (1620 20) (17.检查四批产品,其批量与不合格品率如下: 批号 1 2 3 4 试求这四批产品的不合格率。 解:这批产品的总不合格品率为 批量 100 300 250 150 不合格品率 0.05 0.06 0.04 0.03p=100 × 0.05 + 300 × 0.06 + 250 × 0.04 + 150 × 0.03 = 0.047 100 + 300 + 250 + 15018.设总体以等概率取 1,2,3,4,5,现从中抽取一个容量为 4 的样本,试分别求 x(1)和 x(4)的 分布. 解: 由古典概率可得 p x(1) ≥ k = ?()?6?k ? ? , k = 1, 2,3, 4, 5. ? 5 ?4 4?4? P ( x(1) = 1) = P ( x(1) ≥ 1) ? P ( x(1) ≥ 2 ) = 1 ? ? ? = 0.5904, ?5? ? 4? ?3? P ( x(1) = 2 ) = P ( x(1) ≥ 2 ) ? P ( x(1) ≥ 3) = ? ? ? ? ? = 0.28 ?5? ?5? ?3? ? 2? P ( x(1) = 3) = P ( x(1) ≥ 3 ) ? P ( x(1) ≥ 4 ) = ? ? ? ? ? = 0.104 ?5? ?5? ? 2? ?1? P ( x(1) = 4 ) = P ( x(1) ≥ 4 ) ? P ( x(1) ≥ 5 ) = ? ? ? ? ? = 0.104 ?5? ?5? ?1? P ( x(1) = 5 ) = P ( x(1) ≥ 5 ) = ? ? = 0.0016, ?5?这就给出了 x(1) 的分布列 x(1) P 1 0..28 3 0.104 4 0.024 5 0.00164 4 4 4 3 4 320 类似地, P ( x(4) ≤ k ) = ??k? ? , k = 1, 2,3, 4, 5. 从而 ?5?P ( x(4) = 1) = P ( x(4) ≤ 1) = 0.0016, P ( x(4) = 2) = P ( x(4) ≤ 2) ? P ( x(4) ≤ 1) = 0.024, P ( x(4) = 3) = P ( x(4) ≤ 3) ? P ( x(4) ≤ 2) = 0.104, P ( x(4) = 4) = P ( x(4) ≤ 4) ? P ( x(4) ≤ 3) = 0.28, P ( x(4) = 5) = 1 ? P ( x(4) ≤ 4) = 0.5904,4这就给出了 x(4)的分布列 x(4) p 1 0..024 3 0.104 4 0.28 5 0.590419. 设 x1 ,L , x16 是来自 N (8,4 ) 的样本,试求下列概率 (1) P ( x(16) & 10) ; (2) P ( x(1) & 5) . 解:(1) P ( x(16) & 10) = 1 ? P ( x(16) ≤ 10) = 1 ? ( P ( x1 ≤ 10))1610? ? 10 ? 8 ? ? 16 = 1? ? Φ ? ? ? = 1 ? 0.8413 = 0.9370, ? ? 0 ??(2 ) P ( x(1) & 5) = ( P ( x1 & 5) )16 16 ? ? 5 ?8 ?? = ?1 ? Φ ? ? ? = ?Φ (1.5) ? = 0.3308. ? ? ? 2 ?? ? 1620. 设总体为韦尔分布 Wei(m, η ) ,其密度函数为p( m,η ) =mx m ?1ηm? ? x ?m ? ? ? exp?? ? ? ?, ?η ? ? ? ? ? ? ?x&0,m&0, η &0.现从中得到样本 x1 ,L , xn ,证明 x(1)仍服从韦布尔分布,并指出其参数 解: 由总体分布的密度函数可得总体的分布函数 为F ( x) = ∫xmt m ?10ηme? t ?m ?? ? ?η ? ? ?? x? m m ?? ? ?t? ? ?t? ? ? ? ? ? ? ? ? = 1? e ?η ? . dt = ? ∫ e ? ? ? d ? ? ?η ? ? η ? 0 ? ? ? ? ? ? xm因而最小次序统计量的分布函数为x x P( x(1) ≤ x) = 1 ? P( x(1) & x) = 1 ? (exp(? η ) m )n = 1 ? exp(? η ) mn ,x&0.21 这说明 x(1) ~ Wei ( mn,η ). 21. 设总体密度函数为 p ( x ) = 6 x (1 ? x ) , 0 & x & 1, x1 ,L , x9 是来自该总体的样本,试求 样本中位数的分布。 解: 总体分布函数为F ( x) = ∫ 6t (1 ? t )dt = 3x 2 ? 2 x 3 = x 2 (3 ? 2 x),0 ≤ x ≤ 1,0x1 ? F ( x) = (1 ? x) 2 (2 x + 1), 0 ≤ x ≤ 1.故样本中位数 m0.5 = x( 5) 的精确分布密度函数为?9? ? 5? 4 p m0.5 ( x) = ? ?( F ( x)) 4 ? ? p ( x)(1 ? F ( x) ) ? 4? ? 1? ? ? ? ? 4 ?9? 4 ? 5? 2 = ? ? x 2 (3 ? 2 x ) ? ?6 x(1 ? x) (1 ? x ) (2 x + 1) ? 4? ?1? ? ? ? ?()()= 3780 x 9 (1 ? x) 9 (3 ? 2 x ) (2 x + 1) .4 4这个精确密度函数是 26 次多项式,使用是不方便的,譬如 P (m0.5 & 0.7 ) 用上述密度函数 是可以求的,可就是不方便,寻求近似计算就十分必要。 下面来寻求 m0.5 的渐进分布,由于总体中位数是 x0.5 = 0.5 ,且p ( x 0.5 ) = 6 × 0.5 × (1 ? 0.5) = 3 / 2,故在 n = 9 时 m0.5 的渐近分布为 m0.5 ~ N ? x0.5 , & ? 4np 2 ( x? ?1? 1 ? = N (0.5, ). ? 81 0.5 ) ?利用此渐进分布容易算出概率 P (m0.5 & 0.7 ) = Φ (1.8) = 0.9641. & 22.设 x1 , L , x n 是来自 U (0,θ ) 的样本, x (1) ≤ L ≤ x ( n ) 为其次序统计量,令yi =证明 y1 , L , y n 相互独立.x(i ) x( i +1), i = 1, L , n ? 1,y n = x(n) ,证:令 U i = x (i ) , i = 1,2, L , n, 则 U 1 , L , U n 的联合密度函数为p (u1 , L , u n ) = n! / θ n , 0 ≤ u1 ≤ L ≤ u n ≤ θ ,作变换22 ? y1 = U 1 / U 2 , ?M ? ? ? y n ?1 = U n ?1 / U ? yn = U n ?n,?U 1 = y1 y 2 L y n , ?M ? 其逆变换为 ? ?U n ?1 = y n ?1 y n , ?U n = y n , ?2 n ?1其中 0 & y i & 1, i = 1, L , n ? 1,0 & y n & θ , 其 Jacobi 行列式绝对值为 J = y 2 y3 L y n 合密度函数为,联p( y1 , L , y n ) = n! y 2 y 3 L y n2 2n ?1(1 / θ ) nn ?1= (2 y 2 )(3 y3 ) L (nθ ? n y n),0 & y i & 1, i = 1, L , n ? 1,0 & y n & θ .该联合密度函数为可分离变量,因而 y1 , L , y n 相互独立,且y1 ~ Be(1,1) = U (0,1), y 2 ~ Be(2,1), L , y n ?1 ~ Be(n ? 1,1), y n / θ ~ Be(n,1).23.对下列数据构造箱线图472 425 447 377 341 369 412 419 400 382 366 425 399 398 423 384 418 392 372 418 374 385 439 428 429 428 430 413 405 381 403 479 381 443 441 433 419 379 386 387解:这批数据 n=40,最小值 x (1) = 341, 最大值 x ( 40 ) = 479 ,中位数,第一四分位数和第三 四分位数分别为m0.5 =1 (x(20) + x( 21) ) = 1 (405 + 412) = 408.5 , 2 2 1 1 Q1 = (x(10) + x (11) ) = (382 + 384) = 383 , 2 2 1 1 Q2 = ( x( 30) + x(31) ) = (428 + 428) = 428 , 2 2于是可画出箱线图如图 5.4341383 408.5 428 图 5.447924.根据调查,某集团公司的中层管理人员的年薪数据如下(单位:千元) :23 40.6 39.6 43.8 36.2 40.8 37.3 39.2 42.9 38.6 39.6 40.0 34.7 41.7 45.4 36.9 37.8 44.9 45.4 37.0 35.1 36.7 41.3 38.1 37.9 37.1 37.7 39.2 36.9 44.5 40.4 38.4 38.9 39.9 42.2 43.5 44.8 37.7 34.7 36.3 39.7 42.1 41.5 40.6 38.9 42.2 40.3 35.8 39.2试画出箱线图. 解:这批数据 n = 48 ,最小值为 x(1) = 34.7, ,最大值为 x(48) = 45.4, ,中位数,第一四分位 数和第三四分位数分别为m0.5 =1 1 ( x( 24 ) + x( 25) ) = (39.2 + 39.6 ) = 39.4 , 2 2 1 1 Q1 = (x(12) + x(13) ) = (37.3 + 37.7) = 37.5 , 2 2 1 1 Q2 = ( x (36) + x(37 ) ) = (41.5 + 41.7) = 41.6 , 2 2于是可画出箱线图如图 5.534.737.5 39.4 41.6 图 5.545.425. 设总体 X 服从几何分布,P(X=k)=pqk-1,k=1,2,…,其中 0&p&1,q=1-p,x1,x2,…,xn 为该 总体的样本。求 x(n),x(1)的概率分布。 解: 容易看出 P(X ≤ k)=∑ pql =1kl ?1=1-q k ,k=1,2,…,所以P( x( n ) ≤ k ) = P( x1 ≤ k ,L , xn ≤ k ) = ( P( x1 ≤ k )) n = (1 ? q k )n , k = 1, 2,L同样可以得到P( x( n ) ≤ k ? 1) = (1 ? q k ?1 ) n , k = 1, 2,L此式对 k=1 也同样成立,因为 P(x(n) ≤ 0 )=0.所以 x(n)的分布列为P( x( n ) = k ) = P( x( n ) ≤ k ) ? P( x( n ) ≤ k ? 1) = (1 ? q k ) n ? (1 ? q k ?1 ) n , k = 1, 2,L可 以 验 证 上 述 分 布 满 足非 负 性 和 正 则 性 两 个 基本 要 求 。 事 实 上 , 由 于 q k & q k ?1 , 所 以1 ? q k & 1 ? q k ?1 , 从而 P( x n = k ) = (1 ? q k ) n ? (1 ? q k ?1 ) n & 0, k=1,2,…,而其和24 ∑ P( x( n ) = k ) = limk =1+∞m →+∞∑ [(1 ? qk =1mk n) ? (1 ? q k ?1 ) n ] = lim (1 ? q m ) n = 1.m →+∞下面求 x1 的分布列。由于 P ( X ≥ k ) = 1 ? P ( X ≤ k ? 1) = q k ?1 , k = 1,2, L , 所以P( x(1) ≥ k ) = ( P( x1 ≥ k )) n = q n ( k ?1) , k = 1,2,L,类似有P( x(1) ≥ k + 1) = q nk , k = 1,2,L ,所以 x1 的分布列为P( x(1) = k ) = P( x(1) ≥ k ) ? P( x(1) ≥ k + 1) = q n ( k ?1) (1 ? q n ), k = 1,2,L.同样可以验证上述分布列满足非负性和正则性两个基本要求。这里非负性是显然的,而 其和∑ P( xk =1+∞(1)= k ) =∑ (qk =1+∞n ( k ?1)1 qn ?q )= ? = 1. 1? q 1? qnnk26.在下列密度函数下分别求容量为 n 的样本中位数 m0.5 的渐进分布。 (1) p(x)=6x(1-x),0&x&1; (2) p ( x) =1 2πσexp{?(x ? ? )2 }. 2σ 2解:(1)先求出总体的中位数。该分布是贝塔分布 Be(2,2),可以看出 p(x)关于 0.5 对称,所以 m0.5=0.5,于是样本中位数 m0.5 的渐近分布为 N(0.5,(9n) -1).? πσ 2 ? (2)正态分布 N( ? , σ )的中位数为 ? ,所以 m0.5 的竭尽分布为 N ? ? , ?。 2n ? ?2讨论:样本均值 x 的样本分布为 N( ? , σ 2 n ),可见在 n 较大时,m 0.5 的渐进方差要大 于 x 的方差,所以使用中 x 用得更多,更受欢迎。 27.总体 X 服从双参数指数分布,其分布函数为x?? ? ?1 ? exp{? }, x & ? , F ( x) = ? σ ?0, x ≤ ?, ?其中 ? ∞ & ? & +∞,0 & σ & +∞, x (1) ≤ L ≤ x ( n ) 为样本的次序统计量。证明 (n-i-1)2 (x(i)-x(i-1)) /2~ χ 2 (2) (i=2,3,…,n). 证: 令 y i =xi ? ?σ~ Exp(1), 则 y (1) , L , y ( n ) 的联合密度为25 p ( y1 ,L , yn ) )=n!exp{ ? ∑ y i },i =1n作变换?t1 = ny(1), ?t = (n ? 1)( y ? y ), (2) (1) ?2 ? M ? ? ?ti = (n ? i ? 1)( y(i ) ? y(i ?1) ), ? M ? ?tn = y( n ) ? y( n ?1) , ?其 Jacobi 行列式为 J =n 1 , t1, L t n 的联合密度为 f (t1, L , t n ) = exp{?∑ t i }. 由该联合密度 n! i =1我们可以知道 T1 , LTn 是独立分布的随机变量,且 T i ~ Exp(1),从而P((n ? i ? 1)2σ( x(i ) ? x(i ?1) ) ≤ x) = P(2(n ? i ? 1)( y(i ) ? y(i ?1) ) ≤ x) = P(2Ti ≤ x) = P(Ti ≤ x / 2) = 1 ? e ? x / 2这是指数分布 Exp(1/2)的分布函数,我们知道,Exp(1/2)就是 Ga(1,1/2),也就是 χ 2 ( 2) ,这就证明了2(n ? i ? 1)( x( i ) ? x(i ?1) )σ~ χ 2 (2).28.设总体 X 的密度函数为?3 x 2, f ( x) = ? ? 0,0 & x & 1, 其他.x( 2) x( 4)与 x ( 4 ) 相互独立。x(1) ≤ x( 2) ≤ L ≤ x (5) 为容量为 5 的取自此总体的次序统计量,试证证:先求 x ( 2 ) , x ( 4 ) 的联合密度。由于总体 X 的分布函数为 F ( x ) = x 3 ,0 & x ≤ 1, 所以()(x( ) , x( ) )的联合密度为2 4f ( x, y ) =下求 ?5! 3 3 3 x ( y ? x )(1 ? y 3 ) ? 3 x 2 ? 3 y 2 , 0 & x & y & 1. 1!1!1!? x(2) ? , x(4) ? 的联合密度,为此,令 ?x ? ? (4) ?26 x ? ?u = , y ? ?v= y ?其 Jacobi 行列式的绝对值为 J =其逆变量为? x = uv, ? ? y = v,v u = v. 由 0&x&y&1 得 0&u&1,0&v&1,于是 0 1p(u,, v) = f (uv, v)v = 120v3u 3 (v3 ? v3u 3 )(1 ? v 3 ) ? 3v 2u 2 ? 3v 2 v =
? u 3 )v11 (1 ? v 3 )另外,我们还可以求出边际密度,U=x (2 ) x (4 )~ p1 (u ) = ∫ p(u , v )dv =
? u 31 0()∫ v (1 ? v )dv = 18u (1 ? u ),0 & u & 1.1 11 3 5 3 0类似可求得V = x(4 ) ~ p 2 (v ) = 60v 11 1 ? v 3 ,0 & v & 1.显然 p ( u , v ) = p1 (u ) ? p2 (v) ,这就证明了()x( 2) x( 4)与 x ( 4 ) 独立29.当总体为指数分布 Exp (λ ) 和均匀分布 U(0,1)时,分别求容量为 n 的样本极差 Rn 的 分布。 解: 对于一般的情况,设总体 X 的密度函数为 p (x), 分布函数为 F (x ) ,x(1), x(2),…,x(n)为次 序统计量,则(x(1),x(n))的联合密度函数为f ( x(1) , x( n ) ) =n! p ( x(1) ) p ( x( n ) )( F ( x( n ) ) ? F ( x (1) )) n? 2 , x(1) ≤ x ( n ). (n ? 2)!作变换 ?? Rn = x ( n ) ? x(1) , ? x (1) = Z , ,其逆变换为 ? ,Jacobi 行列式绝对值为 J = 1 ,于是 ? Z = x(1) , ? x ( n ) = Rn + Z ,Rn 与 x(1) 的联合密度为f Rn , Z ( x, z ) = n(n ? 1) p( z ) p ( x + z )( F ( x + z ) ? F ( z )) n ? 2由此可以算得 Rn 的边际密度为f Rn ( x) = ∫ n(n ? 1) p( z ) p( x + z )( F ( x + z ) ? F ( z )) n ?2 dz ,?∞+∞Rn 的分布函数为27 FRn ( x) = ∫x0∫+∞?∞n(n ? 1) p ( z ) p (t + z )( F (t + z ) ? F ( z )) n ?2 dzdtx 0= ∫ n(n ? 1) p ( z ) ∫ ( F (t + z ) ? F ( z )) n ?2 d ( F (t + z ) ? F ( z ))dz?∞+∞= ∫ np ( z )( F ( x + z ) ? F ( z )) n ?1 dz?∞+∞对于指数分布 Exp (λ ) ,由上述结果,有FRn ( x) = ∫ nλ e ? λ z (1 ? e ? λ ( x + z ) ? 1 + e? λ z ) n ?1 dz0+∞= ∫ nλ e ? nλ z (1 ? e? λ x )n ?1 dz = (1 ? e ? λ x ) n ?1 , x ≥ 00+∞对于均匀分布 U(0,1),由于 0 & x (1) & x ( n ) & 1 ,这说明对 z 的积分限时要考虑到不等式0 & z & x + z & 1 ,故 z 的积分范围为 0 & z & 1 ? x ,从而f Rn ( x) = ∫即 Rn ~ Be( n ? 1,2).1? x0n(n ? 1) x n ?2 dz = n(n ? 1) x n ?2 (1 ? x)30. 设 x1 , x2 是从同一正态总体 N ( ? , σ 2 ) 独立抽取的容量相同的两个样本均值.试确定 样本容量 n ,使得两样本均值的距离超过 σ 的概率不超过 0.01. 解: 由于 xi ~ N ? ? ,? ?σ2 ?? 2σ 2 ? , i = 1, 2, 且相互独立,所以 x1 ? x2 ~ N ? 0, ? ?, n ? n ? ?于是有? ? x ?x ? ? n ?? σ P( x1 ? x2 & σ ) = P ? 1 2 & ? = 2 ?1 ? Φ ? ? 2 ? ? ≤ 0.01 . ? 2σ 2 / n ? ? 2σ 2 / n ? ? ?? ? ? ? ?等价地,? n? n ? Φ? ? 2 ? ≥ 0.995, 2 ≥ ? 0.995 = 2.575, ? ?n ≥ 2.575 2 × 2 = 13.26.最后结果表明,只要样本容量 n ≥ 14. 就可使同一正态总体的两样本均值距离超过标准 差 σ 的可能性不大于 0.01.这意味着,只要样本容量较大,两样本均值的距离不超过 σ 的可能 性是很大的,可达 0.99. 31 . 设 x1 , x 2 , L , x n 是 来 自 分 布 函 数 为 F ( x ) , 密 度 函 数 为 p( x ) 的 一 个 样 本 。x(1) , x(2 ) , L , x(n ) 是其次序统计量,试求在 x(r +1) , L , x(n ) 给定时 x(1) , L , x(r ) 的联合条件密度函数。28 解:次序统计量 x (1) , x (2 ) , L , x (n )联合密度函数为p x(1) , x( 2 ) ,L , x( n ) = n !∏ p ( xi )i =1()n而后 n ? r 个次序统计量 x (r +1) , L , x (n ) 的联合密度函数为p (x(r +1) ,L , x(n ) ) =故所求联合条件密度函数为n! r![F (x(r +1) )] n ∏ p(xr n i = r +1r i =1 i(i ))p x(1) ,L , x( r ) x( r +1(( ) ,L , x( ) ) = p ( x(np x(1,) x( 2, ) L x( n )r +1 n) = r! p x ?F x ∏ ( ( ) ) ( ( r +1) ) ? . ? ? ) ,L , x( ) )r最后结果表明:所求条件密度函数只与 x(1) , L , x( r ) , x( r +1) 有关,而与 x(r + 2 ) , L , x( n ) 的取 值 无 关 。 从 而 , 其 分 布 也 仅 依 赖 于 X (r + 1) 的 给 定 值 x(r +1) 这 样 一 来 , 条 件 密 度 函 数p x(1) , L , x(r ) x(r +1) , L , x(n ) 完全可以写成 p x(1) , L , x(r ) x(r +1) 。32. 来自正态总体 N()()(? , σ )2的容量为 n = 2k + 1 的样本中位数是 x (k +1) ,证明 x (k +1) 的密度函数关于 ? 对称,且 E x ( k +1) = ? . 证:记正态分布 N ? , σ 2()()的分布函数与密度函数分别为 F ( X ) 与 f ( x ) ,则容量为n = 2k + 1 的样本中位数 x(k +1) 的密度函数为 g ( x) =令y=( 2k + 1) ![ F ( x)]k fk !k !( x ) [1 ? F ( x)]kx(k +1) ? ?σ,此变换的 Jacobi 行列式的绝对值 J = σ ,于是 y 的密度函数为gY ( y ) ==k !k ! ( 2k + 1)! k !k !( 2k + 1)![ F (? + σ y)]k [1 ? F ( ? + σ y)]k ? f ? + σ y ? σ ( ),σ [Φ( y )]k [1 ? Φ( y )]k ? ( y )其中 Φ( y ) 与 ? ( y ) 分别是标准正态分布 N (0,1) 的分布憾事与密度函数,依据它们的性质Φ(? y ) = 1 ? Φ( y ), ? (? y ) = ? ( y ) ,29 可得gY ( ? y ) = =( 2k + 1)!σ [Φ(? y )]k [1 ? Φ(? y )]k ?k !k ! ( 2k + 1)! k !k !k k(? y)。σ [1 ? Φ ( y )] [Φ( y )] ? ( y ) = gY ( y )这表明密度函数 g Y ( y ) 是偶函数,它关于点 O 对称,从而 x (k +1) 的密度函数 g ( x ) 关于 ? 对称, 同时还有 E ( y ) = 0 与 E x (k +1) = ?()30 §5.4 三大抽样分布内容概要1. 三大抽样分布:χ2 分步,F 分布,t 分布 三大抽样分布: 分步, 分布, 设 x1,x2,…,xn 和 y1,y2,…,yn 是来自标准正态分布的两个相互独立的样本,则此三个统计 量的构造及其抽样分布人员下表所示统计量的构造2 2 χ 2 = x12 + x2 +L+ xn抽样分布密度函数 p( y) = Γ( n1 n/2 y 2 e 2 I{y&0} )22 n ?1期望 n方差 2n?yF= t=2 2 + m ?1 ( y12 + y2 +L+ ym ) / m n 2n2 (m + n ? 2) Γ( m2 n ) ? m+n p( y) = Γ( m )Γ( n ) ( m)m/2 y 2 (1+ m y) 2 I{y&0} (n & 2) n n 2 2 2 2 n ?2 m(n ? 2)2 (n ? 4) (x12 + x2 +L+ xn ) / ny1 (x + x +L+ x ) / n2 1 2 2 2 np( y) =+ Γ( n21)nπ Γ( n ) 2(1+ 1 y2 ) n+ ? n210(n &1)n (n & 2) n ?2今后正态总体参数的置信区间与假设检验大多数将基于这三大抽样分布 2. 一个重要的定理 设 x1,x2,…,xn 是来正态总体 N(?,σ2)的的样本,其样本均值与样本方差分别为x=1 n ∑ xi 和 n i =1s2 =1 ∑ ( xi ? x ) 2 , n ?1(2) x ~ 则有(1) x 与 s 相互独立; 3. 一些重要推论2N ( ? , δ 2 / n) ; (3)(n ? 1) ? s 2δ2~ χ 2 ( n ? 1) .2 (1)设 x1 , L , x n 是来自正态总体 N ( ? , δ ) 的样本,则有 t =n (x ? ?) ~ t ( n ? 1) , s其中 x 为样本均值,为样本标准差. (2)设 x1 , L , x m 是来自 N ( ? 1 , δ 1 ) 的样本, y1 , L , y n 是来自 N ( ? 2 , δ 2 ) 的样本,且此2 2两样本相互独立,则有 F =2 2sx δ122sy2δ 22~ F ( m ? 1, n ? 1) ,2 2其中 s x , s y 分别是两个样本方差.若 δ 1 = δ 2 ,则F = sx2s y ~ F (m ? 1, n ? 1) .231 习题与解答 5.41. 在总体 N (7.6,4) 中抽取容量为 n 的样本,如果要求样本均值落在 (5.6,9.6) 内的概率 不小于 0.95,则至少为多少? 解:样本均值 x ~ N (7.6, ) ,从而按题意可建立如下不等式4 nP(5.6 & x & 9.6) = P(5.6 ? 7.6 4n&x ? 7.6 4n&9.6 ? 7.6 4n) ≥ 0.95 ,n ≥ 1.96 或即 2Φ ( n ) ? 1 ≥ 0.95 , 所 以 Φ ( n ) ≥ 0.975 , 查 表 , Φ (1.96) = 0.975 , 故n ≥ 3.84 ,即样本量 n 至少为 4.2.设 x1 , L , x n 是来自 N ( ? ,25) 的样本,问 n 多大时才能使得 P (| x ? ? |& 1) ≥ 0.95 成 立? 解:样本均值 x ~ N ( ? ,25 ) ,因而 n? x?? 1 ? P (| x ? ? |& 1) = P ? | |& ? = 2Φ ( n 5) ? 1 ≥ 0.95 , ? 25 n ? 25 n ? ?所以 Φ ( n 5) ≥ 0.975 , n 5 ≥ 1.96 ,这给出 n ≥ 96.04 ,即 n 至少为 97 时,上述概率不等式 才成立. 3. 由正态总体 N (100,4) 抽取两个独立样本,样本均值分别为 x, y ,样本容量分别 15,20, 试求 P (| x ? y |& 0.2) . 解:由条件得x ~ N (100,4 4 ) , y ~ N (100, ) ,且 x 和 y 相互独立,从而: 15 20 4 4 7 x ? y ~ N (0, + ) ,即 x ? y ~ N (0, ) , 15 20 15于是P(| x ? y |& 0.2) = P(|x? y| 7 15&0.2 7 15) = 2(1 ? Φ(0.29)) = 0.7718 .204. 由正态总体 N ( ? , δ 2 ) 抽取容量为 20 的样本,试求 P (10δ 2 ≤∑ (xi =1i? ? ) 2 ≤ 30δ 2 ) .解:因为 xi ~ N ( ? , δ 2 ) ,所以xi ? ?δ~ N (0,1) ,∑i =120( xi ? ? ) 2δ2~ χ 2 ( 20) ,用 k 20 ( x ) 表示服2 从 χ ( 20) 的随机变量的分布函数值,则32 ? 20 ? P (10δ 2 ≤ ∑ ( xi ? ? ) 2 ≤ 30δ 2 ) = P ?10 ≤ ? i =1 ? ?∑ (x ? ?)i =1 i202δ2? ? ≤ 30 ? = k20 (30) ? k20 (10) . ? ? ?利用统计软件可计算上式.譬如,可使用 MATLAB 软件计算上式: 在命令行输入 chi2cdf(30,20) 则给出 0.9301,输入 chi2cdf(10,20) 则给出 0.0318,直接输入 chi2cdf(30,20)- chi2cdf(10,20)则一 次性给出 0.8983.这里的 chi2cdf ( x, k ) 就表示自由度为 k 的分布在 χ 处的分布函数值.于是2有P (10δ 2 ≤ ∑ ( xi ? ? ) 2 ≤ 30δ 2 ) = 0.8983 .i =1 2 2 5.设 x1 , L , x16 是来自 N ( ? , δ ) 的样本,经计算 x = 9, s = 5.32 ,试求 P (| x ? ? |& 0.6) .20| x??|解: 因为n(x ? ?) = sδ(n ? 1) s2n (n ? 1)~ t ( n ? 1) ,用 t15 ( x ) 表示服从 t (15) 的随机变δ2量的分布函数,注意到 t 分布是对称的,故P(| x ? ? |& 0.6) = P(4 | x ? ? | 4 × 0 .6 & ) = 2t15 (1.0405) ? 1 . s s统计软件可计算上式.譬如,使用 MATLAB 软件在命令行输入 tcdf(1.0405,15)则给出 0.8427, 直接输入 2* tcdf(1. 则给出 0.6854.这里的 tcdf(x,k)就是表示自由度为可 k 的 t 分布 在 x 处的分布函数,于是有P(| x ? ? |& 0.6) = 2 × 0.8427 ? 1 = 0.6854.6.设 x1 , L , x n 是来自 Ν ( ? ,1) 的样本,试确定最小的常数 c,使得对任意的 ? ≥ 0 ,有Ρ(| x |& c) ≤ α .解:由于 x ~ Ν ( ? , ) ,所以 Ρ(| x |& c ) 的值依赖于 ? ,它是 ? 的函数,记为 g( ? ),于是1 ng ( ? ) = Ρ? (| x |& c) = Ρ(?c & x & c) = Φ ( n (?c ? ? )) ? Φ ( n (?c ? ? )) ,其导函数为 g ' ( ? ) = ? n [? ( n (c ? ? )) ? ? ( n ( ?c ? ? ))] , 其中 ? (x ) 表示 Ν (0,1) 的 密度函数,由于 c ≥ 0, ? ≥ 0 ,故 ? c ? ? ≥ c ? ? ,从而 ? ( n ( ?c ? ? )) ≤ ? ( n (c ? ? )), 这33 说明 g ' ( ? ) ≤ 0, g ( ? ) 为减函数,并在 ? = 0 处取得最大值,即max{Φ ( n (c ? ? )) ? Φ ( n (?c ? ? ))} = Φ( nc) ? Φ (? n c) = 2Φ ( nc) ? 1.? ≥0于 是 , 只 要 2Φ ( nc ) ? 1 ≤ α , 即 (0 ≤)c ≤ u (1+α ) / 2 / n 就 可 保 证 对 任 意 的 ? ≥ 0, 有Ρ(| x |& c) ≤ α . 最大的常数为 c = u (1+α ) / 2 / n.7. 设随机变量 X~F(n,n),证明 Ρ( X & 1) = 0.5. 证:若随机变量 X~ F ( n, n), 则 Y=1/X 也服从 F(n,n),从而Ρ( X & 1) = Ρ(Y & 1) = Ρ(1 / X & 1) = Ρ( X & 1).而Ρ( X & 1) + Ρ( X & 1) = 1, 这就证明了 Ρ( X & 1) = 0.5.8.设 X~F(n,m),证明: Ζ =n n X /(1 + X ) 服从贝塔分布,并指出其参数. m mn证:若 X~F(n,m),则 X 的密度函数为? m + n ?? n ? 2 m+n Γ? ? ?? ? n n ? 2 2 ?? m ? 2 ?1 ? p X ( x) = ? x ?1 + x ? , ?n? ?m? ? m ? Γ? ?Γ? ? ?2? ? 2 ?由 z=mz dx m n ? n ? , = ,Z x / ?1 + x ? 在 (0,+∞) 是严增函数,其反函数为 x = n(1 ? z ) dy n(1 ? z ) 2 m ? m ?的密度函数为? m + n ?? n ? 2 Γ? ?? ? ? 2 ?? m ? p z ( z) = ?n? ?m? Γ? ?Γ? ? ? 2? ? 2 ?整理得nn? mz ? 2 ? z ? ? ? n(1 ? z ) ? ?1 + 1 ? z ? ? ? ? ? ??1?m+n 2m , n(1 ? z ) 2?m + n? Γ? ? n m ?1 2 ? 2 ?1 p z ( z) = ? z (1 ? z ) 2 , ?n? ?m? Γ? ?Γ? ? ?2? ? 2 ?这说明 Z 服从贝塔分布 Be?0&z&1,?n m? , ?, 其两个参数分别为 F 分布两个自由度的一半. ?2 2 ?34 ? x + x2 ? 9.设 x1 , x 2 是来自 N (0, σ ) 的样本,试求 Y = ? 1 ? x ? x ? 的分布. ? 2 ? ? 122解: 由条件, x1 + x 2 ~ N (0,2σ 2 ), x1 ? x 2 ~ N (0,2σ 2 ), 故? x1 + x 2 ? ? x ? x2 ? ? ? ~ χ 2 (1), ? 1 ? ~ χ 2 (1), ? 2σ ? ? 2σ ?又 Cov( x1 + x 2 , x1 ? x 2 ) = Var ( x1 ) ? Var ( x 2 ) = 0 ,且 x1 + x 2 与x1 ? x 2 服从二元正态分布,22? x + x2 ? (( x + x 2 ) / 2σ ) 2 ? = 1 故 x1 + x 2 与x1 ? x 2 独立,于是 Y = ? 1 ~ F (1,1). ?x ?x ? (( x1 ? x 2 ) / 2σ ) 2 ? 1 2 ?10.设总体为 N(0,1), x1 , x 2 为样本,试求常数 k,使得2? ? ( x1 + x 2 ) 2 ? Ρ? & k ? = 0.05. 2 2 ? ? ( x1 ? x 2 ) + ( x1 + x 2 ) ?? x1 + x 2 ? ( x1 + x 2 ) 2 Y ? ? ~ F (1,1), z = 解:由上题, Y = ? , = 2 2 ? 1+ Y ( x1 ? x 2 ) + ( x1 + x 2 ) ? x1 ? x 2 ?由于 Z 的取值与(0,1),故由题目所给要求有 0&k&1,从而2Y k P( Z & k ) = P( & k ) = P (Y & ) = 0.05. 1+ Y 1? k k 161.45 于是 = F0.95 (1,1) = 161.45, 这给出 k = = 0.9938. 1? k 1 + 161.4511.设 x1 , L , x n 是来自N (?1,σ2) 的样本, y1 ,L , y m 是来自 N ( ? 2 , σ 2 ) 的样本,c,d 是任意两个不为 0 的常数,证明t=c( x ? ?1 ) + d ( y ? ? 2 ) ~ t (n + m ? 2), sω c 2 + d 2n m其中 sω =22 (n ? 1) s x + (m ? 1) s 2 yn+m?22 2 , s x 与s y 分别是两个样本方差.证:由条件有? c 2σ 2 ? d 2σ 2 ?, d ( y ? ? 2 ) ~ N (0, ), c = ( x ? ?1 ) ~ N ? 0, ? n ? m ? ?2 (n ? 1) s xσ2~ χ (n ? 1),22 (m ? 1) s yσ2~ χ 2 (m ? 1),35 __且 x , y , s x , s y 相互独立,故22c( x ? ?1 ) + d ( y ? ? 2 ) ~ N (0,2 (n + m ? 2) s w 2 (n ? 1) s x__c 2σ 2 d 2σ 2 + ), n mσ于是2=σ2+2 (m ? 1) s yσ2~ χ 2 (n + m ? 2).t=c( x ? ?1 ) + d ( y ? ? 2 ) sw___c2 d 2 + n m_=[c( x ? ?1 ) + d ( y ? ? 2 )]2 ( n + m ? 2) s wc 2σ 2 d 2σ 2 + n m ~ t (n + m ? 2). ( n + m ? 2)_ 1 n 1 n 2 xi , sn = ( xi ? xn ) 2 , ∑ ∑ n i =1 n ? 1 i =1σ212. x1 , x 2 , K x n , x n +1 是来自 N ( ? , σ 2 ) 的样本, xn = 设试求常数 c 使得 tc = cxn +1 ? xn 服从 t 分布,并指出分布的自由度。 sn2 2 σ 2 (n ? 1) sn 2 ), ~ χ 2 (n ? 1), 且 xn +1 , xn , sn 相互 σ2 n解:由条件: xn +1 ~ N ( ? , σ ), xn ~ N ( ? ,独立,因而 xn +1 ? xn ~ N (0, σ +2σ2n) = N (0,n +1 2 σ ), ,故 nt=( xn +1 ? xn ) snn +1 n +1 2 ( xn +1 ? xn ) σ n = n ~ t (n ? 1). 2 (n ? 1) sn (n ? 1) 2σ这说明当 c =n x ? xn 时, tc = c n +1 ~ t (n ? 1), 自由度为 n-1。 n +1 sn13.设从两个方差相等的正态总体中分别抽取容量为 15,20 的样本,其样本方差分别为2 s12 , s 2 , 试求 p ( S12 & 2). S2 2解 不妨设正太总体的方差为 σ ,则有214 s12σ2~ χ 2 (14),2 19 s 2σ2~ χ 2 (19), 于是36 F=s12 ~ F (14,19). 2 s22 利用统计软件计算可算出 P ( s12 s 2 & 2) = P ( F & 2) = 0.0798. 譬如,可使用 MATLAB软件计算上式:在命令行输入 1-fcdf(2,14,19)则给出 0.0798,这里的 fcdf ( x, k1 , k 2 ) 就表示(k1 , k 2 ) 自由度为 的 F 分布在 x 处的分布函数。14. 某厂生产的灯泡使用寿命 X ~ N (
) ,现进行质量检查,方法如下:随机抽 取若干个灯泡,如果这些灯泡的平均寿命超过 2200h,就认为该厂生产的灯泡质量合格,若要使 检查能通过的概率不低于 0.997,问至少应检查多少只灯泡? 解 : 设 x1 , x 2 , K x n 是 来 自 总 体 的 样 本 , 则 x ~ N (
/ n) 。 由 题 意 , 应 有_x ?
? 2250 n P( x & 2200) ≥ 0.997, 即 P( n & n ) = Φ( ) ≥ 0.997, 查 表 可 250 250 5__以得到1 n ≥ 2075, 所以 n 至少应取 190。 5讨论:假设对灯泡质量提高要求,我们可对该问题作进一步分析。提高对灯泡质量的检 查要求有两个途径:其一是提高通过概率,譬如,要求通过概率由 0.997 提高到 0.998,这时由Φ( n 5) ≥ 0.998 查表得n ≥ 2.88, ,从而 n ≥ (2.88 × 5) 2 = 207.36, ,即 n 至少应取 208; 5其二是提高样本均值通过检查的临界值,譬如,将要求“灯泡的平均寿命超过 2200h”改为要求 “灯泡的平均寿命超过 2210h”,此时与上面过程类似可得到 Φ ( 4 n 25) ≥ 0.997 ,由此有4 n ≥ 2.75, 25这给出 n 至少应取 296.可以看出,只要提高对检验质量的要求都会增加对样本量的要求,只是样本量的增加量不同而已。反之,若降低对质量的要求则可减少样本量。 15.设( x1 K x17 )是来自正态分布 N ( ? , σ 2 )__的一个样本, x与s 2 分别是样本均值与样本方差。求 k,使得 p ( x &_? + ks ) = 0.95 ,n ( x? ? ) 解:在正态总体下,总有 ~ t (n ? 1), 所以 s_ ? ? n ( x? ? ) ? P ( x & ? + ks ) = P & k n ? = 0.95, ? ? s ? ? _37 n ( x? ? ) ≤ k n ) = 0.05, 故 k n 是自由度是 n-1 的 t 分布 t(n-1)的 0.05 分倍数,即 即 P( s_k n = t 0.05 (n ? 1), 如今 n=17,查表知 t 0.05 (16) = ?1.7459, 从而 k =16.证明:若 t ~ t ( k ) ,则对 r〈k 有? 0, ? r ? k 2Γ ? r +1 ? Γ ? k ? r ? ? ? ? ? ? E (t r ) = ? ? 2 ? ? 2 ?, ? ?k? ? πΓ? ? ? ?2? ?? 1.7459 17= ?0.4234.r为 奇 数 ,r为 偶 数 ,并由此写出 E(t)与 Var(t). 证:由 t 变量的结构知,t 变量可表示为 t = ur? v = k 2 u ? v 2 , 其中 u~N(0,1),v~χ2(k)= kr11? ?k 1? Ga ? , ? , 且 u 与 v 独立,从而有 E (t r ) = k 2 E (u r ) ? E (v 2 ). ? 2 2?由于?0, ? E (u r ) = ? r 2 ? r + 1 ? 2 Γ? ? ? ? 2 ? ??k 2r为寄数,π , r为偶数,?k ?r? 2 ? r 2 Γ? ? 2 ? 2 ? , r & k, ?r 2 ? r 2 k 2 ?1 ? v 2 E (v ) = v v e dv = Γ(k 2) ∫ Γ(k 2) 0+∞将两者代回可知,在 r&k 时,若 r 为奇数,则 E (t r ) = 0, 若 r 为偶数,则? r + 1? ? k ? r ? k r 2 Γ? ?Γ? ? ? 2 ? ? 2 ?. r E (t ) = ?k? π Γ? ? ? 2?证 明 完 成 。 进 一 步 , 当 r=1 时 ,E(t)=0( 此 时 要 求 k&1, 否 则 均 值 不 存 在 ), 当 r=2 时, Var (t ) = E (t ) =2k (此时要求 k&2,否则方差不存在) 。 k ?2 k m 17.证明:若 F~F(k,m),则当 ? & r & 时有 2 2?k ? ?m ? m r Γ? + r ?Γ? ? r ? ?2 ? ?2 ?, E(F r ) = ?k ? ?m? k r Γ? ?Γ? ? ? 2? ? 2 ?38 由此写出 E(F)与 Var(F). 证: F 变量的构造知 F = 由vk m = v ? w ?1 , v ~ χ 2( k ) , w ~ χ 2( m ) , 且 v 与 w 相互独立, wm k因此 F 变量 r 阶矩为 E ( F ) =rmr ?k 1? E (v r ) ? E ( w ? r ). 由于 χ 2 (k ) = Ga ? , ? , 容易算得 r k ? 2 2??m ? Γ? ? r ? 2 ? ,r & m E ( w ?r ) = ? ?r 2, ?1? ?m? ? ? Γ? ? ? 2? ? 2 ??k ? Γ? + r ? 2 ? ,r & ? k , E (v r ) = ? r 2 ?1? ?k ? ? ? Γ? ? ? 2? ? 2??k ? ?m ? m r Γ? + r ?Γ? ? 1? ?2 ? ?2 ? ,? k & r & m , 在其他场合, E ( F r ) 不存在。 r 从而可得 E ( F ) = 2 2 ?k ? ?m? k r Γ? ?Γ? ? ? 2? ? 2 ?当 r=1 时,只要 m&2,k&-2,就有?k ? ?m ? k mΓ? + 1?Γ? ? 1? m? 2 ? ?2 ? ?= 2 = m . E(F ) = ?k ? ?m? ?m ? m?2 kΓ? ?Γ? ? k ? ? 1? ? 2? ? 2 ? ?2 ?当 r=2 时,只要 m&4,k&-4,就有?k ? ?m ? ?k ?k m 2 Γ? + 2 ?Γ? ? 2 ? m 2 ? + 1? m 2 ( k + 2) ?2 ? ?2 ?= ?2 ?2 = E(F 2 ) = . ?? m ? k (m ? 2)(m ? 4) 2 ?k ? ?m? 2? m k Γ? ?Γ? ? k ? ? 1?? ? 2 ? ? 2? ? 2 ? ?2 ?? 2 ? Var ( F ) = E ( F 2 ) ? ( E ( F )) 2 = 2 m 2 ( k + m ? 2) . k ( m ? 2) 2 ( m ? 4)18.设 x1 , x 2 , L , x n 是来自某连续总体的一个样本。该总体的分布函数 F(x)是连续严增 函数,证明:统计量 T = ?2 证 分几步进行:∑ ln F ( x ) 服从 χi =1 in2(2n).(1) X~F(x),且 F(x)为连续严增函数,则 Y=F(x)~U(0,1).这是因为 F(x)的反函数 F ?1 也 若 存在。于是 Y=F(x)的分布函数为39 FY ( y ) = P( F ( X ) ≤ y ) = P( X ≤ F ?1 ( y )) = F ( F ?1 ( y )) = y,其中 y ∈ (0,1), 当 y ≤ 0, FY ( y ) = 0, y ≥ 1, FY ( y ) = 1, 所以 F(X)~U(0,1). (2) 若 Y~U(0,1),则 Z = ? ln Y ~χ 2 ( 2). 这时由于 y 仅在(0,1)上取值,故 Z=-lnY 仅在(0,+∞) 上取值,所以当 z ≤ 0, FZ ( z ) = 0; 当 z&0 时,有 FZ ( z ) = P (? ln Y ≤ z ) = P (Y ≥ e ? z ) = 1 ? e ? z .这是参数为 1 的指数分布函数,也是自由度为 2 的 χ 分布函数,即 Z = ? ln Y ~2χ 2( 2 ) .(1) (3) X 1 , X 2 , L , X n 的相互独立性可导致 F ( X 1 ), F ( X 2 ), L , F ( X n ) 相互独立,由 由 与(2)可知 u = ?2∑ linF (x ) ~ x (2n ) 。2 i =1 in2 2 19.设 ( x i,y i ) ,i=1,2,3,…,n 是取自二维正态分布 N ?1 , ? 2 , σ 1 , σ 2 , ρ 的一个二维样本 ,()记x=1 n 1 n 1 n 1 n 2 *2 xi , y = ∑ yi , sx = ∑ ( xi ? x )2 , s* 2 = ∑ ( y i ? y ) , ∑ y n i =1 n i =1 n i =1 n i =1 r=∑ ( x ? x )( y ? y )i =1 i in∑ ( xi ? x )i =1n2∑( y ? y )i =1 in2试 求统 计量 T = n ? 1x ? y ? ( ?1 ? ? 2 ) s*2 + s* 2 ? 2rs* s* x y x y的 分布σ12n解: 容易看出 x ? y 仍服从正太分布, E( x ? y ) = ?1 ? ? 2 , E( x ? y ) = 且 所以+ σn2 ? 2 ρσ1σ 2 n2x ? y ? ( ?1 ? ?2 )σ 12 + σ 22 ? 2 ρσ 1σ 2~ N (0,1) ,另外n n n*2 * n( sx + s* 2 ? 2rsx s* ) = ∑ ( xi ? x ) + ∑ ( yi ? y ) ? 2∑ ( xi ? x )( yi ? y ) y y 2 2 i =1 n i =1 i =1= ∑ [( xi ? yi ) ? ( x ? y )]2i =1类 似 于 一 维 正 态 变 量 场 合 , 可 证 : s x + s y ? 2rs x s y 与 x ? y 相 互 独 立 , 且* **2*240 n s * + s * ? 2rs * s * x y x yσ + σ ? 2σ σ2 1 2 2 2 1(222 2) ~ x (n ? 1) 于是根据 t 变量的构造可知2nx ? y ? ( ?1 ? ?2 )2 σ 12 + σ 2 ? 2 ρσ 1σ 2(σ*2 * n ( sx + s* 2 ? 2rsx s* ) y y 2 1= n ?1x ? y ? ( ?1 ? ? 2 )*2 * sx + s* 2 ? 2rsx s* y y~ t ( n ? 1)2 + σ 2 ? 2 ρσ 1σ 2 ) ( n ? 1)这就是我们要求的分布。 20.设 Tn 为自由度为 n 的 t 变量,试证 Tn 的极限分布为标准正态分布 N (0,1) 。 证: 据自由度为 n 的 t 变量的构造知,其中 Tn =X 2 其中 X ~ N ( 0,1) , Y ~ χ ( n ) , 且 Y /n? n与相互独立。 Y 的特征函数为 (1 ? 2it ) 由?n 2t? 2 ? ,故 Y/n 的特征函数为 ?1 ? 2i ? ,考察其极限知 n? ?? 2it ? lim ?1 ? ? n →∞ n ? ??n 2? 2it ? = lim ?1 ? ? n →∞ n ? ??n it 2 it= eit ,由特征函数的性质知,从而由Y P ?? 1 。再由 → n依概率收敛性知 Tn=X P ?? X → Y /n。这就证明了 Tn 的极限分布为标准正态分布N (0,1) 。注:此结论也可以由自由度的分布的密度函数直接导出,只是推算稍微复杂一些。 21.设 x1 ,L , xn 是来自正态分布总体 N2 ? sn(? , σ ) 的一个样本。 s22 n=1 n ∑ ( xi ? x ) 是 n ? 1 i =1样本方差,试求满足 P? ?? ≤ 1.5 ? ≥ 0.95 的最小 n 值。 ? ?σ ?2解由于(n ? 1)s n2σ2~ χ 2 (n ? 1) ,所以有,2 ? sn ? P ? 2 ≤ 1.5 ? = P ( χ 2 ( n ? 1) ) ≤ 1.5 ( n ? 1) ?σ ?要使上述的概率 ≥ 0.95 ,等价与要使 χ 2 (n ? 1) 分布的 0.95 分位数不大于 1.5(n ? 1) ,即χ 2 0.95 ( n ? 1) ≤ 1.5 ( n ? 1) ,满足上述的不等式的最小值可用搜缩法获得,如下表:41 n 2 5 10 15 20 25 26 27 28χ20.95(n-1)3.73 16.79 30.03 37.14 40.113271.5(n-1) 1.5 6 13.5 21 28.5 36 37.5 39 40.5由此可见,当 n ≥ 27 就可以使上述不等式成立42 §5.5 充分统计量内容概要1 充分统计量 x1,x2,… ,xn 是 来 自总 体分布 函数为 F(θ )的一 个样 本, 统计 量T=T(x1,x2,…,xn)称为θ的充分统计量(也称为该分布的充分统计量),如果在给定 T 的取值后, x1,x2,…,xn 的条件分布与θ无关。 2 因子分解定理 设总体的概率函数为 f(x; θ), x1,x2,…,xn 为其样本,则 T=T(x1,x2,…,xn) 为充分统计量的充要条件是:存在如下两个函数? (t, θ),它是通过统计量 T 的取值 t 而依赖于样本的函数; ? h(x1,x2,…,xn),它是样本的函数,与θ无关,使得 f(x1,x2,…,xn)=g(T(x1,x2,…,xn), θ)h(x1,x2,…,xn).3 充分统计量的一一对应变换仍是充分统计量 4 一些常见分布的充分统计量分布 二 点 分 布 b (1, p ) 泊 松 分 布 p (λ ) 几 何 分 布 Ge (θ ) 均 匀 分 布 U (0, θ ) 均 匀 分 布 U (θ1 , θ 2 ) 均 匀 分 布 U θ ,θ) ( 2 正 态 分 布 N ?, σ 2) ( 幂分布 指 数 分 布 Exp (λ ) 双参数指数分布 伽 玛 分 布 Ga (α , λ ) 对 数 正 态 分 布 LN( ? , σ 2 ) 贝 塔 分 布 Be ( a , b )分布列或密度函数 p z (1 ? p )1? x , x = 0,1 e ? λ , x = 0,1, 2, L x! θ (1 ? θ ) x , x = 0,1, 2,L 1参数 p充分统计量 T = x1 + L + xn T = x1 + L + xn T = x1 + L + xn T = max( x1 , L , xn ) T1 = x(1) , T2 = x( n ) T1 = x(1) , T2 = x( n ) xnλxλ θ θ θ1 , θ 2 θ ? ,σ 2 θ λθ,0 & x & θ1 , θ1 & x & θ 2 θ 2 ? θ1 1θ, θ & x & 2θ2 2 1 e ? ( x ? ? ) / 2σ 2πσ与 ∑ ( xi ? x ) 2i =1 nnp ( θ ) = θ xθ ?1 , 0 & x & 1T = ∏ xi或 T = ∑ ln xii =1 i =1λe?λ x , x & 0p ( θ , ? ) =nT = x1 + L + xn T1 = x(1) , T2 = ∑ xii =1 n1θe?x??θ,x & ?? ,θ α,λλ xα ?1e ? λ x , x. & o Γ (α )1 2πσ x( Inx ? ? ) 2T1 = ∑ xi , T2 = ∏ xii =1 i =1 n nnne2σ 2? , σ 2 T1 = ∑ Inxi , T2 = ∑ ( Inxi ) 2i =1 i =1 n n1 x n ?1 (1 ? x ) b ?1 , 0 & x & 1 a , b T1 = ∑ ln xi , T2 = ∑ ln (1 ? xi ) B ( a, b) i =1 i =143 习题与解答 5.51 设 x1 , L , x n 是来自几何分布 P(X=x)= θ (1 ? θ ) x , x=0,1,2,…的样本,证明 T= 分统计量。 证 由几何分布性质如,T~Nb( n,θ ),其分布列为 P(T=t)= ? ?∑xi =1ni是充? n + t ? 1? n ?θ (1 ? θ ) t ,t=0,1 2, L . ? ? t ?在给定 T=t 后,对任意的一个样本 x1 ,L , x n∑xi =1ni=t有P( X 1 = x1 ,L , X n = xn T = t )P ( X 1 = x1 , L , X n ?1 = x n?1 , X n = x n = t ? ∑ xi=n ?1 i =1n ?1 i =1P (T = t )∏ P( X=i= xi ) ? P ( X n = t ? ∑ xi )i =1n ?1? n + t ? 1? n t ? ? θ (1 ? θ ) t ? ?xi∏θ (1 ? θ )=i =1n ?1?θ (1 ? θ )t ? ∑ xii =1n?1? n + t ? 1? n t ? ? θ (1 ? θ ) ? t ?=θ n (1 ? θ ) t? n + t ? 1? n t ? ? t ?θ (1 ? θ ) ? ? ?=1 ? n + t ? 1? ? ? t ? ? ? ?该条件分布与 θ 无关,因而 T=∑xi =1ni是充分统计量。这个条件分布是离散均匀分布,可用等可能模型给其一个解释;设想有 n-1 个“1”和 t 个 “0”,把它们随机地排成一行,并在最后位置上天上 1 个“1”,譬如0,2,0 ,1, 0,2,0 ,1, 0,2,0 ,1, L 0,2,0 ,1, 0,2,0 ,1。 L L L L L 1 3 1 3 1 3 1 3 1 3x1 x2 x3 xn ?1 xn这 n 个“1”把此序列段分成 n 段,每段中“0”的个数依次记为 x1 , x 2 , L , x n ,这里诸 xi 服44 ? 2 i =1 ? (2πn )?1 / 2 exp ?? 1 (t ? n? )2 ? ? ? ? 2n ? n (2π )?n / 2 exp ?? 1 ∑ xi2 ? 2 ?t + n? 2 ? ? 2 i =1 = (2πn )?1 / 2 exp ?? 1 t 2 ? 2n?t + n 2 ? 2 ? ? 2n =(2π )?n / 2 exp ?? 1 ∑ (xi ? ? )2 ? ? ?n()? ?2()? 2? ? ?=n1 n(2π )?(n ?1) / 2 exp ?? 1 ? ∑ xi2 ? t ?? 2 ? i =1??n?? ??, n ?? ?2它与 ? 无关,从而 Τ =n∑xi =1i是充分统计量。讨论:Τ =∑xi =1i是 ? 的充分统计量, T1 = x 也是的充分统计量,因为 Τ1 与 Τ 是一一对应的,但是 T 2 = x 则不是 ? 的充分统计量。事实上,由于 x ~ N ( ? ,1/ n ) ,记其密度函数为,则2f (x ) =n 2πe ? n( x ? ? )2/2,则 T2 = x 的密度函为2g (t ) = f( )2t1 t+f ? t( )21 t=1 2 tn 2π? ? n( ?e ?t ??)2/2+e?n ? t ??() /2 ? ? ?2于是条件密度函数(注意到 t = x )f (x1, L , x n Τ2 = t ) = 1 2 t(2π )?n / 2?n∑ ( xi ? ? )2 ii =1 2ne? ? ? ?2 ? n ??? ?x + ? ??? ? ? ? ? ? n ? ?n? x ? ? ? +e e ? ? 2π ? ? ?? ? ? ? ? ?它是依赖与 ? 的,所以 T2 = x 不是 ? 的充分统计量。25.设 x 2 , L , x n 是来自 p(θ ) = θ ? x θ ?1 ,0 & x & 1, θ & 0 的样本,试给出一个充分统计 量。 解:样本的联合密度函数为p (x1, x 2 , L ,θ ) = θ n ( x1 x 2 L x n )θ ?1?n ? = θ n ? Π xi ? ? i =1 ?θ ?1,45 θ ?1 n 令, Τ = Π x i 取 g (θ ) = t θ , h( x1 , L , x n ) = 1 ,由因子分解定理, Τ = Π xi 为 θ 的充分统nni =1i =1计量。另外, Τ 的一一变换得到的统计量,如 x1 , L , x n 的几何平均 ( x1 L x n )1/ n或其对数1 n ∑ ln xi ,都是 θ 的充分统计量。 n i =16.设 x1, L , x n 是来自韦布尔分布 p (θ ) = mx 给出一个充分统计量。 解:样本的联合密度函数为m ?1θ ? m e ? ( x /θ ) 的样本( m & 0 已知),试mp( x1 , x 2 , L ,θ ) = m ( x1 x 2 L x n )nm ?1θ e?m?∑ xim / θ mi =1n,m ?1若令 Τ =n∑xi =1 m ini,取 g (t , θ ) = θ? nmexp ? t / θ{m}? n ? , h( x1 , L , x n ) = m ? Πxi ? ? i =1 ?n, 由因子分解定理, Τ =∑xi =1是的充分统计量。7.设 x1 , L , x n 是来自 Pareto 分布p (x;θ ) = θ ? a θ x ? (θ +1) , x & a, θ & 0的样本( a & 0 ),试给出 θ 的充分统计量。 解:样本的联合密度函数为p( x1 , x 2 ,L,θ ) = θ n a nθ ( x1 x 2 L x n )令 Τ = Π xi , g ( θi =1 n? ( n +1), xi & a, i = 1,L, nn) = θ n a nθ t ? (θ +1) , h ( x1 , x 2 , L , x n ) = 1 ,由因子分解定理, T = Π1 xi i=或s =1 n ∑ ln xi 都是 θ 的充分统计量 n i =18.设 x1 , L , x n 是来自 Laplace 分布 p (x;θ ) 计量。 解:样本的联合密度函数为1 ? x /θ e , θ & 0 的样本,试给出一个充分统 2θ? 1 ? ? i =1 p (x1 , x 2 , L ,θ ) = ? ? e θ . ? 2θ ?n∑ xin46 取Τ =∑i =1nn ? 1 ? ? xi , g (θ ) = ? ? e θ , h( x1 , L , x n ) = 1, 由因子分解定理, Τ = ∑ xi 为 θ 的充 ? 2θ ? i =1nt分统计量。 9.设 x1 , L , x n 是来自正态分布 Ν2(? ,σ )的样本2(1)在已知 ? 时给出 σ 的一个充分统计量; (2)在 σ 已知时给出 ? 的一个充分统计量。2解: (1)在已知 σ 时,样本联合密度函数为2p ( x1 , x 2 , L , σ ) = (2πσ )22 ?n / 2? 1 ? exp?? 2 ? 2σ ?? ? ( xi ? ? ) ?. ∑ ? i =1 ?n 2令T =∑ (xi =1 nnit ? ? ? ? ) , 取 g ( σ 2 ) = (2πσ 2 ) ? n / 2 exp?? , h( x ) = 1 , 由 因 子 分 解 定 2 ? ? 2σ ?22理, T =∑ ( xi ? ? ) 为 σ 2 的充分统计量。i =1 2(2)在 σ 已知时,样本联合密度函数为p ( x1 , L , ? ) = (2πσ )2 ?n / 2? 1 ? exp?? 2 ? 2σ ?∑ (xi =1 nni? ? ? ?) ? ? ?2? 1 = (2πσ 2 ) ? n / 2 exp?? 2 ? 2σ令x =n ? 1 ? 2? xi ? exp?? (n? 2 ? 2 ? ∑ xi )?. ∑ ? ? 2σ 2 i =1 i =1 ?1 n ∑ xi ,取 n i =1? 1 ? 1 ? g ( ? ) = exp?? (n? 2 ? 2n? x)?, h( x) = (2πσ 2 ) ? n / 2 exp?? 2 2 ? 2σ ? ? 2σ由因子分解定理, x 为 ? 的充分统计量。∑xi =1n2 i? ?, ?10.设 x1 , L , x n 是来自均匀分布 U (θ 1 ,θ 2 ) 的样本,试给出一个充分统计量。 解:总体的密度函数为? 1 , ? p (θ 1 ,θ 2 ) = ?θ 2 ? θ 1 ?0, ?47θ1 & x & θ 2 ,其他。 于是样本的联合密度函数为?? 1 ? n ?? ? p( x1 , L,θ 1 ,θ 2 ) = ?? θ ? θ ? , ? 2 1 ? ?0, ?nθ 1 & x(1) ≤ x( n ) & θ 2 ,其他,? 1 ? 即 p ( x1 , L ,θ 1 ,θ 2 ) = ? ? θ ? θ ? I θ1 & x(1) & x( n ) &θ 2 ,令 t1 = x(1) , t 2 = x( n ) ,并取 ? ? 2 1 ? ? 1 ? g (θ 1 ,θ 2 ) = ? ? θ ? θ ? I θ1 &t1 &t2 &θ 2 , h( x) = 1. ? 1 ? ? 2由因子分解定理, T = (t1 , t 2 ) = ( x (1) , x ( n ) ) 为参数 (θ 1 ,θ 2 ) 的充分统计量。 11.设 x1 , L , x n 是来自均匀分布 U (θ 1 ,2θ 2 ),θ & 0 的样本,试给出充分统计量。 解:总体的密度函数为2?1 ? , p (θ ) = ?θ ?0, ?于是样本的联合密度为θ & x & 2θ,其他,?1? p ( x1 , L ,θ ) = ? ? I θ & x(1) & x( n 0 & 2θ . ?θ ?令 t1 = x (1) , t 2 = x ( n ) , 并取n?1? g (θ ) = ? ? I θ &t1 &t2 & 2θ , h( x) = 1, ?θ ?由因子分解定理, T (t1,t 2 ) = ( x (1) , x ( n ) ) 为 θ 的充分统计量(这里没有唯一的充分统计量) 。 这表明:充分统计量的维数不一定等于未知参数个数。 12.设 x1 , L , x n 是来自两参数指数分布 p (θ , ? ) = 证明 ( x, x (1) ) 是充分统计量。 证:由已知,样本联合密度函数为n1θe ?( x ? ? ) / θ , x & ? ,θ & 0 的样本,? 1 ? ? ∑ ( xi ? ? )/θ ?1? p ( x1 ,L ,θ , ? ) = ? ? e i=1 I x(1) & ? = ? ? e ?θ ? ?θ ?n nn? n x ? n?θI x(1) & ? .48 令 g (θ ) = ??1? ? e ?θ ?n? n x ? n?θI x(1) & ? , h( x) = 1 ,由因子分解定理, ( x, x(1) ) 是 ( ? ,θ ) 的充分统计量。213. 设 Yi ~ N ( β 0 + β 1 x i , σ ), i = 1,2, L , n, 诸 Yi 独 立 , x1 , L , x n 是 已 知 常 量 , 证 明n n ? n 2? ? ∑ Yi , ∑ xi Yi , ∑ Yi ? 是充分统计量。 i =1 i =1 ? i =1 ?证: Y1 , L , Yn 的联合密度函数为n ? 1 ? 1 ?? exp ?? 2 ( yi ? β 0 ? β1 xi ) 2 ?? p ( y1 ,L , yn ) = ∏ ? 2 ? 2σ ?? i =1 ? 2πσ ? 1 n ? = (2πσ 2 ) ? n / 2 exp ?? 2 ∑ ( yi ? β 0 ? β1 xi ) 2 ? ? 2σ i =1 ? n ? 1 ? n = (2πσ 2 ) ? n / 2 exp ?? 2 ? ∑ yi 2 + nβ 0 2 + β12 ∑ xi 2 i =1 ? 2σ ? i =1 n n n ?? ? 2 β 0 ∑ yi ? 2 β1 ∑ xi yi + 2 β 0 β1 ∑ xi ? ? . i =1 i =1 i =1 ??注意到 x1 , L , x n 是已知常量,令 t = (t1 , t 2 , t 3 ) = ??n n 2? y i , ∑ xi y i , ∑ y i ? ,取 ∑ i =1 i =1 ? i =1 ? nn n ? 1 ? ?? g (t , σ 2 , β 0 , β1 ) = (2πσ 2 ) ? n / 2 exp ? ? 2 ? nβ 0 2 + β12 ∑ xi 2 + 2β 0 β1 ∑ xi ? ? . i =1 i =1 ?? ? 2σ ? ? 1 ? exp ? ? 2 (t3 ? 2 β 0t1 ? 2β1t2 ) ? , 2σ ? ?h( y1 ,L , yn ) =1由因子分解定理,(∑ Yi , ∑ xiYi , ∑ Y12 )是( β 0, β 1 , σ 2 ) 的充分统计量.i =1 i =1 i =1nnn14. 设 x 1 , L , x n 是 来 自 正 态 统 计 N(? , σ 12 ) 的 样 本 , y1 L y m 是 来 自 另 一 正 态 总 体2 2 N( ? , σ 2 ) 样本,这两个样本相互独立,试给出( ? , σ 12 , σ 2 ) 的充分统计量.解:样本 x1,L xn ,y 1 , L y m 的联合密度函数为 ,? ( x ? ? )2 ? ( x ? ? )2 ? 1 ? n ? 1 ? 2 i 2 i 2 σ1 2σ 2 ? ? ? ? P( x1,L xn ,y 1 , L y m )= ∏ ? , e e ?∏ ? ? 2 2 i =1 ? 2πσ 1 ? i =1 ? 2πσ 2 ? ? ? ? ? 1 1n49 = (2π ) 其中 x = x =? ( n + m )/ 2σ 1? nσ e? 1 ? ?? 2 ?m ? 2σ 1 ? 2? ? ? ? ∑ xi2 + 2σ 22 ∑ yi2 ?? σ12 + σ 22 ? ? +? σ12 + σ 22 ? ? 2 ? ? ? ? ? ? 1i =1 i =1nn? nxny ?? nn ?? ? ?m ? ? n 1 n 1 m ∑ xi , y = m ∑ yi 令 t=(t 1 , t 2 , t3, t 4 )=( x, y, ∑ xi2 , ∑ yi2 ), 取 n i =1 i =1 i =1 i =1? 1 ? ?? 2 ?m ? 2σ 1 ? 2n ng (t , β , ? , σ , σ ) = (2π )2 1 2 2? ( n + m )/ 2σ σ e?n 1? ? ? ? ∑ xi2 + 2σ 22 ∑ yi2 ?? σ12 + σ 22 ? ? +? σ12 + σ 22 ? ? 2 ? ? ? ? ? ?1i =1 i =1? nxny ?? nn ?? ? ?h( x1 ,L xn , y1 ,L , yn ) = 1 )由因子分解定理,( t = (t1 , t2 , t3 , t4 ) = ( x , y ,∑ xi2 , ∑ yi2 ) )是 (? , σ 12 , σ 22 ) 的充分统计量.i =1 i =1nn50
更多相关文档

我要回帖

更多关于 正态分布的充分统计量 的文章

 

随机推荐