应用统计学题:统计学可分为描述性统计和计算与分析。题如图。麻烦啦

应用统计学课后答案 【范文十篇】
应用统计学课后答案
范文一:《应用统计学》第一章 答案
1.解:(1)??{(x1,x2,?,x5)|xi?0或1,i?1,?,5}
P(x1,x2,?,x5)?pi?1(1?p)
,xi?0或1,i?1,?,5
(2)T1,T4是统计量,T2,T3不是统计量,因为含有未知参数p (3)?
,xi?(0?1?1?0?1)?s?(xi?)?(xi?)2? ???5i?155n?1i?15?1i?1510
2.解:因为X~N(30,4),所以~N(30,),因而
P(?31)?P??1???1???1??
时,P(?31)?1???1??(1)?1?0.84?0.16 当n=9
时,P(?31)?1???1??(1.5)?1?0.93?0.07 当n=16
时,P(?31)?1???1??(2)?1?0.98?0.02 7.解:(1)?X~P(?),?P(X?k)?
e??,k?0,1,?,且EX?DX??
联合分布列为P(X1?k1,?,Xn?kn)??P(Xi?ki)??
?n?,i?1,?,n
(2)因为样本与总体同分布且独立,所以有
?E(?Xi)??EXi??n????;?D(?Xi)?2
ni?1ni?1nni?1n
(3)E(S2)?E(
(Xi?))?(?EXi2?2) ?n?1i?1n?1i?1
因为EXi??,所以EXi2?DXi?(EXi)2????2,2??()2?因此ES2?
(n?(???2)?n?(??2))?? n?1n
8.解:(1)P(x1,x2,?,xn)?p
1n1n1p(1?p)
(2)?E(X)?p,?D(?Xi)?2?DXi?2?n?p?(1?p)?
ni?1nni?1nx?0?0,
,0?x?1 (3)Fn(x)??n?
1??x?a,a?x?b??
11.解:(1)?X~R(a,b),?f(x)??b?a,F(x)??,a?x?b
b?a??0,其它?x?b??1,
联合密度函数为f(x1,x2,?,xn)??f(xi)?
?x?an?11n()?,a?x?b
(2)X(n)的密度函数为fn(x)?n(F(x))n?1f(x)??,所以有 b?a?b?a
?0,其它?EX(n)??xfn(x)dx??x?n(
)?dx?b?ab?a(b?a)n
(x?a?a)(x?a)n?1dx
bbnn(x?a)n?1ba(x?a)nbnb?ann?1
?[(x?a)dx?a(x?a)dx]?[|?|]?aa?a
n?1nn?1(b?a)n?a(b?a)n
?b?xn?11)?,a?x?b?n(
,所以有 X(`1)的密度函数为f1(x)?n(1?F(x))n?1f(x)??b?ab?a
EX(1)??xf1(x)dx??x?n(
)??b?ab?a(b?a)n
x(b?x)n?1dx
(b?a)n(?1)nn?
(x?b?b)(x?b)n?1dx
(x?b)n?1?b(x?b)n?1dx?
Xn?1~N(?,?),~N(?,
),?Xn?1?~N(0,
~N(0,1) ?)n又因为
~?2(n?1),且Xn?1?与S相互独立,所以有
16.解:?X~N(0,1),(X1,?,Xn)为取自总体的样本,且正态分布具有可加性 ??
Xi~N(0,3),?Xi~N(0,3),???
~N(0,1),??
~N(0,1),且?与?相互独立
?Y?????((?Xi)?(?Xi)2)~?2(2),所以取c=1/3
17.解:?X~N(0,?2),(X1,?,Xn)为取自总体的样本,?(1)(2)
)2~?2(n) )2~?2(n)
)??Xi~N(0,n?~N(0,1),?32?2~?2(1)
?由此可以导出Y1,Y2,Y3,Y4的分布
27.证:(1)L(x1,x2,?,?,?)??f(?,?)?(
)(?xi)??1e?(?)i?1
)(?xi)e取h(x1,?,xn)?1,g(T(x1,?,xn),?,?)?(, ?(?)i?1
所以由因子分解定理知(?xi,?xi)是(?,?)的充分统计量
(2)当?已知时,L(x1,x2,?,?,?)??f(?,?)?(
)(?xi)??1e?(?)i?1
取h(x1,?,xn)?(
)(?xi)??1,g(T(x1,?,xn),?)??n?e?(?)i?1
所以由因子分解定理知?xi是?的充分统计量
)(?xi)e(3)当?已知时,L(x1,x2,?,?,?)??f(?,?)?( ?(?)i?1i?1
取h(x1,?,xn)?e
)(?xi)??1 ,g(T(x1,?,xn),?)?(
所以由因子分解定理知?xi是?的充分统计量
29.证:L(x1,x2,?,?)???x
?(??1)?(??1)12
???(?xi)?(??1)
取h(x1,?,xn)?1,g(T(x1,?,xn),?)??n?n?(?xi)?(??1)
所以由因子分解定理知?xi是?的充分统计量
32.解:(1)P(X1?x1,?,Xn??)?e取a(?)?e
?exp{ln???xi}?
,Q(?)?ln?,T(x1,?,xn)??xi,h(x1,?,xn)?
所以泊松分布族{P(?):??0}是单参数分布族
n?n?1n1n22
L(x1,?,?)???(xi??)}???xi???xi}e2
2i?12i?1i?1
xi2}exp{??xi}e?2i?1i?1
,Q(?)??,T(x1,?,xn)??xi,h(x1,?,xn)?
1n2?xi} 2i?1
所以正态分布族{N(?,1):???????}是单参数分布族 (3
)L(x1,?,?)?取a(?)?
,T(x1,?,xn)??xi2,h(x1,?,xn)?1
所以正态分布族{N(0,?2):?2?0}是单参数分布族
(4)L(x1,?,?)?
(?xi)?0?1e
a(?)?,Q(?)?n?,T(x,?,x)?x,h(x,?,x)?(xi)?取??1ni1nn
?(?0)i?1i?1
所以Gamma分布族{Ga(?0,?):??0}是单参数分布族 (5)
?(a0?b)nna0?1n?(a0?b)nna0?1b?1
L(x1,?,b)?()?xi?(1?xi)?()?xiexp{(b?1)?ln(1?xi)}
?(a0)?(b)i?1?(a)?(b)i?1i?1i?10nn
),Q(b)?(b?1),T(x1,?,xn)??ln(1?xi),h(x1,?,xn)?(?xi)?0?1, 取a(b)?(
?(a0)?(b)i?1i?1
所以Beta分布族{Be(a0,b):b?0}是单参数分布族 (6)L(x1,?,?)??ne
取a(?)??,Q(?)???,T(x1,?,xn)??xi,h(x1,?,xn)?
所以指数分布族{E(?):??0}是单参数分布族
34.证:L(x1,x2,?,?)??(1??),取h(x1,?,xn)?1,g(T(x1,?,xn),?)??(1??)i?1
所以由因子分解定理知?xi是几何分布的充分统计量
《应用统计学》第二章 答案
1.解:(1)??EX?p,?p^?为p的矩估计;
(2)设x1,x2,?,xn为样本的一组观测值,则L(p)?L(x1,x2,?,p)?p
?lnL(p)?i?1
?i?1??0 lnL(p)??xilnp?(n??xi)ln(1?p),令?pp1?pi?1i?1
^?为p的极大似然估计 所以p
5.解:f(x;p)?Cmp(1?p)m?x,设x1,x2,?,xn为样本的一组观测值,则似然函数为
xnx1L(x1,x2,?,p)?Cm?Cmpi?1(1?p)
,取对数为
lnL(x1,x2,?,p)?lnC?C??xilnp?(mn??xi)ln(1?p),
为p的极大似然估计,1-p^?1?为q的极大似然估计 mm
1,??x???1??
15.解:f(x;?)??,F(x;?)??x??,??x???1
?0,其它?1,x???1?
(1)??EX?
,?????为?的矩估计 222
设x1,x2,?,xn为样本的一组观测值,则似然函数为L(x1,x2,?,?)?1为常数 所以符合条件的所有??X(1)???X(n)???1, ^?X都可以看作是?的极大似然估计。 即X(n)?1??(1)
^)?E(?1)??1?2??1?1??,所以?^是?的无偏估计 (2)E(?112222
X(n)的密度函数为fn(x)?n(F(x))
??n(x??),??x???1f(x)??
xfn(x)dx??
x?n(x??)n?1dx??
(x????)?n(x??)n?1dx??
n(x??)n??n(x??)n?1dx
?1?1|???(x??)n|????
^是?的无偏估计 ^)?E(X?n)??,所以?因为E(?22(n)
X(`1)的密度函数为f1(x)?n(1?F(x))
??n(1???x),??x???1
,所以有 f(x)??
xf1(x)dx??
x?n(1???x)n?1dx?(?1)n?1n?
x(x?1??)n?1dx
(x?1??)?(1??)(x?1??)dx?(?1)
(x?1??)n?1??1(x?1??)n??1
n[|??(1??)|?]
?(1??)(?1)2n?1???n?1n?1
^是?的无偏估计 ^)?E(X?1)??,所以?因为E(?33(1)
n?1^)?D(?1)??DX?1?1?1 (3)D(?1
n^)?D(X?n)?DX?E(X)2?EX???1x2?n(x??)n?1dx?(??n)2?D(?2(n)(n)(n)(n)??n?1n?1(n?2)(n?1)2n^)?D(X?1)?DX?E(X)2?EX???1x2?n(1???x)n?1dx?(??1)2?D(?3(1)(1)(1)(1)??
n?1n?1(n?2)(n?1)2
^,?^,?^都是?的相合估计量 (4)?123
16.解:(1)因为ETc(X)?1??3?(2?2c)??2(1??)?c?2?(1??)?(1?2c)??(1??)2?0?(1??)3?? 所以对于任意常数c,Tc(X)是?的无偏估计
17.解:(1)设x1,x2,?,xn为样本的一组观测值,则似然函数为L(x1,x2,?,?)?1为常数 11
所以符合条件的所有???X(1)???X(n)???,
?X(1)?都可以看作是?的极大似然估计。 即X(n)???22
18.解:经验证指数分布满足Rao-Cramer正则条件,当x>0时 ?lnf(x;?)1x?2lnf(x;?)12x
?2?3 lnf(x;?)??ln??,???2,
???????2??
?2lnf(x;?)12x12121
I(?)??E()??E(?)???E(X)?????
??2?2?3?2?3?2?3?2
?所以?的无偏估计量的方差下界为 nI(?)n
19.解:经验证两点分布满足Rao-Cramer正则条件,有f(x;p)?px(1?p)1?x,x?0或1
?lnf(x;p)x1?x?2lnf(x;p)x1?x
??,???lnf(x;p)?xlnp?(1?x)ln(1?p), ?pp1?p?p2p2(1?p)2?2lnf(x;p)x1?x11?E(X)1
I(p)??E()??E(?2?)?2E(X)?? 222
p(1?p)?pp(1?p)p(1?p)
[((1?p)2)']2[?2(1?p)]24p(1?p)3
所以(1?p)的无偏估计量的方差下界为 ??
nI(p)np(1?p)
范文二:应用统计学第七章作业题及答案
P188~189 第1 2 3 7 9题
n=49 =10.5
抽样平均数的平均误差为:??又因为t=1.96
所以 抽样极限误差为:??t??1.96?1.5?2.94(元)
所以 总体平均消费额95%的置信区间为(25.5-2.94,25.5+2.94)=(22.56,28.44)
2、(1)合格品率为:p=190/200=0.95
抽样平均误差为
:?p? (2)抽样极限误差为:??t?p?2?0.8
合格品率区间在(0.95-0.+0.0308)=91.92%~98.08%,合格品数的区间估计为(0.,0.)=()
21.96?400222n=t?/?=?171 3、(1)23
21.96? (2)n=t?/?=21.5
7、已知n=10、x?170,S=12, 则ux?sn?12
由题意可知:X∈[160.5,179.5], x?170,
则tux?t12?9.5
得出t?2.503,F(t)=98.76%
因此有98.76%的把握
9、(1)??t??1?0.6?0.6(小时)
(2)n?22?0.4
??900 (3)n?22?0.4
??400 (4)n?22?0.6
(5)抽样单位数与概率度的平方成正比,与误差的平方成反比
范文三:书P213
1.解:由题已知可得,r=?2xy
x72=0.?7.9
r=0.9348,所以中文成绩和英文成绩为高度正相关
2. 解:(1)相关系数为:
(2)根据已知数据,利用最小二乘法可得:
b= n?xy??x?y=0.68 22n?x?(?x)
a=?b=1.?15=-8.5333
所建立的直线回归方程为:y=-8.x
回归系数b=0.68表示销售额每增加1万元,公司的利润会平均增加0.68万元;截距a=-8.5333,表示在销售额为0的情况下,公司的利润为-8.5333万元。
(3)当销售额x=360万元时,预测销售利润的可能值为:
y=-8.533+0.68?360=236.2667(万元)
4.解:(1)相关系数为:
6?79??181476
= r=-0.909
所以说明产量与单位成本高度负相关
(2)b= n?xy??x?y=-1.818 22n?x?(?x)
a=?b=77.364
单位成本对产量的回归直线方程:y=77.364-1.818x
其中:y——成本 x——产量
,产量每增加1000件时,单位成本平均下降1.818元。
(3)当y=70时,70=77.364-1.818x
解得x=4.05千件
范文四:能力训练参考答案
10.√ 三、1.ABE
10.√ 三、1.(1)频数分布数列
n=5,i=93.8?100
(3)直方图
(4)耐用时间呈现钟型分布或正态分布。
2.洛伦茨曲线是描述收入和财富分配性质的曲线。曲线横轴是累计人口百分比,纵轴是累计收入或财富的百分比。
当一个国家的收入分配完全按人均分配时,同一累计百分比的人口就一定占有相同的累 计收入百分比。此时该国的收入分配程度曲线就与对角线重合。如果绝大多数人口占有很少的财富和收入,而少部分人占有了绝大部分的收入,则该国的曲线就靠近下横轴和右纵轴。
3.对于不连续组界的数列处理 (1)确定单位差
(2)确定新连续组界的上下限
新数列上限=原来上限+单位差/2
新数列下限=原来下限-单位差/2
4.见下表。
12.D 13.B 14.B 15.D
23.C 24.B 25.B 26.B 27.B 28.B 29.A 30.C 二、1.×
20.× 2.产量计划完成程度=122.86%,提前6个月零68天。
5.计划规定比上年增长1.94% 6.(1)结构相对指标见下表:
产业、第三产业的比例为 1:2:2.1。 8.
(千克/亩) m2500?x
?250(千克/亩)
在相同的耕地自然条件下,乙村的单产均高于甲村,故乙村的生产经营管理工作做得好。但由于甲村的平原地所占比重大,山地所占比重小,乙村则相反,由于权数的作用,使得甲村的总平均单产高于乙村。 9. 103.9%
10. 早、中、晚购买量相同时,平均每元可买蔬菜:
?2.73(千克/元)
111??22.55
早、中、晚购买额相同时,平均每元可以买蔬菜:
?3.17(千克/元)
11. G?94.74%
12.(1)5.49%
(2)5.50%
13. (1)Me=283.3千克/亩
Q1=242千克/亩
Mo=294.5千克/亩
Q3=312.8千克/亩
(2)R=350千克/亩
A.D.=41.78千克/亩
(4)略 (3)?278千克/亩
m?180?1.8件/人 m100?x
?X甲?X乙,?乙单位工人生产水平高
?0.67件/人?乙?200
?0.6件/人 100
V乙?乙??100%?33.3 %?100%?44.7 %
V甲?V乙,?乙单位工人生产水平整齐。
标准化过程表
23.BD 二、1. ×
5. × 6.√
13.√ 14.√ 三、1、1696万元
2、该商店上半年商品库存额:50.417万元;该商店全年商品库存额:52.75万元;该商店全年商品库存额:51.5835万元
3、(1)2007年至2010年的总增长速度为: 46.07%; (2)平均增长速度为:9.9%
4、568.4百万元
5、619.17=620人
6、2908万元
7、2.6125万元
10、136698元/人;第一季度全员劳动生产率=410094元/人 11、(1)见下表
(3) 平均增长量= 3.2万吨;平均发展速度=112.5%;平均增长速度=12.5%
13、yc=.914t+4.91t;y3千克 14、季节比率依次为:50.88%、76.92%、120.44%、151.78%
15、各月的季节比率依次为:16.53%、24.07%、67.87%、98.9%、160.38%、283.64%、258.41%、
128.77%、73.67%、44.37%、24.07%、19.72%
除法剔除长期趋势后各月的季节比率为:18.21%、25.16%、72.45%、103.35%、163.73%、278.04%、263.05%、126.59%、68.93%、39.55%、22.34%、18.62%
14.√ 三、
1、销售额指数=108.97%;销量指数=103.64% ;价格指数=105.14%;+12900 2、价格总指数=105.74%;产量总指数=销售额指数/价格指数=114.04%
3、总成本增长8.5%,绝对额增加2500元。其中由于单位成本下降5.9%,使成本降低2000元,由于产量增长15.3%,使成本增加了4500元
4、价格总指数为106.4%;因价格变动使农民收入增加453.8万元
5、社会商品零售额指数==98.48%;零售物价指数=99.5%;零售量指数=98.48%/99.5%=98.98%
价格下跌使居民少支出179.15元
6、总成本指数=130%;产量指数=112.11%;产品单位成本总指数=115.96% 7、价格指数=96.09%;价格变动使居民减少的开支.9=-52.9万元
8、价格总指数=104.95%;由于价格变动引起的收购额变动的绝对额为=2358.97元 9、产量总指数=143.85%;由于产量变动而增加的总成本绝对数=57万元
10、由于单位成本产品报告期比基期增长了19.05%,增加了18000元,以及产品产量报告期比基期增长了13.17%,增加了11000元这两个原因,使得全厂产品总成本报告期比基期增长34.73%,增加了29000元;可变构成指数=94.31%,225-238.57=13.57元;结构影响指数=79.22%
189-238.57=49.57元;固定构成指数=119.05%,225-189=36元 11、102.78%=112.87%×91.06%;134.2元=566.1元+(-431.9) 元
或102.78%=111.31%×92.33%;134.2元=546.23元+(-412.13) 元 12、p=103.24%
20.B 二、1.×
10.× 三、1
、抽样平均数的平均误差为:?X?
抽样极限误差为:??t??1.96?1.5?2.94(元)
所以总体平均消费额95%的置信区间为(25.5-2.94,25.5+2.94),即(22.56,28.44)
2、(1)合格品率为:p=190/200=0.95
抽样平均误差为
(2)抽样极限误差为:??t?p?2?0.8
合格品率区间在(0.95-0.+0.0308)即91.92%~98.08%,合格品数的区间估计
为(0.,0.)即()件之间。
1.962??400?171 (2)n=t?/?=?683 3、(1)n=t?/?=
1.962?4.82
=88.51?89 4、n=t?/?=
5、n=200,p=60/200=0.3
置信区间为(0.3-1.96?0.+1.96?0.0324),即(0.269,0.331)
6、92%?P?98%
7、t=2.503,F(t)=98.76% 8、(1)n=88 (2)n=22
(小时)9、(1)??t??1?0.6?0.6
(2)n?2??225 2
?0.4t2?222?62
(3)n?2??900 2
?0.4t2?222?62
(4)n?2??400 2
(5)抽样单位数与概率度的平方成正比,与极限误差的平方成反比 10、
H0:?0?50,H1:?0?50
50.2?500.62/?1.02<t0.1?1.83,所以接受原假设,每袋重量符合要求。
H0:???0?250,H1:???0?250
Z?3.333?Z0.025?1.96,否定原假设,该批产品不符合标准。
20.C 二、1.×
8. × 9.×
10.√ 三、1.解:r=0.9348,中文成绩和英文成绩为高度正相关。
2.解:(1)相关系数为:
(2)根据已知数据,利用最小二乘法可得:
nxy-xy=0.68
a=?b=1.?15=-8.5333 所建立的直线回归方程为:y=-8.x
回归系数b=0.68表示销售额每增加1万元,公司的利润会平均增加0.68万元;截
距a=-8.5333,表示在销售额为0的情况下,公司的利润为-8.5333万元。 (3)当销售额x=360万元时,预测销售利润的可能值为:
y=-8.533+0.68?360=236.2667(万元) 3.解:(1)总成本与产量的协方差为:
总成本与产量的相关系数为:
(2)设总成本为y,产量为x,根据最小二乘法计算一元线性回归方程的参数。
nxy-xy=0.78
a=-b=4.076,
所以直线回归方程为:y=4.076+0.78x
4.(1)r=-0.909 说明产量与单位成本高度负相关
(2)y=77.364-1.818x
其中:y——成本 x——产量
产量每增加1000件时,单位成本平均下降1.818元。
(3)4050件
5.(1)y=-0.421+0.803x
其中:y——支出 x——收入
(2)b表示人均收入每增加一千元,人均支出就平均增加803元。
(3)y(x=12千元)=9.2105(千元)
6.(1) r=0.948
(2) y=395.567+0.896x
(3) s.e=126.6279
(4) y (x=1100万元)=(万元) 7.(1)y=77.364-1.818x
(2)r=-0.909
(3)s.e=0.977
2、X2=6.133,P=0.013
3、F=84.544,P<0.001。因此可认为三组矿工用力肺活量不同。
4、l、3药物效应与2、4药物效应无明显差异;l、4药物效应与3、5药物效应无明显差异;1与2、1与3、1与4、3与5药物之间的差异显著;而1与5、2与3、2与4、2与5、3与4、4与5药物之间的差异不明显。
5、机器C和A日产量的均数之间无明显差异;而机器B与它们的差异较显著;工人2、3和4的日产量的均数之间无明显差异;工人4和1的日产量的均数之间无明显差异。 6、第一期,出生后至满月,增长率最高。
第二期,第2个月起至第3个月,增长率次之。
第三期,第3个月起至第8个月,增长率减缓。
第四期,第8个月后,增长率显著减缓。
根据题意得出:
第六章:统计作业
盆,扇子,纸巾的
pq分别为200,24000,总计为263700。
pq分别为000,28800,总计为250800
分别为000,24000,总计为242000
报告期销售额比基期提高8.97%,销售额绝对量增加了21700元。
-?pq=12900元 pq?k
销售价格报告期比基期提高5.14%,由于销售价格上涨使销售额增加12900元,
-?pqpq?242000
4、108.97%=105.14%x103.63%
报告期销售额比基期提高8.97%,销售额绝对量增加了21700元。这是由于销售量报告期比基期提高3.63%,由于销售量增加使销售额增加8800元和销售价格报告期比基期提高5.14%,由于销售价格上涨使销售额增加12900元共同作用形成的。
由图表可知:三类商品的
pq分别为650,200,1200,合计为2050万元;pq
别为500,200,1000,合计为1700万元;
和价格变动率,得出pq分别为637.3,210.5,1090.9,合计为1938.7万元 k
pq??则==??120.59% ?105.74%,?
kpq?kp?kq,得出kq?
即三种产品价格总指数为105.74%,产量总指数为114.04%
由数据,可得:
?pq=32000元,?pq
=29500元,
?pq=34000元,?pq
由于产量增长15.3%,使总成本增加了4500元 3、
单位成本下降5.9%,使总成本降低2000元
4、由计算可知:108.5%=115.3%×94.1%
总成本增长8.5%,实际增加2500元。其中由于单位成本下降5.9%,使总成本降低2000元,由于产量增长15.3%,使总成本增加了4500元共同作用形成的。
(一 ),由计算表中数据可得:
?pq=112500
?pq=116500
?pq=112500k
?pq- ?pq=-4000元
单位成本报告期比基期减少3.43%,使成本总额减少4000元。
产品产量报告期比基期提高39.52%,使成本总额增加了33000元
成本总额报告期比基期提高了34.73%,总共增加了29000元。
4、 96.57%?139.52%?134.73%
因此,成本总额报告期比基期提高了34.73%,总共增加了29000元。是由于单位成本报告期比基期减少3.43%,使成本总额减少4000元;同时,产品产量报告期比基期提高39.52%,使成本总额增加了33000元两者共同的作用形成的。
(二)(1)分析该公司总平均工资的变动情况(从绝对和相对角度);
(2)分析各商场职工人数结构因素(f)对公司总平均工资变动的影响; (3)分析各商场工资水平因素(x)对公司总平均工资变动的影响。
解:有已知得:
f0??116500
f/?f0?x因此:(1)可变构成指数=???94.31%
f?xf?x则??22.5-23.857=-1.357元 ?f?f
总平均单位成本报告期比基期降低了5.69%,平均每件降低1.375元。
f/?f0?x(2)固定构成指数=??96.57%
?xf??xf?22.5?23.3??0.8元 则
各分厂的单位成本报告期比基期降低了3.43%,由于各分厂的成本降低,使总平均
单位成本每件降低0.8元。
f/?f023.3?x(3)结构影响指数=???97.65%
f?xf?x则??23.3?23.857??0.557元 ??0
报告期产量降低了2.35%,由于产量降低使总平均单位成本每件降低0.557元。 (4)94.31%=96.57%×97.65%
-1.357=-0.8-0.557
因此,总平均单位成本报告期比基期减少5.69%,减少的绝对额为1.357元。其中由于各分厂单位成本报告期比基期下降3.43%,使总平均单位成本每件降低0.8元;同时,各分厂产品产量报告期比基期下降2.35%,使总平均单位成本每件降低0.557元共同作用形成的。
范文六:练习与思考答案
一、判断题
10.× 二、单项选择题
6.C 三、简答题(略)
一、判断题
二、单项选择题
三、简答题(略) 四、计算题
(4)钟型分布。 五、实践题(略)
一、判断题
10.√ 二、单项选择题
12.D 三、简答题(略) 四、计算题
1、平均时速=109.09(公里/时)
2、顾客占了便宜,因为如果两条鲫鱼分开买,则平均价格为16.92元/公斤。在这次买卖中,顾客所占的便宜是11元-10.4元=0.6元。原因是鲫鱼重量有权数作用。
3、(1)平均每个企业利润额=203.70(万元);
(2)全公司平均资金利润率=13.08%。 4、(1)全厂总合格率、平均合格率和平均废品率分别是92.17%、97.32%和
2.68%;(采用几何平均法)
(2)全厂总合格率、平均合格率和平均废品率分别是97.31%、97.31%和2.69%;(采用调和平均法)
(3)全厂总合格率、平均合格率和平均废品率分别是97.38%、97.38%和2.62%。(采用算术平均法)
5、(1)算术平均数?76.3043;四分位数QL=70.6818,QM=75.9091和
QU=82.5;众数mo?75.38;
(2)全距R=50;平均差A.D.=7.03;四分位差Qd=11.82,异众比率
Vr=51.11%;方差s2?89.60;标准差s?9.4659;
(3)偏度系数Sk(1)=0.0977,Sk(2)=0.1154,Sk(3)=0.0454; (4)峰度系数?=2.95;
(5)Vs甲?12.41%;Vs乙?12.5%。甲班平均成绩更有代表性。
6、小号、中号和大号三款校服大概应分别准备544、128、128套。
7、若是非变量结果为1的比重为P,则是非变量的平均数为P、方差为
8、甲、乙、丙三位同学该三门课程的标准化成绩的总和分别为1.27,0.52和1.63,所以,丙同学更具有竞争优势。
一、判断题
10.× 二、单项选择题
三、简答题(略)
四、计算题
1、(1)样本均值的抽样分布为:
(2)样本均值抽样分布的期望为:E()?5;方差为:V()?1.3333; (3)抽样标准误为:SE()?1.1547;
(4)概率保证程度95%时的抽样极限误差为:?=2.2632;
(5)若抽中的三个数字是1、7、9,则95%概率保证的总体均值的置信区间为:〔3.9〕。
2、重复抽样时样本中红色卡片比例的抽样分布为:
不重复抽样时样本中红色卡片比例的抽样分布为:
3、(1)?56.07元,s?28.74元,se()?5.20元,??10.19元,以95%的概率保证程度估计该校学生该月平均购书支出额为:〔45.88,66.26〕元;
(2)p?26.67%,se(p)?8.14%,??15.95%,以同样的概率保证程度估计该校学生该月购书支出额超出70元的人数为:〔187,739〕人;
(3)所需的样本量为:n?73人。
4、(1)该地区拥有私人汽车的家庭比例为:p?11.43%,抽样标准误为:
se(p)?1.47%;
(2)所需的样本量为:n?156户。 5、(1)甲种疾病调查所需样本量为30,乙种疾病调查所需样本量为19;
(2)最终所需样本量为30。 6、(略)
7、(1)N?844,W2?0.5,W3?0.21?11.22?25.53?26;W1?0.3,
s1?9.12,s2?17.39,s3?29.14;估计该小区居民户购买彩票的平均支出为:st=21.31元,抽样标准误为:se(st)?3.38元。
(2)当概率保证程度为95%,要求极限误差不超过6元时,按比例分配所需的样本量为:n?36,其中n1?11,n2?18,n3?7;Neyman分配所需的样本量为:n?31,其中n1?5,n2?16,n3?10。
8、(1)估计该市居民在家吃年夜饭的比例为:pst?92.40%;抽样标准误为:
se(pst)?1.99%;
(2)当概率保证程度为95%,要求极限误差不超过1%时,按比例分配所需的总样本量为:n?2755;各层的样本量分别为:496、579、386、248、440和606;Neyman分配所需的总样本量为:n?2654;各层的样本量分别为:555、538、431、314、410和406。
^?0.28,P^(1?P^)?0.2016,9、根据题意可猜测该单位职工的总离职意愿为P
?WP(1?P)?0.186;如果不考虑有限总体校正系数,那么采用按比例分配的
分层抽样时,与样本量为100的简单随机样本具有相同抽样标准误所需的样本
量应为:n?93。
10、(1)样本各群的均值i分别为:59,72,1085.6,
43.7和1049;样本群间方差为:sb?301.765;估计灯泡平均耐用时数为:cs?1054.78小时,抽样标准误为:se(cs)?6.13小时。
(2)如果将以上数据视为从20000个灯泡中按简单随机抽样直接抽取的,估计平均耐用时数为:?1054.78小时,抽样标准误为:se()=7.91小时;抽样效果整群抽样优于简单随机抽样。
11、R?1000,r?10,M?6,m?3,f1?0.01,f2?0.5。各调查寝室的样本比例分别为:66.67%,0%,33.33%,66.67%,33.33%,33.33%,0%,33.33%,33.33%和0%;可估计该高校拍摄过个人艺术照的女生的比例为:pts?30%;
s2pb?0.0605,sp2?0.2333;抽样标准误为:se(pts)?7.76%;具有95%概率
保证程度的置信区间为:〔14.79%,45.21%〕。
12、R?160,r?40,M?9,m?3,f1?0.25,f2?0.3333。40个调查小地块中,有病害植物的样本比例为:22个0%,11个33.33%,4个66.67%,3个100%;可估计该160个小地块上有病害的植物的比例为:pts?23.33%;
2s2pb?0.098,sp2?0.125;抽样标准误为:se(pts)?4.48%;具有90%概率保
证程度的有病害植物的比例的置信区间为:〔15.98%,30.68%〕。
一、判断题
二、单项选择题
三、简答题(略)
四、计算题
1、双侧检验问题。H0:?5;H1:?5。
临界值规则:Z=3.182,Z?1.96,Z>Z,拒绝H0而接受H1,即
该批元件的厚度不符合规定的要求;
P-值规则:与3.182相对应的P-值为0.0007,小于=0.025,拒绝H0
而接受H1,即该批元件的厚度不符合规定的要求。
2、双侧检验问题。H0:?5.2;H1:?5.2。
临界值规则:Z=5.17,Z?1.96,Z>Z,拒绝H0而接受H1,即
该天生产的保健品的某维生素含量不处于产品质量控制状态。
3、左单侧检验问题。H0:P?95%;H1:P<95%。
临界值规则:p?93.33%,Z=-0.5088,-Z0.05?-1.64,Z>-Z0.05,接受H0,外商应该接受该批皮鞋。
4、左单侧检验问题。H0:?12;H1:<12。小样本,t检验。 临界值规则:t=-1.83,-t?0.05,24?=-1.71,t<-t?0.05,24?,错误!链接无效。可以认为新的教学训练方法已使男生100m跑的成绩明显加快了。 P-值规则:与1.83相对应的P-值约为0.04,小于0.05,错误!链接无效。可以认为新的教学训练方法已使男生100m跑的成绩明显加快了。
5、左单侧检验问题。H0:P?80%;H1:P<80%。
临界值规则:p?73%,Z=-2.47,-Z0.05?-1.64,-Z0.01?-2.33,Z<-Z0.05,
Z<-Z0.01,无论在0.05还是0.01的显著性水平下都拒绝H0而接受H1,即该
研究机构的猜测不成立。
6、双侧检验问题。H0:?150;H1:?150。
临界值规则:?153.3,s?6.2548,t=1.67,t?
?2.26,t<t?
接受H0,即可认为该广告真实可信。
7、双侧检验问题。H0:1?2;H1:1?2。
临界值规则:Z=5.01,Z?1.96,Z>Z,拒绝H0而接受H1,即
可以认为两厂生产的材料平均抗压强度有显著差异。
8、右单侧检验问题。H0:P1?P2;H1:P1>P2。
^=16.52%,Z=2.73,Z?1.64,Z临界值规则:p1=20.98%,p2?9.7%,P0.05
>Z0.05,拒绝H0而接受H1,即调查数据能支持“吸烟容易患慢性支气管炎”的观点。
P-值规则:与2.73相对应的P-值约为0.003,小于0.05,拒绝H0而接受
H1,即调查数据能支持“吸烟容易患慢性支气管炎”的观点。
9、右单侧检验问题。H0:1?2;H1:1>2。
临界值规则:t=1.76,t?0.05,48?=1.677,t>t?0.05,48?,拒绝H0而接受H1,即可认为大学女生外语学习能力比男生强。
(同学们可以再进行双侧检验,看看会得出什么结论)
10、(1)右单侧检验问题。H0:S2?55;H1:S2>55。
临界值规则:s2=60.01,?2=9.83,?2?0.05,9?=16.92,?2<?2?0.05,9?,接受H0,即不能认为该校一年级男生体重的方差大于55公斤。
(2)双侧检验问题。H0:S12?S2;H1:S12>S2。
临界值规则:F=1.18,F?
=3.92,F1??
=0.28, 3.59
,接受H0,即两个年级的男生体重方差无显著差异。
11、Se()?6.25;双侧检验时,C1=287.75,C2=312.25,?=0.64,检验功效1-?=0.36;单侧检验时,C=289.75,?=0.516,检验功效1-?=0.484。
12、Z0.05=1.64,Z0.12=1.175
,300?n=89。 ?315? 第九章
一、判断题
二、单项选择题
三、简答题(略)
四、计算题
1、(1)三种商品的个体价格指数kp分别是90.91%,120%和130%;三种商品的个体销售量指数kq分别为:107.69%,112.5%和85.71;
(2)?p1q1?150000,?p0q0?140800,?p0q1?144900;商品销售价格总指数Ip?103.52%,说明三种商品的价格综合上升了3.52%;
(3)商品销售量总指数Iq?102.91%,错误!链接无效。 (4)说明“先综合,后对比”的特点;
(5)分别说明价格、消费量在起到同度量作用的同时,如何还起到权数的作用;
(6)销售额总指数Ipq=106.53%,即报告期的销售额比基期上升了6.53%,绝对额增加了9200元;原因:商品销售价格综合上升了3.52%,使销售额增加了5100元;商品销售量综合上升了2.91%,使销售额增加了4100元。
2、(1)2005年单位成本计划完成总指数Ic=90.37%,产量计划完成总指数
Iq=102.91%;
(2)总成本指数Icq?96.04%,即实际总成本比计划下降了3.96%,节省总成本24万元;原因:单位成本综合下降了9.63%,使总成本减少了62万元;产量综合上升了6.27%,使总成本增加了38万元。
(3)2005年比2004年的单位成本总指数Ic=79.08%,产量总指Iq=132.37%; (4)2005年比2004年的总成本指数Icq?104.68%,即2005年总成本比2004年上升了4.68%,增加总成本26万元;原因:单位成本综合下降了20.92%,使总成本减少了154万元;产量综合上升了32.37%,使总成本增加了180万元。
3、(1)?p0q1??kqp0q0?2332万元,Ip=105.06%; (2)Iq=106%;
(3)Ipq=111.36%,销售总额增加了250万元。原因:商品销售量综合上升了6%,使销售额增加了132万元;商品销售价格综合上升了5.06%,使销售额增加了118万元。
4、(1)?p0q1??
p1q1?1200.91万元,Ip=101.59%; kp
(2)Iq=104.43%;
(3)由于产品价格变化使企业销售额上升了1.59%,使销售额增加了19.09万元。
5、?x1f1?22730,?x0f0?18600,?x0f1?20900。 (1)I=111.1%;
(2)Ix=108.76%,If=102.15%;
(3)该企业平均劳动生产力上升了11.1%,即每人年产值增加了4.13万元;原因:三个车间劳动生产力综合上升了8.76%,使每人年产值增加了3.33万元;三个车间职工结构变动使平均劳动生产力上升了2.15%,使每人年产值增加了
(4)该企业总产值指数Ixf=122.20%;
(5)该企业总产值上升了22.2%,即增加了4130万元。原因:Ix=108.76%,
If=112.37%;即三个车间劳动生产力综合上升了8.76%,使总产值增加了1830万元;三个车间职工人数综合上升了12.37%,使总产值增加了2300万元。
(3)该商场2季度比1季度的总流转次数指数为:Il=99.32%;
(4)该商场流转次数下降了0.68%,即减少了0.046次;原因:Ix=99.30%;即两个部门流转次数综合下降了0.7%,使总流转次数减少了0.047If=100.01%;
次;两个部门平均库存额结构变化使总流转次数上升了0.01%,增加了0.001次。
7、?q1m1p1?30780,?q1m0p0?30960,?q1m1p0?27360,
(1)Iq=109.17%,Im=88.37%,Iq=112.5%; (2)Iqmp=108.53%,消耗总额增加了2420万元;
(3)由于产量综合增加9.17%,使消耗总额增加了2600万元;由于单耗量下降11.63%,使消耗总额减少了3600万元;由于单位原材料价格综合上升12.5%,使消耗总额增加了3420万元。
8、(略)读者可以从多个不同的角度进行分析。 9、该地区的工业发展速度是110.78%。
范文七:应用多元统计分析课后答案
第五章聚类分析
判别分析和聚类分析有何区别?
答:即根据一定的判别准则,判定一个样本归属于哪一类。具体而言,设有n个样本,对每个样本测得p项指标(变量)的数据,已知每个样本属于k个类别(或总体)中的某一类,通过找出一个最优的划分,使得不同类别的样本尽可能地区别开,并判别该样本属于哪个总体。聚类分析是分析如何对样品(或变量)进行量化分类的问题。在聚类之前,我们并不知道总体,而是通过一次次的聚类,使相近的样品(或变量)聚合形成总体。通俗来讲,判别分析是在已知有多少类及是什么类的情况下进行分类,而聚类分析是在不知道类的情况下进行分类。
试述系统聚类的基本思想。
答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。
对样品和变量进行聚类分析时,所构造的统计量分别是什么?简要说明为什么这样构造?
答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。因为我们把n个样本看作p维空间的n个点。点之间的距离即可代表样品间的相似度。常用的距离为 (一)闵可夫斯基距离:dij(q)q取不同值,分为 (1)绝对距离(q?1)
?(?Xik?Xjk)
dij(1)??Xik?Xjk
(2)欧氏距离(q?2)
dij(2)?(?Xik?Xjk)
(3)切比雪夫距离(
dij(?)?maxXik?Xjk
(二)马氏距离
(三)兰氏距离
pk?1Xik?Xjk
dij(M)?(Xi?Xj)?Σ(Xi?Xj)
对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。 将变量看作p维空间的向量,一般用
(一)夹角余弦 XikXjk
(二)相关系数
(Xik?i)(Xjk?j)
在进行系统聚类时,不同类间距离计算方法有何区别?选择距离公式应遵循哪些原则?
答:设dij表示样品Xi与Xj之间距离,用Dij表示类Gi与Gj之间的距离。 (1). 最短距离法
Xi?Gi,Xj?Gj
(2)最长距离法
Xi?Gk,Xj?Gr
dij?min{Dkp,Dkq}
Xi?Gp,Xj?Gq
Xi?Gk,Xj?Gr
max{Dkp,Dkq}
(3)中间距离法
Dkr ?Dkp?Dkq??Dpq 22
(4)重心法
2Dpq?(p?q)?(p?q)
(npp?nqq) nr
(5)类平均法
dD???nknrXi?GpXj?Gj
Xi?GkXj?Gr
(6)可变类平均法
其中?是可变的且?<1
(7)可变法
(Dkp?Dkq)??Dpq其中?是可变的且?<1 2
(8)离差平方和法
St??(Xit?t)?(Xit?
nr?nknr?nknr?nk
nk?npnk?nq
通常选择距离公式应注意遵循以下的基本原则:
(1)要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有非常明确的空间距离概念。马氏距离有消除量纲影响的作用。
(2)要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。如在进行聚类分析之前已经对变量作了标准化处理,则通常就可采用欧氏距离。
(3)要考虑研究对象的特点和计算量的大小。样品间距离公式的选择是一个比较复杂且带有一定主观性的问题,我们应根据研究对象的特点不同做出具体分折。实际中,聚类分析前不妨试探性地多选择几个距离公式分别进行聚类,然后对聚类分析的结果进行对比分析,以确定最合适的距离测度方法。
5.5试述K均值法与系统聚类法的异同。
答:相同:K—均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的。
不同:系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。
具体类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K—均值法确定类数的参考。
5.6试述K均值法与系统聚类有何区别?试述有序聚类法的基本思想。
答:K均值法的基本思想是将每一个样品分配给最近中心(均值)的类中。系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。具体类数的确定,有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K均值法确定类数的参考。
有序聚类就是解决样品的次序不能变动时的聚类分析问题。如果用X(1),X(2),?,X(n)表示
n个有序的样品,则每一类必须是这样的形式,即X(i),X(i?1),?,X(j),其中1?i?n,且
j?n,简记为Gi?{i,i?1,?,j}。在同一类中的样品是次序相邻的。一般的步骤是(1)
计算直径{D(i,j)}。(2)计算最小分类损失函数{L[p(l,k)]}。(3)确定分类个数k。(4)最优分类。
检测某类产品的重量,抽了六个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11.试用最短距离法,重心法进行聚类分析。 (1)用最短距离法进行聚类分析。 采用绝对值距离,计算样品间距离阵
由上表易知计算距离阵
中最小元素是
于是将,,聚为一类,记为
中最小元素是计算样本距离阵
聚为一类,记为
中最小元素是因此,
于是将,聚为一类,记为
(2)用重心法进行聚类分析 计算样品间平方距离阵
中最小元素是于是将,,聚为一类,
计算距离阵
注:计算方法
中最小元素是计算样本距离阵
,其他以此类推。
聚为一类,记为
中最小元素是于是将因此,
,聚为一类,记为
5.8 下表是15个上市公司2001年的一些主要财务指标,使用系统聚类法和K-均值法分别对这些公司进行聚类,并对结果进行比较分析。
解:令净资产收益率为X1,每股净利润X2,总资产周转率为X3,资产负债率为X4,流动负债比率为X5,每股净资产为X6,净利润增长率为X7,总资产增长率为X8,用spss对公司聚类分析的步骤如下:
a) 系统聚类法:
1. 在SPSS窗口中选择Analyze→Classify→Hierachical Cluster,调出
系统聚类分析主界面,并将变量X1-X8移入Variables框中。在Cluster栏中选择Cases单选按钮,即对样品进行聚类(若选择Variables,则对变量进行聚类)。在Display栏中选择Statistics和Plots复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。
系统分析法主界面
2. 点击Statistics按钮,设置在结果输出窗口中给出的聚类分析统计量。
我们选择Agglomeration schedule与Cluster Membership中的Range of solution 2-4,如图5.2所示,点击Continue按钮,返回主界面。 (其中,Agglomeration schedule表示在结果中给出聚类过程表,显示系统聚类的详细步骤;Proximity matrix 表示输出各个体之间的距离矩阵;Cluster Membership 表示在结果中输出一个表,表中显示每个个体被分配到的类别,Range of solution 2-4即将所有个体分为2至4类。) 3. 点击Plots按钮,设置结果输出窗口中给出的聚类分析统计图。选中
Dendrogram复选框和Icicle栏中的None单选按钮,如图5.3,即只给出聚类树形图,而不给出冰柱图。单击Continue按钮,返回主界面。
图5.2Statistics子对话框图5.3 Plots子对话框
4. 点击Method按钮,设置系统聚类的方法选项。Cluster Method下拉列
表用于指定聚类的方法,这里选择Between-group inkage(组间平均数连接距离);Measure栏用于选择对距离和相似性的测度方法,选择Squared Euclidean distance(欧氏距离);单击Continue按钮,返回主界面。
图5.4 Method子对话框图5.5 Save子对话框
5. 点击Save按钮,指定保存在数据文件中的用于表明聚类结果的新变量。
None表示不保存任何新变量;Single solution表示生成一个分类变量,在其后的矩形框中输入要分成的类数;Range of solutions表示生成多个分类变量。这里我们选择Range of solutions,并在后面的两个矩形框中分别输入2和4,即生成三个新的分类变量,分别表明将样品分为2类、3类和4类时的聚类结果,如图5.5。点击Continue,返回主界面。 6. 点击OK按钮,运行系统聚类过程。
聚类结果分析:
下面的群集成员表给出了把公司分为2类,3类,4类时各个样本所属类别的情况,另外,从右边的树形图也可以直观地看到,若将15个公司分为2类,则13独自为一类,其余的为一类;若分为3类,则公司8分离出来,自成一类。以此类推。 表5.1 各样品所属类别表
图5.6 聚类树形图
b) K均值法的步骤如下:
1. 在SPSS窗口中选择Analyze→Classify→K-Means Cluster,调出K均
值聚类分析主界面,并将变量X1-X8移入Variables框中。在Method框中选择Iterate classify,即使用K-means
算法不断计算新的类中心,
并替换旧的类中心(若选择Classifyonly,则根据初始类中心进行聚类,在聚类过程中不改变类中心)。在Number of Cluster后面的矩形框中输入想要把样品聚成的类数,这里我们输入3,即将15个公司分为3类。 (Centers按钮,则用于设置迭代的初始类中心。如果不手工设置,则系统会自动设置初始类中心,这里我们不作设置。)
图5.7 K均值聚类分析主界面
2. 点击Iterate按钮,对迭代参数进行设置。Maximum Iterations参数框
用于设定K-means算法迭代的最大次数,输入10,Convergence Criterion参数框用于设定算法的收敛判据,输入0,只要在迭代的过程中先满足了其中的参数,则迭代过程就停止。单击Continue,返回主界面。
图5.8Iterate子对话框
3. 点击Save按钮,设置保存在数据文件中的表明聚类结果的新变量。我们
将两个复选框都选中,其中Cluster membership选项用于建立一个代表聚类结果的变量,默认变量名为qcl_1;Distance from cluster center选项建立一个新变量,代表各观测量与其所属类中心的欧氏距离。单击Continue按钮返回。
Save子对话框
4. 点击Options按钮,指定要计算的统计量。选中Initial cluster
和Cluster information for each case复选框。这样,在输出窗口中将给出聚类的初始类中心和每个公司的分类信息,包括分配到哪一类和该公司距所属类中心的距离。单击Continue返回。
Options子对话框
5. 点击OK按钮,运行K均值聚类分析程序。
聚类结果分析:
以下三表给出了各公司所属的类及其与所属类中心的距离,聚类形成的类的中心的各变量值以及各类的公司数。由以上表格可得公司13与公司8各自成一类,其余的公司为一类。
通过比较可知,两种聚类方法得到的聚类结果完全一致。
5.9下表是某年我国16个地区农民支出情况的抽样调查数据,每个地区调查了反映每人平均生活消费支出情况的六个经济指标。试通过统计分析软件用不同的方法进行系统聚类分析,并比较何种方法与人们观察到的实际情况较接近。
解:令食品支出为X1,衣着支出为X2,燃料支出为X3,住房支出为X4,交通和通讯支出为X5,娱乐教育文化支出为X6,用spss对16各地区聚类分析的步骤如5.8题,不同的方法在第4个步骤的Method子对话框中选择不同的Cluster method。
1. Between-group inkage(组间平均数连接距离)
上表给出了把全国16个地区分为2类、3类和4类时,各地区所属的类别,另外从右边的树形图也可以直观地观察到,若用组间平均数连接距离将这些地区分为3类,则9(上海)独自为一类,1(北京)和11(浙江)为一类,剩余地区为一类。
2. Within-group linkage(组内平均连接距离)
若用组内平均数连接距离将这些地区分为3类,则9(上海)独自为一类,1(北京)独自为一类,剩余地区为一类。
3. Nearest neighbor(最短距离法)
若用最短距离法将这些地区分为3类,则9(上海)独自为一类,1(北京)独自为一类,剩余地区为一类。
4. Furthest neighbor(最远距离法)
若用最远距离法将这些地区分为3类,则9(上海)独自为一类,1(北京)和11(浙江)为一类,剩余地区为一类。
5. Centroid cluster(重心法)
若用重心法将这些地区分为3类,则9(上海)独自为一类,1(北京)和11(浙江)为一类,剩余地区为一类。
6. Median cluster(中位数距离)
若用中位数距离法将这些地区分为3类,则9(上海)独自为一类,1(北京)和11(浙江)为一类,剩余地区为一类。
7. Ward method(离差平方和)
若用离差平方和法将这些地区分为3类,则9(上海),1(北京)和11(浙江)为一类,2(天津)、6(辽宁)、7(吉林)、10(江苏)、12(安徽)、13(福建)和14(江西)为一类,剩余地区为一类。
5.10 根据上题数据通过SPSS统计分析软件进行快速聚类运算,并与系统聚类分析结果进行比较。
解:快速聚类运算即K均值法聚类,具体步骤同5.8,聚类结果如下:
聚类的结果为9(上海)独自为一类,1(北京)、2(天津)、6(辽宁)、7(吉林)、10(江苏)、11(浙江)、13(福建)和14(江西)为一类,剩余地区为一类。
5.11下表是2003年我国省会城市和计划单列市的主要经济指标:人均GDPx1(元)、人均工业产值x2(元)、客运总量x3(万人)、货运总量x4(万吨)、地方财政预算内收入x5(亿元)、固定资产投资总额x6(亿元)、在岗职工占总人口的比例x7(%)、在岗职工人均工资额x8(元)、城乡居民年底储蓄余额x9(亿元)
。试通过统计分析软件进行系统聚类
分析,并比较何种方法与人们观察到的实际情况较接近。
资料来源:《中国统计年鉴2004》
解:用spss对37个地区聚类分析的步骤如5.8题,不同的方法在第4个步骤的Method子对话框中选择不同的Cluster method。
1.Between-group inkage(组间平均数连接距离)
从上面的树形图可以直观地观察到,若用组间平均数连接距离将这些地区分为3类,则24(深圳)独自为一类,10(上海)和16(厦门)为一类,剩余地区为一类。
2.Within-group linkage(组内平均连接距离)
若用组内平均数连接距离将这些地区分为3类,则24(上海)独自为一类,27(重庆)和28(成都)为一类,剩余地区为一类。
3. Nearest neighbor(最短距离法)
若用最短距离法将这些地区分为2类,则24(深圳)独自为一类,剩余地区为一类。
4.Furthest neighbor(最远距离法)
若用最远距离法将这些地区分为3类,则24(深圳)独自为一类,1(北京)、2(天津)、7(大连)、10(上海)、11(南京)、12(杭州)、13(宁波)、16(厦门)、19(青岛)、23(广州)、36(海宁)和37(海口)为一类,剩余地区为一类。
范文八:第二章
4-45. 自动车床加工中轴,从成品中抽取 11 根,并测得它们的直径(mm)如下:
10.52,10.41,10.32,10.18,10.64,10.77,10.82,10.67,10.59,10.38,10.49
试用 W 检验法检验这批零件的直径是否服从正态分布?(显著性水平 ? ? 0.05 ) (参考数据: ) 4-45. 解:数据的顺序统计量为:
10.18,10.32,10.38,10.41,10.49,10.52,10.59,10.64,10.67,10.77,10.82
L 的计算如下表:
k 1 2 3 4 5 所以
10.18 10.32 10.38 10.41 10.49
x( n ?1? k )
10.82 10.77 10.67 10.64 10.59
x(n?1?k ) ? x(k )
0.64 0.45 0.29 0.23 0.10
0.5 0.9 0.0695
a(k )[x(n?1?k ) ? x(k ) ]
0.2 0.9 0.0070
L ? ? a( k ) [ x( n ?1? k ) ? x( k ) ] ? 0.6131 ,
x ? 10.5264 ,
? x ) 2 ? 0.38197
? 0.984 ,
当 n = 11 时, W0.05 ? 0.85
W0.05 ? W ? 1 , 从而 接受正态假设,亦即 零件直径服从正态分布。
4-47. 甲、乙两个车间生产同一种产品,要比较这种产品的某项指标波动的情况,从这两个 车间连续 15 天取得反映波动大小的数据如下表:
在 ? ? 0.05 下,用符号检验法检验假设“这两个车间所生产的产品的该项指标的波动 性情况的分布重合” 。 (参考数据: ) 4-47. 解: 在 ? ? 0.05 下,
1.13 1.21 - 1.26 1.31 -
1.16 0.99 + 1.41 1.59 -
H 0 :F1 ( x) ? F2 ( x) ;
0.86 1.41 - 1.39 1.48 - 1.21 1.31 - 1.22 1.12 +
H1 :F1 ( x) ? F2 ( x)
1.20 1.60 - 0.62 1.38 - 1.18 1.60 - 1.34 1.84 - 1.57 1.95 -
由上表知: n? ? 11 , n? ? 2 , ? 查
n ? n? ? n? ? 13
n ? 13 , ? ? 0.05 的符号检验表, 得 临界值 S? ? 2.5 ,
即: S ? S? , 故 拒绝 H 0
而 S ? min{n? , n? } ? 2 ,
即 认为这两车间所生产的产品的该项指标波动情况不同. 4-51. 对核动力工厂的某类仪器实施甲、 乙两种不同的维修方案, 现观测到两组失效时间 (单 位:小时)如下表所示:
在显著性水平 ? ? 0.05 下,用游程检验法(两种方法)检验这两种维修方案是否有一 种维修方案显著地优于另一种方案? (参考数据: ) 4-51. 解: (1)基于游程总个数 R 的检验法 设 甲仪器失效时间 ? 服从分布 F1 ( x) ,乙仪器失效时间 ? 服从分布 F2 ( x) 。 检验问题
H 0 :F1 ( x) ? F2 ( x)
将 ? 、 ? 混排( ? 的样本值带下划线)得: 3 7 8 10 25 26
27 28 29 30 35 42 72 84 101 150 即 游程总个数 R = 5 而 当 n1 所以
? n2 ? 8 , ? ? 0.05 时, R 1 , 0.05 ? 6
R ? R 1 , 0.05 ,
故 拒绝 H 0 ,认为这两种维修方案有一种维修方案显著地优于另一种方案。
5-5. 某建材实验室在作陶粒混凝土强度实验中,考察每立方米混凝土的水泥用量 x (kg)对 28 天后的混凝土抗压强度 ? ( kg cm 2 ) 的影响,测得数据如下:
(1)求? 对 x 的线性回归方程,并问:每立方米混凝土中增加 1kg 水泥时,可提高的 抗压强度是多少? (2)检验线性回归效果的显著性( ? ? 0.05 ); (3)求回归系数 b 的区间估计(置信度为 1 ? ? ? 0.95 ) ; (4)求 x0 ? 225kg 时, ?0 的预测值及预测区间(置信度为 1 ? ? ? 0.95 ) 。 (参考数据: ) 5-5. 解:解: (1)计算得
? 518600 , x ?
1 1 ? xi ? 205 , y ? 12 ? yi ? 72 .6 , 12
? 182943 ,
? 64572 .84 ,
l xx ? ? xi2 ? nx 2 ? 518600 ? 12 ? 205 2 ? 14300
l xy ? ? xi yi ? nx y ? 182943 ? 12 ? 205 ? 72 .6 ? 4347
4347 ^ l b ? xy ? ? 0.304 , l xx 14300
^ ^ a ? y ? bx ? 7206 ? 0.304 ? 205 ? 10 .28
^ ? 对 x 的回归直线方程为: y ? 10.28 ? 0.304 x 。
^ ^ y ( x ) ? 10 .28 ? 0.304 x , y ( x ? 1) ? 10 .28 ? 0.304 ( x ? 1) , 所以 每立方米混凝土中增加 1kg 水泥时,可提高的抗压强度是: ^ ^ y ( x ? 1) ? y ( x ) ? 0.304
(2)检验假设 由
H0 : ? 0 . b
用 T 检验法:
l yy ? ? yi2 ? ny 2 ? 64572 .84 ? 12 ? 72 .6 2 ? 1323 .72
得 而 即有 所以 (3)由于
^ Se l yy ? b 2l xx ? ? 0.466 n?2 n?2
^ b ^ ?* l xx
0 . 304 ? 78 . 0174 0 . 466 14300
( n ? 2 ) ? t 0 .975 (12 ? 2 ) ? t 0 .975 (10 ) ? 2 . 2281
拒绝 H 0 ,即 认为线性回归效果显著。
^ 置信区间为: ( b ? t
^ (n ? 2) ? *
^ 所以 当 ? ? 0.05 时,有: ( 0.304 ? t0.975(10) ? *
^ ? ( 0.304 ? t0.975(10) ? *
lxx ) ? ( 0.304 ? 2. 14300 )
? ( 0.304 ? 0.00868) ? ( 0.7)
^ (4)当 x0 ? 225 时, ? 0 的预测值为 y0 ? 10.28 ? 0.304 ? 225 ? 78.68
^ ^ 由于 ? 0 的 1 ? ? 预测区间为: ( y0 ? ? (x0 ) , y0 ? ? (x0 ) )
^ ^ ? ( y0 ?? ?t 1 (x ? x)2 1 (x ? x)2 ^ ^ (n ? 2) 1? ? 0 , y0 ?? ?t ? (n ? 2) 1? ? 0 ) 1? 1? n lxx n lxx 2 2
所以 当 ? ? 0.05 时,有:
^ ? ( x0 ) ? ? ?t 1 (x ? x)2 1 (225 ? 205) 2 (n ? 2) 1 ? ? 0 ? 0.466 ? 2.2281? 1 ?
? ? 1? n l xx 12 14300 2
所求预测区间为: ( 77.6) 。
5-14. 在彩色显影中,根据以往的经验,形成染料光学密度? 与析出银的光学密度 x 之间有 下面类型的关系:
通过 11 次试验得到下面数据:
求未知参数 a、b 的估计值,并求回归方程的残差平方和。
5-14. 解:两边对 y ? ae x 取对数,有: ln y ? ln a ? 作变换 z ? ln y , A ? ln a , t ? 1 , x 将数据整理如下表:
得 z ? A ? bt
xi yi ti ? 1 xi z i ? ln y i
0.05 0.10 20 -2.302
0.06 0.14 16.67 -1.966
0.07 0.23 14.29 -1.429
0.10 0.37 10 -0.994
0.14 0.59 7.143 -0.528
0.20 0.79 5 -0.236
0.25 1.00 4 0
0.31 1.12 3.226 0.113
0.38 1.19 2.632 0.174
0.43 1.25 2.325 0.223
0.47 1.29 2.128 0.255
计算得: t ?
1 11 1 ? t i ? 7 .947 ; z ? 11 11 i ?1
? ? 6 . 731 ;
(ti ? t ) ( z i ? z ) ?
? 11 ? t z ? ? 496 . 583 ;
(ti ? t ) 2 ?
? 11 ? t 2 ? 3406 . 681 .
^ l t z ? ? 496 .583 ? ? 0 .146 ; b? lt t
^ ^ A ? z ? b t ? 0 .532 .
得 换 故得
^ z ? 0.532 ? 0.146 ? t
^ ^ y ? e z^ , a ? e A ? 1.73 , x ? 1 t
回归方程为:
^ y ? 1 . 73 ? e
回归方程的残差平方和为: S e ?
^ ? y i ) 2 ? 0 .006 .
6-2. 现有某种型号的电池 3 批,它们分别是甲、乙、丙 3 个厂生产的,为评论其质量,各 随机抽取 5 只电池为样品,经试验得其寿命(h)如下表所示:
40 26 39 48 34 40
命 38 30 43 42 28 50 45 32 50
试在显著性水平 ? ? 0.05 下,检验电池的平均寿命有无显著差异。 (略:若差异是 显著的,检验哪些工厂之间有显著差异,并求 ?1 ? ? 2 、 ?1 ? ?3 和 ? 2 ? ?3 的 95% 置信区间。 ) 6-2. 工厂 甲 乙 丙
(参考数据: )
解:检验问题
H 0 :?1 ? ? 2 ? ?3
50 5 32 0) 213 150 222
63.2 40 113.2
48 6 40 1600
43 1849 n =15
42.6 30 44.4
26 676 39 1521
ST ? ? ?? ?ij 2 ?
5852 T2 ? 23647 ? ? 832 15 n
3 1 2 T2 5852 S A ? ? Ti? ? ? 23430.6 ? ? 615.6 n 15 i ?1 5
S e ? S T ? S A ? 832 ? 615 .6 ? 216 .4
S A (r ? 1) 615.6 (3 ? 1) ? ? 17.07 Se (n ? r ) 216.4 (15 ? 3)
F1?? ( r ? 1, n ? r ) ? F1? 0.05 (3 ? 1
, 15 ? 3) ? F0.95 ( 2, 12 ) ? 3.89
故 拒绝 H 0 ,即 认为电池的平均寿命有显著差异.
即: F ? F0. 95
方差分析表如下:
方差来源 因素A 误差e 总和 或
平方和 S 615.6 216.4 832
自由度 f 2 12 14
均方和 S 307.8 18.03
? 216 .4 ,
ST ? ??(?ij ? ? )2 ? 832 ,
S A ? S T ? S e ? 832 ? 216 .4 ? 615 .6
S A (r ? 1) 615.6 (3 ? 1) ? ? 17.07 Se (n ? r ) 216.4 (15 ? 3)
F1?? ( r ? 1, n ? r ) ? F1? 0.05 (3 ? 1, 15 ? 3) ? F0.95 ( 2, 12 ) ? 3.89
故 拒绝 H 0 ,即 认为电池的平均寿命有显著差异.
即: F ? F0. 95
6-3. 用 3 种不同的小球测定引力常数的试验结果如下表所示(单位: 10?11 N ? m 2 kg 2 ) :
铂 金 玻璃
6.661 6.683 6.678
6.661 6.681 6.671
6.667 6.676 6.675
6.667 6.678 6.672
6.664 6.679 6.674 6.672
试问:不同小球对引力常数的测定有无显著影响?(显著性水平 ? ? 0.01 ) (略:并求并求 ? 2 ? ?1 、 ?3 ? ?1 和 ) ?2 ? ?3 的 95%置信区间。 (参考数据: )
6-3. 解:检验问题 元素 铂 金 玻璃
H 0 :?1 ? ? 2 ? ?3
6.664 6.679 6.674 6.672 33.32 40.068 33.37
6.664 6.678 6.674
0...000030
6.661 6.681 6.671
6.667 6.676 6.675
6.667 6.678 6.672
5.45 1113.56
6.683 6.678
? 0 . 000141
ST ? ? ?? ?ij 2 ?
T2 ? 0.000709 n
3 1 2 T2 S A ? ? Ti? ? ? 0.000568 n i ?1 5
S e ? S T ? S A ? 0 .000141
S A (r ? 1) 0. ? 1) ? ? 26.2 Se (n ? r ) 0. ? 3)
F1?? ( r ? 1, n ? r ) ? F1? 0.01 (3 ? 1, 16 ? 3) ? F0.99 ( 2, 13) ? 6.7
即: F ? F0. 95 故 拒绝 H 0 ,即 认为不同小球对引力常数的测定有显著影响.
? 0 .000141 ,
ST ? ?? (? ij ? ? ) 2 ? 0.000709 ,
S A ? S T ? S e ? 0 .000709 ? 0 .000141 ? 0 .000568
S A (r ? 1) 0. ? 1) ? ? 26.2 Se (n ? r ) 0. ? 3)
F1?? ( r ? 1, n ? r ) ? F1? 0.01 (3 ? 1, 16 ? 3) ? F0.99 ( 2, 13) ? 6.7
即: F ? F0. 95 故 拒绝 H 0 ,即 认为不同小球对引力常数的测定有显著影响.
方差分析表如下: 方差来源 因素A 误差e 总和 平方和 S 0...000709 自由度 f 2 13 15 均方和 S 0..
6-15. 选矿用的油膏的配方对矿石回收率有很大影响,为了提高回收率,分别选取油膏的 3 种成分的 2 种水平,所选因素、水平如下表所示:
C 石蜡 12% 6%
选用正交表 L4 (2 ) 来安排试验,结果由 1 到 4 号试验的回收率顺次为 72,58,78,84, 试分析试验结果。 6-15. 解:选用正交表 L4 (2 ) 来安排试验,由 1 到 4 号试验的回收率指标,可计算得分析数 据 k1 j , k 2 j , k1 j , k 2 j , Rj ,进而得到优方案 A2 B1C1 ,具体如下表:
因素 试验号 列号
A 1 1(60%) 1 2(50%) 2 130 162 65 81 32(16)
B 2 1(10%) 2 1 2(8%) 150 142 75 71 8(4) A C B
C 3 1(12%) 2 2(6%) 1 156 136 78 68 20(10)
回收率 yi % 72 58 78 84
因素主→次 优方案
范文九:应用5.2
x?3.5,s?1.2,1???0.95,Z?1.96,n?100100为大样本,~(?,置信区间为x?z*
即:(3.2)
x?15000公里,s?200公里,1???0.95,Z?1.96,N?50000,n?100
N??500?20,不用校正大样本。x~N(?,5.4
x?12500,S?1200,
n=900>30, 为大样本,x~N(?,(1)当1???0.90,z?1.65
置信区间为:
?12500?66,即12434???12566
(2)当1???0.95时,Z=1.96 则置信区间为:
?,即12421.6???12578.4
(3)当1???0.99,Z=2.58
则置信区间为:12396.8???.5
当置信区间宽度为90元时,即2e?90=90,即Z*
?Z?1.125,?1-??0.742
当置信区间宽度为80元时,Z*Sn
?40Z, Z?1, 1???0.683
n=1000,x=600,np??600?5,n(1?p)??400?5
n?0.6,1???0.95,Z?1.96p~N(?,n
), 置信区间为0.6?1.96*
0.6*(1?0.6)
?0.6?0.030,
0.57???0.63
解:n1=361>30,n2=400>30,且两样本彼此独立,由中心极限定理可得,
近似服从正态分布。
时,查表得
则可得其置信区间为:
[(x1?x2)?Z??S1?2,(x1?x2)?Z??S1?2]
=[(35-31)-1.96?0.28,(35-31)?1.96?0.28]
?400,n2?900,1???0.95,Z?1.96,
由中心极限定理知:x1?x2~N(?11??2,
?73.05差异的置信区间:x?1.96*7.305?,
即:856.82??1
??x122.?(x?x)n
小样本,t???s/n
置信区间:
15.35?1.895
1.57,14.30???16.40
解:∵n1=529,n2=625,p1=
.7297,p2=438625
=0.7008,α=0.1,z=1.645 又∵??n1p1?5且?1)?5?n2p2?5
,?n(1?p?nx2(1?p2)?5x?x2近似服从正态分布。
1又Sp)p2(1?p2)0..8?(1?0.1?p2?
p1(1?p1n?n??7008)
∴置信区间为?(p1?p2)?z?Sp1?p2,(p1?p2)?z?Sp1?p2?
=?0.?0.9?1.645?0.0007?
=?0.2,0.2?
∴A市与B市的电脑拥有率差异的置信区间为?0.1?
x?5.2,??2.5, 1???0.99,Z?2.58,Z*
(1)n?(2.58?2.50.5
?166.41?167
?5.2?0.5,置信区间为:
据某中等城市一次样本容量为900户的随机抽样调查结果,被检查的家庭下一年耐用消费品的计划购买额(指所要购买各种商品各自的平均价格与数量的乘积之和)平均数为12500元,标准差为1200元。置信系数为95%,希望置信区间的宽度为90元,样本容量是多少?解(1):
时,查表得
根据e?z???
,有 90?2?1.96?
2?1.96?120090
?2732,应取样本的样本容量为2732户。
解(2)?n?
1.962*1200
1???0.95,Z?1.96,Z*p(1?p)
n?0.04,e??0.04 ?n?
设n表示被调查电池的平均寿命,则:
H0:??550小时
:?〉550小时
x~(550,200/10),??0.05,单尾Z?1.645若x?550?1.645*20?582.9则拒绝H0x?582.9,接受H0
?x?565?582.9,落入接受域,接受H
认为平均寿命小于550小时
p值?p(x?565/??550)
?0.5?p(0?Z?565?550
?0.5?p(0?Z?0.75)?0.5?0.6p??,落入接受域
样本数据在统计上证明新电池的寿命不足550,不能购买。
解:设?表示被调查挂钩的平均最大承受拉力,则 (1)
H:??10000公斤 H:??10000公斤
I型错误是设挂钩的最大承受拉力没有或低于10000公斤
即H0为真时,(??10000公斤),但公司由样本数据却得到错误的结论,认为?〉
10000公斤,这样会出口一批不合格的产品,造成较大的损失,影响公司的声誉,并给消费者造成重大损失。
II型错误是设挂钩承受拉力大于10000公斤,但公司却得到错失商机,未能出口商品,造成一定的损失。 (2)
若n?400,??0.05,??2000
为真的错误结论,这样会
x?N(?,Z?1.645
),即x~N()
x?*100?10164.5kg拒绝H0x?*100?10164.5kg接受H0
(3)若x?10310kg,即x?.5拒绝力大于10000公斤,认为这些挂钩是合格的。 (4)p值=p(x???10000)
,即认为设挂钩的平均最大承受
?0.5?p(10000?x??10000
?0.5?p(0?Z3.1) ?0.5?0.499?0.5?p(0?Z??0.001
?p??,?拒绝H0
H0:??2.5H1:??2.5
2.68?2.50.29
?6.88?1.96
拒绝原假设,引进生产线所生产的防腐管的防腐层厚度超过2.5mm。
6.4大样本,用Z检验
H0:?=160
?Z??2.157?t0.05??1.96
样本数据支持顾客的怀疑意见。 6.7
解:设?表示顾客购买该种类钢笔的比率
:??0.35:??0.35
?n?800,n??5,n(1??)?5
即p~N(0.35,
0.35(1?0.35)
?比率抽样分布服从正态分布
??0.1,Z?1.28若p???Z若p???Z
?0.40,Z?1.28 2
?0.35?1.28*0.,拒绝H0 ?0.37,接受
?p?320/800?0.4?0.372落入拒绝域,?拒绝H0,即认为这种新型钢笔比原产品有
较高的竞争力。
6.11 解:
小样本,?d~Z正态分布,?未知,
d??满足n-1=9的t分布 d
??0.05,t9?2.23
若t?2.23,则拒绝H0 若??2.23,则接受H0
t?10.7?82.?3.97?2.23?拒绝H0
认为该种锻炼有效 6.12
?近似服从正态分布
??0.01,Z?2.33,S
?22.5,拒绝H
0,?22.5,?接受H0
(x1?x2)?(?1??2)
s22~N(0,1)
(3.83?3.3)52.22
0..04?0.0225
拒绝原假设,结算系统在统计上具有显著差异。
小样本,两总体方差未知但相等,需要计算合并估计量
1?1)1?(n2?1)s2(10?1)2.12?(10?1)3.22
n=?71?n2?210?10?2.325
(x1?x2)?(?1??2)
查表=2.101,接受原假设。两种化学制品的纯度无显著差异。 7.6
由于P值大于显著性水平,所以接受原假设,即:不同的焊接头之间在力度上没有差异.
查表得到显著性水平为0.01时,F(3,40,0.01)=4.31 样本F=0.038<F?=4.31,所以应该接受原假设,即:4类地区的平均购买量没有差异. 8章
8.1未解释变差:Sy.x?
(y?y)?(S)?60?64?60?3840
?(y?yc)(y?)?(y?)
?1?r2?1?0.36?0.64
(2)由散点图可得,x与y呈正直线协变关系 (3)Cov(x,y)=
(4)相关系数r?
(5)对相关系数r进行显著性检验 假设
本之间高度相关。
(6)设总成本为y,产量为x 根据最小二乘法计算一元线性回归方程的参数,
x)(y)?b?nxy?(
?nx?(x)?y?bx由a??n?
得 a=4.076,b=0.780
回归方程为 y=4.076+0.780x
nx?(x)][ny?(x)]
H0:??0H1: ??0
n=10为小样本,故采用t分布进行检验
检验统计量t?
计算得t值=5.800 ,又α=0.05,查得t8,0.05=2.306
由于t值=5.800>t8,0.05=2.306,因此拒绝H0,即认为当α=0.05时,产量和总成
(7)对回归系数?进行显著性检验
H0:??0H1: ??0
计算t值=5.874 ,在双尾检验中,p值=0.000<5%
因此拒绝H0,即认为显著性水平为5%时,总成本和产量存在线性关系 (8)当产量为20台时,其中n=10,a=0.05
所求置信区间根据公式y(x0)?t(n?2),??Sy?x
所求置信区间为[16.983]
(9)当产量为20台时,其中n=10,a=0.05
所求预测区间根据公式y(x0)?t(n?2),??Sy?x?
所求置信区间为[13.444]
r2?0.952?0.9025
经济意义:回归方程的拟合效果较好,回归方程对于y有较强的解释作用,即生产性
固定资产价值对工业总产值有较大影响,在工业总产值的变异中,有90.25%可以归因于生产性固定资产价值的影响。 (2)b?r
?0.95??0.897 SX396
a?y?bx?980?0.897?653?394.26
^?394.26?0.897x y
经济意义:生产性固定资产价值(x)每增加1万元,工业总产值平均增加0.897万元。 (3)r
22SYX(n?2)SYX?8?1?2?1??0.9025
SY(n?1)3742?9
?SYX?123.865
对?进行显著性检验:
H0:??0H1:??1
取??0.05,t8,0.05?2.306
bS?0.897?8.6?t8,0.05 b0.1043
?认为生产性国定资产价值与工业总产值有显著的线性关系。
(4)当X=1300万元时,
答:工业总产值的预测值为元。
∴上限:.381*2.306= 下限:.381*2.306=
答:工业总产值Y0的预测区间为万元~万元
经济意义:回归方程的拟合效果较好,回归方程对于y有较强的解释作用,即生产性固定资产价值对工业总产值有较大影响,在工业总产值的变异中,有90.25%可以归因于生产性固定资产价值的影响。 (2)b?r
S?0.95??0.897 X396
a?y?bx?980?0.897?653?394.26
^?394.26?0.897x 经济意义:生产性固定资产价值(x)每增加1万元,工业总产值增加0.897万元。 2
)?(?1?S22YX(n?2)SYX?8y?y)
S21)?1?3742
?0.9025 Y(n??SYX?123.865 对?进行显著性检验:
H0:??0H1:??1
取??0.05,t8,0.05?2.306
123.865?x2?
?8.6?t8,0.05 b0.1043
?认为生产性国定资产价值与工业总产值有回归关系。
(4)当X=1300万元时,
答:工业总产值的预测值为元。
∴上限:.381*2.306= 下限:.381*2.306=
答:工业总产值Y0的预测区间为万元~万元
下面是一项多元回归分析结果:
y?5?3x1?8x2?4x3且Sb1=2, Sb2=4, Sb3=0.8
(1) 增加1个单位x2(其他自变量保持不变,下同)与减少2个单位x3对的影响是否相同?
答:相同。
a=5 ,b1=2 ,b2=8 ,b3=-4,
则x2增加一个单位:y增加8个单位;
减少2个单位x3:y增加(-2-4=)8 个单位 (2)分别计算b1,b2,b3的偏检验t值。 解:t1?
??1.5 Sb12b2??28
??2 Sb24b3??3?4
???5 Sb30.8
(3)对的推算时,哪一个自变量最重要?哪一个最不重要?
答:t值相当于将原计量单位为量纲得偏回归系数换算成以相应的标准差为量纲的标准化系数,因而可以由此判断哪个自变量对推断因变量得作用更大。
t3?t2?t1,因此x3最重要,x1最不重要。
电视台为了收费必然要播出广告,广告播多了又会失去观众,致使失去广告客户。为了分析广告节目对观众人数的影响,某电视台对其33个播放时段的观众进行了调查,在所得数据基础上拟合了一个回归方程,其中因变量为观众人数(y:万人);自变量为广告节目频度(x1:分/时)。
对样本观察数据计算后得出如下统计值:
(1)简单综合价格指数p?
*100%?111.798% ?pn(2)简单价比平均指数p?
?119.58% (3)基期加权综合价格指数p
(4)本期加权销售量指数
(5)基期加权价比指数
(6)本期加权量比平均指数Q?
(7)1990年销售额指数V??pnqn3
范文十:第一章思考题
1.1什么是统计学
统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计
描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点
统计数据;按所采用的计量尺度不同分;
(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;
(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;
观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;
截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
第二章思考题
2.1什么是二手资料?使用二手资料应注意什么问题
与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源。
2.2比较概率抽样和非概率抽样的特点,指出各自适用情况
概率抽样:抽样时按一定的概率以随机原则抽取样本。每个单位别抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样:操作简单,时效快,成本低,而且对于抽样中的统计学专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。它同样使用市场调查中的概念测试(不需要调查结果投影到总体的情况)。
2.3除了自填式,面访式和电话式还有什么搜集数据的办法
试验式和观察式等
第三章思考题
3.1数据预处理内容
数据审核(完整性和准确性;适用性和实效性),数据筛选和数据排序。
3.2分类数据和顺序数据的整理和图示方法各有哪些
分类数据:制作频数分布表,用比例,百分比,比率等进行描述性分析。可用条形图,帕累托图和饼图进行图示分析。
顺序数据:制作频数分布表,用比例,百分比,比率。累计频数和累计频率等进行描述性分析。可用条形图,帕累托图和饼图,累计频数分布图和环形图进行图示分析。
3.3数据型数据的分组方法和步骤
分组方法:单变量值分组和组距分组,组距分组又分为等距分组和异距分组。 分组步骤:1确定组数2确定各组组距3根据分组整理成频数分布表
第4章 数据的概括性度量
4.1一组数据的分布特征可以从哪几个方面进行测度?
数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
4.2怎样理解平均数在统计学中的地位?
平均数在统计学中具有重要的地位,是集中趋势的最主要的测度,主要适用于数值型数据,而不适用于分类数据和顺序数据。
4.3简述四分位数的计算方法。
四分位数是一组数据排序后处于25%和75%位置上的值。根据未分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。
第七章思考题
估计量:用于估计总体参数的随机变量
估计值:估计参数时计算出来的统计量的具体值
评价估计量的标准:
无偏性:估计量抽样分布的数学期望等于被估计的总体参数
有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效
一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数
置信区间:由样本统计量所构造的总体参数的估计区间
第8章思考题
8.1假设检验和参数估计有什么相同点和不同点?
答:参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,然而推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。而在参数假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
8.2什么是假设检验中的显著性水平?统计显著是什么意思?
答:显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率和风险。统计显著等价拒绝H0,指求出的值落在小概率的区间上,一般是落在0.05或比0.05更小的显著水平上。
8.3什么是假设检验中的两类错误?
答:假设检验的结果可能是错误的,所犯的错误有两种类型,一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用α表示,所以也称α错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概论用β表示,所以也称β错误或取伪错误。
第10章思考题
10.1什么是方差分析?它研究的是什么?
答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。它所研究的是非类型自变量对数值型因变量的影响。 10.2要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?
答:作两两比较十分繁琐,进行检验的次数较多,随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会增加。而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。 10.3方差分析包括哪些类型?它们有何区别?
答:方差分析可分为单因素方差分析和双因素方差分析。区别:单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响,而双因素涉及两个分类型自变量。
第13章思考题
13.1简述时间序列的构成要素。
时间序列的构成要素:趋势,季节性,周期性,随机性
13.2利用增长率分析时间序列时应注意哪些问题。
(1)当时间序列中的观察值出现0或负数时,不宜计算增长率;
(2)不能单纯就增长率论增长率,要注意增长率与绝对水平的综合分析;大的增长率背后,其隐含的绝对值可能很小,小的增长率背后其隐含的绝对值可能很大。 13.3简述平稳序列和非平稳序列的含义。
1.平稳序列(stationary series)
基本上不存在趋势的序列,各观察值基本上在某个固定的水平上波动或虽有波动,但并不存在某种规律,而其波动可以看成是随机的
2.非平稳序列 (non-stationary series)
是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列又可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。
第14章思考题
14.1解释指数的含义。
答:指数最早起源于测量物价的变动。
广义上,是指任何两个数值对比形成的相对数;
狭义上,是指用于测定多个项目在不同场合下综合变动的一种特殊相对数。实际应用中使用的主要是狭义的指数。
14.2加权综合指数和加权平均指数有何区别与联系?
加权综合指数:通过加权来测定一组项目的综合变动,有加权数量指数和加权质量指数。
使用条件:必须掌握全面数据(数量指数,测定一组项目的数量变动,如产品产量指数,商品销售量指数等)(质量指数,测定一组项目的质量变动,如价格指数、产品成本指数等)
拉式公式:将权数的各变量值固定在基期。
帕式公式:把作为权数的变量值固定在报告期。
加权平均指数:以某一时期的总量为权数对个体指数加权平均。使用条件:可以是全面数据、不完全数据。因权数所属时期的不同,有不同的计算形式。有:算术平均形式、调和平均形
14.3解释零售价格指数、消费价格指数、生产价格指数、股票价格指数。 答:零售价格指数:反映城乡商品零售价格变动趋势的一种经济指数。
消费价格指数:反映一定时期内消费者所购买的生活消费品价格和服务项目价格的变动趋势和程度的一种相对数。
生产价格指数: 测量在初级市场上出售的货物(即在非零售市场上首次购买某种商品时) 的价格变动的一种价格指数。
股票价格指数:反映某一股票市场上多种股票价格变动趋势的一种相对数,简称股价指数。其单位一般用“点”(point)表示,即将基期指数作为100,每上升或下降一个单位称为“1点”。

我要回帖

更多关于 统计学可分为描述性统计和 的文章

 

随机推荐