课件27张PPT。第二章 统 计(A)
(时间:120分钟 满分:150分)
一、选择题(本大题共12小题,每小题5分,共60分)
1.从某年级1 000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是( )
A.1 000名学生是总体
B.每个被抽查的学生是个体
C.抽查的125名学生的体重是一个样本
D.抽取的125名学生的体重是样本容量
2.由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于-1,那么对于样本1,x1,-x2,x3,-x4,x5的中位数可以表示为( )
A.(1+x2) B.(x2-x1)
C.(1+x5) D.(x3-x4)
3.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别应抽取的人数是( )
A.7,11,19 B.6,12,18
C.6,13,17 D.7,12,17
4.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
5.已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是,那么另一组数3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数,方差分别是( )
A.2, B.2,1
C.4, D.4,3
6.某学院有4个饲养房,分别养有18,54,24,48只白鼠供实验用.某项实验需抽取24只白鼠,你认为最合适的抽样方法是( )
A.在每个饲养房各抽取6只
B.把所有白鼠都加上编有不同号码的颈圈,用随机抽样法确定24只
C.从4个饲养房分别抽取3,9,4,8只
D.先确定这4个饲养房应分别抽取3,9,4,8只,再由各饲养房自己加号码颈圈,用简单随机抽样的方法确定
7.下列有关线性回归的说法,不正确的是( )
A.相关关系的两个变量不一定是因果关系
B.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.任一组数据都有回归直线方程
8.已知施肥量与水稻产量之间的回归直线方程为 =4.75x+257,则施肥量x=30时,对产量y的估计值为( )
A.398.5 B.399.5
C.400 D.400.5
9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3
10.某高中在校学生2 000人,高一与高二人数相同并都比高三多1人.为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动.每人都参加而且只参与了其中一项比赛,各年级参与比赛人数情况如下表:
高一
高二
高三
跑步
a
b
c
登山
x
y
z
其中a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高二参与跑步的学生中应抽取( )
A.36人 B.60人
C.24人 D.30人
11.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们所有比赛得分的情况用如右图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为( )
A.19,13 B.13,19
C.20,18 D.18,20
12.从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下:
分组
[90,100)
[100,110)
[110,120)
[120,130)
[130,140)
[140,150]
频数
1
2
3
10
3
1
则这堆苹果中,质量不小于120克的苹果数约占苹果总数的( )
A.30% B.70%
C.60% D.50%
题号
1
2
3
4
5
6
7
8
9
10
11
12
答案
二、填空题(本大题共4小题,每小题5分,共20分)
13.甲、乙、丙、丁四名射击手在选拔赛中的平均环数及其标准差s如下表所示,则选送决赛的最佳人选应是________.
甲
乙
丙
丁
7
8
8
7
s
2.5
2.5
2.8
3
14.一组数据23,27,20,18,x,12,它们的中位数是21,即x是________.
15.某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份
2005
2006
2007
2008
2009
收入x
11.5
12.1
13
13.3
15
支出Y
6.8
8.8
9.8
10
12
根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.
16.某单位为了了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与当天气温.
气温(℃)
14
12
8
6
用电量(度)
22
26
34
38
由表中数据得回归直线方程 = x+ 中 =-2,据此预测当气温为5℃时,用电量的度数约为______.
三、解答题(本大题共6小题,共70分)
17.(10分)一批产品中,有一级品100个,二级品60个,三级品40个,用分层抽样的方法,从这批产品中抽取一个容量为20的样本,写出抽样过程.
18.(12分)为了了解学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)学生跳绳次数的中位数落在哪个小组内?
(2)第二小组的频率是多少?样本容量是多少?
(3)若次数在110以上(含110次)为良好,试估计该学校全体高一学生的良好率是多少?
19.(12分)为了研究三月下旬的平均气温(x)与四月棉花害虫化蛹高峰日(y)的关系,某地区观察了2003年至2008年的情况,得到下面数据:
年份
2003
2004
2005
2006
2007
2008
x(℃)
24.4
29.6
32.9
28.7
30.3
28.9
y
19
6
1
10
1
8
已知x与y之间具有线性相关关系,据气象预测该地区在2010年三月下旬平均气温为27℃,试估计2010年四月化蛹高峰日为哪天?
20.(12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程 =x+ ;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
21.(12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下:(单位:cm)
甲:9,10,11,12,10,20
乙:8,14,13,10,12,21.
(1)在右面给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;
(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.
22.(12分)从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.
试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数.
(2)这50名学生的平均成绩.
第二章 统 计(A)
1.C [在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量.”因此题中所指的对象应是体重,故A、B错误,样本容量应为125,故D错误.]
2.C [由题意把样本从小到大排序为x1,x3,x5,1,-x4,-x2,因此得中位数为(1+x5).]
3.B [因27∶54∶81=1∶2∶3,×36=6,×36=12,×36=18.]
4.C [由点的分布知x与y负相关,u与v正相关.]
5.D [因为数据x1,x2,x3,x4,x5的平均数是2,方差是,
所以=2, (xi-2)2=,
因此数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为:
(3xi-2)=3×xi-2=4,
方差为: (3xi-2-)2= (3xi-6)2=9× (xi-2)2=9×=3.]
6.D [因为这24只白鼠要从4个饲养房中抽取,因此要用分层抽样决定各个饲养房应抽取的只数,再用简单随机抽样法从各个饲养房选出所需白鼠.C虽然用了分层抽样,但在每个层中没有考虑到个体的差异,也就是说在各个饲养房中抽取样本时,没有表明是否具有随机性,故选D.]
7.D [根据两个变量具有相关关系的概念,可知A正确,散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B、C正确.只有线性相关的数据才有回归直线方程,所以D不正确.]
8.B [成线性相关关系的两个变量可以通过回归直线方程进行预测,本题中当x=30时, =4.75×30+257=399.5.]
9.D [由于甲地总体均值为3,中位数为4,即中间两个数(第5、6天)人数的平均数为4,因此后面的人数可以大于7,故甲地不符合.乙地中总体均值为1,因此这10天的感染人数总和为10,又由于方差大于0,故这10天中不可能每天都是1,可以有一天大于7,故乙地不符合.丙地中中位数为2,众数为3,3出现的最多,并且可以出现8,故丙地不符合.故丁地符合.]
10.A [由题意知高一、高二、高三的人数分别为667,667,666.
设a=2k,b=3k,c=5k,
则a+b+c=×2 000,即k=120.
∴b=3×120=360.
又2 000人中抽取200人的样本,即每10人中抽取一人,则360人中应抽取36人,故选A.]
11.A [分别将甲、乙两名运动员的得分从小到大排列,中间位置的分数则为中位数.]
12.B [由数据分布表可知,质量不小于120克的苹果有10+3+1=14(个),占苹果总数的×100%=70%.]
13.乙
解析 平均数反映平均水平大小,标准差表明稳定性.标准差越小,稳定性越好.
14.22
15.13 正
16.40
解析 ∵=(14+12+8+6)=10,
=(22+26+34+38)=30,
∴ =- =30+2×10=50.
∴当x=5时, =-2×5+50=40.
17.解 分层抽样方法:
先将总体按其级别分为三层,一级品有100个,产品按00,01,…,99编号,二级品有60个,产品按00,01,…,59编号,三级品有40个,产品按00,01,…,39编号.因总体个数∶样本容量为10∶1,故用简单随机抽样的方法,在一级品中抽10个,二级品中抽6个,三级品中抽4个.这样就可得到一个容量为20的样本.
18.解 (1)∵前三组的频率和为=<,
前四组的频率之和为=>,
∴中位数落在第四小组内.
(2)频率为:=0.08,
又∵频率=,
∴样本容量===150.
(3)由图可估计所求良好率约为:
×100%=88%.
19.解 由题意知:
≈29.13,=7.5,
x=5 130.92,
xiyi=1 222.6,
∴ =≈-2.2,
=- ≈71.6,
∴回归方程为 =-2.2x+71.6.
当x=27时, =-2.2×27+71.6=12.2,据此,可估计该地区2010年4月12日或13日为化蛹高峰日.
20.解 (1)散点图如下:
(2)==4.5,==3.5,
xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
x=32+42+52+62=86,
∴===0.7,
=- =3.5-0.7×4.5=0.35.
∴ =0.7x+0.35.
∴所求的回归直线方程为 =0.7x+0.35.
(3)现在生产100吨甲产品用煤
=0.7×100+0.35=70.35,
∴90-70.35=19.65.
∴生产能耗比技改前降低约19.65吨标准煤.
21.解 (1)茎叶图如图所示:
(2)甲==12,
乙==13,
s=×[(9-12)2+(10-12)2+(11-12)2+(12-12)2+(10-12)2+(20-12)2]≈13.67,
s=×[(8-13)2+(14-13)2+(13-13)2+(10-13)2+(12-13)2+(21-13)2]≈16.67.
因为甲<乙,所以乙种麦苗平均株高较高,又因为s22.解 (1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形框的中间值的横坐标即为所求,所以众数应为75.
由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.
∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,
∴前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,
∴中位数应位于第四个小矩形内.
设其底边为x,高为0.03,
∴令0.03x=0.2得x≈6.7,故中位数约为70+6.7=76.7.
(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.
∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈74.
第二章 统 计(B)
(时间:120分钟 满分:150分)
一、选择题(本大题共12小题,每小题5分,共60分)
1.对于给定的两个变量的统计数据,下列说法正确的是( )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
2.一组数据中的每一个数据都乘以2,再减去80,得到一组新数据,若求得新的数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )
A.40.6,1.1 B.48.8,4.4
C.81.2,44.4 D.78.8,75.6
3.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如右图,则下面结论中错误的一个是( )
A.甲的极差是29 B.乙的众数是21
C.甲罚球命中率比乙高 D.甲的中位数是24
4.某学院A,B,C三个专业共有1 200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取的学生人数为( )
A.30 B.40
C.50 D.60
5.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.4、8.4、9.4、9.9、9.6、9.4、9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A.9.4,0.484 B.9.4,0.016
C.9.5,0.04 D.9.5,0.016
6.两个变量之间的相关关系是一种( )
A.确定性关系 B.线性关系
C.非确定性关系 D.非线性关系
7.如果在一次实验中,测得(x,y)的四组数值分别是A(1,3),B(2,3.8),C(3,5.2),D(4,6),则y与x之间的回归直线方程是( )
A. =x+1.9 B. =1.04x+1.9
C. =0.95x+1.04 D. =1.05x-0.9
8.现要完成下列3项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查.
②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈.
③东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
较为合理的抽样方法是( )
A.①简单随机抽样,②系统抽样,③分层抽样
B.①简单随机抽样,②分层抽样,③系统抽样
C.①系统抽样,②简单随机抽样,③分层抽样
D.①分层抽样,②系统抽样,③简单随机抽样
9.从存放号码分别为1,2,…,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:
卡片号码
1
2
3
4
5
6
7
8
9
10
取到的次数
13
8
5
7
6
13
18
10
11
9
则取到号码为奇数的频率是( )
A.0.53 B.0.5
C.0.47 D.0.37
10.某校对高一新生进行军训,高一(1)班学生54人,高一(2)班学生42人,现在要用分层抽样的方法,从两个班中抽出部分学生参加4×4方队进行军训成果展示,则(1)班,(2)班分别被抽取的人数是( )
A.9人,7人 B.15人,1人
C.8人,8人 D.12人,4人
11.右图是根据《山东统计年鉴2010》中的资料作成的2000年至2009年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到2000年至2009年我省城镇居民百户家庭人口数的平均数为( )
A.304.6 B.303.6
C.302.6 D.301.6
12.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如表所示:
甲的成绩
环数
7
8
9
10
频数
5
5
5
5
乙的成绩
环数
7
8
9
10
频数
6
4
4
6
丙的成绩
环数
7
8
9
10
频数
4
6
6
4
s1、s2、s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( )
A.s3>s1>s2 B.s2>s1>s3
C.s1>s2>s3 D.s2>s3>s1
题号
1
2
3
4
5
6
7
8
9
10
11
12
答案
二、填空题(本大题共4小题,每小题5分,共20分)
13.已知一个回归直线方程为 =1.5x+45(xi∈{1,5,7,13,19}),则=________.
14.若a1,a2,…,a20这20个数据的平均数为,方差为0.21,则a1,a2,…,a20,这21个数据的方差为________.
15.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
16.某公司有员工49人,其中30岁以上的员工有14人,没超过30岁的员工有35人,为了解员工的健康情况,用分层抽样方法抽一个容量为7的样本,其中30岁以上的员工应抽取________人.
三、解答题(本大题共6小题,共70分)
17.(10分)某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:
广告支出x(单位:万元)
1
2
3
4
销售收入y(单位:万元)
12
28
42
56
(1)画出表中数据的散点图;
(2)求出y对x的回归直线方程;
(3)若广告费为9万元,则销售收入约为多少万元?
18.(12分)炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据如下表所示:
x(0.01%)
104
180
190
177
147
134
150
191
204
121
y(min)
100
200
210
185
155
135
170
205
235
125
(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?
(2)求回归直线方程;
(3)预测当钢水含碳量为160时,应冶炼多少分钟?
19.(12分)甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价.
20.(12分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:
家庭编号
1
2
3
4
5
6
7
8
9
10
xi收入)
千元
0.8
1.1
1.3
1.5
1.5
1.8
2.0
2.2
2.4
2.8
yi(支出)
千元
0.7
1.0
1.2
1.0
1.3
1.5
1.3
1.7
2.0
2.5
(1)判断家庭平均收入与月平均生活支出是否相关?
(2)若二者线性相关,求回归直线方程.
21.(12分)某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类,B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).
(1)A类工人中和B类工人中各抽查多少工人?
(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.
表1
生产能
力分组
[100,110)
[110,120)
[120,130)
[130,140)
[140,150)
人数
4
8
x
5
3
表2
生产能
力分组
[110,120)
[120,130)
[130,140)
[140,150)
人数
6
y
36
18
①先确定x,y,再补全下列频率分布直方图.就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)
图1 A类工人生产能力的频率分布直方图
图2 B类工人生产能力的频率分布直方图
②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).
22.(12分)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验.测得的数据如下:
零件数
x(个)
10
20
30
40
50
60
70
80
90
100
加工时间
y(分)
62
68
75
81
89
95
102
108
115
122
(1)y与x是否具有线性相关关系?
(2)如果y与x具有线性相关关系,求回归直线方程;
(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?
第二章 统 计(B)
1.C [给出一组样本数据,总可以作出相应的散点图,但不一定能分析出两个变量的关系,更不一定符合线性相关或有函数关系.]
2.A
3.D [甲的极差是37-8=29;乙的众数显然是21;甲的平均数显然高于乙,即C成立;甲的中位数应该是=23.]
4.B [由题知C专业有学生1 200-380-420=400(名),那么C专业应抽取的学生数为120×=40名.]
5.D [去掉一个最高分9.9后再去掉一个最低分8.4,剩余的分值为9.4、9.4、9.6、9.4、9.7.
求平均值=9.5,代入方差运算公式可知方差为0.016.]
6.C 7.B
8.A [①总体较少,宜用简单随机抽样;②已分段,宜用系统抽样;③各层间差距较大,宜用分层抽样,故选A.]
9.A [(13+5+6+18+11)=0.53.]
10.A [高一(1)班与(2)班共有学生96人,现抽出16名学生参加方队展示,所以抽取(1)班人数为×54=9(人),抽取(2)班人数为×42=7(人).]
11.B
12.B [∵s=(x+x+…+x)-2,
∴s=(5×72+5×82+5×92+5×102)-8.52=73.5-72.25=1.25=,
∴s1=.同理s2=,s3=,∴s2>s1>s3,故选B.]
13.58.5
解析 回归直线方程为 =1.5x+45经过点(, ),由=9,知=58.5.
14.0.2
15.0.030 3
解析 因5个矩形面积之和为1,即(0.005+0.010+0.020+a+0.035)×10=1,
∴0.070×10+10a=1,∴a=0.030.
由于三组内学生数的频率分别为:0.3,0.2,0.1,所以三组内学生的人数分别为30,20,10.
因此从[140,150]内选取的人数为×18=3.
16.2
17.解 (1)作出的散点图如图所示
(2)观察散点图可知各点大致分布在一条直线附近,列出下表:
序号
x
y
x2
xy
1
1
12
1
12
2
2
28
4
56
3
3
42
9
126
4
4
56
16
224
∑
10
138
30
418
易得=,=,
所以 ===,
=- =-×=-2.
故y对x的回归直线方程为 =x-2.
(3)当x=9时, =×9-2=129.4.
故当广告费为9万元时,销售收入约为129.4万元.
18.解 (1)以x轴表示含碳量,y轴表示冶炼时间,可作散点图如图所示:
从图中可以看出,各点散布在一条直线附近,即它们线性相关.
(2)列出下表,并用科学计算器进行计算:
i
1
2
3
4
5
6
7
8
9
10
xi
104
180
190
177
147
134
150
191
204
121
yi
100
200
210
185
155
135
170
205
235
125
xiyi
10 400
36 000
39 900
32 745
22 785
18 090
25 500
39 155
47 940
15 125
=159.8,=172,
x=265 448,y=312 350,xiyi=287 640
设所求的回归直线方程为 = x+ ,
=≈1.267, =- ≈-30.47.
所求回归直线方程为
=1.267x-30.47.
(3)当x=160时, =1.267×160+(-30.47)=172.25.
即当钢水含碳量为160时,应冶炼约172.25分钟.
19.解 (1)由图象可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
甲==13,
乙==13,
s=[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s=[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s>s可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
20.解 (1)作出散点图:
观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系.
(2)=(0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,
=(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,
xiyi=27.51,x=33.72,
=≈0.813 6,
=1.42-1.74×0.813 6≈0.004 3,
∴回归方程为 =0.813 6x+0.004 3.
21.解 (1)A类工人中和B类工人中分别抽查25名和75名.
(2)①由4+8+x+5+3=25,得x=5,6+y+36+18=75,得y=15.
频率分布直方图如下:
图1 A类工人生产能力的频率分布直方图
图2 B类工人生产能力的频率分布直方图
从直方图可以判断:B类工人中个体间的差异程度更小.
②A=×105+×115+×125+×135+×145=123,
B=×115+×125+×135+×145=133.8,
=×123+×133.8=131.1.
A类工人生产能力的平均数,B类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.
22.解 (1)作出如下散点图:
由图可知,y与x具有线性相关关系.
(2)列出下表
i
1
2
3
4
5
6
7
8
9
10
xi
10
20
30
40
50
60
70
80
90
100
yi
62
68
75
81
89
95
102
108
115
122
xiyi
620
1 360
2 250
3 240
4 450
5 700
7 140
8 640
10 350
12 200
=55,=91.7,
x=38 500,y=87 777,xiyi=55 950,
设所求的回归直线方程为 = x+ ,则有
==≈0.668,
=- =91.7-0.668×55=54.96,
因此,所求的回归直线方程为 =0.668x+54.96.
(3)这个回归直线方程的意义是当x每增加1时,y的值约增加0.668,而54.96是y不随x变化而变化的部分,因此,当x=200时,y的估计值为
=0.668×200+54.96=188.56≈189,
因此,加工200个零件所用的时间约为189分.
§2.1 习题课
课时目标 1.从总体上把握三种抽样方法的区别和联系.2.学会根据数据的不同情况,选用适合的抽样方法进行抽样.
1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是( )
A.总体 B.个体
C.总体的一个样本 D.样本容量
答案 C
2.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是( )
A.分层抽样 B.简单随机抽样
C.系统抽样 D.以上都不对
答案 C
解析 按照一定的规律进行抽取为系统抽样.
3.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )
A.简单随机抽样法 B.抽签法
C.随机数法 D.分层抽样法
答案 D
解析 由分层抽样的定义可知,该抽样为按比例的抽样.
4.对于简单随机抽样,下列说法中正确的命题为( )
①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;
②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;
③它是一种不放回抽样;
④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.
A.①②③ B.①②④
C.①③④ D.①②③④
答案 D
5.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________.
答案 30
解析 由题意,知×n=6,∴n=30.
6.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.
答案 760
解析 设该校女生人数为x,则男生人数为(1 600-x).
由已知,×(1 600-x)-·x=10,解得x=760.故该校的女生人数是760人.
一、选择题
1.下列哪种工作不能使用抽样方法进行( )
A.测定一批炮弹的射程
B.测定海洋水域的某种微生物的含量
C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度
D.检测某学校全体高三学生的身高和体重的情况
答案 D
2.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )
A.16 B.14
C.28 D.12
答案 A
解析 运动员共计98人,抽取比例为=,因此男运动员56人中抽取16人.
3.下列抽样实验中,最适宜用系统抽样的是( )
A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样
B.某厂生产的2 000个电子元件中随机抽取5个入样
C.从某厂生产的2 000个电子元件中随机抽取200个入样
D.从某厂生产的20个电子元件中随机抽取5个入样
答案 C
解析 A中总体有明显层次,不适用系统抽样法;B中样本容量很小,适宜用简单随机抽样法中的随机数法;D中总体数很小,故适宜用抽签法,只有C比较适用系统抽样法.
4.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为( )
A.2个 B.3个
C.5个 D.13个
答案 A
解析 抽取的样本容量与总体的比值为=,
所以抽取的样本中,进口的标志灯抽取的数量为30×=2(个).
5.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是( )
A.12,24,15,9 B.9,12,12,7
C.8,15,12,5 D.8,16,10,6
答案 D
解析 由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×=8,40×=16,40×=10,40×=6.
6.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是( )
A.7,4,6 B.9,5,6
C.6,4,9 D.4,5,9
答案 B
解析 各年龄段所选分别为×45=9,×25=5,×30=6.
二、填空题
7.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.
答案 5.7%
解析 ∵990∶99 000=1∶100,∴普通家庭中拥有3套或3套以上住房的大约为50×100=5 000(户).
又∵100∶1 000=1∶10,∴高收入家庭中拥有3套或3套以上住房的大约为70×10=700(户).
∴3套或3套以上住房的家庭约有5 000+700=5 700(户).故=5.7%.
8.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.
答案 37 20
解析 由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37. 40岁以下的年龄段的职工数为200×0.5=100,则应抽取的人数为×100=20(人).
9.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.
性别
人数
生活能否自理
男
女
能
178
278
不能
23
21
则该地区生活不能自理的老人中男性比女性约多________人.
答案 60
解析 由表知500人中生活不能自理的男性比女性多2人,所以该地区15 000位老人生活不能自理的男性比女性多2×=60(人).
三、解答题
10.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:
很喜爱
喜爱
一般
不喜爱
2 435
4 567
3 926
1 072
电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应当怎样进行抽样?
解 可用分层抽样方法,其总体容量为12 000.“很喜爱”占,应取60×≈12(人);“喜爱”占,应取60×≈23(人);“一般”占,应取60×≈20(人);“不喜爱”占,应取60×≈5(人).因此采用分层抽样在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.
11.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?
解 (1)将624名职工用随机方式编号由000至623.
(2)利用随机数法从总体中剔除4人.
(3)将剩下的620名职工重新编号由000至619.
(4)分段,取间隔k==10,将总体分成62组,每组含10人.
(5)从第一段,即为000到009号随机抽取一个号l.
(6)按编号将l,10+l,20+l,…,610+l,共62个号码选出,这62个号码所对应的职工组成样本.
能力提升
12.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( )
A.9 B.18 C.27 D.36
答案 B
解析 设该单位老年职工有x人,从中抽取y人.
则160+3x=430?x=90,即老年职工有90人,
则=?y=18.
故选B.
13.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:
学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.
学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.
学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.
请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?
解 学生A的方法得到的样本不能够反映不上网的居民情况,是一种方便样本,所得的结果代表性差,不能很准确地获得平均每户居民的月用水量;学生B的方法实际上是普查,花费的人力物力要多一些,但是如果统计过程不出错,可以准确地得到平均每户居民的月用水量;在小区的每户居民都装有电话的情况下,学生C的方法是一种随机抽样方法,所得的样本具有代表性,可以比较准确地获得平均每户居民的月用水量.
在小区的每户居民都装有电话的情况下,建议用随机抽样的方法获取数据,即用学生C的方法,以节省人力物力,并且可以得到比较精确的结果.
1.抽签法的关键是搅拌均匀,才能达到等概率抽样,抽签法的优点是操作简单、易行、方便,缺点是只适用于总体中个体数较少时.
2.在系统抽样中,遇到(N是总体,n是样本容量)不是整数时,要从总体中剔除多余的个体,使剩余的个体能被样本容量整除,剔除多余个体所用的方法是随机抽样法.
3.分层抽样的步骤是将总体按一定的标准分层,按各层个体占总体的比在每一层进行随机抽取;其特点是适用于总体由差异明显的几部分组成.
4.几种抽样方法的共同特点是它们在抽样过程中,属不放回抽样,且每次抽取时,总体内的各个个体被抽到的机会是相等的.这体现了这些抽样方法的客观性和公平性.
§2.2 习题课
课时目标 1.进一步巩固基础知识,学会用样本估计总体的思想、方法.2.提高学生分析问题和解决实际应用问题的能力.
1.要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的( )
A.平均数 B.方差
C.众数 D.频率分布
2.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差等于( )
A.3.5 B.-3 C.3 D.-0.5
3.对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是( )
A.频率分布直方图与总体密度曲线无关
B.频率分布直方图就是总体密度曲线
C.样本容量很大的频率分布直方图就是总体密度曲线
D.如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近于总体密度曲线
4.容量为100的样本数据,按从小到大的顺序分为8组,如下表:
组号
1
2
3
4
5
6
7
8
频数
10
13
x
14
15
13
12
9
第三组的频数和频率分别是( )
A.14和0.14 B.0.14和14
C.和0.14 D.和
5.某中学高三(2)班甲、乙两名同学自高中以来每次考试成绩的茎叶图如图,下列说法正确的是( )
A.乙同学比甲同学发挥稳定,且平均成绩也比甲同学高
B.乙同学比甲同学发挥稳定,但平均成绩不如甲同学高
C.甲同学比乙同学发挥稳定,且平均成绩比乙同学高
D.甲同学比乙同学发挥稳定,但平均成绩不如乙同学高
6.数据70,71,72,73的标准差是________.
一、选择题
1.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000中再用分层抽样方法抽出100人作出一步调查,则在[2 500,3 000](元)/月收入段应抽出的人数为( )
A.20 B.25 C.40 D.50
2.一组数据的平均数是4.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( )
A.55.2,3.6 B.55.2,56.4
C.64.8,63.6 D.64.8,3.6
3.一容量为20的样本,其频率分布直方图如图所示,样本在[30,60)上的频率为( )
A.0.75 B.0.65 C.0.8 D.0.9
4.甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/km2):
品种
第1年
第2年
第3年
第4年
第5年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
其中产量比较稳定的小麦品种是( )
A.甲 B.乙
C.稳定性相同 D.无法确定
5.某校在“创新素质实践行”活动中组织学生进行社会调查,并对学生的调查报告进行了评比,下面是将某年级60篇学生调查报告进行整理,分成5组画出的频率分布直方图(如图所示).已知从左至右4个小组的频率分别为0.05,0.15,0.35,0.30,那么在这次评比中被评为优秀的调查报告有(分数大于或等于80分为优秀且分数为整数)( )
A.18篇 B.24篇
C.25篇 D.27篇
题 号
1
2
3
4
5
答 案
二、填空题
6.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.
7.将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.
8.某地区为了解中学生的日平均睡眠时间(单位:h),随机选择了n位中学生进行调查,根据所得数据画出样本的频率分布直方图如图所示,且从左到右的第1个、第4个、第2个、第3个小长方形的面积依次相差0.1,又第一小组的频数是10,则n=________.
三、解答题
9.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲
27
38
30
37
35
31
乙
33
29
38
34
28
36
(1)画出茎叶图,由茎叶图你能获得哪些信息?
(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、极差、方差,并判断选谁参加比赛比较合适?
10.潮州统计局就某地居民的月收入调查了10 000人,并根据所得数据画出了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).
(1)求居民月收入在[3 000,3 500)的频率;
(2)根据频率分布直方图算出样本数据的中位数;
(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?
能力提升
11.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95].由此得到频率分布直方图如图,则由此估计该厂工人一天生产该产品数量在[55,70)的人数约占该厂工人总数的百分率是________.
1.方差反映了一组数据偏离平均数的大小,一组数据方差越大,说明这组数据波动越大.即方差反应了样本偏离样本中心(,)的情况.标准差可以使其单位与样本数据的单位一致,从另一角度同样衡量这组数据的波动情况.
2.在求方差时,由于对一组数据都同时加上或减去相同的数只是平均数发生了变化,其方差不变,因此可以转化为一组较简单的新数求方差较为简捷.
答案:
§2.2 习题课
双基演练
1.D [样本的平均数、方差、众数都不能反应样本在某一范围的个数所占样本容量的比例,故选D.]
2.B [少输入90,=3,平均数少3,求出的平均数减去实际的平均数等于-3.]
3.D
4.A [频数为100-(10+13+14+15+13+12+9)=14;频率为=0.14.]
5.A [从茎叶图可知乙同学的成绩在80~90分分数段的有9次,而甲同学的成绩在80~90分分数段的只有7次;再从题图上还可以看出,乙同学的成绩集中在90~100分分数段的最多,而甲同学的成绩集中在80~90分分数段的最多.故乙同学比甲同学发挥较稳定且平均成绩也比甲同学高.]
6.
解析 ==71.5,
s=
=.
作业设计
1.B [由题意可知:在[2 500,3 000](元)/月的频率为0.000 5×500=0.25,故所求的人数为0.25×100=25.]
2.D [每一个数据都加上60时,平均数也应加上60,而方差不变.]
3.B [由图可知,样本在[30,60)上的频率为0.02×10+0.025×10+0.02×10=0.2+0.25+0.2=0.65,故选择B.]
4.A [方法一 甲=×(9.8+9.9+10.1+10+10.2)=10,
乙=×(9.4+10.3+10.8+9.7+9.8)=10,
即甲、乙两种冬小麦的平均单位面积产量的均值都等于10,其方差分别为
s=×(0.04+0.01+0.01+0+0.04)=0.02,
s=×(0.36+0.09+0.64+0.09+0.04)=0.244,
即s方法二 (通过特殊的数据作出合理的推测)表中乙品种在第一年的产量为9.4,在第三年的产量为10.8,其波动比甲品种大得多,所以甲种冬小麦的产量比较稳定.]
5.D [第5个小组的频率为1-0.05-0.15-0.35-0.30=0.15,
∴优秀的频率为0.15+0.30=0.45
∴优秀的调查报告有60×0.45=27(篇).]
6.24 23
解析 甲=(10×2+20×5+30×3+17+6+7)=24,
乙=(10×3+20×4+30×3+17+11+2)=23.
7.60
解析 ∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,
∴前三组频数为·n=27,故n=60.
8.100
解析 设第1个小长方形的面积为S,则4个小长方形的面积之和为S+(S+0.1)+(S+0.2)+(S+0.3)=4S+0.6.由题意知,4S+0.6=1,
∴S=0.1.又=0.1,∴n=100.
9.解 (1)画茎叶图、中间数为数据的十位数.
从茎叶图上看,甲、乙的得分情况都是分布均匀的,只是乙更好一些.乙发挥比较稳定,总体情况比甲好.
(2)甲==33.
乙==33.
s=[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67.
s=[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈12.67.
甲的极差为11,乙的极差为10.
综合比较以上数据可知,
选乙参加比赛较合适.
10.解 (1)月收入在[3 000,3 500)的频率为
0.000 3×(3 500-3 000)=0.15.
(2)∵0.000 2×(1 500-1 000)=0.1,
0.000 4×(2 000-1 500)=0.2,
0.000 5×(2 500-2 000)=0.25,
0.1+0.2+0.25=0.55>0.5.
∴样本数据的中位数为
2 000+=2 000+400=2 400(元).
(3)居民月收入在[2 500,3 000)的频率为
0.000 5×(3 000-2 500)=0.25,
所以10 000人中月收入在[2 500,3 000)的人数为0.25×10 000=2 500(人),
再从10 000人中分层抽样方法抽出100人,则月收入在[2 500,3 000)的这段应抽取100×=25(人).
11.52.5%
解析 结合直方图可以看出:生产数量在[55,65)的人数频率为0.04×10=0.4,生产数量在[65,75)的人数频率为0.025×10=0.25,而生产数量在[65,70)的人数频率约为0.25×=0.125,那么生产数量在[55,70)的人数频率约为0.4+0.125=0.525,即52.5%.
章末复习课
课时目标 1.巩固本章主干知识点.2.提高知识的综合应用能力.
1.某质检人员从编号为1~100这100件产品中,依次抽出号码为3,13,23,…,93的产品进行检验,则这样的抽样方法是( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.以上都不对
2.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( )
A.7 B.15
C.25 D.35
3.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
4.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为( )
A.1 B.2
C.3 D.4
5.如果数据x1,x2,…,xn的平均数为,方差为s2,则2x1+3,2x2+3,…,2xn+3的平均数和方差分别为( )
A.和s B.2+3和4s2
C.2+3和s2 D.2+3和4s2+12s+9
6.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有______根棉花纤维的长度小于20 mm.
一、选择题
1.为了调查参加运动会的500名运动员的身高情况,从中抽查了50名运动员的身高,就这个问题来说,下列说法正确的是( )
A.50名运动员是总体
B.每个运动员是个体
C.抽取的50名运动员是样本
D.样本容量是50
2.某高级中学高一年级有十六个班,812人,高二年级有十二个班,605人,高三年级有十个班,497人,学校为加强民主化管理,现欲成立由76人组成的学生代表会,你认为下列代表产生的办法中,最符合统计抽样原则的是( )
A.指定各班团支部书记、班长为代表
B.全校选举出76人
C.高三选举出20人,高二选举出24人,高一选举出32人
D.高三20人,高二24人,高一32人均在各年级随机抽取
3.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40和0.125,则n的值是( )
A.640 B.320
C.240 D.160
4.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000]的频率为( )
A.0.001 B.0.01
C.0.003 D.0.3
5.在某项体育比赛中,七位裁判为一选手打出的分数如下:
90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A.92,2 B.92,2.8
C.93,2 D.93,2.8
6.下列图形中具有相关关系的两个变量是( )
题 号
1
2
3
4
5
6
答 案
二、填空题
7.一个总体中有100个个体,随机编号0,1,2,…,99,依从小到大的编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是________.
8.一个样本容量是100的频率分布如图:
(1)样本落在[60,70)内的频率为________;
(2)样本落在[70,80)内的频数为________;
(3)样本落在[90,100)内的频率是0.16,该小矩形的高是________.
9.某商店统计了最近6个月某商品的进价x与售价y(单位:元)的对应数据如下表:
x
3
5
2
8
9
12
y
4
6
3
9
12
14
假设得到的关于x和y之间的回归直线方程是 = x+ ,那么该直线必过的定点是________.
三、解答题
10.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:
甲
60
80
70
90
70
乙
80
60
70
80
75
分别计算两个样本的平均数和方差s2,并根据计算结果估计甲、乙谁的平均成绩较好?谁的各门功课发展较平衡?
11.下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长度计算的,且对于给定的x,y为正态变量,其方差与x无关.
x(℃)
300
400
500
600
700
800
y(%)
40
50
55
60
67
70
(1)画出散点图;
(2)指出x,y是否线性相关;
(3)若线性相关,求y关于x的回归方程;
(4)估计退水温度是1 000℃时,黄酮延长性的情况.
12.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.
(1)求第二小组的频率,并补全这个频率分布直方图;
(2)求这两个班参赛的学生人数是多少?
(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)
能力提升
13.在一次中学生田径运动会上,参加跳高的17名运动员成绩如下:
成绩
(单位m)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数
2
3
2
3
4
1
1
1
(1)分别求这些运动员成绩的众数、中位数、平均数(保留3个有效数字);
(2)分析这些数据的含义.
14.今年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如下表:(月均用水量的单位:吨)
用水量分组
频数
频率
[0.5,2.5)
12
[2.5,4.5)
[4.5,6.5)
40
[6.5,8.5)
0.18
[8.5,10.5]
6
合计
100
1
(1)请完成该频率分布表,并画出相对应的频率分布直方图和频率分布折线图;
(2)估计样本的中位数是多少?
(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1 200户,请估计上级支援该乡的月调水量是多少吨?
1.三种常用的抽样方法:简单随机抽样、系统抽样和分层抽样.在使用它们的过程中,每一个个体被抽到的可能性是一样的.应用抽样方法抽取样本时,应注意以下几点:
(1)用随机数法抽样时,对个体所编的号码位数是相等的,当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.
(2)用系统抽样法抽样时,如果总体容量N能被样本容量n整除,抽样间隔为k=,如果总体容量N不能被样本容量n整除,先用简单抽样法剔除多余个数、抽样间隔为k=[],([]表示取的整数部分.)
(3)三种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数表法;当总体容量较大,样本容量也较大时,可采用系统抽样法;当总体由差异明显的几部分组成时,可采用分层抽样法.
2.为了从整体上更好地把握总体的规律,可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是把样本数据分成相同数目的两部分,其中一部分比这个数小,另一部分比这个数大的那个数;平均数就是所有样本数据的平均值,用表示;标准差是反映样本数据分散程度大小的最常用统计量,其计算公式如下:
s=.
有时也用标准差的平方s2——方差来代替标准差,实质一样.
3.求回归直线方程的步骤:
(1)先把数据制成表,从表中计算出,,x,y,xiyi;
(2)计算回归系数 , .公式为
(3)写出回归直线方程 = x+ .
答案:
章末复习课
双基演练
1.B
2.B [设样本容量为n,则=,∴n=15.]
3.A
4.D [∵=10,[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]=2,化简得x+y=20,(x-10)2+(y-10)2=8,解得x=12,y=8或x=8,y=12,
∴|x-y|=4.]
5.B [因x1+x2+…+xn=n,
所以
==+3=2+3.
又(x1-)2+(x2-)2+…+(xn-)2=ns2,
所以[2x1+3-(2+3)]2+[2x2+3-(2+3)]2+…+[2xn+3-(2+3)]2=4[(x1-)2+(x2-)2+…+(xn-)2]=4ns2.
所以方差为4s2.]
6.30
解析 纤维长度小于20 mm的频率约为
p=5×0.01+5×0.01+5×0.04=0.3,
∴100×0.30=30.
作业设计
1.D [在这个问题中所要考察的对象是身高,另一方面,样本容量是指样本中的个体数目.]
2.D [以年级为层,按各年级所占的比例进行抽样,为了使抽取的学生具有代表性,应在各年级进行随机抽样.]
3.B [由=0.125,得n=320.]
4.D [频率=×组距,
由图易知:=0.001,组距=3 000-2 700=300,
∴频率=0.001×300=0.3]
5.B [去掉95和89后,剩下5个数据的平均值
==92,
方差s2=[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=2.8.]
6.D [A和B符合函数关系,即对x的每一个值,y都有唯一确定的值与之对应;从C、D散点图来看,D的散点都在某一条直线附近波动,因此两变量具有相关关系.]
7.76
解析 由题意知:m=8,k=8,
则m+k=16,也就是第8组的个位数字为6,
十位数字为8-1=7,故抽取的号码为76.
8.(1)0.2 (2)30 (3)0.016
解析 (1)由×组距=频率,得频率为0.2;
(2)频率为0.3,又由频数=频率×样本容量,得频数为30;
(3)由=高,得小矩形的高是0.016.
9.(6.5,8)
解析 =(3+5+2+8+9+12)=6.5,
=(4+6+3+9+12+14)=8.
由 =- 得= + ,
所以y= x+ 恒过(,),
即过定点(6.5,8).
10.解 甲=(60+80+70+90+70)=74,
乙=(80+60+70+80+75)=73,
s=(142+62+42+162+42)=104,
s=(72+132+32+72+22)=56,
∵甲>乙,s>s;
∴甲的平均成绩较好,乙的各门功课发展较平衡.
11.解 (1)散点图如下.
(2)由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.
(3)列出下表并用科学计算器进行有关计算.
i
1
2
3
4
5
6
xi
300
400
500
600
700
800
yi
40
50
55
60
67
70
xiyi
12 000
20 000
27 500
36 000
46 900
56 000
90 000
160 000
250 000
360 000
490 000
640 000
=550,=57
x2i=1 990 000,xiyi=198 400
于是可得
==≈0.058 86,
=- =57-0.058 86×550=24.627.
因此所求的回归直线方程为
=0.058 86x+24.627.
(4)将x=1 000代入回归方程得
y=0.058 86×1 000+24.627=83.487,
即退水温度是1 000℃时,
黄酮延长性大约是83.487%.
12.解 (1)各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05.
∴第二小组的频率为:
1.00-(0.30+0.15+0.10+0.05)=0.40.
∴落在59.5~69.5的第二小组的小长方形的高===0.04.
则补全的直方图如图所示.
(2)设九年级两个班参赛的学生人数为x人.
∵第二小组的频数为40人,频率为0.40,
∴=0.40,解得x=100(人).
所以九年级两个班参赛的学生人数为100人.
(3)∵0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5,
即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5,所以九年级两个班参赛学生的成绩的中位数应落在第二小组内.
13.解 (1)在17个数据中,1.75出现了4次,次数最多,即众数是1.75;
把成绩从小到大排列,中间一个数即第9个数据是1.70中的一个,即中位数是1.70;
平均数=(1.50×2+1.60×3+…+1.90×1)≈1.69(m)
因此,17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
(2)众数是1.75说明了跳1.75 m的人数最多;中位数是1.70 m说明了1.70 m以下和1.70 m以上的成绩个数相等;平均数是1.69 m说明了所有参赛运动员平均成绩是1.69 m.
14.解 (1)频率分布表与相应的频率分布直方图和频率分布折线图如下:
用水量分组
频数
频率
[0.5,2.5)
12
0.12
[2.5,4.5)
24
0.24
[4.5,6.5)
40
0.40
[6.5,8.5)
18
0.18
[8.5,10.5]
6
0.06
合计
100
1
(2)前两个矩形面积和为0.12+0.24,第三个矩形一半的面积为0.5-(0.12+0.24),则所求的中位数为:4.5+=4.5+0.7=5.2.
(3)该乡每户平均月均用水量估计为
(1.5×12+3.5×24+5.5×40+7.5×18+9.5×6)/100=5.14.
上级支援该乡的月调水量应为5.14×1 200=6 168.
答 上级支援该乡的月调水量是6 168吨.