课件55张PPT。
第 二 章 统计知能整合提升热点考点例析答案: 25答案: 56.19
答案: D答案: A答案: C答案: B答案: 2
谢谢观看!章末综合测评(二) 统计
(时间120分钟,满分150分)
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.某学校为了调查高一年级的200名学生完成课后作业所需时间,采取了两种抽样调查的方式:第一种由学生会的同学随机抽取20名同学进行抽查;第二种由教务处对该年级的学生进行编号,从001到200,抽取学号最后一位为2的同学进行调查.则这两种抽样的方法依次是( )
A.分层抽样,简单随机抽样
B.简单随机抽样,分层抽样
C.分层抽样,系统抽样
D.简单随机抽样,系统抽样
【解析】 由抽样方法的概念知,第一种是简单随机抽样,第二种是系统抽样.
【答案】 D
2.小波一星期的总开支分布如图1①所示,一星期的食品开支如图1②所示,则小波一星期的鸡蛋开支占总开支的百分比为( )
图1
A.1% B.2%
C.3% D.5%
【解析】 由题图②知,小波一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%.
【答案】 C
3.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,则由此求出的平均数与实际平均数的差是( )
A.3.5 B.-3
C.3 D.-0.5
【解析】 少输入90,=3,平均数少3,求出的平均数减去实际平均数等于-3.
【答案】 B
4.某校现有高一学生210人,高二学生270人,高三学生300人,学校学生会用分层抽样的方法从这三个年级的学生中抽取n个学生进行问卷调查,如果已知从高一学生中抽取的人数为7人,那么从高三学生中抽取的人数应为( )
A.10 B.9
C.8 D.7
【解析】 由题意知抽取的比例为=,
故从高三中抽取的人数为300×=10.
【答案】 A
5.一个容量为100的样本,其数据的分组与各组的频数如下:
组别
[0,10)
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70]
频数
12
13
24
15
16
13
7
则样本数据在[10,40)上的频率为( )
A.0.13 B.0.39
C.0.52 D.0.64
【解析】 频率为=0.52.
【答案】 C
6.如图2是一容量为100的样本的质量的频率分布直方图,则由图可估计样本质量的中位数为( )
图2
A.11 B.11.5
C.12 D.12.5
【解析】 由频率分布直方图得组距为5,故样本质量在[5,10),[10,15)内的频率分别为0.3和0.5,从而中位数为10+×5=12,故选C.
【答案】 C
7.高三某班有学生56人,现将所有同学随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号、33号、47号学生在样本中,则样本中还有一个学生的编号为( )
A.13 B.17
C.19 D.21
【解析】 因为47-33=14,所以由系统抽样的定义可知样本中的另一个学生的编号为5+14=19.
【答案】 C
8.在某次测量中得到的A样本数据如下:52,54,54,56,56,56,55,55,55,55.若B样本数据恰好是A样本数据都加6后所得数据,则A,B两样本的下列数字特征对应相同的是( )
A.众数 B.平均数
C.中位数 D.标准差
【解析】 由题意可知B样本的数据为58,60,60,62,62,62,61,61,61,61,将A样本中的数据由小到大依次排列为52,54,54,55,55,55,55,56,56,56,将B样本中的数据由小到大依次排列为58,60,60,61,61,61,61,62,62,62,因此A样本的众数为55,B样本的众数为61,A选项错误;A样本的平均数为54.8,B样本的平均数为60.8,B选项错误;A样本的中位数为55,B样本的中位数为61,C选项错误;事实上,在A样本的每个数据上加上6后形成B样本,样本的稳定性不变,因此两个样本的标准差相等,故选D.
【答案】 D
9.如图3茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩.(单位:分)
图3
已知甲组数据的平均数为17,乙组数据的中位数为17,则x,y的值分别为( )
A.2,6 B.2,7
C.3,6 D.5,7
【解析】 依题意得9+10×2+2+x+20×2+7+4=17×5,即x=5;y=7,故选D.
【答案】 D
10.在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的,且样本容量为160,则中间一组的频数为( )
A.32 B.0.2
C.40 D.0.25
【解析】 由频率分布直方图的性质,可设中间一组的频率为x,则x+4x=1,
所以x=0.2,故中间一组的频数为160×0.2=32,选A.
【答案】 A
11.如图4所示,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则( )
图4
A.A>B,sA>sB B.A<B,sA>sB
C.A>B,sA<sB D.A<B,sA<sB
【解析】 A中的数据都不大于B中的数据,所以A<B,但A中的数据比B中的数据波动幅度大,所以sA>sB.
【答案】 B
12.(2014·陕西高考)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )
A.,s2+1002 B.+100,s2+1002
C.,s2 D.+100,s2
【解析】 =,yi=xi+100,所以y1,y2,…,y10的均值为+100,方差不变,故选D.
【答案】 D
二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上).
13.(2014·天津高考)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.
【解析】 根据题意,应从一年级本科生中抽取的人数为×300=60.
【答案】 60
14.某地区对某路段公路上行驶的汽车速度实施监控,从中抽取50辆汽车进行测试分析,得到如图5所示的时速的频率分布直方图,根据下图,时速在70 km/h以下的汽车有________辆.
图5
【解析】 由频率分布直方图可得时速在70 km/h以下的频率是(0.01+0.03)×10=0.4,所以频数是0.4×50=20.
【答案】 20
15.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下:
零件数x(个)
10
20
30
40
50
加工时间y(分钟)
64
69
75
82
90
由表中数据,求得线性回归方程为=0.65x+,根据回归方程,预测加工70个零件所花费的时间为________分钟.
【解析】 由数据可得=30,=76,将中心点(30,76)代入线性回归方程可得=76-0.65×30=56.5,所以线性回归方程为=0.65x+56.5.当x=70时,=0.65×70+56.5=102.
【答案】 102
16.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图6).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________. 【导学号:28750046】
图6
【解析】 ∵0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,
∴a=0.030.
设身高在[120,130),[130,140),[140,150]三组的学生分别有x,y,z人,
则=0.030×10,解得x=30.
同理,y=20,z=10.
故从[140,150]的学生中选取的人数为×18=3.
【答案】 0.030 3
三、解答题(本大题共6小题,共70分,解答应写出文字说明,证明过程或演算步骤)
17.(本小题满分10分)一批产品中,有一级品100个,二级品60个,三级品40个,分别用系统抽样和分层抽样的方法,从这批产品中抽取一个容量为20的样本.
【解】 (1)系统抽样的方法:
先将200个产品随机编号:001,002,…,200,再将200个产品按001~010,011~020,…,191~200,分成20组,每组10个产品,在第一组内用简单随机抽样确定起始的个体编号,按事先确定的规则,从每组中分别抽取样本,这样就得到一个容量为20的样本.
(2)分层抽样的方法:
先将总体按其级别分为三层,一级品有100个,产品按00,01,…,99编号;二级品有60个,产品按00,01,…,59编号;三级品有40个,产品按00,01,…,39编号.因总体个数:样本容量为10∶1,故用简单随机抽样的方法:在一级品中抽10个,二级品中抽6个,三级品中抽4个.这样就得到一个容量为20的样本.
18.(本小题满分12分)某公司为了了解一年内的用水情况,抽取了10天的用水量如下表所示:
天数
1
1
1
2
2
1
2
用水量/吨
22
38
40
41
44
50
95
(1)在这10天中,该公司用水量的平均数是多少?
(2)在这10天中,该公司每天用水量的中位数是多少?
(3)你认为应该用平均数和中位数中的哪一个数来描述该公司每天的用水量?
【解】 (1)=(22+38+40+2×41+2×44+50+2×95)=51(吨).
(2)中位数为=42.5(吨).
(3)平均数受数据中的极端值(2个95)影响较大,使平均数在估计总体时可靠性降低,10天的用水量有8天都在平均值以下,故用中位数描述每天的用水量更合适.
19.(本小题满分12分)两台机床同时生产一种零件,在10天中,两台机床每天的次品数如下:
甲:1,0,2,0,2,3,0,4,1,2.
乙:1,3,2,1,0,2,1,1,0,1.
(1)哪台机床次品数的平均数较小?
(2)哪台机床的生产状况比较稳定?
【解】 (1)甲=(1+0+2+0+2+3+0+4+1+2)×=1.5,
乙=(1+3+2+1+0+2+1+1+0+1)×=1.2.
∵甲>乙,
∴乙车床次品数的平均数较小.
(2)s=[(1-1.5)2+(0-1.5)2+(2-1.5)2+(0-1.5)2+(2-1.5)2+(3-1.5)2+(0-1.5)2+(4-1.5)2+(1-1.5)2+(2-1.5)2]=1.65,
同理s=0.76,∵s>s,
∴乙车床的生产状况比较稳定.
20.(本小题满分12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下:(单位:cm)
甲:9,10,11,12,10,20
乙:8,14,13,10,12,21.
图7
(1)在如图7给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;
(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.
【解】 (1)茎叶图如图所示:
(2) 甲==12,
乙==13,
s≈13.67,s≈16.67.
因为甲<乙,所以乙种麦苗平均株高较高,又因为s<s,所以甲种麦苗长得较为整齐.
21.(本小题满分12分)某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数如下表:
尿汞含量x
2
4
6
8
10
消光系数y
64
134
205
285
360
(1)如果y与x之间具有线性相关关系,求回归直线方程;
(2)估计尿汞含量为9 mg/L时的消光系数.
【解】 (1)设回归直线方程为=x+.
∵=6,=209.6,
∴===37.15.
∴=209.6-37.15×6=-13.3.
∴回归方程为=37.15x-13.3.
(2)∵当x=9时,=37.15×9-13.3≈321,
∴估计尿汞含量为9 mg/L时消光系数为321.
22.(本小题满分12分)某班100名学生期中考试语文成绩的频率分布直方图如图8所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].
图8
(1)求图中a的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段
[50,60)
[60,70)
[70,80)
[80,90)
x∶y
1∶1
2∶1
3∶4
4∶5
【解】 (1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005.
(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).
(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5;0.04×10×100=40;0.03×10×100=30;0.02×10×100=20.
由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5;40×=20;30×=40;20×=25.
故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.
第二章 统 计(A)
(时间:120分钟 满分:150分)
一、选择题(本大题共12小题,每小题5分,共60分)
1.从某年级1 000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是( )
A.1 000名学生是总体
B.每个被抽查的学生是个体
C.抽查的125名学生的体重是一个样本
D.抽取的125名学生的体重是样本容量
2.由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于-1,那么对于样本1,x1,-x2,x3,-x4,x5的中位数可以表示为( )
A.(1+x2) B.(x2-x1)
C.(1+x5) D.(x3-x4)
3.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别应抽取的人数是( )
A.7,11,19 B.6,12,18
C.6,13,17 D.7,12,17
4.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
5.已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是,那么另一组数3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数,方差分别是( )
A.2, B.2,1
C.4, D.4,3
6.某学院有4个饲养房,分别养有18,54,24,48只白鼠供实验用.某项实验需抽取24只白鼠,你认为最合适的抽样方法是( )
A.在每个饲养房各抽取6只
B.把所有白鼠都加上编有不同号码的颈圈,用随机抽样法确定24只
C.从4个饲养房分别抽取3,9,4,8只
D.先确定这4个饲养房应分别抽取3,9,4,8只,再由各饲养房自己加号码颈圈,用简单随机抽样的方法确定
7.下列有关线性回归的说法,不正确的是( )
A.相关关系的两个变量不一定是因果关系
B.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.任一组数据都有回归直线方程
8.已知施肥量与水稻产量之间的回归直线方程为 =4.75x+257,则施肥量x=30时,对产量y的估计值为( )
A.398.5 B.399.5
C.400 D.400.5
9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3
10.某高中在校学生2 000人,高一与高二人数相同并都比高三多1人.为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动.每人都参加而且只参与了其中一项比赛,各年级参与比赛人数情况如下表:
高一
高二
高三
跑步
a
b
c
登山
x
y
z
其中a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高二参与跑步的学生中应抽取( )
A.36人 B.60人
C.24人 D.30人
11.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们所有比赛得分的情况用如右图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为( )
A.19,13 B.13,19
C.20,18 D.18,20
12.从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下:
分组
[90,100)
[100,110)
[110,120)
[120,130)
[130,140)
[140,150]
频数
1
2
3
10
3
1
则这堆苹果中,质量不小于120克的苹果数约占苹果总数的( )
A.30% B.70%
C.60% D.50%
题号
1
2
3
4
5
6
7
8
9
10
11
12
答案
二、填空题(本大题共4小题,每小题5分,共20分)
13.甲、乙、丙、丁四名射击手在选拔赛中的平均环数及其标准差s如下表所示,则选送决赛的最佳人选应是________.
甲
乙
丙
丁
7
8
8
7
s
2.5
2.5
2.8
3
14.一组数据23,27,20,18,x,12,它们的中位数是21,即x是________.
15.某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份
2005
2006
2007
2008
2009
收入x
11.5
12.1
13
13.3
15
支出Y
6.8
8.8
9.8
10
12
根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.
16.某单位为了了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与当天气温.
气温(℃)
14
12
8
6
用电量(度)
22
26
34
38
由表中数据得回归直线方程 = x+ 中 =-2,据此预测当气温为5℃时,用电量的度数约为______.
三、解答题(本大题共6小题,共70分)
17.(10分)一批产品中,有一级品100个,二级品60个,三级品40个,用分层抽样的方法,从这批产品中抽取一个容量为20的样本,写出抽样过程.
18.(12分)为了了解学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)学生跳绳次数的中位数落在哪个小组内?
(2)第二小组的频率是多少?样本容量是多少?
(3)若次数在110以上(含110次)为良好,试估计该学校全体高一学生的良好率是多少?
19.(12分)为了研究三月下旬的平均气温(x)与四月棉花害虫化蛹高峰日(y)的关系,某地区观察了2003年至2008年的情况,得到下面数据:
年份
2003
2004
2005
2006
2007
2008
x(℃)
24.4
29.6
32.9
28.7
30.3
28.9
y
19
6
1
10
1
8
已知x与y之间具有线性相关关系,据气象预测该地区在2010年三月下旬平均气温为27℃,试估计2010年四月化蛹高峰日为哪天?
20.(12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程 =x+ ;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
21.(12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下:(单位:cm)
甲:9,10,11,12,10,20
乙:8,14,13,10,12,21.
(1)在右面给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;
(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.
22.(12分)从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.
试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数.
(2)这50名学生的平均成绩.
第二章 统 计(A)
1.C [在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量.”因此题中所指的对象应是体重,故A、B错误,样本容量应为125,故D错误.]
2.C [由题意把样本从小到大排序为x1,x3,x5,1,-x4,-x2,因此得中位数为(1+x5).]
3.B [因27∶54∶81=1∶2∶3,×36=6,×36=12,×36=18.]
4.C [由点的分布知x与y负相关,u与v正相关.]
5.D [因为数据x1,x2,x3,x4,x5的平均数是2,方差是,
所以=2, (xi-2)2=,
因此数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为:
(3xi-2)=3×xi-2=4,
方差为: (3xi-2-)2= (3xi-6)2=9× (xi-2)2=9×=3.]
6.D [因为这24只白鼠要从4个饲养房中抽取,因此要用分层抽样决定各个饲养房应抽取的只数,再用简单随机抽样法从各个饲养房选出所需白鼠.C虽然用了分层抽样,但在每个层中没有考虑到个体的差异,也就是说在各个饲养房中抽取样本时,没有表明是否具有随机性,故选D.]
7.D [根据两个变量具有相关关系的概念,可知A正确,散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B、C正确.只有线性相关的数据才有回归直线方程,所以D不正确.]
8.B [成线性相关关系的两个变量可以通过回归直线方程进行预测,本题中当x=30时, =4.75×30+257=399.5.]
9.D [由于甲地总体均值为3,中位数为4,即中间两个数(第5、6天)人数的平均数为4,因此后面的人数可以大于7,故甲地不符合.乙地中总体均值为1,因此这10天的感染人数总和为10,又由于方差大于0,故这10天中不可能每天都是1,可以有一天大于7,故乙地不符合.丙地中中位数为2,众数为3,3出现的最多,并且可以出现8,故丙地不符合.故丁地符合.]
10.A [由题意知高一、高二、高三的人数分别为667,667,666.
设a=2k,b=3k,c=5k,
则a+b+c=×2 000,即k=120.
∴b=3×120=360.
又2 000人中抽取200人的样本,即每10人中抽取一人,则360人中应抽取36人,故选A.]
11.A [分别将甲、乙两名运动员的得分从小到大排列,中间位置的分数则为中位数.]
12.B [由数据分布表可知,质量不小于120克的苹果有10+3+1=14(个),占苹果总数的×100%=70%.]
13.乙
解析 平均数反映平均水平大小,标准差表明稳定性.标准差越小,稳定性越好.
14.22
15.13 正
16.40
解析 ∵=(14+12+8+6)=10,
=(22+26+34+38)=30,
∴ =- =30+2×10=50.
∴当x=5时, =-2×5+50=40.
17.解 分层抽样方法:
先将总体按其级别分为三层,一级品有100个,产品按00,01,…,99编号,二级品有60个,产品按00,01,…,59编号,三级品有40个,产品按00,01,…,39编号.因总体个数∶样本容量为10∶1,故用简单随机抽样的方法,在一级品中抽10个,二级品中抽6个,三级品中抽4个.这样就可得到一个容量为20的样本.
18.解 (1)∵前三组的频率和为=<,
前四组的频率之和为=>,
∴中位数落在第四小组内.
(2)频率为:=0.08,
又∵频率=,
∴样本容量===150.
(3)由图可估计所求良好率约为:
×100%=88%.
19.解 由题意知:
≈29.13,=7.5,
x=5 130.92,
xiyi=1 222.6,
∴ =≈-2.2,
=- ≈71.6,
∴回归方程为 =-2.2x+71.6.
当x=27时, =-2.2×27+71.6=12.2,据此,可估计该地区2010年4月12日或13日为化蛹高峰日.
20.解 (1)散点图如下:
(2)==4.5,==3.5,
xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
x=32+42+52+62=86,
∴===0.7,
=- =3.5-0.7×4.5=0.35.
∴ =0.7x+0.35.
∴所求的回归直线方程为 =0.7x+0.35.
(3)现在生产100吨甲产品用煤
=0.7×100+0.35=70.35,
∴90-70.35=19.65.
∴生产能耗比技改前降低约19.65吨标准煤.
21.解 (1)茎叶图如图所示:
(2)甲==12,
乙==13,
s=×[(9-12)2+(10-12)2+(11-12)2+(12-12)2+(10-12)2+(20-12)2]≈13.67,
s=×[(8-13)2+(14-13)2+(13-13)2+(10-13)2+(12-13)2+(21-13)2]≈16.67.
因为甲<乙,所以乙种麦苗平均株高较高,又因为s22.解 (1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形框的中间值的横坐标即为所求,所以众数应为75.
由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.
∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,
∴前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,
∴中位数应位于第四个小矩形内.
设其底边为x,高为0.03,
∴令0.03x=0.2得x≈6.7,故中位数约为70+6.7=76.7.
(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.
∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈74.
第二章 统 计(B)
(时间:120分钟 满分:150分)
一、选择题(本大题共12小题,每小题5分,共60分)
1.对于给定的两个变量的统计数据,下列说法正确的是( )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
2.一组数据中的每一个数据都乘以2,再减去80,得到一组新数据,若求得新的数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )
A.40.6,1.1 B.48.8,4.4
C.81.2,44.4 D.78.8,75.6
3.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如右图,则下面结论中错误的一个是( )
A.甲的极差是29 B.乙的众数是21
C.甲罚球命中率比乙高 D.甲的中位数是24
4.某学院A,B,C三个专业共有1 200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取的学生人数为( )
A.30 B.40
C.50 D.60
5.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.4、8.4、9.4、9.9、9.6、9.4、9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A.9.4,0.484 B.9.4,0.016
C.9.5,0.04 D.9.5,0.016
6.两个变量之间的相关关系是一种( )
A.确定性关系 B.线性关系
C.非确定性关系 D.非线性关系
7.如果在一次实验中,测得(x,y)的四组数值分别是A(1,3),B(2,3.8),C(3,5.2),D(4,6),则y与x之间的回归直线方程是( )
A. =x+1.9 B. =1.04x+1.9
C. =0.95x+1.04 D. =1.05x-0.9
8.现要完成下列3项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查.
②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈.
③东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
较为合理的抽样方法是( )
A.①简单随机抽样,②系统抽样,③分层抽样
B.①简单随机抽样,②分层抽样,③系统抽样
C.①系统抽样,②简单随机抽样,③分层抽样
D.①分层抽样,②系统抽样,③简单随机抽样
9.从存放号码分别为1,2,…,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:
卡片号码
1
2
3
4
5
6
7
8
9
10
取到的次数
13
8
5
7
6
13
18
10
11
9
则取到号码为奇数的频率是( )
A.0.53 B.0.5
C.0.47 D.0.37
10.某校对高一新生进行军训,高一(1)班学生54人,高一(2)班学生42人,现在要用分层抽样的方法,从两个班中抽出部分学生参加4×4方队进行军训成果展示,则(1)班,(2)班分别被抽取的人数是( )
A.9人,7人 B.15人,1人
C.8人,8人 D.12人,4人
11.右图是根据《山东统计年鉴2010》中的资料作成的2000年至2009年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到2000年至2009年我省城镇居民百户家庭人口数的平均数为( )
A.304.6 B.303.6
C.302.6 D.301.6
12.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如表所示:
甲的成绩
环数
7
8
9
10
频数
5
5
5
5
乙的成绩
环数
7
8
9
10
频数
6
4
4
6
丙的成绩
环数
7
8
9
10
频数
4
6
6
4
s1、s2、s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( )
A.s3>s1>s2 B.s2>s1>s3
C.s1>s2>s3 D.s2>s3>s1
题号
1
2
3
4
5
6
7
8
9
10
11
12
答案
二、填空题(本大题共4小题,每小题5分,共20分)
13.已知一个回归直线方程为 =1.5x+45(xi∈{1,5,7,13,19}),则=________.
14.若a1,a2,…,a20这20个数据的平均数为,方差为0.21,则a1,a2,…,a20,这21个数据的方差为________.
15.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
16.某公司有员工49人,其中30岁以上的员工有14人,没超过30岁的员工有35人,为了解员工的健康情况,用分层抽样方法抽一个容量为7的样本,其中30岁以上的员工应抽取________人.
三、解答题(本大题共6小题,共70分)
17.(10分)某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:
广告支出x(单位:万元)
1
2
3
4
销售收入y(单位:万元)
12
28
42
56
(1)画出表中数据的散点图;
(2)求出y对x的回归直线方程;
(3)若广告费为9万元,则销售收入约为多少万元?
18.(12分)炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据如下表所示:
x(0.01%)
104
180
190
177
147
134
150
191
204
121
y(min)
100
200
210
185
155
135
170
205
235
125
(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?
(2)求回归直线方程;
(3)预测当钢水含碳量为160时,应冶炼多少分钟?
19.(12分)甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价.
20.(12分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:
家庭编号
1
2
3
4
5
6
7
8
9
10
xi收入)
千元
0.8
1.1
1.3
1.5
1.5
1.8
2.0
2.2
2.4
2.8
yi(支出)
千元
0.7
1.0
1.2
1.0
1.3
1.5
1.3
1.7
2.0
2.5
(1)判断家庭平均收入与月平均生活支出是否相关?
(2)若二者线性相关,求回归直线方程.
21.(12分)某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类,B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).
(1)A类工人中和B类工人中各抽查多少工人?
(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.
表1
生产能
力分组
[100,110)
[110,120)
[120,130)
[130,140)
[140,150)
人数
4
8
x
5
3
表2
生产能
力分组
[110,120)
[120,130)
[130,140)
[140,150)
人数
6
y
36
18
①先确定x,y,再补全下列频率分布直方图.就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)
图1 A类工人生产能力的频率分布直方图
图2 B类工人生产能力的频率分布直方图
②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).
22.(12分)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验.测得的数据如下:
零件数
x(个)
10
20
30
40
50
60
70
80
90
100
加工时间
y(分)
62
68
75
81
89
95
102
108
115
122
(1)y与x是否具有线性相关关系?
(2)如果y与x具有线性相关关系,求回归直线方程;
(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?
第二章 统 计(B)
1.C [给出一组样本数据,总可以作出相应的散点图,但不一定能分析出两个变量的关系,更不一定符合线性相关或有函数关系.]
2.A
3.D [甲的极差是37-8=29;乙的众数显然是21;甲的平均数显然高于乙,即C成立;甲的中位数应该是=23.]
4.B [由题知C专业有学生1 200-380-420=400(名),那么C专业应抽取的学生数为120×=40名.]
5.D [去掉一个最高分9.9后再去掉一个最低分8.4,剩余的分值为9.4、9.4、9.6、9.4、9.7.
求平均值=9.5,代入方差运算公式可知方差为0.016.]
6.C 7.B
8.A [①总体较少,宜用简单随机抽样;②已分段,宜用系统抽样;③各层间差距较大,宜用分层抽样,故选A.]
9.A [(13+5+6+18+11)=0.53.]
10.A [高一(1)班与(2)班共有学生96人,现抽出16名学生参加方队展示,所以抽取(1)班人数为×54=9(人),抽取(2)班人数为×42=7(人).]
11.B
12.B [∵s=(x+x+…+x)-2,
∴s=(5×72+5×82+5×92+5×102)-8.52=73.5-72.25=1.25=,
∴s1=.同理s2=,s3=,∴s2>s1>s3,故选B.]
13.58.5
解析 回归直线方程为 =1.5x+45经过点(, ),由=9,知=58.5.
14.0.2
15.0.030 3
解析 因5个矩形面积之和为1,即(0.005+0.010+0.020+a+0.035)×10=1,
∴0.070×10+10a=1,∴a=0.030.
由于三组内学生数的频率分别为:0.3,0.2,0.1,所以三组内学生的人数分别为30,20,10.
因此从[140,150]内选取的人数为×18=3.
16.2
17.解 (1)作出的散点图如图所示
(2)观察散点图可知各点大致分布在一条直线附近,列出下表:
序号
x
y
x2
xy
1
1
12
1
12
2
2
28
4
56
3
3
42
9
126
4
4
56
16
224
∑
10
138
30
418
易得=,=,
所以 ===,
=- =-×=-2.
故y对x的回归直线方程为 =x-2.
(3)当x=9时, =×9-2=129.4.
故当广告费为9万元时,销售收入约为129.4万元.
18.解 (1)以x轴表示含碳量,y轴表示冶炼时间,可作散点图如图所示:
从图中可以看出,各点散布在一条直线附近,即它们线性相关.
(2)列出下表,并用科学计算器进行计算:
i
1
2
3
4
5
6
7
8
9
10
xi
104
180
190
177
147
134
150
191
204
121
yi
100
200
210
185
155
135
170
205
235
125
xiyi
10 400
36 000
39 900
32 745
22 785
18 090
25 500
39 155
47 940
15 125
=159.8,=172,
x=265 448,y=312 350,xiyi=287 640
设所求的回归直线方程为 = x+ ,
=≈1.267, =- ≈-30.47.
所求回归直线方程为
=1.267x-30.47.
(3)当x=160时, =1.267×160+(-30.47)=172.25.
即当钢水含碳量为160时,应冶炼约172.25分钟.
19.解 (1)由图象可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
甲==13,
乙==13,
s=[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s=[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s>s可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
20.解 (1)作出散点图:
观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系.
(2)=(0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,
=(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,
xiyi=27.51,x=33.72,
=≈0.813 6,
=1.42-1.74×0.813 6≈0.004 3,
∴回归方程为 =0.813 6x+0.004 3.
21.解 (1)A类工人中和B类工人中分别抽查25名和75名.
(2)①由4+8+x+5+3=25,得x=5,6+y+36+18=75,得y=15.
频率分布直方图如下:
图1 A类工人生产能力的频率分布直方图
图2 B类工人生产能力的频率分布直方图
从直方图可以判断:B类工人中个体间的差异程度更小.
②A=×105+×115+×125+×135+×145=123,
B=×115+×125+×135+×145=133.8,
=×123+×133.8=131.1.
A类工人生产能力的平均数,B类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.
22.解 (1)作出如下散点图:
由图可知,y与x具有线性相关关系.
(2)列出下表
i
1
2
3
4
5
6
7
8
9
10
xi
10
20
30
40
50
60
70
80
90
100
yi
62
68
75
81
89
95
102
108
115
122
xiyi
620
1 360
2 250
3 240
4 450
5 700
7 140
8 640
10 350
12 200
=55,=91.7,
x=38 500,y=87 777,xiyi=55 950,
设所求的回归直线方程为 = x+ ,则有
==≈0.668,
=- =91.7-0.668×55=54.96,
因此,所求的回归直线方程为 =0.668x+54.96.
(3)这个回归直线方程的意义是当x每增加1时,y的值约增加0.668,而54.96是y不随x变化而变化的部分,因此,当x=200时,y的估计值为
=0.668×200+54.96=188.56≈189,
因此,加工200个零件所用的时间约为189分.
课件25张PPT。第二章 统计习题课1.从总体上把握三种抽样方法的区别和联系;
2.学会根据不同情况,选用适合的抽样方法;
3.进一步熟练三种抽样方法的操作步骤.问题导学题型探究达标检测学习目标知识点一 抽样答案问题导学 新知探究 点点落实答案 用样本估计总体.思考1 抽样的根本目的是什么?答案 样本的代表性,每个个体被抽到的机会是否均等.思考2 评价抽样方法好坏的首要标准是什么?思考 常用的抽样方法有哪些?怎样选用?知识点二 抽样方法答案 简单随机抽样;系统抽样;分层抽样.
总体中的个体数较少,采用简单随机抽样;个体数较多,采用系统抽样;总体分为差异明显的若干层,采用分层抽样.答案返回类型一 简单随机抽样解析答案反思与感悟题型探究 重点难点 个个击破例1 今用简单随机抽样从含有6个个体的总体中抽取一个容量为2的样本.问:
(1)总体中的某一个体a在第一次抽取时被抽到的可能性是多少?
(2)个体a不是在第1次被抽到,而是在第2次被抽到的可能性是多少?
(3)在整个抽样过程中,个体a被抽到的可能性是多少? ??反思与感悟简单随机抽样的特点:(1)抽取的个体数较少;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.抽签法适于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.反思与感悟解析答案跟踪训练1 某公司甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )
A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法解析 ①因为抽取销售点与地区有关,因此要采用分层抽样法;
②从20个特大型销售点中抽取7个调查,总体和样本都比较少,适合采用简单随机抽样法.
答案 B类型二 系统抽样解析答案反思与感悟例2 某学校有3 004名学生,从中抽取30名学生参加问卷调查,试用系统抽样的方法完成对样本的抽取.解 第一步,将3 004名学生编号为0000,0001,…,3003.
第二步,利用随机数法从中找出4个号,并将对应的4名学生排除.
第三步,将剩余的3 000名学生重新编号为0000,0001,…,2999,并将总体均分成30组,每组含有100名学生.
第四步,在第一组中用简单随机抽样的方法抽取号码l.
第五步,将编号为l,l+100,l+200,…,l+2900对应的学生抽出,组成样本.?反思与感悟跟踪训练2 在120个零件中,一级品24个,二级品36个,三级品60个,用系统抽样方法从中抽取容量为20的样本,则三级品a被抽到的可能性为
___.?解析答案?类型三 分层抽样解析答案反思与感悟例3 某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户.从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户,进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.?反思与感悟分层抽样遵循的原则:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层抽样为保证每个个体等可能入样需遵循每层的抽样比相同,抽样比即样本容量与总体数目的比值.反思与感悟跟踪训练3 将一个总体分为A、B、C三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C中抽取___个个体.解析答案返回?201.抽样方法有( )
A.抽签法、系统抽样和分层抽样
B.随机数法、抽签法和分层抽样法
C.简单随机抽样、分层抽样和系统抽样
D.系统抽样、分层抽样和随机数法C达标检测 12345解析 我们常用的抽样方法有简单随机抽样、分层抽样和系统抽样,而抽签法和随机数法,只是简单随机抽样的两种不同抽取方法,故选C.解析答案2.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于( )
A.9 B.10 C.12 D.13D12345解析答案3.下列问题中,最适合用分层抽样的是( )
A.某电影院有32排座位,每排有40个座位,座位号是1~40.有一次报告会
坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检查
C.某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩,
现抽取农田480亩估计全乡农田平均产量
D.从50个零件中抽取5个做质量检验解析 A的总体容量较大,宜采用系统抽样法;
B的总体容量较小,宜用简单随机抽样法;
C总体容量较大,且各类田地的产量差别很大,宜采用分层抽样法;
D与B类似.解析答案C123454.①教育局到某学校检查工作,打算在每个班各抽调2人参加座谈;②某班期中考试有10人在85分以上,25人在60~84分,5人不及格,欲从中抽出8人参加改进教与学研讨;③某班级举行元旦晚会,要产生两名“幸运者”,则合适的抽样方法分别为( )
A.系统抽样,系统抽样,简单随机抽样
B.简单随机抽样,分层抽样,简单随机抽样
C.系统抽样,分层抽样,简单随机抽样
D.分层抽样,简单随机抽样,简单随机抽样12345答案C123455.某大型超市销售的乳类商品有4类:鲜奶、酸奶、婴幼儿奶粉、成人奶粉,且分别有45种、10种、25种、20种不同的品牌,现从中抽取一个容量为20的样本进行三聚氰胺的安全检测,若采用分层抽样的方法抽取样本,则抽取的酸奶与成人奶粉品牌数之和是( )
A.7 B.6 C.5 D.4解析答案B规律与方法?返回4.几种抽样方法的共同特点是它们在抽样过程中,属不放回抽样,且每次抽取时,总体内的各个个体被抽到的机会是相等的.这体现了这些抽样方法的客观性和公平性.课件41张PPT。第二章 统计章末复习课1.会根据不同的特点选择适当的抽样方法获得样本数据;
2.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计总体;
3.能利用散点图对两个变量是否相关进行初步判断,能用回归方程进行预测.知识整合题型探究达标检测学习目标[知识网络]知识整合 新知探究 点点落实 答案[图表梳理] 最高小长方形底边的中点所对应的数据面积小长方形底边中点的横坐标答案面积答案[知识梳理]1.抽样方法
(1)当总体容量较小,样本容量也较小时,可采用 .
(2)当总体容量较大,样本容量较小时,可用 .
(3)当总体容量较大,样本容量也较大时,可用 .
(4)当总体由差异明显的几部分组成时,可用 .
2.用样本估计总体
用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率
与频率 .当样本只有两组数据且样本容量比较小时,用
刻画数据比较方便.抽签法随机数法系统抽样法分层抽样法分布表分布直方图茎叶图答案3.样本的数字特征
样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括
、 和 ;另一类是反映样本波动大小的,包括 及
.
4.变量间的相关关系
(1) 两个变量之间的相关关系的研究,通常先作变量的 ,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系).众数中位数平均数方差标准差散点图返回类型一 抽样方法的应用解析答案反思与感悟题型探究 重点难点 个个击破例1 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,干事20人,上级机关为了了解机关人员对政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取?解 用分层抽样抽取.即从副处级以上干部中抽取2人,一般干部中抽取14人,干事中抽取4人.
∵副处级以上干部与干事人数都较少,他们分别按1~10编号和1~20编号,然后采用抽签法分别抽取2人和4人,对一般干部采用00,01,…,69编号,然后用随机数法抽取14人.反思与感悟三种抽样方法并非截然分开,它们都能保证个体被抽到的机会相等.反思与感悟解析答案解析 分层抽样的原理是按照各部分所占的比例抽取样本,跟踪训练1 某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( )
A.6 B.8 C.10 D.12设从高二年级抽取的学生数为n,B类型二 用样本的频率分布估计总体分布解析答案例2 有1个容量为100的样本,数据(均为整数)的分组及各组的频数如下:
[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;
[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;
[30.5,33.5),8.
(1)列出样本的频率分布表;解 样本的频率分布表如下:解析答案(2)画出频率分布直方图;解 频率分布直方图如下图.解析答案(3)估计数据小于30的数据约占多大百分比.解 小于30的数据占0.06+0.16+0.18+0.22+0.20+0.10=0.92=92%.反思与感悟借助图表,可以把抽样获得的庞杂数据变得直观,凸显其中的规律,便于信息的提取和交流.反思与感悟跟踪训练2 为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为( )
A.64 B.54 C.48 D.27解析 [4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为1-0.62-0.05-0.11=1-0.78=0.22.
∴a=(0.22+0.32)×100=54.解析答案B类型三 用样本的数字特征估计总体的数字特征解析答案例3 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;解析答案反思与感悟(2)根据计算结果判断哪台机床加工零件的质量更稳定.解 两台机床所加工零件的直径的平均数相同,所以乙机床加工零件的质量更稳定.样本的数字特征就像盲人摸到的象的某一局部特征,只有把它们结合起来才能看到全貌.反思与感悟跟踪训练3 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:解析答案问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?类型四 回归方程的应用解析答案例4 下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;解 散点图如图所示:解析答案解析答案(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?∴预测生产100吨甲产品的生产能耗比技改前降低19.65吨标准煤.反思与感悟散点图经最小二乘法量化为回归方程后,更便于操作(估计、预测),但得到的值仍是估计值.反思与感悟跟踪训练4 2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:解析答案(1)如果已知y与x成线性相关关系,求回归方程;解析答案返回(2)若某家庭年收入为9万元,预测其年饮食支出.1.10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,则数0.4是指1号球占总体分布的( )
A.频数 B.概率 C.频率 D.累积频率C达标检测 12345答案2.为了了解全校1 320名高一学生的身高情况,从中抽取220名学生进行测量,下列说法正确的是( )
A.样本容量是220 B.个体是每一个学生
C.样本是220名学生 D.总体是1 32012345解析答案解析 个体是每一个学生的身高;
样本是220名学生的身高;
总体是全校1 320名高一学生的身高.
A3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:12345解析答案则y对x的回归直线方程为( )C4.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如图,则下面结论中错误的一个是( )
A.甲的极差是29 B.乙的众数是21
C.甲罚球命中率比乙高 D.甲的中位数是2412345解析 甲的极差是37-8=29;
乙的众数显然是21;
甲的平均数显然高于乙,即C成立;
甲的中位数应该是23.D解析答案12345解析答案解析 由频率分布直方图,得低于60分的频率为(0.01+0.005)×20=0.3.5.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )
A.45 B.50
C.55 D.60B规律与方法1.应用抽样方法抽取样本时,应注意以下几点:
(1)用随机数法抽样时,对个体所编的号码位数要相等.当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.2.用样本的频率分布估计总体分布
利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体情况作出估计.直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式,这样根据样本的频率分布,我们可以大致估计出总体的分布.但是,当总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增加,频率分布折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体密度曲线,它能给我们提供更加精细的信息.在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留原始信息,而且可以随时记录,这给数据的记录和表示都带来方便.返回3.用样本的数字特征估计总体的数字特征
为了从整体上更好地把握总体的规律, 我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计.平均数就是所有样本数据的平均值,用 表示;标准差是反映样本数据分散程度大小的最常用统计量,有时也用标准差的平方s2—方差来代替标准差,实质一样.
4.回归方程的应用
分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归方程,并利用回归方程进行估计和预测.章末复习课
课时目标 1.巩固本章主干知识点.2.提高知识的综合应用能力.
1.某质检人员从编号为1~100这100件产品中,依次抽出号码为3,13,23,…,93的产品进行检验,则这样的抽样方法是( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.以上都不对
2.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( )
A.7 B.15
C.25 D.35
3.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
4.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为( )
A.1 B.2
C.3 D.4
5.如果数据x1,x2,…,xn的平均数为,方差为s2,则2x1+3,2x2+3,…,2xn+3的平均数和方差分别为( )
A.和s B.2+3和4s2
C.2+3和s2 D.2+3和4s2+12s+9
6.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有______根棉花纤维的长度小于20 mm.
一、选择题
1.为了调查参加运动会的500名运动员的身高情况,从中抽查了50名运动员的身高,就这个问题来说,下列说法正确的是( )
A.50名运动员是总体
B.每个运动员是个体
C.抽取的50名运动员是样本
D.样本容量是50
2.某高级中学高一年级有十六个班,812人,高二年级有十二个班,605人,高三年级有十个班,497人,学校为加强民主化管理,现欲成立由76人组成的学生代表会,你认为下列代表产生的办法中,最符合统计抽样原则的是( )
A.指定各班团支部书记、班长为代表
B.全校选举出76人
C.高三选举出20人,高二选举出24人,高一选举出32人
D.高三20人,高二24人,高一32人均在各年级随机抽取
3.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40和0.125,则n的值是( )
A.640 B.320
C.240 D.160
4.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000]的频率为( )
A.0.001 B.0.01
C.0.003 D.0.3
5.在某项体育比赛中,七位裁判为一选手打出的分数如下:
90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A.92,2 B.92,2.8
C.93,2 D.93,2.8
6.下列图形中具有相关关系的两个变量是( )
题 号
1
2
3
4
5
6
答 案
二、填空题
7.一个总体中有100个个体,随机编号0,1,2,…,99,依从小到大的编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是________.
8.一个样本容量是100的频率分布如图:
(1)样本落在[60,70)内的频率为________;
(2)样本落在[70,80)内的频数为________;
(3)样本落在[90,100)内的频率是0.16,该小矩形的高是________.
9.某商店统计了最近6个月某商品的进价x与售价y(单位:元)的对应数据如下表:
x
3
5
2
8
9
12
y
4
6
3
9
12
14
假设得到的关于x和y之间的回归直线方程是 = x+ ,那么该直线必过的定点是________.
三、解答题
10.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:
甲
60
80
70
90
70
乙
80
60
70
80
75
分别计算两个样本的平均数和方差s2,并根据计算结果估计甲、乙谁的平均成绩较好?谁的各门功课发展较平衡?
11.下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长度计算的,且对于给定的x,y为正态变量,其方差与x无关.
x(℃)
300
400
500
600
700
800
y(%)
40
50
55
60
67
70
(1)画出散点图;
(2)指出x,y是否线性相关;
(3)若线性相关,求y关于x的回归方程;
(4)估计退水温度是1 000℃时,黄酮延长性的情况.
12.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.
(1)求第二小组的频率,并补全这个频率分布直方图;
(2)求这两个班参赛的学生人数是多少?
(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)
能力提升
13.在一次中学生田径运动会上,参加跳高的17名运动员成绩如下:
成绩
(单位m)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数
2
3
2
3
4
1
1
1
(1)分别求这些运动员成绩的众数、中位数、平均数(保留3个有效数字);
(2)分析这些数据的含义.
14.今年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如下表:(月均用水量的单位:吨)
用水量分组
频数
频率
[0.5,2.5)
12
[2.5,4.5)
[4.5,6.5)
40
[6.5,8.5)
0.18
[8.5,10.5]
6
合计
100
1
(1)请完成该频率分布表,并画出相对应的频率分布直方图和频率分布折线图;
(2)估计样本的中位数是多少?
(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1 200户,请估计上级支援该乡的月调水量是多少吨?
1.三种常用的抽样方法:简单随机抽样、系统抽样和分层抽样.在使用它们的过程中,每一个个体被抽到的可能性是一样的.应用抽样方法抽取样本时,应注意以下几点:
(1)用随机数法抽样时,对个体所编的号码位数是相等的,当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.
(2)用系统抽样法抽样时,如果总体容量N能被样本容量n整除,抽样间隔为k=,如果总体容量N不能被样本容量n整除,先用简单抽样法剔除多余个数、抽样间隔为k=[],([]表示取的整数部分.)
(3)三种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数表法;当总体容量较大,样本容量也较大时,可采用系统抽样法;当总体由差异明显的几部分组成时,可采用分层抽样法.
2.为了从整体上更好地把握总体的规律,可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是把样本数据分成相同数目的两部分,其中一部分比这个数小,另一部分比这个数大的那个数;平均数就是所有样本数据的平均值,用表示;标准差是反映样本数据分散程度大小的最常用统计量,其计算公式如下:
s=.
有时也用标准差的平方s2——方差来代替标准差,实质一样.
3.求回归直线方程的步骤:
(1)先把数据制成表,从表中计算出,,x,y,xiyi;
(2)计算回归系数 , .公式为
(3)写出回归直线方程 = x+ .
答案:
章末复习课
双基演练
1.B
2.B [设样本容量为n,则=,∴n=15.]
3.A
4.D [∵=10,[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]=2,化简得x+y=20,(x-10)2+(y-10)2=8,解得x=12,y=8或x=8,y=12,
∴|x-y|=4.]
5.B [因x1+x2+…+xn=n,
所以
==+3=2+3.
又(x1-)2+(x2-)2+…+(xn-)2=ns2,
所以[2x1+3-(2+3)]2+[2x2+3-(2+3)]2+…+[2xn+3-(2+3)]2=4[(x1-)2+(x2-)2+…+(xn-)2]=4ns2.
所以方差为4s2.]
6.30
解析 纤维长度小于20 mm的频率约为
p=5×0.01+5×0.01+5×0.04=0.3,
∴100×0.30=30.
作业设计
1.D [在这个问题中所要考察的对象是身高,另一方面,样本容量是指样本中的个体数目.]
2.D [以年级为层,按各年级所占的比例进行抽样,为了使抽取的学生具有代表性,应在各年级进行随机抽样.]
3.B [由=0.125,得n=320.]
4.D [频率=×组距,
由图易知:=0.001,组距=3 000-2 700=300,
∴频率=0.001×300=0.3]
5.B [去掉95和89后,剩下5个数据的平均值
==92,
方差s2=[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=2.8.]
6.D [A和B符合函数关系,即对x的每一个值,y都有唯一确定的值与之对应;从C、D散点图来看,D的散点都在某一条直线附近波动,因此两变量具有相关关系.]
7.76
解析 由题意知:m=8,k=8,
则m+k=16,也就是第8组的个位数字为6,
十位数字为8-1=7,故抽取的号码为76.
8.(1)0.2 (2)30 (3)0.016
解析 (1)由×组距=频率,得频率为0.2;
(2)频率为0.3,又由频数=频率×样本容量,得频数为30;
(3)由=高,得小矩形的高是0.016.
9.(6.5,8)
解析 =(3+5+2+8+9+12)=6.5,
=(4+6+3+9+12+14)=8.
由 =- 得= + ,
所以y= x+ 恒过(,),
即过定点(6.5,8).
10.解 甲=(60+80+70+90+70)=74,
乙=(80+60+70+80+75)=73,
s=(142+62+42+162+42)=104,
s=(72+132+32+72+22)=56,
∵甲>乙,s>s;
∴甲的平均成绩较好,乙的各门功课发展较平衡.
11.解 (1)散点图如下.
(2)由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.
(3)列出下表并用科学计算器进行有关计算.
i
1
2
3
4
5
6
xi
300
400
500
600
700
800
yi
40
50
55
60
67
70
xiyi
12 000
20 000
27 500
36 000
46 900
56 000
90 000
160 000
250 000
360 000
490 000
640 000
=550,=57
x2i=1 990 000,xiyi=198 400
于是可得
==≈0.058 86,
=- =57-0.058 86×550=24.627.
因此所求的回归直线方程为
=0.058 86x+24.627.
(4)将x=1 000代入回归方程得
y=0.058 86×1 000+24.627=83.487,
即退水温度是1 000℃时,
黄酮延长性大约是83.487%.
12.解 (1)各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05.
∴第二小组的频率为:
1.00-(0.30+0.15+0.10+0.05)=0.40.
∴落在59.5~69.5的第二小组的小长方形的高===0.04.
则补全的直方图如图所示.
(2)设九年级两个班参赛的学生人数为x人.
∵第二小组的频数为40人,频率为0.40,
∴=0.40,解得x=100(人).
所以九年级两个班参赛的学生人数为100人.
(3)∵0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5,
即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5,所以九年级两个班参赛学生的成绩的中位数应落在第二小组内.
13.解 (1)在17个数据中,1.75出现了4次,次数最多,即众数是1.75;
把成绩从小到大排列,中间一个数即第9个数据是1.70中的一个,即中位数是1.70;
平均数=(1.50×2+1.60×3+…+1.90×1)≈1.69(m)
因此,17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
(2)众数是1.75说明了跳1.75 m的人数最多;中位数是1.70 m说明了1.70 m以下和1.70 m以上的成绩个数相等;平均数是1.69 m说明了所有参赛运动员平均成绩是1.69 m.
14.解 (1)频率分布表与相应的频率分布直方图和频率分布折线图如下:
用水量分组
频数
频率
[0.5,2.5)
12
0.12
[2.5,4.5)
24
0.24
[4.5,6.5)
40
0.40
[6.5,8.5)
18
0.18
[8.5,10.5]
6
0.06
合计
100
1
(2)前两个矩形面积和为0.12+0.24,第三个矩形一半的面积为0.5-(0.12+0.24),则所求的中位数为:4.5+=4.5+0.7=5.2.
(3)该乡每户平均月均用水量估计为
(1.5×12+3.5×24+5.5×40+7.5×18+9.5×6)/100=5.14.
上级支援该乡的月调水量应为5.14×1 200=6 168.
答 上级支援该乡的月调水量是6 168吨.