第二章统计复习学案+检测题(3份)

文档属性

名称 第二章统计复习学案+检测题(3份)
格式 zip
文件大小 880.3KB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2019-05-21 08:13:38

文档简介

滚动训练二(§3.1~§3.2)
一、选择题
1.从10个事件中任取一个事件,若这个事件是必然事件的概率为0.2,是不可能事件的概率为0.3,则这10个事件中随机事件的个数是(  )
A.3 B.4
C.5 D.6
答案 C
解析 这10个事件中,必然事件的个数为10×0.2=2,不可能事件的个数为10×0.3=3.
而必然事件、不可能事件、随机事件是彼此互斥的事件,且它们的个数和为10.
故随机事件的个数为10-2-3=5.故选C.
2.某人练习射击,他脱靶的概率为0.20,命中6环,7环,8环,9环,10环的概率依次为0.10,0.20,0.30,0.15,0.05,则该人射击命中的概率为(  )
A.0.50 B.0.60
C.0.70 D.0.80
答案 D
解析 ∵某人练习射击,他脱靶的概率为0.20,
∴该人射击命中的概率P=1-0.20=0.80.故选D.
3.在甲、乙两个盒子中分别装有标号为1,2,3,4,5的五个球,现从甲、乙两个盒子中各取出1个球,球的标号分别记作a,b,每个球被取出的可能性相等,则|a-b|≤1的概率为(  )
A. B.
C. D.
答案 B
解析 所有的数对(a,b)共有5×5=25个,而满足|a-b|≤1的数对(a,b)有(1,1),(1,2),(2,1),(2,2),(2,3),(3,2),(3,3),(3,4),(4,3),(4,4),(4,5),(5,4),(5,5),共13个,
故|a-b|≤1的概率为.故选B.
4.齐王与田忌赛马,田忌的上等马优于齐王的中等马,劣于齐王的上等马,田忌的中等马优于齐王的下等马,劣于齐王的中等马,田忌的下等马劣于齐王的下等马,现双方各出上、中、下等马各一匹分组分别进行一场比赛,胜两场及以上者获胜,若双方均不知道对方马的出场顺序,则田忌获胜的概率为(  )
A. B.
C. D.
答案 D
解析 设齐王的下等马、中等马、上等马分别记为a1,a2,a3,田忌的下等马、中等马、上等马分别记为b1,b2,b3,
齐王与田忌赛马,其情况有:
(a1,b1),(a2,b2),(a3,b3),齐王获胜;
(a1,b1),(a2,b3),(a3,b2),齐王获胜;
(a2,b1),(a1,b2),(a3,b3),齐王获胜;
(a2,b1),(a1,b3),(a3,b2),齐王获胜;
(a3,b1),(a1,b2),(a2,b3),田忌获胜;
(a3,b1),(a1,b3),(a2,b2),齐王获胜,共6种.
其中田忌获胜的只有一种(a3,b1),(a1,b2),(a2,b3),
则田忌获胜的概率为,故选D.
5.从1,2,3,4中任取2个不同的数,则取出的2个数之差的绝对值为2的概率是(  )
A. B. C. D.
答案 B
解析 基本事件的总数为6,
构成“取出的2个数之差的绝对值为2”这个事件的基本事件的个数为2,
所以所求概率P==,故选B.
6.一个口袋内装有大小相等的1个白球和已编有不同号码的3个黑球,从中摸出2个球.其中“摸出2个黑球”的基本事件有(  )
A.3个 B.4个 C.5个 D.6个
答案 A
解析 由于4个球的大小相等,摸出每个球的可能性是均等的,所以是古典概型.
将黑球编号为黑1,黑2,黑3,从装有4个球的口袋内摸出2个球,所有的基本事件为(黑1,黑2),(黑1,黑3),(黑1,白),(黑2,黑3),(黑2,白),(黑3,白),共6个,其中“摸出2个黑球”的基本事件有3个.
7.从{1,2,3,4,5}中随机选取一个数为a,从{1,2,3}中随机选取一个数为b,则b>a的概率是(  )
A. B. C. D.
答案 D
解析 设“所取的数中b>a”为事件A,如果把选出的数a,b写成数对(a,b)的形式,则基本事件有(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),(4,1),(4,2),(4,3),(5,1),(5,2),(5,3),共15个,事件A包含的基本事件有(1,2),(1,3),(2,3),共3个,因此所求的概率P(A)==.
8.有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为(  )
A. B. C. D.
答案 A
解析 由题意设3个兴趣小组分别为A,B,C.试验发生包含的基本事件为AA,AB,AC,BA,BB,BC,CA,CB,CC,共9种结果,满足条件的事件是这两位同学参加同一个兴趣小组,由于共有三个小组,则有3种结果,根据古典概型概率公式得到P==,故选A.
二、填空题
9.质地均匀的正方体骰子各面上分别标有数字1,2,3,4,5,6,每次抛掷这样两个相同的骰子,规定向上的两个面的数字的和为这次抛掷的点数,则每次抛掷时点数被4除余2的概率是________.
答案 
解析 质地均匀的正方体骰子各面上分别标有数字1,2,3,4,5,6,每次抛掷这样两个相同的骰子,规定向上的两个面的数字的和为这次抛掷的点数,基本事件总数n=6×6=36,每次抛掷时点数被4除余2包含的基本事件有(1,1),(1,5),(5,1),(2,4),(4,2),(3,3),(4,6),(6,4),(5,5),共9个,所以抛掷时点数被4除余2的概率是P==.
10.在3张奖券中有一、二等奖各1张,另1张无奖.甲、乙两人各抽取1张,则两人都中奖的概率是________.
答案 
解析 设中一、二等奖及不中奖分别记为1,2,0,那么甲、乙抽奖结果有(1,2),(1,0),(2,1),(2,0),(0,1),(0,2),共6种.
其中甲、乙都中奖有(1,2),(2,1),共2种,
所以P(A)==.
11.已知x,y∈{0,1,2,3,4,5},P(x,y)是坐标平面内的点,则点P在x轴上方的概率为________.
答案 
解析 由于点P与x轴的位置关系只与纵坐标有关,因此,纵坐标的6种可能结果中,有5种在x轴上方,
所以点P在x轴上方的概率为.
三、解答题
12.某人在如图所示的直角边长为4米的三角形地块的每个格点(指纵、横直线的交叉点以及三角形的顶点)处都种了一株相同品种的作物.根据历年的种植经验,一株该种作物的年收获量Y(单位:kg)与它的“相近”作物株数X(单位:株)之间的关系如下表所示.
X
1
2
3
4
Y
51
48
45
42
这里,两株作物“相近”是指它们之间的直线距离不超过1米.
(1)完成下表,并求所种作物的平均年收获量;
Y
51
48
45
42
频数
4
(2)在所种作物中随机选取一株,求它的年收获量至少为48 kg的概率.
解 (1)所种作物的总株数为1+2+3+4+5=15,其中“相近”作物株数为1的作物有2株,“相近”作物株数为2的作物有4株,“相近”作物株数为3的作物有6株,“相近”作物株数为4的作物有3株,列表如下.
Y
51
48
45
42
频数
2
4
6
3
所种作物的平均年收获量为
===46.
(2)由(1),知P(Y=51)=,P(Y=48)=.
故在所种作物中随机选取一株,它的年收获量至少为48 kg的概率为P(Y≥48)=P(Y=51)+P(Y=48)=+=.
13.已知关于x的一元二次函数f(x)=ax2-bx+1,设集合P={1,2,3},Q={-1,1,2,3,4},分别从集合P和Q中随机取一个数a和b得到数对(a,b).
(1)列举出所有的数对(a,b),并求函数y=f(x)有零点的概率;
(2)求函数y=f(x)在区间[1,+∞)上是增函数的概率.
解 (1)(a,b)共有(1,-1),(1,1),(1,2),(1,3),(1,4),(2,-1),(2,1),(2,2),(2,3),(2,4),(3,-1),(3,1),(3,2),(3,3),(3,4),15种情况.
函数y=f(x)有零点等价于Δ=b2-4a≥0,有(1,2),(1,3),(1,4),(2,3),(2,4),(3,4),共6种情况满足条件.
所以函数y=f(x)有零点的概率为=.
(2)因为a>0,函数y=f(x)图象的对称轴为直线x=,在区间[1,+∞)上是增函数,所以有≤1,满足条件的(a,b)有(1,-1),(1,1),(1,2),(2,-1),(2,1),(2,2),(2,3),(2,4),(3,-1),(3,1),(3,2),(3,3),(3,4),共13种.所以函数y=f(x)在区间[1,+∞)上是增函数的概率为.
四、探究与拓展
14.现有甲、乙、丙、丁4名学生参加学校社团文学社与街舞社的活动,每人参加且只能参加一个社团的活动,且参加每个社团是等可能的.
(1)求文学社和街舞社都至少有1人参加的概率;
(2)求甲、乙在同一个社团,且丙、丁不在同一个社团的概率.
解 甲、乙、丙、丁4名学生参加学校社团文学社与街舞社的情况如下,
文学社
街舞社
1
甲乙丙丁
2
甲乙丙

3
甲乙丁

4
甲丙丁

5
乙丙丁

6
甲乙
丙丁
7
甲丙
乙丁
8
甲丁
乙丙
9
乙丙
甲丁
10
乙丁
甲丙
11
丙丁
甲乙
12

乙丙丁
13

甲丙丁
14

甲乙丁
15

甲乙丙
16
甲乙丙丁
共有16种情形,即有16个基本事件.
(1)文学社或街舞社没有人参加的基本事件有2个,则都至少有1人参加的基本事件有14个,概率为=,
即文学社和街舞社都至少有1人参加的概率为.
(2)甲、乙同在一个社团,且丙、丁不同在一个社团的基本事件有4个,概率为=.
15.某儿童乐园在“六一”儿童节推出了一项趣味活动.参加活动的儿童需转动如图所示的转盘两次,每次转动后,待转盘停止转动时,记录指针所指区域中的数.设两次记录的数分别为x,y.奖励规则如下:
①若xy≤3,则奖励玩具一个;
②若xy≥8,则奖励水杯一个;
③其余情况奖励饮料一瓶.
假设转盘质地均匀,四个区域划分均匀,小亮准备参加此项活动.
(1)求小亮获得玩具的概率;
(2)请比较小亮获得水杯与获得饮料的概率的大小,
并说明理由.
解 (1)用数对(x,y)表示儿童参加活动先后记录的数,则基本事件空间Ω与点集S={(x,y)|x∈N,y∈N,1≤x≤4,1≤y≤4}一一对应.
因为S中元素的个数是4×4=16,
所以基本事件总数n=16,
记“xy≤3”为事件A,则事件A包含的基本事件共5个,即(1,1),(1,2),(1,3),(2,1),(3,1),
所以P(A)=,即小亮获得玩具的概率为.
(2)记“xy≥8”为事件B,“3则事件B包含的基本事件共6个,
即(2,4),(3,3),(3,4),(4,2),(4,3),(4,4).
所以P(B)==.
事件C包含的基本事件共5个,
即(1,4),(2,2),(2,3),(3,2),(4,1).
所以P(C)=.因为>,
所以小亮获得的水杯的概率大于获得饮料的概率.
章末复习
学习目标 1.会根据不同的特点选择适当的抽样方法获得样本数据.2.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计总体.3.能利用散点图对两个变量是否相关进行初步判断,能用线性回归方程进行预测.
1.抽样方法
(1)用随机数法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.
(2)两种抽样方法的异同点
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽到的可能性相同
从总体中逐个抽取
总体中的个体数较少
分层抽样
将总体分成几层,按各层个体数之比抽取
在各层抽样时采用简单随机抽样
总体由差异明显的几部分组成
2.用样本估计总体
(1)用样本估计总体
用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率分布表与频率分布直方图.当样本只有两组数据且样本容量比较小时,用茎叶图刻画数据比较方便.
(2)样本的数字特征
样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差.
3.变量间的相关关系
(1)两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系).
(2)求回归方程的步骤:
①先把数据制成表,从表中计算出,,x,xiyi;
②计算回归系数,,公式为
③写出回归方程=x+.
类型一 用样本的频率分布估计总体
例1 某制造商生产一批直径为40 mm的乒乓球,现随机抽样检查20个,测得每个球的直径(单位:mm,保留两位小数)如下:
40.03 40.00 39.98 40.00 39.99 40.00 39.98
40.01 39.98 39.99 40.00 39.99 39.95 40.01
40.02 39.98 40.00 39.99 40.00 39.96
(1)完成下面的频率分布表,并画出频率分布直方图;
分组
频数
频率

[39.95,39.97)
[39.97,39.99)
[39.99,40.01)
[40.01,40.03]
合计
(2)假定乒乓球的直径误差不超过0.02 mm为合格品.若这批乒乓球的总数为10 000,试根据抽样检查结果估计这批产品的合格个数.
考点 样本估计总体
题点 用样本的频率分布估计总体的频率分布
解 (1)频率分布表如下:
分组
频数
频率

[39.95,39.97)
2
0.10
5
[39.97,39.99)
4
0.20
10
[39.99,40.01)
10
0.50
25
[40.01,40.03]
4
0.20
10
合计
20
1.00
频率分布直方图如图.
(2)∵抽样的20个产品中在[39.98,40.02]范围内的有17个,∴合格品合格率为×100%=85%.
∴10 000×85%=8 500.
故根据抽样检查结果,可以估计这批产品的合格个数为8 500.
反思与感悟 总体分布中相应的统计图表主要包括:频率分布表、频率分布直方图、频率分布折线图等.通过这些统计图表给出的相应统计信息可以估计总体.
跟踪训练1 某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.
考点 样本估计总体
题点 用样本的频率分布估计总体的频率分布
解 (1)如题图所示,用水量在[0.5,3)的频率的和为
(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.
∴用水量小于等于3立方米的频率为0.85,又w为整数,
∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.
(2)当w=3时,该市居民该月的人均水费估计为
(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).
即该市居民该月的人均水费估计为10.5元.
类型二 用样本的数字特征估计总体的数字特征
例2 为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图.
(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为1,2,估计1-2的值.
考点 样本估计总体
题点 用样本的数字特征估计总体的数字特征
解 (1)设甲校高三年级学生总人数为n.
由题意,知=0.05,解得n=600.
样本中甲校高三年级学生数学成绩不及格的人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为
1-=.
(2)设甲、乙两校样本平均数分别为,.
根据样本茎叶图知,30(-)=30-30
=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92
=2+49-53-77+2+92=15.
因此-=0.5,所以1-2的估计值为0.5分.
反思与感悟 样本的数字特征分为两大类:一类是反映样本数据集中趋势的特征数,例如平均数;另一类是反映样本数据波动大小的特征数,例如方差和标准差.通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),从而实现对总体的估计.
跟踪训练2 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:

60
80
70
90
70

80
60
70
80
75
问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?
考点 样本估计总体
题点 用样本的数字特征估计总体的数字特征
解 甲的平均成绩为甲=74,乙的平均成绩为乙=73.所以甲的平均成绩好.
甲的方差是s=[(-14)2+62+(-4)2+162+(-4)2]=104,乙的方差是s=×[72+(-13)2+(-3)2+72+22]=56.
因为s>s,所以乙的各门功课发展较平衡.
类型三 变量间的相关关系
例3 理论预测某城市2020到2024年人口总数与年份的关系如下表所示:
年份202x(年)
0
1
2
3
4
人口数y(十万)
5
7
8
11
19
(1)请画出上表数据的散点图;
(2)指出x与y是否线性相关;
(3)若x与y线性相关,请根据上表提供的数据,用最小二乘法求出y关于x的回归方程=x+;
(4)据此估计2025年该城市人口总数.
(参数数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)
考点 变量间的相关关系
题点 变量间的相关关系
解 (1)数据的散点图如图:
(2)由散点图可知,样本点基本上分布在一条直线附近,故x与y呈线性相关.
(3)由表知=×(0+1+2+3+4)=2,
=×(5+7+8+11+19)=10.
∴==3.2,
=-=3.6,
∴回归方程为=3.2x+3.6.
(4)当x=5时,=19.6(十万)=196万.
故2025年该城市人口总数约为196万.
反思与感悟 对两个变量进行研究,通常是先作出两个变量之间的散点图,根据散点图直观判断两个变量是否具有线性相关关系,如果具有,就可以应用最小二乘法求线性回归方程.由于样本可以反映总体,所以可以利用所求的线性回归方程,对这两个变量所确定的总体进行估计,即根据一个变量的取值,预测另一个变量的取值.
跟踪训练3 某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程=x+,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少小时?

考点 变量间的相关关系
题点 变量间的相关关系
解 (1)散点图如图.
(2)由表中数据得:iyi=52.5,
=3.5,=3.5,=54,
∴ =0.7,∴=1.05,
∴=0.7x+1.05,回归直线如图所示.
(3)将x=10代入线性回归方程,
得=0.7×10+1.05=8.05,
故预测加工10个零件约需要8.05小时.
1.一个容量为80的样本中,数据的最大值是140,最小值是50,组距是10,这里将样本数据分为(  )
A.10组 B.9组
C.8组 D.7组
考点 抽样方法
题点 抽样方法中的计算
答案 B
解析 组数===9.
2.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是(  )
A.1 B.2
C.3 D.4
考点 方差与标准差
题点 求标准差
答案 B
解析 设这10个数为a1,a2,…,a10,则有a+a+…+a=200,且a1+a2+…+a10=40,
所以
=
==4,∴标准差为=2.
3.某农田施肥量x(单位:kg)与小麦产量y(单位:kg)之间的回归方程是=4x+250,则当施肥量为50 kg时,可以预测小麦的产量为________kg.
考点 变量间的相关关系
题点 变量间的相关关系
答案 450
解析 直接将x=50代入回归方程中,可得=4×50+250=450.
4.如图所示是一次考试结果的频率分布直方图,则据此估计这次考试的平均分为________.
考点 平均数
题点 由表或图估计平均数
答案 75
解析 利用组中值估算平均分,则有=55×0.1+65×0.2+75×0.4+85×0.2+95×0.1=75,故估计这次考试的平均分为75.
5.从某学校的男生中随机抽取50名测量身高,被测学生身高全部介于155 cm和195 cm之间,将测量结果按如下方式分成八组;第一组[155,160),第二组[160,165),…,第八组[190,195].如图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组的人数相同,第六组的人数为4.
(1)求第七组的频率;
(2)估计该校的800名男生的身高的中位数以及身高在180 cm以上(含180 cm)的人数.
考点 样本估计总体
题点 用样本的频率分布估计总体的频率分布
解 (1)第六组的频率为=0.08,所以第七组的频率为1-0.08-5×(0.008×2+0.016+0.04×2+0.06)=0.06.
(2)身高在第一组[155,160)的频率为0.008×5=0.04,
身高在第二组[160,165)的频率为0.016×5=0.08,
身高在第三组[165,170)的频率为0.04×5=0.2,
身高在第四组[170,175)的频率为0.04×5=0.2,
由于0.04+0.08+0.2=0.32<0.5,0.04+0.08+0.2+0.2=0.52>0.5,
估计这所学校的800名男生的身高的中位数为m,则170<m<175,
由0.04+0.08+0.2+(m-170)×0.04=0.5,得m=174.5,所以可估计这所学校的800名男生的身高的中位数为174.5,
由直方图得后三组频率为0.06+0.08+0.008×5=0.18,
所以身高在180 cm以上(含180 cm)的人数为0.18×800=144.
1.用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点:
?1?纵轴表示;?2?频率分布直方图中各小长方形高的比就是相应各组的频率之比;?3?直方图中各小长方形的面积是相应各组的频率,所有的小长方形的面积之和等于1,即频率之和为1.
2.平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它们可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述波动大小.
一、选择题
1.某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性都为0.2,用随机数法在该中学抽取容量为n的样本,则n等于(  )
A.80 B.160
C.200 D.280
答案 C
解析 由题意可知,=0.2,解得n=200.
2.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n等于(  )
A.54 B.90
C.45 D.126
考点 分层抽样的应用
题点 由抽样情况求样本或总体容量
答案 B
解析 分层抽样的核心是等比例抽取.所以=,解得n=90.
3.下列抽样实验中,适合用抽签法的有(  )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
答案 B
解析 个体数和样本容量较小时适合用抽签法,排除A,D;C中甲、乙两厂生产的两箱产品质量可能差别较大,也不适用,故选B.
4.某市电视台为调查节目收视率,想从全市3个区按人口数用分层抽样的方法抽取一个容量为n的样本,已知3个区人口数之比为2∶3∶5,如果人口最多的一个区抽出的个体数是60,那么这个样本的容量为(  )
A.96 B.120 C.180 D.240
考点 分层抽样的应用
题点 由抽样情况求样本或总体容量
答案 B
解析 由题意知,3个区人口数之比为2∶3∶5,第三个区所抽取的人口数最多,所占比例为50%.又因为第三个区抽取的人数为60,所以三个区所抽取的总人数为60÷50%=120,即这个样本的容量为120.
5.总体已经分成A,B,C三层,且A,B,C三层个体数之比为2∶3∶5,现要从总体中抽取一个容量为20的样本,已知A层中用简单随机抽样抽取样本时,甲被抽到的可能性为,则总体的个体数为(  )
A.60 B.80
C.100 D.120
考点 分层抽样的方法
题点 分层抽样的应用
答案 B
解析 由已知条件知,在整个抽样过程中每个个体被抽到的可能性为,
∴总体的个体数为20÷=80.
6.某班全体学生参加一次测试,将所得分数依次分组:[20,40),[40,60),[60,80),[80,100],绘制出如图所示的成绩频率分布直方图,若低于60分的人数是18,则该班的学生人数是(  )
A.50 B.54
C.60 D.64
考点 频率分布直方图
题点 求频数及容量
答案 C
解析 由频率分布直方图知,得分低于60分的频率为(0.005+0.01)×20=0.3.
∵低于60分的人数是18,
∴该班的学生人数是=60.
故选C.
7.一个样本的容量为72,分成5组,已知第一、五组的频数都为8,第二、四组的频率都为,则第三组的频数为(  )
A.24 B.48
C.16 D.32
答案 A
解析 因为频率=,所以第二、四组的频数都为72×=16.所以第三组的频数为72-2×8-2×16=24.
8.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是(  )
A.众数 B.平均数
C.中位数 D.标准差
考点 样本估计总体
题点 用样本的数字特征估计总体的数字特征
答案 D
解析 由众数、平均数、中位数、标准差的定义知:A样本中各数据都加2后,只有标准差不改变,故选D.
二、填空题
9.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):

10
8
9
9
9

10
10
7
9
9
如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.
考点 样本估计总体
题点 用样本的数字特征估计总体的数字特征
答案 甲
解析 甲=9,乙=9,
s=×2=,s=×6=,甲的方差较小.
10.某校高中年级开设了丰富多彩的课程,甲、乙两班各随机抽取了5名学生的学分,用茎叶图表示(如图).s1,s2分别表示甲、乙两班抽取的5名学生学分的标准差,则s1________s2.(填“>”、“<”或“=”)
考点 样本估计总体
题点 用样本的数字特征估计总体的数字特征
答案 <
解析 标准差反映了数据的离散程度.显然甲的学分更集中.也可用公式计算得出.
11.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.
考点 样本估计总体
题点 用样本的数字特征估计总体的数字特征
答案 24 23
解析 甲=(10×2+20×5+30×3+17+6+7)=24,
乙=(10×3+20×4+30×3+17+11+2)=23.
12.某电子商务公司对10 000名网络购物者在2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
考点 样本估计总体
题点 用样本的频率分布估计总体的频率分布
答案 (1)3 (2)6 000
解析 由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.所以消费金额在区间[0.5,0.9]内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.
三、解答题
13.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).
(1)由图中数据求a的值;
(2)若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为多少?
(3)估计这所小学的小学生身高的众数、中位数(保留两位小数)及平均数.
考点 样本估计总体
题点 用样本的频率分布估计总体的频率分布
解 (1)因为直方图中的各个矩形的面积之和为1,
所以10×(0.005+0.035+a+0.020+0.010)=1,
解得a=0.030.
(2)由直方图知,身高在[120,130),[130,140),[140,150]三组的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,
所以从身高在[140,150]内选取的学生人数为×10=3.
(3)根据频率分布直方图知,身高在[110,120)的小矩形最高,
所以这所小学的小学生身高的众数为=115(cm).
又0.005×10+0.035×10=0.4<0.5,
0.4+0.030×10=0.7>0.5,
所以中位数在[120,130)内,可设为x,
则(x-120)×0.030+0.4=0.5,
解得x≈123.33,
所以中位数为123.33 cm.
根据频率分布直方图,计算平均数为
105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm).
四、探究与拓展
14.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为mo,平均数为,则(  )
A.me=mo= B.mo<<me
C.me<mo< D.mo<me<
考点 样本估计总体
题点 用样本的频率分布估计总体的频率分布
答案 D
解析 30个数中第15个数是5,第16个数是6,所以中位数me==5.5,众数mo=5,
平均值=
=,∴mo15.以下四个命题:
①在回归方程=-0.5x+5中,y与x呈正相关;
②对于两个相关随机变量x,y而言,点P(,)在其回归直线上;
③在回归方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位;
④两个随机变量相关性越弱,则相关系数的绝对值越接近于1.
其中真命题为(  )
A.①④ B.②④ C.①③ D.②③
考点 变量间的相关关系
题点 变量间的相关关系
答案 D
解析 ①由回归方程知,<0,所以y与x呈负相关,故不正确;②对于两个相关随机变量x,y而言,点P(,)在其回归直线上,正确;③在回归方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位,正确;④两个随机变量相关性越强,则相关系数的绝对值越近于1,两个随机变量相关性越弱,则相关系数的绝对值越接近于0,故不正确.
故选D.
章末检测试卷
(时间:120分钟 满分:150分)
一、选择题(本大题共12小题,每小题5分,共60分)
1.某公司从代理的A,B,C,D四种产品中,按分层抽样的方法抽取容量为110的样本,已知A,B,C,D四种产品的数量比是2∶3∶2∶4,则该样本中D类产品的数量为(  )
A.22 B.33
C.40 D.55
答案 C
解析 根据分层抽样,总体中产品数量比与抽取的样本中产品数量比相等,∴样本中D类产品的数量为110×=40.
2.已知总体容量为106,若用随机数法抽取一个容量为10的样本,下面对总体的编号最方便的是(  )
A.1,2,…,106 B.0,1,2,…,105
C.00,01,…,105 D.000,001,…,105
答案 D
解析 由随机数抽取原则可知选D.
3.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的线性回归方程为y=7.19x+73.93,用这个方程预测这个孩子10岁时的身高,正确的叙述是(  )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm以下
D.身高在145.83 cm左右
答案 D
解析 回归直线是用来估计总体的,所以我们求的值都是估计值,所以我们得到的结果也是近似的,只要把自变量的值代入线性回归方程即可求得结果为145.83 cm.
4.一个容量为200的样本,其数据的分组与各组的频数如下表:
组别
[0,10)
[10,20)
[20,30)
[30,40)
[40,50)
频数
15
15
20
30
35
组别
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
25
20
15
15
10
则样本数据落在[20,60)上的频率为(  )
A.0.11 B.0.5
C.0.45 D.0.55
考点 频率分布表
题点 求指定组的频率
答案 D
解析 由题中表格可知样本数据落在[20,60)上的频数为20+30+35+25=110,故其频率为=0.55.
5.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是(  )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
考点 众数、中位数、平均数的综合
题点 茎叶图中的中位数和平均数
答案 A
解析 将这组数据从小到大排列,得87,89,90,91,92,93,94,96.故中位数为=91.5.平均数为=91+=91.5.
6.如图为某个容量为100的样本的频率分布直方图,分组为[96,98),[98,100),[100,102),[102,104),[104,106],则在区间[98,100)上的频数为(  )
A.10 B.30
C.20 D.40
考点 频率分布直方图
题点 求指定组的频率
答案 C
解析 区间[98,100)上小矩形的面积为0.100×2=0.200,所以区间[98,100)上的频数为100×0.200=20,故选C.
7.若数据x1,x2,…,xn的平均数为,方差为s2,则3x1+5,3x2+5,…,3xn+5的平均数和标准差分别为(  )
A.,s B.3+5,s
C.3+5,3s D.3+5,
考点 方差与标准差
题点 求平均数与标准差
答案 C
解析 ∵x1,x2,…,xn的平均数为,
∴3x1+5,3x2+5,…,3xn+5的平均数为3+5,
s′2=[(3x1+5-3-5)2+…+(3xn+5-3-5)2]
=×32[(x1-)2+…+(xn-)2]=9s2.
∴s′=3s.
8.在某地区某高传染性病毒流行期间,为了建立指标显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各项中,一定符合上述指标的是(  )
①平均数≤3;②标准差s≤2;③平均数≤3且标准差s≤2;④平均数≤3且极差小于或等于2;⑤众数等于1且极差小于或等于4.
A.①② B.③④
C.③④⑤ D.④⑤
考点 方差与标准差
题点 方差与其它数字特征的综合运算
答案 D
解析 ①②③不符合,④符合,若极差等于0或1,在≤3的条件下,显然符合指标;若极差等于2且≤3,则每天新增感染人数的最小值与最大值有下列可能:(1)0,2,(2)1,3,(3)2,4,符合指标.⑤符合,若众数等于1且极差小于或等于4,则最大值不超过5,符合指标,故选D.
9.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为(  )
A.64 B.54 C.48 D.27
考点 频率分布直方图
题点 求频数
答案 B
解析 前两组中的频数为100×(0.05+0.11)=16.
因为后五组频数和为62,所以前三组频数和为38.
所以第三组频数为38-16=22.又最大频率为0.32,故第四组频数为0.32×100=32,
所以a=22+32=54.故选B.
10.某校为了对初三学生的体重进行摸底调查,随机抽取了50名学生的体重(kg),将所得数据整理后,画出了频率分布直方图,如图所示 ,体重在[45,50)内适合跑步训练,体重在[50,55)内适合跳远训练,体重在[55,60)内适合投掷相关方面训练,估计该校初三学生适合参加跑步、跳远、投掷三项训练的集训人数之比为(  )
A.4∶3∶1 B.5∶3∶1
C.5∶3∶2 D.3∶2∶1
考点 频率分布直方图
题点 求频数
答案 B
解析 体重在[45,50)内的频率为0.1×5=0.5,体重在[50,55)内的频率为0.06×5=0.30,体重在[55,60)内的频率为0.02×5=0.1,
∵0.5∶0.3∶0.1=5∶3∶1,
∴可估计该校初三学生适合参加跑步、跳远、投掷三项训练的集训人数之比为5∶3∶1,故选B.
11.如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为106,乙组数据的平均数为105.4,则x,y的值分别为(  )
A.5,7 B.6,8 C.6,9 D.8,8
考点 茎叶图
题点 茎叶图的应用
答案 B
解析 ∵甲组数据的中位数为106,
∴x=6.
又∵乙组数据的平均数为105.4,
∴=105.4,
解得y=8.
综上,x,y的值分别为6,8.故选B.
12.下列关于线性回归的判断,正确的个数为(  )
①若散点图中所有的点都在一条直线附近,则这条直线为回归直线;
②散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的点A,B,C;
③已知线性回归方程=0.50x-0.81,则当x=25时,y的估计值为11.69;
④回归直线方程的意义是它反映了样本整体的变化趋势.
A.0 B.1 C.2 D.3
答案 D
解析 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义,知只有按最小二乘法求得回归系数,,得到的直线=x+才是回归直线,所以①不对;②正确;将x=25代入=0.50x-0.81,解得=11.69,所以③正确;④正确,所以选D.
二、填空题(本大题共4小题,每小题5分,共20分)
13.从甲、乙、丙三个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下:
甲:3,4,5,6,8,8,8,10;
乙:4,6,6,6,8,9,12,13;
丙:3,3,4,7,9,10,11,12.
三个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:甲________,乙________,丙________.
答案 众数 平均数 中位数
解析 甲、乙、丙三个厂家从不同角度描述了一组数据的特征.甲:该组数据8出现的次数最多;乙:该组数据的平均数==8;丙:该组数据的中位数是=8.
14.甲、乙、丙、丁四人参加运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:




平均环数
8.5
8.8
8.8
8
方差s2
3.5
3.5
2.1
8.5
则参加运动会的最佳人选应为________.
考点 方差与标准差
题点 平均数与方差的计算
答案 丙
解析 从表格中可以看出乙和丙的平均成绩最好,但丙发挥得比乙稳定,故最佳人选应为丙.
15.某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人):
篮球组
书画组
乐器组
高一
45
30
a
高二
15
10
20
学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.
考点 分层抽样的方法
题点 由比例关系求抽取个数
答案 30
解析 由题意知,=,解得a=30.
16.从一堆苹果中任取20个,并得到它们的质量(单位:克)数据分布如下:
分组
[90,100)
[100,110)
[110,120)
[120,130)
[130,140)
[140,150]
频数
1
2
3
10
3
1
则这堆苹果中,质量不少于120克的苹果数约占苹果总数的________%.
考点 频率分布表
题点 求累计频率
答案 70
解析 ∵质量不少于120克的频数为14,
∴频率为×100%=70%.
三、解答题(本大题共6小题,共70分)
17.(10分)某市化工厂三个车间共有工人1 000名,各车间男、女工人数如下表:
第一车间
第二车间
第三车间
女工
173
100
y
男工
177
x
z
已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是0.15.
(1)求x的值;
(2)现用分层抽样的方法在全厂抽取50名工人,则应在第三车间抽取多少名工人?
考点 分层抽样的方法
题点 由各层比例关系求每层抽取个数.
解 (1)依题意有=0.15,解得x=150.
(2)∵第一车间的工人数是173+177=350,第二车间的工人数是100+150=250,
∴第三车间的工人数是1 000-350-250=400.
设应从第三车间抽取m名工人,则有=,
解得m=20,
∴应在第三车间抽取20名工人.
18.(12分)有关部门要了解甲型H1N1流感预防知识在学校的普及情况,特制了一份有10道题的问卷到各学校进行问卷调查.某中学A,B两个班各被随机抽取了5名学生接受问卷调查.A班5名学生得分为:5,8,9,9,9;
B班5名学生得分为:6,7,8,9,10(单位:分).
请你估计A,B两个班中哪个班的问卷得分要稳定一些.
考点 方差与标准差
题点 求方差与标准差
解 A班的5名学生的平均得分为(5+8+9+9+9)÷5=8,
方差s=×[(5-8)2+(8-8)2+(9-8)2+(9-8)2+(9-8)2]=2.4;
B班的5名学生的平均得分为(6+7+8+9+10)÷5=8,
方差s=×[(6-8)2+(7-8)2+(8-8)2+(9-8)2+(10-8)2]=2.
∴s>s,∴B班的预防知识的问卷得分要稳定一些.
19.(12分)某地政府调查了工薪阶层1 000人的月工资,并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资的满意程度,要用分层抽样的方法从调查的1 000人中抽出100人做电话询访,则[30,35)(百元)月工资段应抽出多少人?
考点 频率分布直方图
题点 求指定组的频数
解 月工资落在[30,35)(百元)内的频率为1-(0.02+0.04+0.05+0.05+0.01)×5=1-0.85=0.15,而0.15÷5=0.03,所以各组的频率比为0.02∶0.04∶0.05∶0.05∶0.03∶0.01=2∶4∶5∶5∶3∶1,所以[30,35)(百元)月工资段应抽出×100=15(人).
20.(12分)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5
2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4
1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据完成下面的茎叶图,从茎叶图看,哪种药的疗效更好?
解 (1)由观测结果可绘制茎叶图如图.
从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎“2.”,“3.”上,而B药疗效的试验结果有的叶集中在茎“0.”,“1.”上,由此可看出A药的疗效更好.
(2)设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得,
=(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,
=(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.
由以上计算结果可得,>,因此可以看出A药的疗效更好.
21.(12分)某市2017年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
考点 频率分布直方图
题点 画频率分布直方图
解 (1)频率分布表:
分组
频数
频率
[41,51)
2

[51,61)
1

[61,71)
4

[71,81)
6

[81,91)
10

[91,101)
5

[101,111]
2

(2)频率分布直方图如图所示.
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月的天数的,说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的;染污指数在80以上的接近轻微染污的天数为15,加上处于轻微污染的天数,共17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善.
22.(12分)某地区2011年至2017年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份
2011
2012
2013
2014
2015
2016
2017
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)已知两变量线性相关,求y关于t的线性回归方程;
(2)利用(1)中的线性回归方程,分析2011年至2017年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2019年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=-.
考点 回归直线
题点 求回归直线
解 (1)由所给数据计算得
=(1+2+3+4+5+6+7)=4,
=(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-)2=9+4+1+0+1+4+9=28,
(ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,
===0.5,
=-=4.3-0.5×4=2.3,
故所求线性回归方程为=0.5t+2.3.
(2)由(1)知,=0.5>0,故2011年至2017年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2019年的年份代号t=9代入(1)中的线性回归方程,
得=0.5×9+2.3=6.8,
故预测该地区2019年农村居民家庭人均纯收入为6.8千元.