统计与统计案例
命题点1 抽样方法
三种抽样方法的特征
共性:不放回抽样,每个个体被抽到的机会均等.
(1)简单随机抽样:适用于总体个数较少的情况;
(2)系统抽样:等距抽样,适用总体个数较多的情况;
(3)分层抽样:按比例抽取,总体由差异明显的几部分组成.
当总体容量为N,样本容量为n时,有下列关系式:=.
[高考题型全通关]
1.某方便面生产线上每隔15分钟抽取一包进行检验,该抽样方法为①,从某中学的40名数学爱好者中抽取5人了解学习负担情况,该抽样方法为②,那么①和②分别为( )
A.①系统抽样,②分层抽样
B.①分层抽样,②系统抽样
C.①系统抽样,②简单随机抽样
D.①分层抽样,②简单随机抽样
C [由随机抽样的特征可知,①为等距抽样,是系统抽样;②是简单随机抽样,故选C.]
2.从30个个体(编号为00~29)中抽取10个样本,现给出某随机数表的第11行到第15行(见下表),如果某人选取第12行的第6列和第7列中的数作为第一个数并且由此数向右读,则选取的前4个的号码分别为( )
9264 4607 2021 3920 7766 3817 3256 1640
5858 7766 3170 0500 2593 0545 5370 7814
2889 6628 6757 8231 1589 0062 0047 3815
5131 8186 3709 4521 6665 5325 5383 2702
9055 7196 2172 3207 1114 1384 4359 4488
A.76,63,17,00
B.16,00,02,30
C.17,00,02,25
D.17,00,02,07
D [在随机数表中,将处于00~29的号码选出,满足要求的前4个号码为17,00,02,07.]
3.(2020·临汾模拟)已知某地区初中水平及以上的学生人数如图所示.为了解该地区学生对新型冠状病毒的了解程度,拟采用分层抽样的方法来进行调查.若高中生需抽取20名学生,则抽取的学生总人数为( )
A.40
B.60
C.120
D.360
B [高中生所占的比例为=,设抽取的学生总人数为x,则由题意可得=,求得x=60,故选B.]
4.采用系统抽样的方法从800人中抽取40人参加某种测试,为此将800人随机编号为1,2,…,800,分组后在第一组采用简单随机抽样的方法抽到的号码为18,在抽到的40人中,编号落入区间[1,200]的人做试卷A,编号落入区间[201,560]的人做试卷B,其余的人做试卷C,则做试卷C的人数为( )
A.10
B.12
C.18
D.28
B [设抽到的学生的编号构成数列{an},
则an=18+(n-1)×20=20n-2,
由560<20n-2≤800,n∈N
,得29≤n≤40,n有12个整数,即做试卷C的人数为12.
]
命题点2 统计图表和样本数字特征
样本数字特征问题常需把握的3点
(1)样本数字特征的特点:平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.
(2)方差公式的等价变形:s2=
(xi-)2=x-2.
(3)频率分布直方图中的样本数字特征:
①最高的小长方形底边中点的横坐标即是众数;
②中位数左边和右边的小长方形的面积和是相等的;
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
[高考题型全通关]
1.(2020·天河区一模)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作实验基地,这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,xn,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是( )
A.x1,x2,…xn的平均数
B.x1,x2,…xn的标准差
C.x1,x2,…xn的最大值
D.x1,x2,…xn的中位数
B [表示一组数据x1,x2,…xn的稳定程度是方差或标准差.故选B.]
2.在一次体能测试中,某校高三600名男生的测试成绩统计如图所示,则下列说法正确的是( )
A.成绩在60分以下的有12人
B.可以估计该校学生体能测试成绩的众数为70
C.可以估计该校学生体能测试成绩的中位数在区间[60,70)内
D.可以估计该校学生体能测试的平均成绩为72
D [成绩在60分以下的人数为600×0.02×10=120(人),A错误;因最高长方形底边的中点为75,所以成绩的众数为75,B错误;该校学生体能测试成绩的中位数在[70,80)内,C错误;所求平均数为45×0.1+55×0.1+65×0.2+75×0.3+85×0.2+95×0.1=72,D正确.故选D.]
3.(2020·石景山模拟)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的统计表如表所示
甲
乙
环数
4
5
6
7
8
环数
5
6
9
频数
1
1
1
1
1
频数
3
1
1
有以下四种说法:
①甲成绩的平均数小于乙成绩的平均数;
②甲成绩的中位数等于乙成绩的中位数;
③甲成绩的方差小于乙成绩的方差;
④甲成绩的极差小于乙成绩的极差.
其中正确命题的个数是( )
A.1
B.2
C.3
D.4
A [由表中数据,计算
甲=×(4+5+6+7+8)=6,
乙=×(5×3+6+9)=6,
所以甲=乙,①错误;
甲成绩的中位数是6,乙成绩的中位数是5,所以甲的中位数大于乙的中位数,②错误;
计算s=×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,
s=×[3×(5-6)2+(6-6)2+(9-6)2]=2.4,
所以s<s,③正确;
由甲成绩的极差为8-4=4,乙成绩的极差为9-5=4,所以甲成绩的极差等于乙成绩的极差,④错误.综上知,正确的命题序号是③.故选A.]
4.随着我国经济实力的不断提升,居民收入也在不断增加.某家庭2020年全年的收入与2016年全年的收入相比增加了一倍,实现翻番.同时该家庭的消费结构随之也发生了变化,现统计了该家庭这两年不同品类的消费额占全年总收入的比例,得到了如下折线图:
则下列结论中正确的是( )
A.该家庭2020年食品的消费额是2016年食品的消费额的一半
B.该家庭2020年教育医疗的消费额与2016年教育医疗的消费额相当
C.该家庭2020年休闲旅游的消费额是2016年休闲旅游的消费额的五倍
D.该家庭2020年生活用品的消费额是2016年生活用品的消费额的两倍
C [2020年食品消费占0.2,2016年食品消费占0.4,因2020年全年的收入与2016年全年的收入相比增加了一倍,所以两年的食品消费额相当,故A错误.2020年教育医疗消费占0.2,2016年教育医疗消费占0.2,因2020年全年的收入与2016年全年的收入相比增加了一倍,所以2020年教育医疗消费额是2016年的两倍,故B错误.2020年休闲旅游消费占0.25,2016年休闲旅游消费占0.1,因2020年全年的收入与2016年全年的收入相比增加了一倍,所以2020年休闲旅游的消费额是2016年的五倍,故C正确.2020年生活用品消费占0.3,2016年生活用品消费占0.15,因2020年全年的收入与2016年全年的收入相比增加了一倍,所以2020年生活用品消费额是2016年的四倍,故D错误.故选C.]
5.(2020·朝阳区模拟)为了宣传“第十八届中国西部博览会”(简称“西博会”),组委会举办了“西博会”知识有奖问答活动.在活动中,组委会对会议举办地参与活动的15~65岁市民进行随机抽样,各年龄段人数情况如表:
组号
分组
各组人数
各组人数频率分布直方图
第1组
[15,25)
10
第2组
[25,35)
a
第3组
[35,45)
b
第4组
[45,55)
c
第5组
[55,65]
d
根据以上图表中的数据可知图表中a和x的值分别为( )
A.20,0.15
B.15,0.015
C.20,0.015
D.15,0.15
C [由频率分布直方图可知,第一组的频率为:0.010×10=0.1,
又∵第一组的人数为10,
∴总人数为:=100,
∵第二组的频率为:0.020×10=0.2,
∴第二组的人数a=0.2×100=20,
由频率分布直方图可知,
x=×[1-(0.01+0.02+0.03+0.025)×10]=0.015,故选C.]
命题点3 统计案例
统计案例的问题需注意的4点
(1)相关系数或散点图:散点图是判断样本点线性相关的直观体现,相关系数r是变量相关性的准确刻画,其取值范围为[-1,1].
(2)线性回归问题:样本点的中心(,)在回归直线上;由线性回归方程求出的数值是估计值.
(3)非线性回归方程问题:可借助代数变换转化为线性回归问题.
(4)独立性检验的关键:准确求出K2值,然后对比临界值表中的数据下结论.
[高考题型全通关]
1.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析.方案一:根据图中所有数据,得到回归方程y=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归方程:y=b2x+a2,相关系数为r2.则( )
A.0<r1<r2<1
B.0<r2<r1<1
C.-1<r1<r2<0
D.-1<r2<r1<0
D [由散点图得负相关,所以r1,r2<0,因为剔除点(10,21)后,剩下点数据更具有线性相关性,|r|更接近1,所以-1<r2<r1<0.故选D.]
2.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+,已知xi=225,yi=1
600,=4.该班某学生的脚长为24,据此估计其身高为( )
A.160
B.163
C.166
D.170
C [由题意可知=4x+,
又=22.5,=160,
因此160=22.5×4+,解得=70,
所以=4x+70.
当x=24时,=4×24+70=166.]
3.(2020·汕尾模拟)2019年10月18日-27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如表所示:
对主办方是否满意
男性运动员/名
女性运动员/名
满意
200
220
不满意
50
30
现有如下说法:
①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为;
②在犯错误的概率不超过1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;
③没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”.
则正确命题的个数为( )
附:K2=,
P(K2≥k)
0.100
0.050
0.010
0.001
k
2.706
3.841
6.635
10.828
A.1
B.2
C.3
D.0
A [在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为=≠,即①错误;
K2=≈5.95<6.635,所以②错误,③正确.所以正确的只有③,故选A.]
8/8