(共37张PPT)
第九章 统 计
章末素养提升
| 体 系 构 建 |
| 核 心 归 纳 |
1.抽样方法
(1)用随机数法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.
(2)分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.
(3)两种抽样方法的异同点.
类别 共同点 各自特点 相互联系 适用范围
简单随 机抽样 抽样过程中每个个体被抽到的可能性相同 从总体中逐个抽取 — 总体中的个体数较少
分层抽样 将总体分成几层,按各层个体数之比抽取 在各层抽样时采用简单随机抽样 总体由差异明显的几部分组成
2.用样本估计总体
(1)用样本估计总体.
用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率分布表与频率分布直方图.
(2)常见的统计图.
常见的统计图有条形统计图、折线统计图、扇形统计图等.
(3)样本的数字特征.
样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本数据稳定程度或波动大小的,包括方差及标准差.
| 思 想 方 法 |
(一)数形结合思想
【思想方法解读】涉及统计图,实质就是借助于数形结合思想来解决问题,利用直观图形所表现的或蕴含的数字特征来估计总体.
对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出了频率分布表和频率分布直方图,如图所示:
分组 频数 频率
[10,15) 10 0.25
[15,20) 24 n
[20,25) m p
[25,30] 2 0.05
合计 M 1
(1)求表中M,p及图中a的值;
(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数.
(2)因为该校高三学生有240人,分组[10,15)的频率是0.25,所以估计该校高三学生参加社区服务的次数在区间[10,15)内的人数为240×0.25=60.
利用数形结合思想求解与频率分布直方图有关问题的策略
(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1可求出其他数据.
(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.
1.(多选)(2023年广州越秀区期末)PM2.5的监测值是用来评价环境空气质量的指标之一,如图是某地12月1日至10日的PM2.5日均值(单位:μg/m3)变化的折线图,则 ( )
A.这10日PM2.5日均值的80%分位数为60
B.前5日PM2.5日均值的极差小于后5日PM2.5日均值的极差
C.前5日PM2.5日均值的方差大于后5日PM2.5日均值的方差
D.这10日PM2.5日均值的中位数为43
【答案】BD
(二)方程思想
【思想方法解读】
在本章的抽样计算中,常常运用方程思想来解决样本数或总体数、中位数等.
一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量(单位:辆)如下表所示:
型号 轿车A/辆 轿车B/辆 轿车C/辆
舒适型 100 150 z
标准型 300 450 600
按类用分层随机抽样的方法在这个月生产的轿车中抽取50辆,其中A类轿车有10辆.
(1)求z的值;
(2)用分层随机抽样的方法从C类轿车中抽取一个容量为5的样本,求舒适型、标准型的轿车应分别抽取多少辆?
利用方程思想解决与分层随机抽样有关问题的策略
(1)依据各层总数与样本数之比,确定抽样比.
(2)求某一层的样本数或总体个数时,可先求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.
(3)求各层的样本数,可先求出各层的抽样比,再求出各层样本数.
(4)在频率分布直方图中,利用中位数两边图形面积相等,可列方程解决问题.
2.(1)某学校高一、高二、高三三个年级共有430名学生,其中高一年级学生160名,高二年级学生180名,为了解学生身体状况,现采用分层随机抽样方法进行调查,在抽取的样本中高二学生有32人,则该样本中高三学生人数为_________.
(2)某单位有职工960人,其中青年职工420人,中年职工300人,老年职工240人,为了解该单位职工的健康情况,用分层随机抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本量为________.
【答案】(1)16 (2)32
| 链 接 高 考 |
(2017年江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层随机抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取__________件.
【答案】18
随机抽样
【点评】分层随机抽样在抽样时要保证样本的结构和总体的结构保持一致,按照一定的比例,即样本量和总体容量的比值,在各层中进行抽取.
(2022年天津)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第
频率分布直方图与统计图的应用
一组,第二组……第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为 ( )
A.8 B.12
C.16 D.18
【答案】B
【点评】本题考查频率分布直方图的性质等基础知识,结合已知条件和频率分布直方图求出志愿者的总人数,进而求出第三组的总人数,由此能求出结果,考查运算求解能力,是基础题.
(2023年上海)如图为2018—2021年上海市货物进出口总额的条形统计图,则下列对于进出口贸易额描述错误的是 ( )
A.从2018年开始,2021年的进出口总额增长率最大
B.从2018年开始,进出口总额逐年增大
C.从2018年开始,进口总额逐年增大
D.从2018年开始,2020年的进出口总额增长率最小
【答案】C
【解析】显然2021年相对于2020年进出口额增量增加特别明显,故2021年的增长率最大,A对;统计图中的每一年条形图的高度逐年增加,故B对;2020年相对于2019的进口总额是减少的,故C错;显然进出口总额2021年的增长率最大,而2020年相对于2019年的增量比2019年相对于2018年的增量小,且计算增长率时前者的分母还大,故2020年的增长率一定最小,D正确.故选C.
【点评】本题考查统计图的识图问题,以及增长率的计算,属于中档题.
(2022年甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
数据的数字特征
则 ( )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
【答案】B
【点评】本题考查数据的数字特征,关键是掌握数据的平均数、中位数、标准差、极差的定义.
(多选)(2023年新高考Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则 ( )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2, … ,x6的极差
【答案】BD
【解析】A选项,x2,x3,x4,x5的平均数不一定等于x1,x2,…,x6的平均数,A错误;B选项,一组数据去掉最大值和最小值后中位数不变,B正确;C选项,一组数据去掉最大值和最小值后,波动程度不大于原数据,C错误;D选项,x1,x2,x3,x4,x5,x6的极差为x6-x1,而x1≤x2,x3,x4,x5≤x6,所以x2,x3,x4,x5任意两数之差小于等于x6-x1,即x2,x3,x4,x5的极差不大于x6-x1,D正确.故选BD.
【点评】本题考查平均数、中位数、标准差、极差的应用,是基础题.
(2023年上海)现有某地一年四个季度的GDP(亿元),第一季度GDP为232(亿元),第四季度GDP为241(亿元),四个季度的GDP逐季度增长,且中位数与平均数相同,则该地一年的GDP为__________.
【答案】946(亿元)
【点评】本题主要考查了中位数和平均数的定义,属于基础题.(共56张PPT)
第九章 统 计
9.2 用样本估计总体
9.2.3 总体集中趋势的估计
9.2.4 总体离散程度的估计
学习目标 素养要求
1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义 数据分析、数学运算
2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义 数据分析、数学运算
3.结合实例,能用样本估计总体的取值规律 数据分析
| 自 学 导 引 |
众数、中位数、平均数的定义
1.众数、中位数、平均数定义
(1)众数:一组数据中重复出现次数________的数.
(2)中位数:把一组数据按大小排序后,处在________位置(或中间两个数的__________)的数叫做这组数据的中位数.
最多
中间
平均数
2.三种数字特征与频率分布直方图的关系
众数 众数是_____________的中点所对应的数据,表示样本数据的中心值
中位数 (1)在频率分布直方图中,中位数左边和右边的直方图面积________,由此可以估计中位数的值,但是有偏差;
(2)表示样本数据所占频率的等分线
平均数 (1)平均数等于每个小矩形的面积乘_________________________之和;
(2)平均数是频率分布直方图的重心,是频率分布直方图的平衡点
最高长方形
相等
小矩形底边中点的横坐标
【预习自测】判断下列命题是否正确.(正确的画“√”,错误的画“×”)
(1)一个样本的众数、平均数和中位数都是唯一的. ( )
(2)样本的平均数是频率分布直方图中最高长方形的中点对应的数据. ( )
(3)若改变一组数据中一个数,则这组数据的平均数、中位数、众数都会发生改变. ( )
【答案】(1)× (2)× (3)×
【解析】(1)一个样本的平均数和中位数是唯一的.若数据中有两个或两个以上出现得最多,且出现次数一样多,则这些数据都叫众数,若一组数据中每个数据出现的次数一样多,则没有众数,可见一个样本的众数可能唯一,可能多个,也可能没有.
(2)样本的平均数等于每个小矩形的面积乘小矩形底边中点的横坐标之和.
(3)若改变一组数据中的一个数,则这组数据的平均数一定会改变,而中位数与众数可能不变.
总体离散程度的估计
绝对值
方差
标准差
特别提醒
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小,标准差的大小不会超过极差.
(2)标准差、方差的取值范围为[0,+∞).标准差、方差为0时,样本各数据相等,说明数据没有波动幅度,数据没有离散性.
(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分解程度上是一样的,但在解决实际问题时,一般多采用标准差.
【预习自测】
1.判断下列命题是否正确.(正确的画“√”,错误的画“×”)
(1)数据5,4,4,3,5,2的众数为4. ( )
(2)数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半. ( )
(3)方差与标准差具有相同的单位. ( )
(4)若一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变. ( )
【答案】(1)× (2)√ (3)× (4)√
【解析】(1)该数据中的众数应为4和5.
(3)二者单位不一致.
(4)平均数也应减去该常数,方差不变.
2.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是__________.
【答案】0.1
| 课 堂 互 动 |
题型1 众数、中位数、平均数的计算及应用
(1)(多选)某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个,命中个数如下所示:
甲:20,22,27,8,12,13,37,25,24,26;
乙:14,9,13,18,19,20,23,21,21,11.
则下面结论中正确的有 ( )
A.甲的极差是29 B.乙的众数是21
C.甲的平均数为21.4 D.甲的中位数是24
【答案】(1)ABC
(2)某工厂人员及月工资构成如下:
人员 经理 管理人员 高级技工 工人 学徒 合计
月工资/元 22 000 2 500 2 200 2 000 1 000 29 700
人数 1 6 5 10 1 23
合计 22 000 15 000 11 000 20 000 1 000 69 000
①指出这个表格中的众数、中位数、平均数;
②这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?
解:①由表格可知,众数为2 000元.
把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.
平均数为69 000÷23=3 000(元).
②虽然平均数为3 000元/月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.
众数、中位数、平均数之间的关系
(1)如果样本平均数大于样本中位数,说明数据中存在较大的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.
(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.
1.已知甲组数据:156,170+a,165,174,162,乙组数据:159,178,160+b,161,167,其中a,b∈{x∈N|x≤9}.若这两组数据的中位数相等,平均数也相等,则a+b= ( )
A.8 B.10
C.11 D.12
【答案】A
【解析】根据题意,甲组数据:156,170+a,165,174,162,其中位数必为165,则乙组数据:159,178,160+b,161,167的中位数也为165,则有160+b=165,解可得b=5;又由两组数据的平均数相等,则有156+170+a+165+174+162=159+178+165+161+167,解得a=3,则a+b=3+5=8.故选A.
题型2 利用频率分布直方图求众数、中位数、平均数
某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;
(2)求这次测试数学成绩的中位数.
(2)由题干图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03×(x-70),所以x≈73.3,即这80名学生的数学成绩的中位数为73.3分.
【例题迁移1】 [改变问法]若本例的条件不变,求数学成绩的平均数.
【例题迁移2】 [改变问法]若本例条件不变,求80分以下的学生人数.
解:分数在[40,80)内的频率为(0.005+0.015+0.020+0.030)×10=0.7,所以80分以下的学生人数为80×0.7=56.
用频率分布直方图估计众数、中位数、平均数
(1)众数:取最高小长方形底边中点的横坐标作为众数.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左、右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.
2.某校为了解全校高中学生“五一”小长假参加实践活动的情况,抽查了100名学生,统计他们假期参加实践活动的时间(单位:时),绘成的频率分布直方图如图所示.
(1)求这100名学生中参加实践活动时间在6~10小时内的人数;
(2)估计这100名学生参加实践活动时间的众数、中位数和平均数.
解:(1)100×[1-(0.04+0.12+0.05)×2]=58(名),
即这100名学生中参加实践活动时间在6~10小时内的人数为58.
(2)由频率分布直方图可以看出最高矩形底边中点的横坐标为7,故这100名学生参加实践活动时间的众数的估计值为7小时.
设中位数为t,由(0.04+0.12)×2=0.32,(0.04+0.12+0.15)×2=0.62,0.32<0.5<0.62,得中位数t满足6<t<8.
由0.32+(t-6)×0.15=0.5,得t=7.2,
即这100名学生参加实践活动时间的中位数的估计值为7.2小时.
由(0.04+0.12+0.15+a+0.05)×2=1,解得a=0.14,
这100名学生参加实践活动时间的平均数的估计值为0.04×2×3+0.12×2×5+0.15×2×7+0.14×2×9+0.05×2×11=7.16(时).
题型3 标准差、方差的计算及应用
甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中抽取6件测量数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算说明哪台机床加工零件的质量更稳定.
用样本的标准差、方差估计总体的方法
(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值.实际应用中,需先分析平均水平,当所得数据的平均数相等时,再计算标准差(方差)分析稳定情况.
(2)标准差、方差的取值范围是[0,+∞).
(3)因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.
3.样本数为9的四组数据,它们的平均数都是5,条形图如图所示,则标准差最大的一组是 ( )
A.第一组 B.第二组
C.第三组 D.第四组
【答案】D
(方法二)从四个图形可以直观看出第一组数据没有波动性,第二、三组数据的波动性都比较小,而第四组数据的波动性相对较大,利用标准差的意义可以直观得到答案.
题型4 分层随机抽样的方差
甲、乙两支田径队的体检结果:甲队体重的平均数为60 kg,方差为200,乙队体重的平均数为70 kg,方差为300,又已知甲、乙两队的队员人数之比为1∶4,那么甲、乙两队全部队员的平均体重和方差分别是多少?
4.在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,求合在一起后的样本平均数与方差(精确到0.1).
易错警示 忽略方差的统计意义致误
甲、乙两种冬小麦实验品种连续5年的平均单位面积产量如下表所示:
单位:t/km2
若某村要从中引进一种冬小麦大量种植,给出你的建议.
品种 第1年 第2年 第3年 第4年 第5年
甲 9.8 9.9 10.1 10 10.2
乙 9.4 10.3 10.8 9.7 9.8
易错防范:平均数反映的是样本的平均水平,方差和标准差则反映了样本的波动、离散程度.对于形如“谁最适合”“谁更稳定”的题目,除了比较数据的平均值之外,还要比较方差或标准差的大小,做出更合理的判断.
| 素 养 达 成 |
1.一组数据中的众数可能不止一个,平均数与中位数是唯一的,求中位数时,必须先排序.
2.利用频率分布直方图求数字特征.
(1)众数是最高的矩形的底边的中点.
(2)中位数左右两边直方图的面积应相等.
(3)平均数等于每个小矩形的面积乘小矩形底边中点的横坐标之和.
3.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.(体现数学运算核心素养)
1.(题型3)一组数据的方差一定是 ( )
A.正数 B.负数
C.任意实数 D.非负数
【答案】D
【解析】方差可为0和正数.
2.(题型1)对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:
①这组数据的众数是3;
②这组数据的众数与中位数的数值不相等;
③这组数据的中位数与平均数的数值相等;
④这组数据的平均数与众数的数值相等.
其中正确的结论的个数为 ( )
A.1 B.2
C.3 D.4
【答案】A
3.(题型2)(2023年上海二模)在下列统计量中,用来描述一组数据离散程度的量是 ( )
A.平均数 B.众数
C.百分位数 D.标准差
【答案】D
【解析】平均数、众数都是描述一组数据的集中趋势的量,故A,B不正确;百分位数是指将一组数据从小到大排列,并计算相应的累计百分位,则某一个百分位所对应的数据的值称为这一百分位数的百分位数,所以百分位数不能用来描述一组数据离散程度的量,故C不正确;标准差反映了数据分散程度的大小,所以说标准差都是描述一组数据的离散程度的统计量,故D正确.故选D.
4.(题型3)(2023年玉树州模拟)已知样本数据x1,x2,…,x2 022的平均数和方差分别为3和56,若yi=2xi+3(i=1,2,…,2 022),则y1,y2,…,y2 022的平均数和方差分别是 ( )
A.12,115 B.12,224
C.9,115 D.9,224
【答案】D
【解析】因为样本数据x1,x2,…,x2 022的平均数和方差分别为3和56,且yi=2xi+3(i=1,2,…,2 022),所以数据y1,y2,…,y2 022的平均数为2×3+3=9,方差为22×56=224.故选D.
5.(题型1,3)甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别求出两人得分的平均数与方差;
(2)根据图和(1)中的计算结果,对两人的训练成绩作出评价.(共57张PPT)
第九章 统 计
9.2 用样本估计总体
9.2.1 总体取值规律的估计
9.2.2 总体百分位数的估计
学习目标 素养要求
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性 直观想象、数据分析
2.结合实例,能用样本估计百分位数,理解百分位数的统计含义 数学抽象、数学运算
| 自 学 导 引 |
频率分布直方图
频率分布直方图的画法
【答案】最大值与最小值 不小于k的最小
【预习自测】判断下列命题是否正确.(正确的画“√”,错误的画“×”)
(2)一般样本容量越大,所分组数越多;样本容量越小,所分组数越少. ( )
(3)频率分布直方图的横轴表示样本数据,纵轴表示频率.( )
(4)频率分布直方图中各个小长方形面积之和等于1. ( )
【答案】(1)× (2)√ (3)× (4)√
(2)当数据总数在50以内时,一般分为5~8组,当数据总数在50~100时,则分为8~12组较合适.
(4)由于各小长方形的面积就是数据落在该组的频率,故各个小长方形面积之和等于1.
总体取值规律的估计
(1)从频率分布表可看出,样本观测数据落在各个小组的比例大小,例如哪组最多,哪组最少,集中在较高值或较低值等.
(2)从__________________可看出,样本的观测数据分布对称情况,左右高低情况,从左到右的变化趋势等.
频率分布直方图
【预习自测】
频率分布直方图的组数对数据分析有何影响?
【提示】当组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息;当组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易看出总体数据的分布特点.
其他统计图表
统计图 主要应用
扇形图 直观描述各类数据占总数的比例
条形图和直方图 直观描述不同类别或分组数据的频数和频率
折线图 描述数据随时间的变化趋势
选择恰当的统计图表分析样本数据有何好处?
【提示】选择恰当的统计图对数据进行可视化描述,能通过图形直观地发现样本数据的分布情况,进而估计总体的分布规律.
百分位数
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有________的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
p%
2.计算一组n个数据的第p百分位数的步骤
第1步,按__________排列原始数据;
第2步,计算i=__________;
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的__________.
3.四分位数
______________,______________,______________.这三个分位数把一组数由小到大排列后的数据分成四等份,因此称为四分位数.
从小到大
n×p%
平均数
第25百分位数
第50百分位数
第75百分数
【预习自测】
“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?
【提示】有70%的同学数学测试成绩小于或等于85分.
| 课 堂 互 动 |
题型1 频率分布直方图的绘制
某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分):
48 64 52 86 71 48 64 41 86 79
71 68 82 84 68 64 62 68 75 57
90 52 74 73 56 78 47 66 55 64
56 88 69 40 73 97 68 56 67 59
70 52 79 44 55 69 62 58 32 58
根据上面的数据,回答下列问题:
(1)这次测验成绩的最高分和最低分分别是多少?
(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图.
(3)分析频率分布直方图,你能得出什么结论?
解:(1)这次测验成绩的最高分是97分,最低分是32分.
(2)根据题意,列出样本的频率分布表如下:
频率分布直方图如图所示.
(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.
1.在列频率分布表时,极差、组距、组数有如下关系:
2.绘图时,应以横轴表示分组,纵轴表示各组频率与组距的比值,以各个组距为底,以各频率除以组距的商为高,分别画成矩形,便得到频率分布直方图.
1.为了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出的频率分布表如下:
分组 频数 频率
[145.5,149.5) 1 0.02
[149.5,153.5) 4 0.08
[153.5,157.5) 20 0.40
[157.5,161.5) 15 0.30
[161.5,165.5) 8 0.16
[165.5,169.5] m n
合计 M N
(1)分别求出表中m,n,M,N所表示的数;
(2)画出频率分布直方图.
题型2 频率分布直方图的应用
如图所示是总体的一个样本频率分布直方图,且在[15,18)内频数为8.
(1)求样本在[15,18)内的频率;
(2)求样本容量;
(3)若在[12,15)内的小矩形面积为0.06,求在[18,33]内的频数.
解:由样本频率分布直方图可知组距为3.
(3)由于在[12,15)内的小矩形面积为0.06,故样本在[12,15)内的频率为0.06,故样本在[15,33]内的频数为50×(1-0.06)=47.又由于在[15,18)内频数为8,故在[18,33]内的频数为47-8=39.
2.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350 kW·h之间,频率分布直方图如图所示.
(1)求直方图中x的值;
(2)在这些用户中,求用电量落在区间[100,250)内的户数.
题型3 其他统计图表与频率分布直方图的综合应用
如图是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日到3月10日最低气温(单位:℃)的扇形统计图.
解:该城市3月1日至10日的最低气温(单位:℃)情况如下表所示:
日期 1 2 3 4 5 6 7 8 9 10
最低气温/℃ -3 -2 0 -1 1 2 0 -1 2 2
其中最低气温为-3 ℃的有1天,占10%,最低气温为-2 ℃的有1天,占10%,最低气温为-1 ℃的有2天,占20%,最低气温为0 ℃的有2天,占20%,最低气温为1 ℃的有1天,占10%,最低气温为2 ℃的有3天,占30%,扇形统计图如图所示.
【例题迁移】 [改变问法]若本例中条件不变,绘制该市3月1日到3月10日最低气温(单位:℃)的条形统计图.
解:该城市3月1日到3月10日的最低气温(单位:℃)情况如下表所示:
日期 1 2 3 4 5 6 7 8 9 10
最低气温/℃ -3 -2 0 -1 1 2 0 -1 2 2
其中最低气温为-3 ℃的有1天,最低气温为-2 ℃的有1天,最低气温为-1 ℃的有2天,最低气温为0 ℃的有2天,最低气温为1 ℃的有1天,最低气温为2 ℃的有3天.条形统计图如图所示.
折线统计图的读图方法
(1)读折线统计图时,首先要看清楚直角坐标系中横、纵坐标表示的意义;其次要明确图中的数量及其单位.
(2)在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.
3.右图是A,B两所学校艺术节期间收到的各类艺术作品的情况的统计图:
(1)从图中能否看出哪所学校收到的水粉画作品数量多?为什么?
(2)已知A学校收到的剪纸作品比B学校的多20件,收到的书法作品比B学校的少100件,请问这两所学校收到艺术作品的总数分别是多少件?
题型4 百分位数的计算
某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦·时的部分按0.5元/(千瓦·时)收费,超过200千瓦·时但不超过400千瓦·时的部分按0.8元/(千瓦·时)收费,超过400千瓦·时的部分按1.0元/(千瓦·时)收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦·时)的函数解析式;
(2)为了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值;
(3)根据(2)中求得的数据计算用电量的75%分位数.
解:(1)当0≤x≤200时,y=0.5x;
当200<x≤400时,y=0.5×200+0.8×(x-200)=0.8x-60;
当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.所以y与x之间的函数解析式为
(2)由(1)可知,当y=260时,x=400,由用电量不超过400千瓦·时的占80%,
结合频率分布直方图可知
解得a=0.001 5,b=0.002 0.
(3)设75%分位数为m,
因为用电量低于300千瓦·时的所占比例为(0.001+0.002+0.003)× 100=60%,
用电量不超过400千瓦·时的占80%,
所以用电量的75%分位数在[300,400)内.
所以用电量的75%分位数为375千瓦·时.
1.根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再应用公式求解.
提醒:总体百分位数估计需要注意的两个问题
(1)总体百分位估计的基础是样本百分位数的计算,因此计算准确是关键.
(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.
4.以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是 ( )
A.90 B.90.5 C.91 D.91.5
【答案】B
易错警示 频率分布直方图的纵坐标当作频率致误
中小学生的视力状况受到社会的关注.某市有关部门从全市6万名高一学生中随机抽取400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示,从左至右五个小组的频率之比为5∶7∶12∶10∶6,则该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有多少人?
易错防范:表面上看本题的回答似乎正确无误,其实答案是错误的,其错因在于没有看懂所提供的频率分布直方图中的数据的含义,误将该频率分布直方图中的纵坐标(频率与组距的比)看成了频率,从而导致问题的解答出错.
| 素 养 达 成 |
1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.(体现数据分析核心素养)
2.当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.
1.(题型2)容量为20的样本数据,分组后的频数如下表所示:
则样本数据落在区间[10,40)的频率为 ( )
A.0.35 B.0.45 C.0.55 D.0.65
【答案】B
分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
频数 2 3 4 5 4 2
2.(题型3)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为 ( )
A.93
B.123
C.137
D.167
【答案】C
【解析】由题图知,该校女教师的人数为110×70%+150×(1-60%)=77+60=137.
3.(题型2)在一次期末考试中,随机抽取200名学生的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:[50,60),[60,70),[70,80),[80,90),[90,100].据此绘制了如图所示的频率分布直方图,则这200名学生中成绩在[80,90)内的学生有 ( )
A.30名
B.40名
C.50名
D.60名
【答案】B
【解析】成绩在[80,90)内的学生所占的频率为1-(0.005×2+0.025+0.045)×10=0.2,所以这200名学生中成绩大于等于80分且小于90分的学生有200×0.2=40(名).故选B.
4.(题型4)对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为________;
(2)由频率分布直方图估计志愿者年龄的95%分位数为________岁.
【答案】(1)0.04 (2)42.5
【解析】(1)设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.
5.(题型2)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层随机抽样调查,测得身高情况的统计图如图所示.
(1)估计该校男生的人数;
(2)估计该校学生身高在170~185 cm之间的学生占总人数的百分比是多少.(共41张PPT)
第九章 统 计
9.1 随机抽样
9.1.2 分层随机抽样
9.1.3 获取数据的途径
学习目标 素养要求
1.通过实例,了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法 数学抽象、数据分析、数学建模
2.结合具体实例,掌握分层随机抽样的样本均值和样本方差 数据分析、数学运算
3.知道获取数据的基本途径,包括:统计年鉴、社会调查、试验设计、普查和抽样、互联网等 数据分析
4.能根据实际问题的特点,设计恰当的抽样方法解决问题 数据分析
| 自 学 导 引 |
分层随机抽样
1.分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行_____________,再把所有子总体中抽取的样本合在一起作为__________,这样的抽样方法称为分层随机抽样,每一个子总体称为______.
2.比例分配
在分层随机抽样中,如果每层样本量都与层的大小________,那么称这种样本量的分配方式为比例分配.
简单随机抽样
总样本
层
成比例
【预习自测】判断下列命题是否正确.(正确的画“√”,错误的画“×”)
(1)在统计实践中选择哪种抽样方法关键是看总体容量的大小. ( )
(2)分层随机抽样有时也需要剔除若干个个体,对这些个体来说是不公平的. ( )
(3)从全班50名同学中抽取5人调查作业完成情况适合用分层随机抽样. ( )
【答案】(1)× (2)× (3)×
【解析】(1)在统计实践中选择哪种抽样方法除看总体和样本量大小外,还要依据总体的构成情况.
(2)根据抽样的意义,对每个个体都是公平的.
(3)适合用简单随机抽样.
分层随机抽样中的总体平均数与样本平均数
(2)在比例分配的分层随机抽样中,可以直接用________________估计________________.
【预习自测】
分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为______________.
【答案】6
获取数据的途径
获取数据的基本途径有:
(1)通过________获取数据;
(2)通过________获取数据;
(3)通过________获取数据;
(4)通过________获取数据.
调查
试验
观察
查询
【预习自测】
要得到某乡镇的贫困人口数据,应采取的方法是 ( )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获取数据
【答案】A
【解析】某乡镇的贫困人口数据属于有限总体问题,所以可以通过调查获取数据.
利用统计报表和年鉴属于哪种获取数据的途径?
【提示】属于通过查询获取数据的途径.
| 课 堂 互 动 |
题型1 分层随机抽样的概念
下列问题中,最适合用分层随机抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.红星中学共有学生1 600名,其中男生840名,防疫站对此校学生进行身体健康调查,抽取一个容量为200的样本
C.从1 000名工人中,抽取100人调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
【答案】B
【解析】A中总体所含个体无差异且个数较少,适合用简单随机抽样;C和D中总体所含个体无差异且个数较多,不适合分层随机抽样;B中总体所含个体差异明显,适合用分层随机抽样.
分层随机抽样的前提和遵循的两条原则
(1)前提:分层随机抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.
(2)遵循的两条原则:①每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②每层样本量与每层个体数量的比等于抽样比.
1.某学校为了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是 ( )
A.抽签法 B.分层随机抽样
C.随机数法 D.以上都不合理
【答案】B
【解析】因为三个年级的学生视力会存在差异,因此使用分层随机抽样.
题型2 分层随机抽样的方案设计
某市的三个区共有高中学生20 000人,且三个区的高中学生人数之比为2∶3∶5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况,试写出抽样过程.
解:(1)由于该市高中学生的视力有差异,按三个区分成三层,用分层随机抽样来抽取样本.
(3)在各层分别按随机数法抽取样本.
(4)综合每层抽样,组成容量为200的样本.
分层随机抽样的步骤
2.一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
解:用分层随机抽样来抽取样本,步骤如下:
(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.
(3)在各层分别按简单随机抽样抽取样本.
(4)汇总每层抽样,组成样本.
题型3 分类抽样的相关计算
(1)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层随机抽样调查,假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为 ( )
A.101 B.808
C.1 212 D.2 012
(2)某分层随机抽样中,有关数据如下:
此样本的平均数为__________.
【答案】(1)B (2)3.437 5
层级 样本量 平均数
第1层 45 3
第2层 35 4
3.(1)在1 000个球中有红球50个,从中抽取100个进行分析,如果用分层随机抽样的方法对球进行抽样,那么应抽红球 ( )
A.5个 B.10个
C.20个 D.33个
(2)将一个总体分为A,B,C三层,其个体数之比为5∶3∶2,若A,B,C三层的样本的平均数分别为15,30,20,则样本的平均数为__________.
【答案】(1)A (2)20.5
题型4 获取数据途径的方法的设计
为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果能很好地反映该市市民的意愿吗?
解:(1)一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.
(2)调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机抽样调查,不要只关注到拥有私家车的市民.
在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法与策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得出统计推断.
4.为了创建“和谐平安”校园,某校决定在开学前将学校的电灯电路使用情况进行检查,以排除安全隐患,获取电灯电路的相关数据应该用什么方法?为什么?
解:由于一个学校的电灯电路数目不算大,属于有限总体问题,所以应该通过调查获取数据,并且对创建“和谐平安”校园来说,必须排除任一潜在或已存在的安全隐患,故必须用普查的方法.
易错警示 忽略分层随机抽样比例分配的特点致误
某校高一有1 000人,高二有990人,高三有1 010 人,为了调查他们的身体情况,需从中抽取一个容量为300的样本,下列说法正确的是 ( )
A.选择简单随机抽样
B.三个年级应各抽取100人
C.可以单独抽取一个年级的学生分析
D.选择分层随机抽样
错解:A,B,C
易错防范:对分层随机抽样的概念理解不透彻.
正解:本题总体由差异明显的三部分组成,应选择分层随机抽样.分层随机抽样应按比例抽样,三个年级应各抽取100人、99人、101人.故选D.
| 素 养 达 成 |
1.对于分层随机抽样中的比值问题,常利用以下关系式.(体现数学运算核心素养)
(2)总体中各层容量之比=对应层抽取的样本数之比.
2.选择抽样方法的规律.(体现逻辑推理核心素养)
(1)当总体容量较小,样本量也较小时,制签简单,号签容易搅匀,可采用抽签法.
(2)当总体容量较大,样本量较小时,可采用随机数法.
(3)当总体是由差异明显的几部分组成时,可采用分层随机抽样法.
1.(题型1)某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了解该机关对政府机构改革的意见,要从中抽取20人,用下列抽样方法最合适的是 ( )
A.抽签法 B.随机数
C.简单随机抽样 D.分层随机抽样
【答案】D
【解析】总体由差异明显的三部分构成,应选用分层随机抽样.
2.(题型3)某单位有职工1 500人,其中青年职工700人,中年职工500人,老年职工300人,为了解该单位职工的健康状况,用分层随机抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本量为 ( )
A.14 B.30
C.50 D.70
【答案】B
3.(题型2)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样和比例分配的分层随机抽样两种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,则 ( )
A.p1>p2 B.p1<p2
C.p1=p2 D.无法确定
【答案】C
4.(题型3)某校有男生2 400人,女生1 600人,李明按男生、女生进行分层,通过分层随机抽样的方法抽取10名学生作为样本,测得样本中男生、女生的平均身高分别为170.20 cm和160.80 cm,则这10名学生的平均身高为__________cm.
【答案】166.44
5.(题型4)一家电脑生产厂家在某城市三个经销本厂产品的大商场调查,产品的销量占这三个大商场同类产品销量的40%.由此在广告中宣传,他们的产品在国内同类产品的销售量占40%.请你根据所学的统计知识,判断该宣传中的数据是否可靠?
解:该电脑生产厂家凭借挑选某城市经销本产品情况,断然说他们的产品在国内同类产品的销量占40%,宣传中的数据是不可靠的,其理由有二:第一,所取样本量太小;第二,样本抽取缺乏代表性和广泛性.(共42张PPT)
第九章 统 计
9.1 随机抽样
9.1.1 简单随机抽样
学习目标 素养要求
1.知道全面调查、抽样调查、总体、个体、样本、样本量、样本数据等概念 数学抽象
2.了解简单随机抽样的含义及解决问题的过程,掌握简单随机抽样的两种方法:抽签法和随机数法 数学抽象、数据分析
3.会计算样本均值和样本方法,了解样本与总体的关系 数据分析
| 自 学 导 引 |
全面调查和抽样调查
调查方式 全面调查(普查) 抽样调查
定义 对__________调查对象都进行调查的方法,称为全面调查,又称普查 根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出________和________的调查方法
每一个
估计
推断
调查方式 全面调查(普查) 抽样调查
相关 概念 总体:在一个调查中,把调查对象的________称为总体; 个体:组成总体的每一个调查________称为个体 样本:把从总体中抽取的那部分________称为样本;
样本量:样本中包含的________称为样本量
全体
对象
个体
个体数
【预习自测】
样本与样本量有什么区别?
【提示】样本与样本量是两个不同的概念,样本是从总体中抽取的个体组成的集合,是研究对象;样本量是样本中个体的数目,是一个数.
简单随机抽样
1.简单随机抽样的定义和方法
(1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n≤N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,把这样的抽样方法叫做_______ ___________;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,把这样的抽样方法叫做___________ __________.放回简单随机抽样与不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为______________.除非特殊声明,本章所称的简单随机抽样指不放回简单随机抽样.
(2)方法:________和____________.
放回简
单随机抽样
不放回简单
随机抽样
简单随机样本
抽签法
随机数法
2.抽签法与随机数法的定义
(1)抽签法:把总体中的N个个体_______,把_______写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取_______号签,连续抽取n次,就得到一个容量为n的样本.
(2)随机数法:随机抽样中,另一个经常被采用的方法是随机数法,即利用____________、____________或__________产生的随机数进行抽样.
编号
号码
一个
随机数表
随机数骰子
计算机
【预习自测】判断下列命题是否正确.(正确的画“√”,错误的画“×”)
(1)抽签法和随机数法都适用于总体容量和样本量较小时的抽样. ( )
(2)利用随机数法抽取样本时,选定的初始数是任意的,但读数的方向只能是从左向右读. ( )
(3)利用随机数法抽取样本时,若一共有总体容量为100,则给每个个体分别编号为1,2,3,…,100. ( )
【答案】(1)√ (2)× (3)×
【解析】(1)由简单随机抽样的定义可知其正确.
(2)读数的方向也是任意的.
(3)编号为00,01,02,…,99(或001,002,003,…,100).
总体平均数与样本平均数
1.总体平均数
(1)一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,
【预习自测】
某展览馆5天中每天进馆参观的人数如下:180,158,170,185,187,则参观人数的平均数是________.
【答案】176
| 课 堂 互 动 |
题型1 简单随机抽样的概念
下列问题中,最适合用简单随机抽样方法的是 ( )
A.某学校有学生1 320人,卫生部门为了解学生身体发育情况,准备从中抽取一个容量为300的样本
B.为了准备省政协会议,某政协委员计划从7 135个村庄中抽取50个进行收入调查
C.从全班30名学生中,任意选取5名进行家访
D.为了解某地区癌症的发病情况,从该地区的5 000人中抽取200人进行统计
【答案】C
【解析】A中不同年级的学生身体发育情况差别较大,B,D的总体容量较大,C的总体容量较小,适宜用简单随机抽样.
简单随机抽样的判断方法
判断所给的抽样是否为简单随机抽样的依据是简单随机抽样的四个特征:
上述四点特征,如果有一点不满足,就不是简单随机抽样.
1.为了进一步严厉打击交通违法,交警队在某一路口随机抽查司机是否酒驾,这种抽查是 ( )
A.简单随机抽样 B.抽签法
C.随机数法 D.以上都不对
【答案】D
【解析】由于不知道总体的情况(包括总体个数),因此不属于简单随机抽样.
题型2 抽签法及其应用
要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,并写出抽样过程.
解:本题中总体容量较小,样本的容量也小,故可选用抽签法来抽取含3个个体的样本,其抽样过程如下:
第一步,将30辆汽车进行编号,所编号码是01,02,…,30;
第二步,将号码分别写在大小、外观相同的纸条上,揉成团,制成号签;
第三步,将全部号签放入一个袋子中,并搅拌均匀;
第四步,从袋子中依次抽取3个号签,并记录上面的编号;
第五步,所得号码对应的3辆汽车就是要抽取的对象.
抽签法的适用条件及注意点
(1)一个抽样能否用抽签法,关键看两点:一是制签是否方便;二是号签是否容易被搅匀.
(2)对个体编号时,也可以利用已有的编号.
(3)号签要求大小、形状完全相同.
(4)号签要搅拌均匀.
(5)要逐一不放回抽取.
2.下列抽样实验中,适合用抽签法的是 ( )
A.从某厂生产3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两工厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
【答案】B
【解析】A,D两项总体容量较大,不适合用抽签法;对C项,甲、乙两厂生产的产品质量可能差异明显.
题型3 随机数法及其应用
为了解参加某次数学知识竞赛的950名学生的成绩,决定从中抽取20名学生的试卷进行分析,写出抽样过程(注:用随机数法).
解:第一步,先将950名学生编号,依次编号为000,001,002,…,949.
第二步,准备10个大小、质地一样的小球,小球上分别写上数字0,1,2,…,9,把它们放入一个不透明的袋中.从袋中有放回地摸取三次,每次摸取前充分搅拌,并把第一、二、三次摸到的数字分别作为百、十、个位数,这样就生成了一个三位随机数.
如果这个三位数在0~949范围内,就代表对应编号的学生被抽中,否则舍弃编号.
第三步,重复第二步,若产生的随机数重复,则剔除,继续摸球,直到选到所需的样本量.
第四步,将符合条件的编号对应的学生的试卷取出,即组成一个样本.
本题中将学生编号都设定成了三位数,我们还可以利用计算机产生若干个0~9范围内的随机数,然后结合编号特点进行读取,若编号为两位数,则两位两位地读取,若编号为三位数,则三位三位地读取.
3.总体由编号为1,2,…,99,100的100个个体组成.现用随机数法选取60个个体,利用电子表格软件产生的若干个1~100范围内的整数随机数的开始部分数据如下表所示,则选出来的第5个个体的编号为__________.
【答案】31
【解析】生成的随机数中落在编号1~100范围内的有8,44,2,17,8(重复,舍弃),31,…故选出来的第5个个体的编号为31.
8 44 2 17 8 31 57 4 55 6
88 77 74 47 7 21 76 33 50 63
题型4 用样本平均数估计总体平均数
为了调查某校高一学生每天午餐消费情况,从该校高一学生中抽查了20名学生,通过调查这20名学生每天午餐消费数据如下表所示(单位:元):
试估计该校高一学生每天午餐的平均费用,以及午餐费用不低于10元的比例.
8 10 6 6 8 12 15 6 8 6
10 8 8 15 6 8 10 8 8 10
解:样本的平均数为
所以估计该校高一全体学生每天午餐的平均费用为8.8元.
在全体学生中,午餐费用不低于10元的比例约为0.35.
4.小林在八年级第一学期的数学书面测验成绩如下:平时考试第一单元得84分,第二单元得76分,第三单元得92分;期中考试得82分;期末考试得90分.如果按照平时、期中、期末的权重分别为10%,30%,60%计算,那么小林该学期数学书面测验的总平均成绩应为多少分?
易错警示 对随机抽样的概念理解不透彻致误
对于下列抽样方法:
①运动员从8个跑道中随机抽取1个跑道;②从20个零件中一次性拿出3个来检验质量;③某班50名学生,指定其中成绩优异的2名学生参加一次学科竞赛;④从无数个有理数中抽取10个有理数作为样本.其中,属于简单随机抽样的是________.(把正确的序号都填上)
错解:②③④
易错防范:对简单随机抽样的概念理解不透彻.
正解:对于②,一次性拿出3个来检验质量,违背简单随机抽样特征中的“逐个”抽取;对于③,指定其中成绩优异的2名学生,不满足等可能抽样的要求;对于④,不满足简单随机抽样中被抽取的样本总体的个数是有限的要求.故填①.
| 素 养 达 成 |
1.要判断所给的抽样方法是不是简单随机抽样,关键是看它们是否符合简单随机抽样的定义.(体现数学抽象核心素养)
2.一个抽样试验能否用抽签法,关键看两点:一是制作号签是否方便,二是号签是否容易被搅拌均匀.一般地,当总体容量和样本容量都较少时可用抽签法.
3.利用随机数法抽取个体时,关键是先确定以表中的哪个数(哪行哪列)作为起点,以哪个方向作为读数的方向.需注意读数时结合编号特点进行读取,编号为两位,则两位、两位地读取;编号为三位,则三位、三位地读取.
1.(题型1)(多选)关于简单随机抽样的特点有以下几种说法,其中正确的有 ( )
A.要求总体中的个体数有限
B.从总体中逐个抽取
C.这是一种不放回抽样
D.每个个体被抽到的机会不一样,与先后顺序有关
【答案】ABC
【解析】简单随机抽样除具有A,B,C三个特点外,还具有等可能性,每个个体被抽取的机会相等,与先后顺序无关.
2.(题型1)(多选)下面抽样方法不属于简单随机抽样的有 ( )
A.从平面直角坐标系中抽取5个点作为样本
B.某饮料公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查
C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动
D.从10台手机中逐个不放回地随机抽取2台进行质量检验(假设10台手机已编号,对编号进行随机抽取)
【答案】ABC
【解析】选项A中,平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;选项B中,一次性抽取不符合简单随机抽样逐个抽取的要求,故错误;选项C中,50名战士是最优秀的,不符合简单随机抽样的等可能性,故错误;选项D符合简单随机抽样的要求.
3.(题型2)抽签法中确保样本代表性的关键是 ( )
A.制签 B.搅拌均匀
C.逐一抽取 D.抽取不放回
【答案】B
【解析】只有将号签搅拌均匀,才能保证每个个体有相等的机会被抽中,从而才能保证样本具有代表性.
4.(题型4)某展览馆在22天中(全年中随机抽取的数据)每天进馆参观的人数如下:180,158,170,185,189,180,184,185,140,179,192,185,190,165,182,170,190,183,175,180,185,147,可估计全年该展览馆平均每天参观的人数约为__________.
【答案】177
5.(题型3)对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度的数据如下表所示:
单位:m/s
分别求出甲、乙两名自行车赛手最大速度数据的平均数并判断选谁参加比赛比较合适.
甲 27 38 30 37 35 31
乙 35 29 40 34 30 36