2023-2024学年高中数学人教A版(2019)必修第二册 第九章 统计 课后习题(打包4份)(含解析)

文档属性

名称 2023-2024学年高中数学人教A版(2019)必修第二册 第九章 统计 课后习题(打包4份)(含解析)
格式 zip
文件大小 936.3KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2023-12-30 10:40:51

文档简介

第九章统计
9.1 随机抽样
9.1.1 简单随机抽样
课后篇巩固提升
必备知识基础练
1.为抽查汽车排放尾气的合格率,某环保局在一路口随机抽查,这种抽查是(  )
                
A.放回简单随机抽样
B.抽签法
C.随机数法
D.以上都不对
答案D
解析由于不知道总体的情况(包括总体个数),因此不属于简单随机抽样.
2.高三某班有34位同学,座位号记为01,02,…,34,用下面的随机数表选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列和第7列数字开始,由左向右依次选取两个数字,则选出来的第4个志愿者的座号为(  )
49 54 43 54 82 17 37 93 23 78 87 35 20
96 43 84 26 34 91 64 57 24 55 06 88 77
04 74 47 67 21 76 33 50 25 83 92 12 06
A.23 B.09 C.16 D.02
答案C
解析根据题意利用随机数法,依次抽取的样本数据为:21,32,09,16,17,所以第4个数据是16.
3.总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为(  )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.08 B.07
C.02 D.01
答案D
解析由随机数法的抽样过程及题意知,选出的5个个体的编号为:08,02,14,07,01,故第5个个体的编号是01.
4.某总体容量为M,其中带有标记的有N个,现用简单随机抽样的方法从中抽取一个容量为m的样本,则抽取的m个个体中带有标记的个数估计为(  )
A. B.
C. D.N
答案A
解析总体中带有标记的比例是,则抽取的m个个体中带有标记的个数估计为.
5.“XX彩票”的中奖号码是从分别标有01,02,…,30的30个小球中逐个不放回地选出7个小球来按规则确定中奖情况,这种从30个号码中选7个号码的抽样方法是     .
答案抽签法
解析30个小球相当于号签,搅拌均匀后逐个不放回地抽取,这是典型的抽签法.
6.用随机数法从100名学生(男生25人)中抽选20人进行评教,某男学生被抽到的可能性是     ,某女学生被抽到的可能性是     .
答案0.2 0.2
解析因为样本量为20,总体数量为100,所以总体中每个个体被抽到的可能性都为=0.2.
7.已知数据x1,x2,…,xn的平均数为=4,则数据3x1+7,3x2+7,…,3xn+7的平均数为     .
答案19
解析∵数据x1,x2,…,xn的平均数为=4,
即数据(x1+x2+…+xn)=4n,
则数据3x1+7,3x2+7,…,3xn+7的平均数=19.
8.学校举办元旦晚会,需要从每班选10名男生,8名女生参加合唱节目,某班有男生32名,女生28名,试用抽签法确定该班参加合唱节目的同学.
解第一步,将32名男生从00到31进行编号.
第二步,用相同的纸条制成32个号签,在每个号签上写上这些编号.
第三步,将写好的号签放在一个不透明的容器内摇匀,不放回地从中逐个抽出10个号签.
第四步,相应编号的男生参加合唱.
第五步,用相同的办法从28名女生中选出8名,则此8名女生参加合唱.
关键能力提升练
9.(2021江西南昌二模)从编号依次为01,02,…,20的20人中选取5人,现从随机数表的第一行第3列和第4列数字开始,由左向右依次选取两个数字,则第五个编号为(  )
5308 3395 5502 6215 2702 4369 3218 1826 0994 7846
5887 3522 2468 3748 1685 9527 1413 8727 1495 5656
A.09 B.02 C.15 D.18
答案A
解析从随机数表的第一行第3列和第4列数字开始,依次读取:08,33(舍),95(舍),55(舍),02,62(舍),15,27(舍),02(舍),43(舍),69(舍),32(舍),18,18(舍),26(舍),09,则第五个编号为09.故选A.
10.用放回简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是 (  )
A. B.
C. D.
答案A
解析在抽样过程中,个体a每次被抽中的概率是相等的,因为总体容量为10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为.故选A.
11.从一群游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续游戏.过了一会儿,再从中任取m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为(  )
A. B.k+m-n
C. D.不能估计
答案C
解析设参加游戏的小孩有x人,则,解得x=.
12.(多选题)下列调查中,适宜采用抽样调查的是(  )
A.调查某市中小学生每天的运动时间
B.某幼儿园中有位小朋友得了手足口病,对此幼儿园中的小朋友进行检查
C.农业科技人员调查今年麦穗的单穗平均质量
D.调查某快餐店中8位店员的生活质量情况
答案AC
解析因为B中要对所有小朋友进行检查,所以用普查的方式;D中共8名店员,可采用普查的方式;A,C中总体容量大,难以做到普查,故采用抽样调查的方式.
13.(多选题)下列抽样方法是简单随机抽样的是(  )
A.从50个零件中随机抽取5个做质量检验
B.从50个零件中每次抽取一个有放回地共抽取5次做质量检验
C.从整数集中随机抽取10个分析奇偶性
D.运动员从8个跑道中随机选取一个跑道
答案ABD
解析C不是,因为整数集是无限集.
14.(多选题)下列抽取样本的方式,不是简单随机抽样的是(  )
A.从无限多个个体中抽取100个个体作为样本
B.盒子里共有80个零件,从中逐个不放回地选出5个零件进行质量检验
C.从80件玩具中一次性随机抽取3件进行质量检验
D.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛
答案AD
解析A不是简单随机抽样,原因是简单随机抽样中总体的个数是有限的,而题中是无限的;B,C是简单随机抽样;D不是简单随机抽样,原因是指定个子最高的5名同学是56名同学中特指的,不存在随机性,不是等可能抽样.
15.假设要抽查某种品牌的900颗种子的发芽率,抽取60粒进行实验.利用随机数法抽取种子时,先将900颗种子按001,002,…,900进行编号,如果从随机数表第8行第7列的数字7开始向右读,请你依次写出最先检测的3颗种子的编号       .(下面摘取了随机数表第7行至第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
答案785,567,199
解析第8行第7列的数字7开始向右读,第一个符合条件的是785,916要舍去,955要舍去,第二个符合条件是567,第三个符合条件是199,故最先检测的3颗种子的编号为785,567,199.
16.某工厂抽取50个机械零件检验其直径大小,得到如下数据:
直径y/cm 12 13 14
频数 12 34 4
估计这个工厂生产的零件的平均直径大约为   .
答案12.84 cm =12.84(cm).
学科素养创新练
17.选择合适的抽样方法抽样,并写出抽样过程.
(1)现有一批电子元件600个,从中抽取6个进行质量检测;
(2)现有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样.
解(1)总体中个体数较大,用随机数法.
第一步,给元件编号为001,002,003,…,099,100,…,600;
第二步,用随机数工具产生1~600范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的电子元件进入样本;
第三步,依次操作,如果生成的随机数有重复,则剔除并重新产生随机数,直到样本量达到6;
第四步,以上这6个号码对应的元件就是要抽取的对象.
(2)总体中个体数较小,用抽签法.
第一步,将30个篮球,编号为01,02,…,30;
第二步,将以上30个编号分别写在外观、质地等无差别的小纸条上,制成号签;
第三步,把号签放入一个不透明的盒子中,充分搅拌;第九章统计
9.1 随机抽样
9.1.2 分层随机抽样 9.1.3 获取数据的途径
课后篇巩固提升
必备知识基础练
1.为了了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男、女生视力情况差异不大,在下面抽样方法中,最合理的抽样方法是(  )
                
A.不放回简单随机抽样
B.按性别分层随机抽样
C.按学段分层随机抽样
D.放回简单随机抽样
答案C
解析小学、初中、高中三个学段学生的视力情况有较大差异,而男、女生视力情况差异不大,故选用按学段分层随机抽样的抽样方法.
2.2020年某省将实行新高考,考试及录取发生了很大的变化.为了报考理想的大学,小明需要获取近年来我国各大学会计专业录取人数的相关数据,他获取这些数据的最好途径是(  )
A.通过调查获取数据
B.通过试验获取数据
C.通过观察获取数据
D.通过查询获取数据
答案D
解析因为近年来我国各大学会计专业录取人数的相关数据有存储,所以小明获取这些数据的最好途径是通过查询获取数据.
3.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层随机抽样的方法抽取一个容量为90的样本,应在这三校分别抽取学生个数为(  )
A.30,30,30 B.30,45,15
C.20,30,10 D.30,50,10
答案B
解析由题意知,,再各层分别抽取,甲校抽取的人数为3 600×=30,乙校抽取的人数为5 400×=45,丙校抽取的人数为1 800×=15,故选B.
4.某中学有高中生3 000人,初中生2 000人,男、女生所占的比例如图所示.为了解学生的学习情况,用分层随机抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则从初中生中抽取的男生人数是(  )
A.12 B.15 C.20 D.21
答案A
解析由扇形图,得该中学有高中生3 000人,其中男生人数为3 000×30%=900,女生人数为3 000×70%=2 100,
初中生2 000人,其中男生人数为2 000×60%=1 200,女生人数为2 000×40%=800,
用分层随机抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,
则,解得n=50,∴从初中生中抽取的男生人数为50×=12.故选A.
5.从某地区15 000位老人中按性别分层随机抽取一个容量为500的样本,调查其生活能否自理的情况如下表所示.
生活能否自理 性别
男 女
能 178 278
不能 23 21
则该地区生活不能自理的老人中男性比女性多的人数约为(  )
A.60 B.100 C.1 500 D.2 000
答案A
解析由分层随机抽样方法知所求人数为×15 000=60.
6.某学校进行数学竞赛,将考生的成绩分成90分及以下、91~120分、121~150分三种情况进行统计,发现三个成绩段的人数之比依次为5∶3∶1.现用分层随机抽样的方法抽取一个容量为m的样本,其中分数在91~120分的人数是45,则此样本的容量m的值为(  )
A.75 B.100 C.125 D.135
答案D
解析由已知得,得m=135.
7.某单位有男、女职工共600人,现用分层随机抽样的方法从所有职工中抽取容量为50的样本,已知从女职工中抽取的人数为15,那么该单位的女职工人数为     .
答案180
解析设该单位的女职工人数为n,则,解得n=180,即该单位的女职工人数为180.
8.古代科举制度始于隋而成于唐,完备于宋、元.明代则处于其发展的鼎盛阶段,其中表现之一为会试分南卷、北卷、中卷按比例录取,其录取比例为11∶7∶2.若明宣德五年会试录取人数为100.则中卷录取人数为     .
答案10
解析由题意,明宣德五年会试录取人数为100,则中卷录取人数为100×=10.
9.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层随机抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
解(1)设参加活动的总人数为x,
游泳组中,青年人、中年人、老年人所占比例分别为a,b,c,则
a==40%,
b==50%,
c==10%,
故游泳组中青年人、中年人、老年人所占的比例分别为40%,50%,10%.
(2)因为是分层随机抽样,所以,游泳组中青年人抽取的人数为200××40%=60;中年人抽取的人数为200××50%=75;老年人抽取的人数为200××10%=15.
关键能力提升练
10.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为(  )
A.60 B.80 C.120 D.180
答案C
解析11~12岁回收180份,其中在11~12岁学生问卷中抽取60份,抽样比为,因为分层抽取的样本容量为300,故回收问卷总数为=900(份),故x=900-120-180-240=360(份),360×=120(份).
11.我国古代数学名著《九章算术》中有如下问题“今有北乡算八千七百五十八,西乡算七千二百三十六,南乡算八千三百五十六,凡三乡,发役三百七十八人,欲以算数多少出之,问各几何 ”意思是:北乡有8 758人,西乡有7 236人,南乡有8 356人,现要按人数多少从三乡共征集378人,问从各乡征集多少人 在上述问题中,需从西乡征集的人数是(  )
A.102 B.112 C.130 D.136
答案B
解析因为北乡有8 758人,西乡有7 236人,南乡有8 356人,现要按人数多少从三乡共征集378人,故需从西乡征集的人数是378×≈112.
12.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为(  )
A.200,20 B.100,20
C.200,10 D.100,10
答案A
解析该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20.
13.下列调查方案中,抽样方法合适、样本具有代表性的是 (  )
A.用一本书第1页的字数估计全书的字数
B.为调查某校学生对航天科技知识的了解程度,上学期间,在该校门口,每隔2分钟随机调查一位学生
C.在省内选取一所城市中学,一所农村中学,向每个学生发一张卡片,上面印有一些科学家的名字,要求每个学生只能在一个喜欢的科学家名字下面画“√”,以了解全省中学生最喜欢的科学家是谁
D.为了调查我国小学生的健康状况,共抽取了100名小学生进行调查
答案B
解析A中,样本缺少代表性(第1页的字数一般较少);B中,抽样保证了随机性原则,样本具有代表性;C中,城市中学与农村中学的规模往往不同,学生喜欢的科学家也未必在所列的名单之中,这些都会影响数据的代表性;D中,总体数量很大,而样本容量太少,不足以体现总体特征.
14.研究下列问题:①某城市元旦前后的气温;②某种新型电器元件使用寿命的测定;③电视台想知道某一个节目的收视率.一般通过试验获取数据的是(  )
A.①② B.③ C.② D.②③
答案C
解析①通过观察获取数据,③通过调查获取数据,只有②通过试验获取数据.
15.(多选题)某公司生产三种型号的轿车,产量分别为1 200辆,6 000辆和2 000辆.为检验该公司的产品质量,公司质监部门要抽取46辆进行检验,则(  )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.三种型号的轿车依次抽取6辆、30辆、10辆
D.这三种型号的轿车,每一辆被抽到的概率都是相等的
答案ACD
解析由于总体按型号分为三个子总体,所以应采用分层随机抽样抽取,A正确;设三种型号的轿车依次抽取x辆,y辆,z辆,则有解得所以三种型号的轿车依次抽取6辆、30辆、10辆,故C正确;由分层随机抽样的意义可知D也正确.
16.(多选题)某工厂生产A,B,C三种不同型号的产品,其相应产品数量之比为2∶5∶3,现用分层随机抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,则(  )
A.此样本的容量n为20
B.此样本的容量n为80
C.样本中B型号产品有40件
D.样本中B型号产品有24件
答案BC
解析工厂生产A,B,C三种不同型号的产品,其相应产品数量之比为2∶5∶3,现用分层随机抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,设样本为n,则n=16÷=80,故A错误,B正确;样本中B型号产品有80×=40件,故C正确,D错误.故选BC.
17.某高中针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:
年级 高一年级 高二年级 高三年级
泥塑 a b c
剪纸 x y z
其中x∶y∶z=5∶3∶2,且“泥塑”社团的人数占两个社团总人数的,为了了解学生对两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取    人.
答案6
解析因为“泥塑”社团的人数占总人数的,故“剪纸”社团的人数占总人数的,所以“剪纸”社团的人数为800×=320.因为“剪纸”社团中高二年级人数比例为,所以“剪纸”社团中高二年级人数为320×=96.由题意知,抽样比为,所以从高二年级“剪纸”社团中抽取的人数为96×=6.
18.某机构对某镇的学生的身体素质状况按年级段进行分层随机抽样调查,得到了如下表所示的数据,则=    .
年级段 小学 初中 高中
总人数 800 x y
样本中人数 16 15 z
答案37 500
解析由分层随机抽样的特点,得,即x=750,=50,则=37 500.
19.为制定本市七、八、九年级男学生校服的生产计划,有关部门准备对180名初中男生的身高做调查,现有三种调查方案:
(1)测量少年体校中180名男子篮球、排球队员的身高;
(2)网上查阅有关我国其他地市180名男生身高的统计资料;
(3)按本市七、八、九年级男学生数目的比例分别从三个年级共抽取180名男生调查其身高.
为了达到估计本市初中这三个年级男生身高分布的目的,则上述调查方案不合理的是    ,合理的是    .(填序号)
答案(1)(2) (3)
解析(1)中,少年体校的男子篮球、排球的运动员的身高一般高于平均水平,因此不能用测量的结果去估计总体的结果,故方案(1)不合理;(2)中,用外地学生的身高也不能准确地反映本地学生身高的实际情况,故方案(2)不合理;(3)中,由于初中三个年级的男生身高是不同的,所以应该用按比例分别抽取的方法从初中三个年级抽取180名男生调查其身高,方案(3)合理.
20.某地气象台记录了本地6月份的日最高气温(如下表所示):
日最高气温y/℃ 20 22 24 25 26 28 29 30
频数 5 4 6 6 4 2 2 1
气象台获取数据的途径是               ,本地6月份的日最高气温的平均数约为    ℃.(结果保留一位小数)
答案通过观察获取数据 24.3
解析由题意可知气象台获取数据的途径是通过观察获取数据;本地6月份的日最高气温的平均数为×(20×5+22×4+24×6+25×6+26×4+28×2+29×2+30×1)≈24.3(℃).
21.一工厂生产了16 800件某种产品,它们分别来自甲、乙、丙3条生产线.为检查这批产品的质量,决定采用分层随机抽样的方法进行抽样.已知从甲、乙、丙3条生产线抽取的产品个数分别是a,b,c,且2b=a+c,则乙生产线生产了     件产品.
答案5 600
解析设甲、乙、丙3条生产线各生产了T甲、T乙、T丙件产品,则a∶b∶c=T甲∶T乙∶T丙,即.
又因为2b=a+c,所以
所以T乙==5 600.
22.某市四个区共有20 000名学生,且四个区的学生人数之比为3∶2.8∶2.2∶2.现要用分层随机抽样的方法从所有学生中抽取一个容量为200的样本,那么在这四个区中,抽取人数最多的区与抽取人数最少的区的人数差是多少
解抽取人数最多的区的人数为×200=×200=60,抽取人数最少的区的人数为×200=×200=40,则抽取人数最多的区与抽取人数最少的区的人数差为60-40=20.
23.某校高中学生有900人,校医务室想对全体高中学生的身高情况做一次调查,为了不影响正常教学活动,准备抽取50名学生作为调查对象.校医务室若从高一年级中抽取50名学生的身高来估计全校高中学生的身高,你认为这样的调查结果会怎样
解由于学生的身高会随着年龄的增长而增高,校医务室想了解全校高中学生的身高情况,在抽样时应当关注高中各年级学生的身高,并且还要分性别进行抽查.如果只抽取高一的学生,结果是片面的.
学科素养创新练
24.一个地区共有5个乡镇,共计3万人,其人口比例为3∶2∶5∶2∶3,从这3万人中抽取一个300人的样本,分析某种疾病的发病率.已知这种疾病与不同的地理位置及水土有关,则应采取什么样的抽样方法 并写出具体过程.
解因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而应采用分层随机抽样的方法.具体过程如下:
(1)将3万人分成5层,一个乡镇为一层.
(2)按照各乡镇的人口比例随机抽取各乡镇的样本:
300×=60(人),300×=40(人),300×=100(人),300×=40(人),300×=60(人).第九章统计
9.2 用样本估计总体
9.2.1 总体取值规律的估计 9.2.2 总体百分位数的估计
课后篇巩固提升
必备知识基础练
1.某班学生在一次数学考试中各分数段以及人数的成绩分布为:[0,80),2人;[80,90),6人;[90,100),4人;[100,110),8人;[110,120),12人;[120,130),5人;[130,140),6人;[140,150),2人.则分数在[100,130)中的频数以及频率分别为(  )
                
A.25,0.56 B.20,0.56
C.25,0.50 D.13,0.29
答案A
解析由题意知该班总人数为2+6+4+8+12+5+6+2=45,其中成绩在[100,130)的人数为8+12+5=25,故分数在[100,130)中的频数为25,频率为≈0.56.
2.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重不小于70.5 kg的人数为(  )
A.300 B.360 C.420 D.450
答案B
解析由题中频率分布直方图,得这100名高中男生体重不小于70.5 kg的频率是(0.04+0.035+0.015)×2=0.18,所以估计该校2 000名高中男生中体重不小于70.5 kg的频率是0.18,则估计该校2 000名高中男生中体重不小于70.5 kg的人数为2 000×0.18=360.
3.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2017年1月至2019年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论不正确的是(  )
A.年接待游客量逐年增加
B.月接待游客量逐月增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
答案B
解析在A中,年接待游客量逐年增加,故A正确;
在B中,月接待游客量8月份后开始减少,并不是逐月增加,故B错误;
在C中,各年的月接待游客量高峰期大致在7,8月,故C正确;
在D中,各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳,故D正确.
4.已知甲、乙两组数据(已按从小到大的顺序排列):
甲组:27,28,39,40,m,50;
乙组:24,n,34,43,48,52.
若这两组数据的第30百分位数、第80百分位数分别相等,则等于(  )
A. B.
C. D.
答案A
解析因为×6=1.8,×6=4.8,所以第30百分位数为n=28,第80百分位数为m=48,所以.
5.为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱.他们捐款数(单位:元)如下:19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图时先计算最大值与最小值的差是     .若取组距为2,则应分成     组;若第一组的起点定为18.5,则在[26.5,28.5)内的频数为     .
答案11 6 5
解析由题意知,极差为30-19=11;因为组距为2,=5.5不是整数,所以取6组;捐款数落在[26.5,28.5)内的有27,27,28,28,27共5个,因此频数为5.
6.统计某校1 000名学生的数学测试成绩,得到样本的频率分布直方图如图所示,规定不低于60分为及格,不低于80分为优秀,则估计及格人数是     ;优秀率是     .
答案800 20%
解析及格率是1-(0.005+0.015)×10=0.8,
所以估计及格人数是1 000×0.8=800,优秀率是(0.01+0.01)×10=0.2=20%.
关键能力提升练
7.港珠澳大桥是中国境内一座连接香港、珠海和澳门的桥隧工程,桥隧全长55千米,桥面为双向六车道高速公路,大桥通行限速100 km/h.现对大桥某路段上汽车行驶速度进行抽样调查,画出频率分布直方图(如图).根据直方图估计在此路段上汽车行驶速度的众数和行驶速度超过90 km/h的频率分别为(  )
A.85,0.25 B.90,0.35
C.87.5,0.25 D.87.5,0.35
答案D
解析由频率分布直方图估计在此路段上汽车行驶速度的众数为=87.5,由频率分布直方图估计在此路段上汽车行驶速度超过90 km/h的频率为(0.05+0.02)×5=0.35,∴由频率分布直方图估计在此路段上汽车行驶速度超过90 km/h的频率为0.35.
8.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,估计棉花纤维的长度的样本数据的第80百分位数是(  )
A.29 mm B.29.5 mm
C.30 mm D.30.5 mm
答案A
解析棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以下的比例为85%-25%=60%,因此,第80百分位数一定位于[25,30)内,由25+5×=29,可以估计棉花纤维的长度的样本数据的第80百分位数是29 mm.
9.(多选题)已知100个数据的第75百分位数是9.3,则下列说法不正确的是(  )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
答案ABD
解析因为75×=75为整数,所以第75个数据和76个数据的平均数为第75百分位数,是9.3,则C正确,其他选项均不对,故选ABD.
10.(多选题)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形图如图所示,则(  )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的平均数等于乙的成绩的平均数
C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数
D.甲的成绩的极差等于乙的成绩的极差
答案BCD
解析由图可得,=6,=6,A项错误,B项正确;甲的成绩的第80百分位数为=7.5,乙的成绩的第80百分位数为=7.5,所以二者相等,所以C项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D项正确.
11.已知30个数据的第60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是    .
答案8.6
解析由60×=18,设第19个数据为x,则=8.2,解得x=8.6,即第19个数据是8.6.
12.如图是某市2020年4月1日至4月7日每天最高、最低气温的折线图,这7天的日最高气温的第10百分位数为    ,日最低气温的第80百分位数为    .
答案24 ℃ 16 ℃
解析由折线图可知,把日最高气温按照从小到大排序,得24,24.5,24.5,25,26,26,27,因为共有7个数据,所以7×=0.7,不是整数,所以这7天日最高气温的第10百分位数是第1个数据,为24 ℃.把日最低气温按照从小到大排序,得12,12,13,14,15,16,17.因为共有7个数据,所以7×=5.6,不是整数,所以这7天日最低气温的第80百分位数是第6个数据,为16 ℃.
13.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的第70百分位数约为    秒.
答案16.5
解析设成绩的第70百分位数为x,因为=0.55,=0.85,所以x∈[16,17),所以0.55+(x-16)×=0.70,解得x=16.5.
14.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为    ;
(2)由频率分布直方图估计志愿者年龄的85%分位数约为    岁.
答案(1)0.04 (2)39
解析(1)设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.
(2)由图可知,年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,
所以志愿者年龄的85%分位数在[35,40)内,
因此志愿者年龄的85%分位数为35+×5≈39(岁).
学科素养创新练
15.(2021浙江宁波期末)首次实施新高考的八省(市)于2021年1月23日统一举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率分布直方图.
(1)求出图中a的值并估计本次考试及格率(“及格率”指得分为90分及以上的学生所占比例);
(2)估计该校学生联考数学成绩的第80百分位数;
(3)估计该校学生联考数学成绩的众数、平均数.
解(1)由(0.004+a+0.013+0.014+0.016)×20=1,得a=0.003,
则及格率为(0.016+0.014+0.003)×20=0.66=66%.
(2)得分在110分以下的学生所占比例为(0.004+0.013+0.016)×20=0.66,
得分在130分以下的学生所占比例为0.66+0.014×20=0.94,
所以第80百分位数位于[110,130)内,
由110+20×=120,
估计第80百分位数为120.第九章统计
9.2 用样本估计总体
9.2.3 总体集中趋势的估计 9.2.4 总体离散程度的估计
课后篇巩固提升
必备知识基础练
1.某趟车某时刻从始发站驶往终点站的过程中,10个车站上车的人数统计如下:70,60,60,50,60,40,40,30,30,10,则这组数据的众数、中位数、平均数的和为(  )
                
A.170 B.165 C.160 D.150
答案D
解析数据70,60,60,50,60,40,40,30,30,10的众数是60,中位数是45,平均数是45,故众数、中位数、平均数的和为150,故选D.
2.一组样本数据的频率分布直方图如图所示,则依据图形中的数据,可以估计总体的平均数与中位数分别是 (  )
A.12.5,12.5 B.13.5,13
C.13.5,12.5 D.13,13
答案D
解析根据频率分布直方图可以得到第一组的频率为0.2,第二组的频率为0.5,则第三组的频率为0.3,则平均数为7.5×0.2+12.5×0.5+17.5×0.3=13,由中位数的概念可以得到中位数在第二组区间[10,15)内,设为x,则0.2+(x-10)×0.1=0.5,解得x=13,故选D.
3.某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其平均数和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为(  )
A.,s2+1002 B.+100,s2+1002
C.,s2 D.+100,s2
答案D
解析由题意知yi=xi+100,
则(x1+x2+…+x10+100×10)=(x1+x2+…+x10)+100=+100,方差s2={[(x1+100)-(+100)]2+[(x2+100)-(+100)]2+…+[(x10+100)-(+100)]2}=[(x1-)2+(x2-)2+…+(x10-)2]=s2.故选D.
4.如图是某市甲、乙两地五月上旬日平均气温的统计图(温度为整数),则甲、乙两地这十天的日平均气温和日平均气温的标准差s甲,s乙的大小关系应为(  )
A.,s甲s乙
C.,s甲s乙
答案B
解析由折线图可得甲、乙两地五月上旬10天的日平均气温,从标准差的统计意义是“各数据浮动的大小”可得乙的标准差比较小.则只需要计算均值即可.
=26,
=26.
故选B.
5.某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77,则这组数据的中位数是     .
答案1.76
解析∵6位同学的身高(单位:米)从小到大排列为1.69,1.72,1.75,1.77,1.78,1.80,位于中间的两个数值为1.75,1.77,∴这组数据的中位数是=1.76.
6.已知样本9,10,11,x,y的平均数是10,标准差为,则xy=     .
答案96
解析由平均数得9+10+11+x+y=50,
所以x+y=20.又由(9-10)2+(10-10)2+(11-10)2+(x-10)2+(y-10)2=()2×5=10,得x2+y2-20(x+y)=-192,(x+y)2-2xy-20(x+y)=-192,所以xy=96.
7.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
运动员 第一次 第二次 第三次 第四次 第五次
甲 87 91 90 89 93
乙 89 90 91 88 92
则成绩较为稳定(方差较小)的那位运动员成绩的方差为     .
答案2
解析由图表中甲、乙两位射击运动员的训练成绩得
=90,
=90.
方差=
=4,
=
=2.
所以乙运动员的成绩较稳定,且方差为2.
8.某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(单位:分,均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图形的信息,回答下列问题:
(1)求第四小组的频率,并补全这个频率分布直方图;
(2)估计这次考试的及格率(60分及以上为及格)、众数和中位数.
解(1)因为各组的频率和等于1,故第四组的频率为1-(0.025+0.015×2+0.01+0.005)×10=0.3.
补全频率分布直方图如图所示:
(2)依题意,60及以上的分数所在的是第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)×10=0.75,所以抽样学生成绩的及格率是75%,众数为最高小长方形底边中点的横坐标,所以众数是75.
由0.1+0.15+0.15=0.4,0.4+0.3=0.7,得中位数在[70,80)分内,设中位数为x,则(x-70)×0.03+0.4=0.5,解得x≈73.3,所以估计中位数是73.3.
关键能力提升练
9.在某次高中学科竞赛中,4 000名考生的参赛成绩统计如图所示,60分以下视为不及格.若同一组中的数据用该组区间中点值为代表,则下列说法中不正确的是(  )
A.成绩在[70,80)内的考生人数最多
B.不及格的考生人数为1 000
C.考生竞赛成绩的平均分约为70.5分
D.考生竞赛成绩的中位数为75
答案D
解析由频率分布直方图可得,成绩在[70,80)内的频率最高,因此考生人数最多,故A正确;由频率分布直方图可得,成绩在[40,60)内的频率为0.25,因此,不及格的人数为4 000×0.25=1 000,故B正确;由频率分布直方图可得,平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;因为成绩在[40,70)内的频率为0.45,[70,80)内的频率为0.3,所以中位数为70+10×≈71.67,故D错误.
10.如图是某学校的教研处根据调查结果绘制的本校学生每天放学后的自学时间情况的频率分布直方图.根据频率分布直方图,求出自学时间的中位数和众数的估计值(精确到0.01)分别是(  )
A.2.20 2.25 B.2.29 2.20
C.2.29 2.25 D.2.25 2.25
答案C
解析由频率分布直方图得,自学时间在[0.5,2)内的频率为(0.16+0.2+0.34)×0.5=0.35,自学时间在[2,2.5)内的频率为0.52×0.5=0.26,所以自学时间的中位数为2+×0.5≈2.29,众数为=2.25.故选C.
11.样本(x1,x2,…,xn)的平均数为,样本(y1,y2,…,ym)的平均数为),若样本(x1,x2,…,xn,y1,y2,…,ym)的平均数为=a+(1-a),其中0A.nm
C.n=m D.不能确定
答案A
解析x1+x2+…+xn=n,y1+y2+…+ym=m,x1+x2+…+xn+y1+y2+…+ym=(m+n)=(m+n)[a+(1-a)]=(m+n)a+(m+n)(1-a),所以n+m=(m+n)a+(m+n)(1-a),
所以
故n-m=(m+n)[a-(1-a)]=(m+n)(2a-1).
因为0所以n-m<0,即n12.(2021河南郑州期末)已知角α,β,γ满足0<α<β<γ<π,若sin α,sin β,sin γ这三个数中的某个数是其他两个数的平均数,则这个数(  )
A.不可能等于sin α
B.不可能等于sin β
C.不可能等于sin γ
D.可能等于sin α,sin β或sin γ
答案D
解析设013.某市有15个旅游景点,经计算,黄金周期间各个景点的旅游人数平均为20万,标准差为s,后来经核实,发现甲、乙两处景点统计的人数有误,甲景点实际为20万,被误统计为15万,乙景点实际为18万,被误统计成23万;更正后重新计算,得到标准差为s1,则s与s1的大小关系为(  )
A.s=s1 B.sC.s>s1 D.不能确定
答案C
解析由已知,两次统计所得的旅游人数总数没有变,即两次统计的各景点旅游人数的平均数是相同的,设为,则
s=,
s1=,
若比较s与s1的大小,只需比较(15-)2+(23-)2与(20- )2+(18-)2的大小即可,而(15-)2+(23-)2=754-76+2,(20-)2+(18-)2=724-76+2,所以(15-)2+(23-)2>(20-)2+(18-)2,从而s>s1.故选C.
14.(多选题)如图,样本A,B分别取自两个不同的总体,它们的平均数分别为,中位数分别为yA,yB,则(  )
A. B.
C.yA>yB D.yA答案BD
解析由题图知,A组的6个数从小到大排列为2.5,2.5,5,7.5,10,10;B组的6个数从小到大排列为6,6,6,7.5,7.5,9,
所以=6.25,=7.显然.又yA=(5+7.5)=6.25,yB==6.75,所以yA15.(多选题)(2021江苏连云港期末)若数据x1,x2,…,x10的平均数为2,方差为3,则(  )
A.数据3x1+2,3x2+2,…,3x10+2的平均数为20
B.xi=20
C.数据3x1+2,3x2+2,…,3x10+2的标准差为3
D.=70
答案BCD
解析因为数据x1,x2,…,x10的平均数为2,所以数据3x1+2,3x2+2,…,3x10+2的平均数为3×2+2=8,故选项A错误;xi=10×2=20,故选项B正确;数据3x1+2,3x2+2,…,3x10+2的方差为32×3=27,所以数据3x1+2,3x2+2,…,3x10+2的标准差为3,故选项C正确;由方差的计算公式可得,=10×3+10×22=70,故选项D正确.
16.(多选题)(2021浙江绍兴期末)如图是甲、乙两人在射击测试中6次命中环数的折线图,则(  )
A.若甲、乙射击成绩的平均数分别为,则
B.若甲、乙射击成绩的方差分别为,则
C.乙射击成绩的中位数小于甲射击成绩的中位数
D.乙比甲的射击成绩稳定
答案CD
解析甲射击测试中6次命中环数为:6,7,8,9,9,10,乙射击测试中6次命中环数为:5,5,6,7,7,7,甲、乙射击成绩的平均数分别为,甲、乙射击成绩的方差分别为,则×(9+10+6+7+9+8)≈8.17,×(6+7+5+5+7+7)≈6.17,所以,故选项A错误;由折线图可以看出,乙的射击成绩比甲的射击成绩波动小,所以,乙比甲的射击成绩稳定,故选项B错误,选项D正确;甲射击成绩的中位数为=8.5,乙射击成绩的中位数为=6.5,故选项C正确.
17.(多选题)某综艺节目为比较甲、乙两名选手的各项能力(每项能力的指标值满分均为5分,分值高者为优),绘制如图所示的六维能力雷达图,图中点A表示甲的创造能力指标值为4,点B表示乙的空间能力指标值为3,则下列叙述正确的是(  )
A.乙的记忆能力优于甲
B.乙的观察能力优于创造能力
C.甲的六大能力整体水平优于乙
D.甲的六大能力比乙均衡
答案BCD
解析由六维能力雷达图,知乙的记忆能力指标值是4,甲的记忆能力指标值是5,故甲的记忆能力优于乙的记忆能力,故A错误;乙的创造能力指标值是3,观察能力指标值是4,故乙的观察能力优于创造能力,故B正确;甲的六大能力之和为25,乙的六大能力之和为24,所以甲的六大能力整体水平优于乙,故C正确;甲的六大能力指标值的方差大于乙的六大能力指标值的方差,所以甲的六大能力比乙均衡,D正确.
18.已知一组正数x1,x2,x3,x4的方差s2=-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为     .
答案4
解析由题意可得s2=(xi-)2=-4,则=4,由于x1,x2,x3,x4均为正数,则其平均数>0,∴=2.
故数据x1+2,x2+2,x3+2,x4+2的平均数为'=(xi+2)=xi+2=+2=4.
19.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x-y|的值为     .
答案4
解析根据题意知n=5,s2=2,=10.
由方差的简易计算公式s2=,
则有=5(s2+)=5×(2+102)=510,
即x2+y2+102+112+92=510,所以x2+y2=208.
又=10,即x+y=20.
所以x2+y2=(x+y)2-2xy=208,解得2xy=192,
所以|x-y|==4.
20.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现用分层随机抽样的方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为    ;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为    小时.
答案50 1 015
解析由分层随机抽样可知,
第一分厂应抽取100×50%=50(件).
由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为1 020×50%+980×20%+1 030×30%=1 015(小时).
21.由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为    .(从小到大排列)
答案1,1,3,3
解析假设这组数据按从小到大的顺序排列为x1,x2,x3,x4,则

又s=
=
==1,
∴(x1-2)2+(x2-2)2=2.
同理可求得(x3-2)2+(x4-2)2=2.
由x1,x2,x3,x4均为正整数,且(x1,x2),(x3,x4)均为方程(x-2)2+(y-2)2=2的解,分析知x1,x2,x3,x4应为1,1,3,3.
学科素养创新练
22.某校高一(1)(2)班各有49名学生,两班学生在一次数学测试(满分100分)中的成绩(单位:分)统计如下表:
班级 平均分 众数 中位数 标准差
高一(1)班 79 70 87 19.8
高一(2)班 79 70 79 5.2
(1)请你对下面的一段话给予简要分析:
高一(1)班的小刚回家对妈妈说:“昨天的数学测试中,全班的平均分为79分,得70分的人最多,我得了85分,在班里算是上游了.”
(2)请你根据表中的数据分析两班的测试情况,并提出教学建议.
解(1)由高一(1)班成绩的中位数是87可知,85分排在25名以后,从名次上讲并不能说85分在班里是上游,但也不能从这次测试的名次上来判断学习的好坏.小刚得了85分,说明他对这阶段的学习内容掌握得较好,从掌握的学习内容上讲也算是上游.
(2)高一(1)班成绩的中位数是87,说明高于87分的人数占一半左右,而平均分为79分,标准差又很大,说明低分者很多,两极分化严重,建议对学习差的学生给予帮助.
高一(2)班成绩的中位数和平均数都是79,标准差较小,说明学生成绩之间的差别也较小,学习差的学生较少,但学习优秀的学生也很少,建议采取措施提高优秀学生的人数.
23.把某校三年级一班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:
统计量 平均成绩 标准差
第一组 90 6
第二组 80 4
求全班学生的平均成绩和标准差.
解设第一组20名学生的成绩为xi(i=1,2,…,20),
第二组20名学生的成绩为yi(i=1,2,…,20),
依题意有(x1+x2+…+x20)=90,
(y1+y2+…+y20)=80,
故全班平均成绩为
(x1+x2+…+x20+y1+y2+…+y20)
=(90×20+80×20)=85;
又设第一组学生成绩的标准差为s1,第二组学生成绩的标准差为s2,则
+…+-20),
+…+-20)(此处,=90,=80),
又设全班40名学生的标准差为s,平均成绩为=85),
故有s2=+…++…+-40)
=(20+20+20+20-40)
=(62+42+902+802-2×852)=51,