2023-2024学年高中数学人教A版必修二 9.3 统计分析 同步练习
一、选择题
1.(2023高二下·河北期末)某学校有男生600人,女生400人.为调查该校全体学生每天的运动时间,采用分层抽样的方法获取容量为的样本.经过计算,样本中男生每天运动时间的平均值为80分钟,方差为10;女生每天运动时间的平均值为60分钟,方差为20.结合数据,估计全校学生每天运动时间的方差为( )
A.96 B.110 C.112 D.128
2.(2023高二下·安康月考)某校为了了解学生的身体素质,对2022届初三年级所有学生仰卧起坐一分钟的个数情况进行了数据统计,结果如下图所示.该校2023届初三学生人数较2022届初三学生人数上升了10%,则下列说法错误的是( )
A.该校2022届初三年级学生仰卧起坐一分钟的个数在内的学生人数占70%
B.该校2023届初三学生仰卧起坐一分钟的个数在内的学生人数比2022届初三学生仰卧起坐一分钟个数同个数段的学生人数的2倍还多
C.该校2023届初三学生仰卧起坐一分钟的个数和2022届初三学生仰卧起坐一分钟个数的中位数均在内
D.相比2022届初三学生仰卧起坐一分钟个数不小于50的人数,2023届初三学生仰卧起坐一分钟个数不小于50的人数占比增加
3.(2023高一下·清远期末)某高中共有学生2400人,其中高一、高二、高三的学生人数比为5∶4∶6,现用分层随机抽样的方法从该高中所有学生中抽取一个容量为120的样本,则应从高三年级抽取的人数为( )
A.32 B.40 C.48 D.56
4.(2023高一下·联合期末)某校通过统计学生在校的5次模考数学成绩(分数均为整数)决定该学生是否适合进行数学竞赛培训.规定:“5次模考成绩均不低于140分”,现有甲、乙、丙三位同学5次模考成绩,则根据以下数据能确定适合数学竞赛培训的学生有( )
甲:众数为140,中位数为145;
乙:中位数为145,极差为6;
丙:均值为143,其中一次成绩为145,方差为1.6.
A.甲乙 B.甲丙 C.乙丙 D.甲乙丙
5.(2023高一下·龙岩期末)已知某班40名学生某次考试的数学成绩依次为,经计算全班数学平均成绩,且,则该班学生此次数学成绩的标准差为( )
A.20 B. C.10 D.
6.(2023高一下·天河期末)为了解学生的课外阅读情况,某校对高中生进行平均每周课外阅读时间(单位:小时)的调查,采用样本量比例分配的分层随机抽样.如果不知道样本数据,只知道抽取了男生40人,其平均数和方差分别为5和1.65,抽取了女生60人,其平均数和方差分别为4和3.5,则估计该校学生平均每周课外阅读时间的总体方差为( )
A.2.58 B.2.76 C.3 D.3.2
7.(2023高一下·广州期末)四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的是( )
A.中位数为3,众数为3 B.中位数为3,极差为3
C.平均数为3,中位数为3 D.平均数为3,众数为4
8.(2023高二下·安宁期末)水果收购商为了了解某种水果的品质,想用分层抽样的方法从500个大果,300个中果,200个小果中抽取一部分送去质检部门检验,若抽取的小果为30个,则他抽取的大果为( )个.
A.150 B.75 C.45 D.15
9.在某地区某高传染性病毒流行期间,为了建立指标显示疫情已受控制,以便向该地区居众显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列① ~ ⑤各个选项中,一定符合上述指标的是 ( )
①平均数; ②标准差; ③平均数且标准差;
④平均数且极差小于或等于2;⑤众数等于1且极差小于或等于4。
A.①② B.③④ C.③④⑤ D.④⑤
10.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12= 13.2,S22=26.26,则
A.甲班10名学生的成绩比乙班10名学生的成绩整齐
B.乙班10名学生的成绩比甲班10名学生的成绩整齐
C.甲、乙两班10名学生的成绩一样整齐
D.不能比较甲、乙两班10名学生成绩的整齐程度
二、多项选择题
11.(2023高二上·长沙开学考)下列说法正确的是( )
A.抽样调查具有花费少、效率高的特点
B.数据,,,,,的中位数为,众数为和
C.极差和标准差都能描述一组数据的离散程度
D.数据,,,的方差为,则数据,,,的方差为
12.(2023·)有一组样本数据,另一组样本数据,其中,c为非零常数,则( )
A.两组样本数据平均数相同 B.两组样本数据方差相同
C.两组样本数据中位数相等 D.两组样本数据极差相同
13.(2023高三上·运城期末)近年来 新冠疫情波及到千家万户,人们的生活方式和习惯不得不发生转变,短视频成了观众空闲时娱乐活动的首选.某电影艺术中心为了解短视频平台的观众年龄分布情况,向各大短视频平台的观众发放了线上调查问卷,共回收有效样本4000份,根据所得信息制作了如图所示的频率分布直方图,则下列说法正确的是( )
A.图中
B.在4000份有效样本中,短视频观众年龄在10~20岁的有1320人
C.估计短视频观众的平均年龄为32岁
D.估计短视频观众年龄的75%分位数为39岁
14.(2023高一下·惠州期末)下列说法正确的是( )
A.数据1,2,3,3,4,5的平均数和中位数相同
B.数据6,5,4,3,3,3,2,2,1的众数为3
C.有甲、乙、丙三种个体按3:1:2的比例分层抽样调查,如果抽取的甲个体数为9,则样本容量为30
D.甲组数据的方差为4,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是乙组
15.(2023高三上·深圳月考)为了向社会输送优秀毕业生,中等职业学校越来越重视学生的实际操作(简称实操)能力的培养.中职生小王在对口工厂完成实操产品100件,质检人员测量其质量(单位:克),将所得数据分成5组:,,,,.根据所得数据制成如图所示的频率分布直方图,其中质量在内的为优等品.对于这100件产品,下列说法正确的是( )
A.质量的平均数为99.7克(同一区间的平均数用区间中点值代替)
B.优等品有45件
C.质量的众数在区间内
D.质量的中位数在区间内
16.(2023高一下·清远期末)已知一组数据的平均数为,中位数为,方差为,众数为,数据的平均数为,中位数为,方差为,众数为,则( )
A. B.无法确定 C. D.
三、填空题
17.(2023高一下·绍兴月考)已知一组样本数据,,,,的方差为5,且满足,则样本数据的方差为 .
18.(2023高二下·湖州期末) 湖州地区甲、乙、丙三所学科基地学校的数学强基小组人数之比为,三所学校共有数学强基学生48人,在一次统一考试中,所有学生的成绩平均分为117,方差为21.5.已知甲、乙两所学校的数学强基小组学生的平均分分别为118和114,方差分别为15和21,则丙学校的学生成绩的方差是 .
19.(2023高一下·安徽月考)为迎接2023年成都大运会,大运会组委会采用按性别分层抽样的方法从200名大学生志愿者中抽取30人组成大运会志愿小组.若30人中共有男生12人,则这200名学生志愿者中女生可能有 人.
20.(2023·齐齐哈尔模拟)一组数据由8个数组成,将其中一个数由4改为2,另一个数由6改为8,其余数不变,得到新的一组数据,则新的一组数的方差相比原一组数的方差的增加值为 .
21.(2023高三上·河源期末)某校为了了解高三年级学生的身体素质状况,在开学初举行了一场身体素质体能测试,以便对体能不达标的学生进行有针对性的训练,促进他们体能的提升,现从整个年级测试成绩中抽取100名学生的测试成绩,并把测试成绩分成六组,绘制成频率分布直方图(如图所示).其中分数在这一组中的纵坐标为,则该次体能测试成绩的分位数约为 分.
22.(2023高一上·西城期末)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为,,,,.根据频率分布直方图,这200名学生中每周的自习时间不少于20小时的人数是 .
23.(2023高三上·邯郸期末)近年来,加强青少年体育锻炼,重视体质健康已经在社会形成高度共识.2021年10月,《中华人民共和国体育法》在颁布20多年后迎来首次大修.教育部发布的2022年工作要点中提出,实施学校体育和体教融合改革发展行动计划.为了考察某校各班参加两项以上体育项目锻炼小组的人数,在全校随机抽取五个班级,把每个班级参加两项以上体育项目锻炼小组的人数作为样本数据.已知样本平均数为7,样本的标准差为2,若样本数据各不相同,则样本数据的第80百分位数是 .
24.(2023高一下·阎良期末)慢走是一种简单又优良的锻炼方式,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.小南计划近6个月的月慢走里程(单位:公里)按从小到大排列依次为11,12,,20,27,且这6个月的月慢走里程的中位数为16,若要使这6个月的月慢走里程的标准差最小,则 .
四、解答题
25.(2023高二上·惠州月考)某校对参加亚运知识竞赛的100名学生的成绩进行统计,分成,,,,五组,得到如图所示频率分布直方图.
(1)估计该校参加亚运知识竞赛的学生成绩的众数和平均数;
(2)估计该校参加亚运知识竞赛的学生成绩的80%分位数.
26.(2023高二上·长沙开学考)某校高三年级甲班名学生在一次期中考试中,数学成绩的频率分布直方图如图所示,成绩分组区间为,,,,,,其中,且.
(1)根据甲班数学成绩的频率分布直方图,估计甲班数学成绩的平均分;
(2)求数学成绩的第百分位数.
27.(2023高二上·朝阳开学考)某工厂生产某款产品,该产品市场评级规定:评分在10分及以上的为一等品,低于10分的为二等品.下面是检验员从一批产品中随机抽取的10件产品的评分:
9.6 10.1 9.7 9.8 10.0 9.7 10.0 9.8 10.1 10.2
经计算得,其中为抽取的第i件产品的评分,.
(1)求这组样本平均数和方差;
(2)若厂家改进生产线,使得生产出的每件产品评分均提高0.2.根据以上随机抽取的10件产品改进后的评分,估计改进后该厂生产的产品评分的平均数和方差;
(3)在第(2)问前提下,再从改进后生产的产品中随机抽取的10件产品,估计这10件产品平均等级是否为一等品?说明理由.
28.(2023高二上·贵港开学考)小晟统计了他6月份的手机通话明细清单,发现自己该月共通话100次,小晟将这100次通话的通话时间(单位:分钟)按照,,,,,分成6组,画出的频率分布直方图如图所示.
(1)求a的值;
(2)求通话时间在区间内的通话次数;
(3)试估计小晟这100次通话的平均时间(同一组中的数据用该组区间的中点值作代表).
29.(2023高一下·滁州) 4月23日是世界读书日,又称“世界图书日”.今年是安徽省开展全民阅读活动的第十年,某市组织学生参加“书香安徽·皖美阅读”活动.为了解该市义务教育阶段学生每周读书时间,按小学生和初中生进行分层,采用比例分配的分层随机抽样方法抽取了样本量为1000的样本进行调查,其中小学生600人,初中生400人,发现他们的每周读书时间都在200~500分钟之间,进行适当分组后(每组都是左闭右开的区间),画出频率分布直方图如图所示.
(1)求a的值;
(2)若上述样本中小学生每周读书时间的平均数为320分钟,请根据频率分布直方图估计样本中初中生每周读书时间的平均数.
30.(2023高一下·湖南期末)某公司最近10年的盈利依次记为,,…,(单位:万元),,分别表示平均值与方差.
(1)若,,,求,的值;
(2)若,,求的平均值.
31.(2023高一下·龙岩期末)某大型企业为员工谋福利,与某手机通讯商合作,为员工办理流量套餐.为了解该企业员工手机流量使用情况,通过抽样,得到100名员工近一周每人手机日平均使用流量(单位:M)的数据,其频率分布直方图如图:
若将每位员工的手机日平均使用流量分别视为其手机日使用流量,回答以下问题.
(1)求这100名员工近一周每人手机日使用流量的众数、中位数;
(2)在办理流量套餐后,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男员工20名,其手机日使用流量的平均数为800M,方差为10000;抽取了女员工40名,其手机日使用流量的平均数为1100M,方差为40000.
(i)已知总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,;,,,记总的样本平均数为,样本方差为.证明:.
(ii)用样本估计总体,试估计该大型企业全体员工手机日使用流量的平均数和方差.
32.(2023高一下·广州期末)为了解某市今年高一年级学生的身体素质状况,从该市高一年级学生中抽取100名学生进行“掷实心球”的项目测试.经统计,成绩均在2米到12米之间,把获得的所有数据分,,,,成五组,得到频率分布直方图如图所示.
(1)根据频率分布直方图,估计该市今年高一年级学生“掷实心球”成绩的平均数(同一组中的数据以该组区间的中点值作代表);
(2)已知这100名学生中有女生40名,男生60名,这40名女生“掷实心球”成绩的平均数和方差分别为7和2.1,这60名男生“掷实心球”成绩的平均数和方差分别为8.5和2.4,求这100名学生“掷实心球”成绩的方差.
答案解析部分
1.【答案】B
【知识点】分层抽样方法;众数、中位数、平均数;极差、方差与标准差
【解析】【解答】解:由题意设分层抽样抽取该校女、男学生人数分别为,,总数为
样本平均值为,
方差为.
故答案为:B.
【分析】 根据分层抽样原理及男、女学生人数比例,设样本女、男学生人数分别为,,则总数为,求出样本的平均值,代入方差公式进行求解.
2.【答案】C
【知识点】频率分布表
【解析】【解答】解:A.根据2022届的扇形图可知学生仰卧起坐一分钟的个数在内的学生人数占20%+25%+25%=70%,故选项A正确.
B.设2022届的学生人数为a,则2023届的学生人数为1.1a,2022届学生仰卧起坐一分钟的个数在内的学生人数0.2a,2023届学生仰卧起坐一分钟的个数在内的学生人数1.1(0.34+0.07)a=0.451a,因为 所以B选项正确.
C.2022届学生仰卧起坐一分钟的个数的中位数在[40,50)内,2023届学生仰卧起坐一分钟的个数的中位数在内,故C选项不正确.
D. 2022届初三学生仰卧起坐一分钟个数不小于50的占比人数为25%+15%+5%=45%,2022届初三学生仰卧起坐一分钟个数不小于50
的占比人数为41%+34%+7%=82%,因为82%>45%所以D选项正确.
故答案为:C
【分析】由2022届的扇形图和2023届的条形图逐个分析即可求解.
3.【答案】C
【知识点】分层抽样方法
【解析】【解答】由题意得应从高三年级抽取的人数为人。
故答案为:C
【分析】根据分层抽样的定义直接计算。
4.【答案】B
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】对于甲:因为中位数为145,则小于145的数至多有2个,
又因为众数为140,则140出现两次,所以 5次模考成绩均不低于140分,满足参加竞赛培训条件;
对于乙:例如5次成绩为:139,145,145,145,145,满足“中位数为145,极差为6”,但不满足参加竞赛培训条件;
对于丙:设另外四次成绩分别为,
由题意可得:,
整理得
又因为,可知,满足参加竞赛培训条件.
故答案为:B
【分析】对于甲:根据众数、中位数的定义分析判定;对于乙:举反例5次成绩为:139,145,145,145,145,分析判断;对于丙:根据方差的计算公式分析判断.
5.【答案】D
【知识点】极差、方差与标准差
【解析】【解答】因为 , ,
则.
故答案为:D.
【分析】根据标准差公式分析求解.
6.【答案】C
【知识点】分层抽样方法;极差、方差与标准差
【解析】【解答】根据题意可知采取的是分层随机抽样,
首先求出分层抽样的总体的平均数:,
再求出分层抽样的总体的方差:
,
故选:C.
【分析】根据分层随机抽样求出对应的总体平均数,再根据男女分别所占比例,求出分层抽样总体的方差.
7.【答案】D
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】对A:当掷骰子出现的结果为1,2,3,3,6时,满足中位数为3,众数为3,故A错误;
对B:当掷骰子出现的结果为3,3,3,3,6时,满足中位数为3,极差为3,故B错误;
对C:当掷骰子出现的结果为1,1,3,4,6时,满足平均数为3,中位数为3,可以出现点6,故C错误;
对D:若平均数为3,且出现点数为6,则其余4个数的和为,
而众数为4,故其余4个数的和至少为,
矛盾,所以D一定没有出现点数6,故D正确.
故答案为:D.
【分析】对ABC,举例子说明可以含有6即可;对D,利用反证法说明一定不含6.
8.【答案】B
【知识点】分层抽样方法
【解析】【解答】设大果抽取个数为x,因为使用分层抽样法,
则,x=75.
故选:B.
【分析】本题考查分层抽样法的实际应用,题中给出大、中、小果的数量,使用分层抽样法,即每层抽取比例相等,即可求解.
9.【答案】D
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【分析】①②③错,④对,若极差等于0或1,在的条件下显然符合指标,若极差等于2,则有下列可能,(1)0,1,2,(2)1,2,3,(3)2,3,4,(4)3,4,5,(5)4,5,6. 在 的条件下,只有(1)(2)(3)成立,符合标准。⑤正确,若众数等于1 且极差小于等于4,则最大数不超过5,符合指标,故选D.
10.【答案】A
【知识点】极差、方差与标准差
【解析】【分析】根据所给的测验成绩的方差,得到两个方差的大小关系S12<S22,即甲班的10名同学的成绩比乙班的10名同学的成绩整齐,波动小.
【解答】∵测验成绩的方差分别为S12=13.2,S22=26.26,
∴S12<S22,
∴甲班的10名同学的成绩比乙班的10名同学的成绩整齐,波动小,
故选A.
【点评】本题考查极差、方差与标准差,本题解题的关键是理解方差的意义,当两组数据的方差大小进行比较时,方差小的数据比较稳定.
11.【答案】A,C
【知识点】简单随机抽样;众数、中位数、平均数;极差、方差与标准差
【解析】【解答】解:抽样调查相比全面调查具有花费少、效率高的特点, 故 A 正确;
将数据,,,,,从小到大排列为 2 , 3 , 3 , 5 , 9 , 9,
所以中位数为, 众数为 3 和 9 , 故 B 错误;
极差和标准差都能描述一组数据的离散程度, 故 C正确;
若数据的方差为 ,
则数据 的方差为 , 故 D 错误.
故答案为:AC.
【分析】根据中位数、众数、极差、方差和标准差以及抽样调查的特点对各个选项分别判断即可得出结论.
12.【答案】B,D
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】解:不妨设 ,平均数为,方差为,中位数为,
对于A:因为, 则 样本数据 的平均数,
且,则,即 两组样本数据平均数不相同,故A错误;
对于B:因为, 则 样本数据 的方差,
所以 两组样本数据方差相同,故B正确;
对于C:因为,则 样本数据 的中位数,
且,则,即 两组样本数据中位数不相等,故C错误;
对于D:因为样本数据 的极差为,
所以 样本数据 的极差为,
即 两组样本数据极差相同,故D正确.
故答案为:BD.
【分析】根据题意结合平均数、方差的性质判断AB;根据中位数、方差的定义判断CD.
13.【答案】C,D
【知识点】收集数据的方法
【解析】【解答】解:对于A,,,A不符合题意;
对于B,由频率分布直方图知:短视频观众年龄在岁的人对应频率为,
短视频观众年龄在岁的有人,B不符合题意;
对于C,平均年龄,C符合题意;
对于D,设分位数为,则,解得:,D符合题意.
故答案为:CD.
【分析】根据频率和为1可构造方程求得,知A错误;由频率和频数的关系可求得观众年龄在岁的人数,知B正确;由平均数和百分位数的估计方法可验证知CD正确.
14.【答案】A,B
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】解:A、数据1,2,3,3,4,5的平均数为,中位数为,故A正确;
B、数据6,5,4,3,3,3,2,2,1的众数为3,故B正确;
C、设样本容量为,由题可知,可得,即样本容量为18,故C错误;
D、 乙组数据5,6,9,10,5 的平均数为,则方差为,因为,所以两组数据中较稳定的为甲组,故D错误.
故答案为:AB.
【分析】求数据的平均数与中位数即可判断A;利用众数的定义可判断B;根据分层抽样的定义及抽样比求解即可判断C;利用方差的定义以及方差的意义可判断D.
15.【答案】A,B,D
【知识点】频率分布直方图;众数、中位数、平均数
【解析】【解答】解:质量平均数为(96 0.025+ 98 0.150+ 100 0.225+1020.075+1040.025)2=99.7,故选项A正确;
优等品数为0.2252100=45件,故选项B正确;
质量的众数不一定落在[98, 100)内,故选项C错误;
由于 [99,101)内有45件, [101, 103)内有15件,[103, 105)内有5件,故质量的中位数一定落在[99,101)内,故选项D正确.
故答案为:ABD.
【分析】 根据频率分布直方图中的数据以及平均数可判断A、B;根据众数性质可判断C;根据中位数的定义可判断D
16.【答案】A,D
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】不妨设 ,则,
A、 ,,A正确;
B、当时, ,当时, ,B错误;
C、,,C错误;
D、,D正确.
故答案为:AD
【分析】根据平均数、中位数、方差、众数的计算方法逐一判断选项.
17.【答案】9
【知识点】极差、方差与标准差
【解析】【解答】解:∵,
∴原数据的平均数为:,
∵原数据的方差为5,
∴,
对于样本数据,该组数据的平均值为:,
∴该组数据的方差为:
.
故答案为:9.
【分析】首先根据已知条件,可求原数据的平均数以及,再利用所求结果可求新数据的平均数和方差.
18.【答案】12
【知识点】分层抽样方法;众数、中位数、平均数;极差、方差与标准差
【解析】【解答】甲、乙、丙三所学科基地学校的数学强基小组人数之比为,三所学校共有数学强基学生48人,
则甲校的数学强基小组人数24;乙校的数学强基小组人数为16;丙校的数学强基小组人数8,
把甲校的数学强基小组学生的平均分记为,方差记为;
把乙校的数学强基小组学生的平均分记为,方差记为;
把丙校的数学强基小组学生的平均分记为,方差记为;
把所有学生的平均分记为,方差记为.
根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系可得解得
,即解得
故答案为:12.
【分析】根据按比例分配分层随机抽样总样本平均数与方差的计算公式求解.
19.【答案】120
【知识点】分层抽样方法
【解析】【解答】设这200名学生志愿者中女生 有人,则,解得
故答案为:120
【分析】利用分层抽样原理进行计算。
20.【答案】2
【知识点】极差、方差与标准差
【解析】【解答】一个数由4改为2,另一个数由6改为8,故该组数据的平均数不变,
设没有改变的6个数分别为,,…,,
原一组数的方差,
新数据的方差,
所以.
故答案为:2.
【分析】由方差公式求出原一组数的方差和新数据的方差,相减即可得答案.
21.【答案】92
【知识点】频率分布直方图
【解析】【解答】由频率分布直方图知,
由得:.
因为,
所以该次体能测试成绩的分位数落在内,设其为,
则由,解得.
故答案为:92.
【分析】由频率分布直方图的性质,求得,得出该次体能测试成绩的分位数落在内,设其为,列出方程,即可求解.
22.【答案】60
【知识点】频率分布直方图
【解析】【解答】由频率分布直方图可知每周自习时间不少于20小时的频率为,
故200名学生中每周的自习时间不少于20小时的人数为人.
故答案为:60.
【分析】根据直方图,先求出这200名学生中每周的自习时间不少于20小时的频率,由此能求出这200名学生中每周的自习时间不少于20小时的人数.
23.【答案】9
【知识点】收集数据的方法
【解析】【解答】设5个数据分别为.
由题意可得:.
由于5个数的平方和为20,则必为0+1+1+9+9=20.
由解得:或4;由解得:或8,故样本数据为4,6,7,8,10.
因为,所以样本数据的第80百分位数为.
故答案为:9
【分析】设5个数据分别为,先由平均数和方差列方程,求出样本数据为4,6,7,8,10.再按百分位数的定义直接求解.
24.【答案】16
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】解:数据按从小到大排列依次为11,12,,20,27,
因为中位数为 16 , 即所以,
故这 6 个月的月慢走里程的平均数为,
而要使这 6 个月的月慢走里程的标准差最小,需要最小;
又因为,
故当这6个月的月慢走里程的标准差最小时, .
故答案为:16.
【分析】根据从小到大排列的6个数据,可表达出中位数从而可求得平均数为17,再由方差公式以及二次函数性质即可求出最值,从而得解.
25.【答案】(1)解:由频率分布直方图的性质,
可得,解得.
由频率分布直方图的众数的概念可知,众数为75,
平均数为.
(2)解:因为的频率为0.65,的频率为0.9,
所以80%分位数为.
【知识点】频率分布直方图;众数、中位数、平均数
【解析】【分析】(1)由频率分布直方图的性质,列出方程,求出a,再
根据频率分布直方图中众数的概念和平均数的计算公式,即可求解.
(2)因为50到80的频率和为0.65,50到90的频率和为0.9,结合百分数的计算方法,即可求解.
26.【答案】(1)解:因为,且,
所以,可得,
由频率分布直方图,可得,
所以,解得,所以、,
所以估计甲班数学成绩的平均分为:
.
(2)解:设第百分位数是,
由,
,
得,则,
解得.
【知识点】频率分布直方图;众数、中位数、平均数;极差、方差与标准差
【解析】【分析】(1)根据频率分布直方图中,总频率等于所有小矩形面积之和=1。再结合,即可求出的值,从而求得平均数;
(2)设是第百分位数,由百分位数的概念可判断的范围,从而由题意即可得到方程,从而求解即可.
27.【答案】(1)解:样本平均值
样本方差.
(2)解:估计改进后该厂生产的产品评分的平均数,
方差.
(3)解:可以认为是一等品.因为改进后该厂生产的产品评分由样本数据估计平均数为,所以可以认为这10件产品平均等级为一等品不一定是一等品.
因为样本数据具有随机性,所以新样本平均值不一定达到10分及以上,所以新样本平均等级不一定是一等品.
【知识点】简单随机抽样;众数、中位数、平均数;极差、方差与标准差
【解析】【分析】(1)利用平均数和方差的定义求解;
(2)根据平均数的性质和方差的性质求解;
(3)从平均数角度分析或从抽样具有随机性角度分析.
28.【答案】(1)解:由,
得.
(2)解:因为通话时间在区间内的频率为,
所以通话时间在区间内的通话次数为.
(3)解:这100次通话的平均时间的估计值为分钟.
【知识点】频率分布直方图
【解析】【分析】(1)根据频率之和为1列方程求得;
(2) 通话时间在区间内的频率为, 所以通话时间在区间内的通话次数为;
(3)根据频率分布直方图求得平均数,即可得解.
29.【答案】(1)由频率分布直方图可知:每组的频率依次为,
则,解得.
(2)由题意可得:中小学生每周读书时间的平均数,
设初中生每周读书时间的平均数,
则,即,解得,
样本中初中生每周读书时间的平均数360.
【知识点】频率分布直方图;众数、中位数、平均数
【解析】【分析】(1)根据所有小矩形面积和为1运算求解a的值;
(2)先根据频率分布直方图估计全体的平均数,再根据平均数运算求解.
30.【答案】(1)解:,
(2)解:因为
,
即,所以,
因为,,所以,
所以的平均值为
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【分析】(1)根据题意结合平均数、方差的公式运算求解;
(2)根据方差公式可得公式,进而计算即可.
31.【答案】(1)解:估计这100名员工近一周每人手机日使用流量的众数450
由频率分布直方图可知流量少于300的所占比例为,流量少于400的所占比例为,所以抽取的100名员工近一周每人手机日使用流量的中位数在内,且中位数为 .
(2)(i)证明:根据方差的定义,总样本的方差为
由,可得
同理可得
因此
(ii)解:估计该大型企业全体员工手机日使用流量的平均数为
由(i)知,估计该大型企业全体员工手机日使用流量的方差为
【知识点】频率分布直方图;众数、中位数、平均数;极差、方差与标准差
【解析】【分析】 (1) 根据频率分布直方图结合众数、中位数的概念分析求解;
(2)(i) 根据题意结合方差公式分析证明;(ii) 根据题意结合(i)中公式分析求解.
32.【答案】(1)解:依题意,由频率分布直方图可得成绩在,,,,的频率分别为,
所以,解得,
所以该本的平均数为,
故估计该市今年高一年级学生“掷实心球”成绩的平均数为.
(2)解:设这40名女生“掷实心球”成绩的平均数和方差分别为和,
这60名男生“掷实心球”成绩的平均数和方差分别为和,
这100名学生“掷实心球”成绩的平均数和方差分别为和,
则
,
所以这100名学生“掷实心球”成绩的方差为.
【知识点】频率分布直方图;众数、中位数、平均数;极差、方差与标准差
【解析】【分析】 (1) 根据频率和为1求得,进而结合加权平均数的公式运算求解;
(2) 根据方差公式直接运算求解即可.
1 / 12023-2024学年高中数学人教A版必修二 9.3 统计分析 同步练习
一、选择题
1.(2023高二下·河北期末)某学校有男生600人,女生400人.为调查该校全体学生每天的运动时间,采用分层抽样的方法获取容量为的样本.经过计算,样本中男生每天运动时间的平均值为80分钟,方差为10;女生每天运动时间的平均值为60分钟,方差为20.结合数据,估计全校学生每天运动时间的方差为( )
A.96 B.110 C.112 D.128
【答案】B
【知识点】分层抽样方法;众数、中位数、平均数;极差、方差与标准差
【解析】【解答】解:由题意设分层抽样抽取该校女、男学生人数分别为,,总数为
样本平均值为,
方差为.
故答案为:B.
【分析】 根据分层抽样原理及男、女学生人数比例,设样本女、男学生人数分别为,,则总数为,求出样本的平均值,代入方差公式进行求解.
2.(2023高二下·安康月考)某校为了了解学生的身体素质,对2022届初三年级所有学生仰卧起坐一分钟的个数情况进行了数据统计,结果如下图所示.该校2023届初三学生人数较2022届初三学生人数上升了10%,则下列说法错误的是( )
A.该校2022届初三年级学生仰卧起坐一分钟的个数在内的学生人数占70%
B.该校2023届初三学生仰卧起坐一分钟的个数在内的学生人数比2022届初三学生仰卧起坐一分钟个数同个数段的学生人数的2倍还多
C.该校2023届初三学生仰卧起坐一分钟的个数和2022届初三学生仰卧起坐一分钟个数的中位数均在内
D.相比2022届初三学生仰卧起坐一分钟个数不小于50的人数,2023届初三学生仰卧起坐一分钟个数不小于50的人数占比增加
【答案】C
【知识点】频率分布表
【解析】【解答】解:A.根据2022届的扇形图可知学生仰卧起坐一分钟的个数在内的学生人数占20%+25%+25%=70%,故选项A正确.
B.设2022届的学生人数为a,则2023届的学生人数为1.1a,2022届学生仰卧起坐一分钟的个数在内的学生人数0.2a,2023届学生仰卧起坐一分钟的个数在内的学生人数1.1(0.34+0.07)a=0.451a,因为 所以B选项正确.
C.2022届学生仰卧起坐一分钟的个数的中位数在[40,50)内,2023届学生仰卧起坐一分钟的个数的中位数在内,故C选项不正确.
D. 2022届初三学生仰卧起坐一分钟个数不小于50的占比人数为25%+15%+5%=45%,2022届初三学生仰卧起坐一分钟个数不小于50
的占比人数为41%+34%+7%=82%,因为82%>45%所以D选项正确.
故答案为:C
【分析】由2022届的扇形图和2023届的条形图逐个分析即可求解.
3.(2023高一下·清远期末)某高中共有学生2400人,其中高一、高二、高三的学生人数比为5∶4∶6,现用分层随机抽样的方法从该高中所有学生中抽取一个容量为120的样本,则应从高三年级抽取的人数为( )
A.32 B.40 C.48 D.56
【答案】C
【知识点】分层抽样方法
【解析】【解答】由题意得应从高三年级抽取的人数为人。
故答案为:C
【分析】根据分层抽样的定义直接计算。
4.(2023高一下·联合期末)某校通过统计学生在校的5次模考数学成绩(分数均为整数)决定该学生是否适合进行数学竞赛培训.规定:“5次模考成绩均不低于140分”,现有甲、乙、丙三位同学5次模考成绩,则根据以下数据能确定适合数学竞赛培训的学生有( )
甲:众数为140,中位数为145;
乙:中位数为145,极差为6;
丙:均值为143,其中一次成绩为145,方差为1.6.
A.甲乙 B.甲丙 C.乙丙 D.甲乙丙
【答案】B
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】对于甲:因为中位数为145,则小于145的数至多有2个,
又因为众数为140,则140出现两次,所以 5次模考成绩均不低于140分,满足参加竞赛培训条件;
对于乙:例如5次成绩为:139,145,145,145,145,满足“中位数为145,极差为6”,但不满足参加竞赛培训条件;
对于丙:设另外四次成绩分别为,
由题意可得:,
整理得
又因为,可知,满足参加竞赛培训条件.
故答案为:B
【分析】对于甲:根据众数、中位数的定义分析判定;对于乙:举反例5次成绩为:139,145,145,145,145,分析判断;对于丙:根据方差的计算公式分析判断.
5.(2023高一下·龙岩期末)已知某班40名学生某次考试的数学成绩依次为,经计算全班数学平均成绩,且,则该班学生此次数学成绩的标准差为( )
A.20 B. C.10 D.
【答案】D
【知识点】极差、方差与标准差
【解析】【解答】因为 , ,
则.
故答案为:D.
【分析】根据标准差公式分析求解.
6.(2023高一下·天河期末)为了解学生的课外阅读情况,某校对高中生进行平均每周课外阅读时间(单位:小时)的调查,采用样本量比例分配的分层随机抽样.如果不知道样本数据,只知道抽取了男生40人,其平均数和方差分别为5和1.65,抽取了女生60人,其平均数和方差分别为4和3.5,则估计该校学生平均每周课外阅读时间的总体方差为( )
A.2.58 B.2.76 C.3 D.3.2
【答案】C
【知识点】分层抽样方法;极差、方差与标准差
【解析】【解答】根据题意可知采取的是分层随机抽样,
首先求出分层抽样的总体的平均数:,
再求出分层抽样的总体的方差:
,
故选:C.
【分析】根据分层随机抽样求出对应的总体平均数,再根据男女分别所占比例,求出分层抽样总体的方差.
7.(2023高一下·广州期末)四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的是( )
A.中位数为3,众数为3 B.中位数为3,极差为3
C.平均数为3,中位数为3 D.平均数为3,众数为4
【答案】D
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】对A:当掷骰子出现的结果为1,2,3,3,6时,满足中位数为3,众数为3,故A错误;
对B:当掷骰子出现的结果为3,3,3,3,6时,满足中位数为3,极差为3,故B错误;
对C:当掷骰子出现的结果为1,1,3,4,6时,满足平均数为3,中位数为3,可以出现点6,故C错误;
对D:若平均数为3,且出现点数为6,则其余4个数的和为,
而众数为4,故其余4个数的和至少为,
矛盾,所以D一定没有出现点数6,故D正确.
故答案为:D.
【分析】对ABC,举例子说明可以含有6即可;对D,利用反证法说明一定不含6.
8.(2023高二下·安宁期末)水果收购商为了了解某种水果的品质,想用分层抽样的方法从500个大果,300个中果,200个小果中抽取一部分送去质检部门检验,若抽取的小果为30个,则他抽取的大果为( )个.
A.150 B.75 C.45 D.15
【答案】B
【知识点】分层抽样方法
【解析】【解答】设大果抽取个数为x,因为使用分层抽样法,
则,x=75.
故选:B.
【分析】本题考查分层抽样法的实际应用,题中给出大、中、小果的数量,使用分层抽样法,即每层抽取比例相等,即可求解.
9.在某地区某高传染性病毒流行期间,为了建立指标显示疫情已受控制,以便向该地区居众显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列① ~ ⑤各个选项中,一定符合上述指标的是 ( )
①平均数; ②标准差; ③平均数且标准差;
④平均数且极差小于或等于2;⑤众数等于1且极差小于或等于4。
A.①② B.③④ C.③④⑤ D.④⑤
【答案】D
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【分析】①②③错,④对,若极差等于0或1,在的条件下显然符合指标,若极差等于2,则有下列可能,(1)0,1,2,(2)1,2,3,(3)2,3,4,(4)3,4,5,(5)4,5,6. 在 的条件下,只有(1)(2)(3)成立,符合标准。⑤正确,若众数等于1 且极差小于等于4,则最大数不超过5,符合指标,故选D.
10.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12= 13.2,S22=26.26,则
A.甲班10名学生的成绩比乙班10名学生的成绩整齐
B.乙班10名学生的成绩比甲班10名学生的成绩整齐
C.甲、乙两班10名学生的成绩一样整齐
D.不能比较甲、乙两班10名学生成绩的整齐程度
【答案】A
【知识点】极差、方差与标准差
【解析】【分析】根据所给的测验成绩的方差,得到两个方差的大小关系S12<S22,即甲班的10名同学的成绩比乙班的10名同学的成绩整齐,波动小.
【解答】∵测验成绩的方差分别为S12=13.2,S22=26.26,
∴S12<S22,
∴甲班的10名同学的成绩比乙班的10名同学的成绩整齐,波动小,
故选A.
【点评】本题考查极差、方差与标准差,本题解题的关键是理解方差的意义,当两组数据的方差大小进行比较时,方差小的数据比较稳定.
二、多项选择题
11.(2023高二上·长沙开学考)下列说法正确的是( )
A.抽样调查具有花费少、效率高的特点
B.数据,,,,,的中位数为,众数为和
C.极差和标准差都能描述一组数据的离散程度
D.数据,,,的方差为,则数据,,,的方差为
【答案】A,C
【知识点】简单随机抽样;众数、中位数、平均数;极差、方差与标准差
【解析】【解答】解:抽样调查相比全面调查具有花费少、效率高的特点, 故 A 正确;
将数据,,,,,从小到大排列为 2 , 3 , 3 , 5 , 9 , 9,
所以中位数为, 众数为 3 和 9 , 故 B 错误;
极差和标准差都能描述一组数据的离散程度, 故 C正确;
若数据的方差为 ,
则数据 的方差为 , 故 D 错误.
故答案为:AC.
【分析】根据中位数、众数、极差、方差和标准差以及抽样调查的特点对各个选项分别判断即可得出结论.
12.(2023·)有一组样本数据,另一组样本数据,其中,c为非零常数,则( )
A.两组样本数据平均数相同 B.两组样本数据方差相同
C.两组样本数据中位数相等 D.两组样本数据极差相同
【答案】B,D
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】解:不妨设 ,平均数为,方差为,中位数为,
对于A:因为, 则 样本数据 的平均数,
且,则,即 两组样本数据平均数不相同,故A错误;
对于B:因为, 则 样本数据 的方差,
所以 两组样本数据方差相同,故B正确;
对于C:因为,则 样本数据 的中位数,
且,则,即 两组样本数据中位数不相等,故C错误;
对于D:因为样本数据 的极差为,
所以 样本数据 的极差为,
即 两组样本数据极差相同,故D正确.
故答案为:BD.
【分析】根据题意结合平均数、方差的性质判断AB;根据中位数、方差的定义判断CD.
13.(2023高三上·运城期末)近年来 新冠疫情波及到千家万户,人们的生活方式和习惯不得不发生转变,短视频成了观众空闲时娱乐活动的首选.某电影艺术中心为了解短视频平台的观众年龄分布情况,向各大短视频平台的观众发放了线上调查问卷,共回收有效样本4000份,根据所得信息制作了如图所示的频率分布直方图,则下列说法正确的是( )
A.图中
B.在4000份有效样本中,短视频观众年龄在10~20岁的有1320人
C.估计短视频观众的平均年龄为32岁
D.估计短视频观众年龄的75%分位数为39岁
【答案】C,D
【知识点】收集数据的方法
【解析】【解答】解:对于A,,,A不符合题意;
对于B,由频率分布直方图知:短视频观众年龄在岁的人对应频率为,
短视频观众年龄在岁的有人,B不符合题意;
对于C,平均年龄,C符合题意;
对于D,设分位数为,则,解得:,D符合题意.
故答案为:CD.
【分析】根据频率和为1可构造方程求得,知A错误;由频率和频数的关系可求得观众年龄在岁的人数,知B正确;由平均数和百分位数的估计方法可验证知CD正确.
14.(2023高一下·惠州期末)下列说法正确的是( )
A.数据1,2,3,3,4,5的平均数和中位数相同
B.数据6,5,4,3,3,3,2,2,1的众数为3
C.有甲、乙、丙三种个体按3:1:2的比例分层抽样调查,如果抽取的甲个体数为9,则样本容量为30
D.甲组数据的方差为4,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是乙组
【答案】A,B
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】解:A、数据1,2,3,3,4,5的平均数为,中位数为,故A正确;
B、数据6,5,4,3,3,3,2,2,1的众数为3,故B正确;
C、设样本容量为,由题可知,可得,即样本容量为18,故C错误;
D、 乙组数据5,6,9,10,5 的平均数为,则方差为,因为,所以两组数据中较稳定的为甲组,故D错误.
故答案为:AB.
【分析】求数据的平均数与中位数即可判断A;利用众数的定义可判断B;根据分层抽样的定义及抽样比求解即可判断C;利用方差的定义以及方差的意义可判断D.
15.(2023高三上·深圳月考)为了向社会输送优秀毕业生,中等职业学校越来越重视学生的实际操作(简称实操)能力的培养.中职生小王在对口工厂完成实操产品100件,质检人员测量其质量(单位:克),将所得数据分成5组:,,,,.根据所得数据制成如图所示的频率分布直方图,其中质量在内的为优等品.对于这100件产品,下列说法正确的是( )
A.质量的平均数为99.7克(同一区间的平均数用区间中点值代替)
B.优等品有45件
C.质量的众数在区间内
D.质量的中位数在区间内
【答案】A,B,D
【知识点】频率分布直方图;众数、中位数、平均数
【解析】【解答】解:质量平均数为(96 0.025+ 98 0.150+ 100 0.225+1020.075+1040.025)2=99.7,故选项A正确;
优等品数为0.2252100=45件,故选项B正确;
质量的众数不一定落在[98, 100)内,故选项C错误;
由于 [99,101)内有45件, [101, 103)内有15件,[103, 105)内有5件,故质量的中位数一定落在[99,101)内,故选项D正确.
故答案为:ABD.
【分析】 根据频率分布直方图中的数据以及平均数可判断A、B;根据众数性质可判断C;根据中位数的定义可判断D
16.(2023高一下·清远期末)已知一组数据的平均数为,中位数为,方差为,众数为,数据的平均数为,中位数为,方差为,众数为,则( )
A. B.无法确定 C. D.
【答案】A,D
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】不妨设 ,则,
A、 ,,A正确;
B、当时, ,当时, ,B错误;
C、,,C错误;
D、,D正确.
故答案为:AD
【分析】根据平均数、中位数、方差、众数的计算方法逐一判断选项.
三、填空题
17.(2023高一下·绍兴月考)已知一组样本数据,,,,的方差为5,且满足,则样本数据的方差为 .
【答案】9
【知识点】极差、方差与标准差
【解析】【解答】解:∵,
∴原数据的平均数为:,
∵原数据的方差为5,
∴,
对于样本数据,该组数据的平均值为:,
∴该组数据的方差为:
.
故答案为:9.
【分析】首先根据已知条件,可求原数据的平均数以及,再利用所求结果可求新数据的平均数和方差.
18.(2023高二下·湖州期末) 湖州地区甲、乙、丙三所学科基地学校的数学强基小组人数之比为,三所学校共有数学强基学生48人,在一次统一考试中,所有学生的成绩平均分为117,方差为21.5.已知甲、乙两所学校的数学强基小组学生的平均分分别为118和114,方差分别为15和21,则丙学校的学生成绩的方差是 .
【答案】12
【知识点】分层抽样方法;众数、中位数、平均数;极差、方差与标准差
【解析】【解答】甲、乙、丙三所学科基地学校的数学强基小组人数之比为,三所学校共有数学强基学生48人,
则甲校的数学强基小组人数24;乙校的数学强基小组人数为16;丙校的数学强基小组人数8,
把甲校的数学强基小组学生的平均分记为,方差记为;
把乙校的数学强基小组学生的平均分记为,方差记为;
把丙校的数学强基小组学生的平均分记为,方差记为;
把所有学生的平均分记为,方差记为.
根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系可得解得
,即解得
故答案为:12.
【分析】根据按比例分配分层随机抽样总样本平均数与方差的计算公式求解.
19.(2023高一下·安徽月考)为迎接2023年成都大运会,大运会组委会采用按性别分层抽样的方法从200名大学生志愿者中抽取30人组成大运会志愿小组.若30人中共有男生12人,则这200名学生志愿者中女生可能有 人.
【答案】120
【知识点】分层抽样方法
【解析】【解答】设这200名学生志愿者中女生 有人,则,解得
故答案为:120
【分析】利用分层抽样原理进行计算。
20.(2023·齐齐哈尔模拟)一组数据由8个数组成,将其中一个数由4改为2,另一个数由6改为8,其余数不变,得到新的一组数据,则新的一组数的方差相比原一组数的方差的增加值为 .
【答案】2
【知识点】极差、方差与标准差
【解析】【解答】一个数由4改为2,另一个数由6改为8,故该组数据的平均数不变,
设没有改变的6个数分别为,,…,,
原一组数的方差,
新数据的方差,
所以.
故答案为:2.
【分析】由方差公式求出原一组数的方差和新数据的方差,相减即可得答案.
21.(2023高三上·河源期末)某校为了了解高三年级学生的身体素质状况,在开学初举行了一场身体素质体能测试,以便对体能不达标的学生进行有针对性的训练,促进他们体能的提升,现从整个年级测试成绩中抽取100名学生的测试成绩,并把测试成绩分成六组,绘制成频率分布直方图(如图所示).其中分数在这一组中的纵坐标为,则该次体能测试成绩的分位数约为 分.
【答案】92
【知识点】频率分布直方图
【解析】【解答】由频率分布直方图知,
由得:.
因为,
所以该次体能测试成绩的分位数落在内,设其为,
则由,解得.
故答案为:92.
【分析】由频率分布直方图的性质,求得,得出该次体能测试成绩的分位数落在内,设其为,列出方程,即可求解.
22.(2023高一上·西城期末)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为,,,,.根据频率分布直方图,这200名学生中每周的自习时间不少于20小时的人数是 .
【答案】60
【知识点】频率分布直方图
【解析】【解答】由频率分布直方图可知每周自习时间不少于20小时的频率为,
故200名学生中每周的自习时间不少于20小时的人数为人.
故答案为:60.
【分析】根据直方图,先求出这200名学生中每周的自习时间不少于20小时的频率,由此能求出这200名学生中每周的自习时间不少于20小时的人数.
23.(2023高三上·邯郸期末)近年来,加强青少年体育锻炼,重视体质健康已经在社会形成高度共识.2021年10月,《中华人民共和国体育法》在颁布20多年后迎来首次大修.教育部发布的2022年工作要点中提出,实施学校体育和体教融合改革发展行动计划.为了考察某校各班参加两项以上体育项目锻炼小组的人数,在全校随机抽取五个班级,把每个班级参加两项以上体育项目锻炼小组的人数作为样本数据.已知样本平均数为7,样本的标准差为2,若样本数据各不相同,则样本数据的第80百分位数是 .
【答案】9
【知识点】收集数据的方法
【解析】【解答】设5个数据分别为.
由题意可得:.
由于5个数的平方和为20,则必为0+1+1+9+9=20.
由解得:或4;由解得:或8,故样本数据为4,6,7,8,10.
因为,所以样本数据的第80百分位数为.
故答案为:9
【分析】设5个数据分别为,先由平均数和方差列方程,求出样本数据为4,6,7,8,10.再按百分位数的定义直接求解.
24.(2023高一下·阎良期末)慢走是一种简单又优良的锻炼方式,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.小南计划近6个月的月慢走里程(单位:公里)按从小到大排列依次为11,12,,20,27,且这6个月的月慢走里程的中位数为16,若要使这6个月的月慢走里程的标准差最小,则 .
【答案】16
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【解答】解:数据按从小到大排列依次为11,12,,20,27,
因为中位数为 16 , 即所以,
故这 6 个月的月慢走里程的平均数为,
而要使这 6 个月的月慢走里程的标准差最小,需要最小;
又因为,
故当这6个月的月慢走里程的标准差最小时, .
故答案为:16.
【分析】根据从小到大排列的6个数据,可表达出中位数从而可求得平均数为17,再由方差公式以及二次函数性质即可求出最值,从而得解.
四、解答题
25.(2023高二上·惠州月考)某校对参加亚运知识竞赛的100名学生的成绩进行统计,分成,,,,五组,得到如图所示频率分布直方图.
(1)估计该校参加亚运知识竞赛的学生成绩的众数和平均数;
(2)估计该校参加亚运知识竞赛的学生成绩的80%分位数.
【答案】(1)解:由频率分布直方图的性质,
可得,解得.
由频率分布直方图的众数的概念可知,众数为75,
平均数为.
(2)解:因为的频率为0.65,的频率为0.9,
所以80%分位数为.
【知识点】频率分布直方图;众数、中位数、平均数
【解析】【分析】(1)由频率分布直方图的性质,列出方程,求出a,再
根据频率分布直方图中众数的概念和平均数的计算公式,即可求解.
(2)因为50到80的频率和为0.65,50到90的频率和为0.9,结合百分数的计算方法,即可求解.
26.(2023高二上·长沙开学考)某校高三年级甲班名学生在一次期中考试中,数学成绩的频率分布直方图如图所示,成绩分组区间为,,,,,,其中,且.
(1)根据甲班数学成绩的频率分布直方图,估计甲班数学成绩的平均分;
(2)求数学成绩的第百分位数.
【答案】(1)解:因为,且,
所以,可得,
由频率分布直方图,可得,
所以,解得,所以、,
所以估计甲班数学成绩的平均分为:
.
(2)解:设第百分位数是,
由,
,
得,则,
解得.
【知识点】频率分布直方图;众数、中位数、平均数;极差、方差与标准差
【解析】【分析】(1)根据频率分布直方图中,总频率等于所有小矩形面积之和=1。再结合,即可求出的值,从而求得平均数;
(2)设是第百分位数,由百分位数的概念可判断的范围,从而由题意即可得到方程,从而求解即可.
27.(2023高二上·朝阳开学考)某工厂生产某款产品,该产品市场评级规定:评分在10分及以上的为一等品,低于10分的为二等品.下面是检验员从一批产品中随机抽取的10件产品的评分:
9.6 10.1 9.7 9.8 10.0 9.7 10.0 9.8 10.1 10.2
经计算得,其中为抽取的第i件产品的评分,.
(1)求这组样本平均数和方差;
(2)若厂家改进生产线,使得生产出的每件产品评分均提高0.2.根据以上随机抽取的10件产品改进后的评分,估计改进后该厂生产的产品评分的平均数和方差;
(3)在第(2)问前提下,再从改进后生产的产品中随机抽取的10件产品,估计这10件产品平均等级是否为一等品?说明理由.
【答案】(1)解:样本平均值
样本方差.
(2)解:估计改进后该厂生产的产品评分的平均数,
方差.
(3)解:可以认为是一等品.因为改进后该厂生产的产品评分由样本数据估计平均数为,所以可以认为这10件产品平均等级为一等品不一定是一等品.
因为样本数据具有随机性,所以新样本平均值不一定达到10分及以上,所以新样本平均等级不一定是一等品.
【知识点】简单随机抽样;众数、中位数、平均数;极差、方差与标准差
【解析】【分析】(1)利用平均数和方差的定义求解;
(2)根据平均数的性质和方差的性质求解;
(3)从平均数角度分析或从抽样具有随机性角度分析.
28.(2023高二上·贵港开学考)小晟统计了他6月份的手机通话明细清单,发现自己该月共通话100次,小晟将这100次通话的通话时间(单位:分钟)按照,,,,,分成6组,画出的频率分布直方图如图所示.
(1)求a的值;
(2)求通话时间在区间内的通话次数;
(3)试估计小晟这100次通话的平均时间(同一组中的数据用该组区间的中点值作代表).
【答案】(1)解:由,
得.
(2)解:因为通话时间在区间内的频率为,
所以通话时间在区间内的通话次数为.
(3)解:这100次通话的平均时间的估计值为分钟.
【知识点】频率分布直方图
【解析】【分析】(1)根据频率之和为1列方程求得;
(2) 通话时间在区间内的频率为, 所以通话时间在区间内的通话次数为;
(3)根据频率分布直方图求得平均数,即可得解.
29.(2023高一下·滁州) 4月23日是世界读书日,又称“世界图书日”.今年是安徽省开展全民阅读活动的第十年,某市组织学生参加“书香安徽·皖美阅读”活动.为了解该市义务教育阶段学生每周读书时间,按小学生和初中生进行分层,采用比例分配的分层随机抽样方法抽取了样本量为1000的样本进行调查,其中小学生600人,初中生400人,发现他们的每周读书时间都在200~500分钟之间,进行适当分组后(每组都是左闭右开的区间),画出频率分布直方图如图所示.
(1)求a的值;
(2)若上述样本中小学生每周读书时间的平均数为320分钟,请根据频率分布直方图估计样本中初中生每周读书时间的平均数.
【答案】(1)由频率分布直方图可知:每组的频率依次为,
则,解得.
(2)由题意可得:中小学生每周读书时间的平均数,
设初中生每周读书时间的平均数,
则,即,解得,
样本中初中生每周读书时间的平均数360.
【知识点】频率分布直方图;众数、中位数、平均数
【解析】【分析】(1)根据所有小矩形面积和为1运算求解a的值;
(2)先根据频率分布直方图估计全体的平均数,再根据平均数运算求解.
30.(2023高一下·湖南期末)某公司最近10年的盈利依次记为,,…,(单位:万元),,分别表示平均值与方差.
(1)若,,,求,的值;
(2)若,,求的平均值.
【答案】(1)解:,
(2)解:因为
,
即,所以,
因为,,所以,
所以的平均值为
【知识点】众数、中位数、平均数;极差、方差与标准差
【解析】【分析】(1)根据题意结合平均数、方差的公式运算求解;
(2)根据方差公式可得公式,进而计算即可.
31.(2023高一下·龙岩期末)某大型企业为员工谋福利,与某手机通讯商合作,为员工办理流量套餐.为了解该企业员工手机流量使用情况,通过抽样,得到100名员工近一周每人手机日平均使用流量(单位:M)的数据,其频率分布直方图如图:
若将每位员工的手机日平均使用流量分别视为其手机日使用流量,回答以下问题.
(1)求这100名员工近一周每人手机日使用流量的众数、中位数;
(2)在办理流量套餐后,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男员工20名,其手机日使用流量的平均数为800M,方差为10000;抽取了女员工40名,其手机日使用流量的平均数为1100M,方差为40000.
(i)已知总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,;,,,记总的样本平均数为,样本方差为.证明:.
(ii)用样本估计总体,试估计该大型企业全体员工手机日使用流量的平均数和方差.
【答案】(1)解:估计这100名员工近一周每人手机日使用流量的众数450
由频率分布直方图可知流量少于300的所占比例为,流量少于400的所占比例为,所以抽取的100名员工近一周每人手机日使用流量的中位数在内,且中位数为 .
(2)(i)证明:根据方差的定义,总样本的方差为
由,可得
同理可得
因此
(ii)解:估计该大型企业全体员工手机日使用流量的平均数为
由(i)知,估计该大型企业全体员工手机日使用流量的方差为
【知识点】频率分布直方图;众数、中位数、平均数;极差、方差与标准差
【解析】【分析】 (1) 根据频率分布直方图结合众数、中位数的概念分析求解;
(2)(i) 根据题意结合方差公式分析证明;(ii) 根据题意结合(i)中公式分析求解.
32.(2023高一下·广州期末)为了解某市今年高一年级学生的身体素质状况,从该市高一年级学生中抽取100名学生进行“掷实心球”的项目测试.经统计,成绩均在2米到12米之间,把获得的所有数据分,,,,成五组,得到频率分布直方图如图所示.
(1)根据频率分布直方图,估计该市今年高一年级学生“掷实心球”成绩的平均数(同一组中的数据以该组区间的中点值作代表);
(2)已知这100名学生中有女生40名,男生60名,这40名女生“掷实心球”成绩的平均数和方差分别为7和2.1,这60名男生“掷实心球”成绩的平均数和方差分别为8.5和2.4,求这100名学生“掷实心球”成绩的方差.
【答案】(1)解:依题意,由频率分布直方图可得成绩在,,,,的频率分别为,
所以,解得,
所以该本的平均数为,
故估计该市今年高一年级学生“掷实心球”成绩的平均数为.
(2)解:设这40名女生“掷实心球”成绩的平均数和方差分别为和,
这60名男生“掷实心球”成绩的平均数和方差分别为和,
这100名学生“掷实心球”成绩的平均数和方差分别为和,
则
,
所以这100名学生“掷实心球”成绩的方差为.
【知识点】频率分布直方图;众数、中位数、平均数;极差、方差与标准差
【解析】【分析】 (1) 根据频率和为1求得,进而结合加权平均数的公式运算求解;
(2) 根据方差公式直接运算求解即可.
1 / 1