人教版高中数学必修第二册9.2.3&9.2.4总体集中趋势的估计、总体离散程度的估计
【考点梳理】
考点一:众数、中位数、平均数
1.众数:一组数据中出现次数最多的数.
2.中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.
3.平均数:如果n个数x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数.
考点二:总体集中趋势的估计
1.平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.
2.一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
考点三 频率分布直方图中平均数、中位数、众数的求法
1.样本平均数:可以用每个小矩形底边中点的横坐标与小矩形面积的乘积之和近似代替.
2.在频率分布直方图中,中位数左边和右边的直方图的面积应相等.
3.将最高小矩形所在的区间中点作为众数的估计值.
考点四:方差、标准差
1.假设一组数据为x1,x2,…xn,则这组数据的平均数=,方差为s2=,标准差s=
2.如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=为总体方差,S=为总体标准差.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=
3.如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称s2=为样本方差,s=为样本标准差.
4.标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
【题型归纳】
题型一、频率分布直方图平均数的计算
1.(2021·全国·高一专题练习)2020年上半年,中国养猪企业受猪价高位的利好影响,大多收获史上最佳半年报业绩,部分企业半年报营业收入同比增长超过1倍.某养猪场抓住机遇,加大了生猪养殖规模,为了检测生猪的养殖情况,该养猪场对2000头生猪的体重(单位:kg)进行了统计,得到如图所示的频率分布直方图,则下列说法正确的是( )
A.这2000头生猪体重的众数为160kg
B.这2000头生猪体重的中位数落在区间[160,180)内
C.这2000头生猪中体重不低于200kg的有40头
D.这2000头生猪体重的平均数为152.8kg
2.(2021·河南·焦作市第一中学高一期末)某健康研究机构调查了100位居民的日平均睡眠时间(单位:时),统计数据制成频率分布直方图,如图所示,则估计这100位居民的日平均睡眠时间的中位数约为( )
A.6.7 B.6.8 C.6.9 D.7
3.(2021·河南·高一阶段练习(理))为了解学生在假期里每天锻炼身体的情况,随机统计了100名学生在假期里每天锻炼身体的时间,所得数据都在内,其频率分布直方图如图所示.那么,学生在假期每天锻炼身体的时间的中位数是( )
A.106.25 B.112.5 C.100 D.110
题型二、平均数、中位数、众数的应用
4.(2021·吉林白山·高一期末)某校举行校园歌手大赛,6位评委对某选手的评分分别为9.2,9.5,8.8,9.9,8.9,9.5,设该选手得分的平均数为x,中位数为y,众数为z,则( )
A. B. C. D.
5.(2021·江苏·高一课时练习)下列关于平均数、中位数、众数的说法中正确的是( )
A.中位数可以准确地反映出总体的情况
B.平均数可以准确地反映出总体的情况
C.众数可以准确地反映出总体的情况
D.平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况
6.(2021·全国·高一课时练习)某高中为了解学生课外知识的积累情况,随机抽取名同学参加课外知识测试,测试共道题,每答对一题得分,答错得分.已知每名同学至少能答对道题,得分不少于分记为及格,不少于分记为优秀,测试成绩百分比分布图如图所示,则下列说法正确的是( )
A.该次课外知识测试及格率为
B.该次课外知识测试得满分的同学有名
C.该次测试成绩的中位数大于测试成绩的平均数
D.若该校共有名学生,则课外知识测试成绩能得优秀的同学大约有名
题型三、利用频率分布直方图估计总体的集中趋势
7.(2022·全国·高一单元测试)某校组织全体学生参加了主题为“建党百年,薪火相传”的知识竞赛,随机抽取了200名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,下列说法正确的是( )
A.直方图中x的值为0.004
B.在被抽取的学生中,成绩在区间[60,70)的学生数为10
C.估计全校学生的平均成绩不低于80分
D.估计全校学生成绩的样本数据的80%分位数约为93分
8.(2021·北京市第十二中学高一期末)某公司为提高职工政治素养,对全体职工进行了一次时事政治测试,随机抽取了100名职工的成绩,并将其制成如图所示的频率分布直方图,以样本估计总体,则下列结论中正确的是( )
A.该公司职工的测试成绩不低于60分的人数约占总人数的80%
B.该公司职工测试成绩的中位数约为75分
C.该公司职工测试成绩的平均值约为68分
D.该公司职工测试成绩的众数约为60分
9.(2021·全国·高一)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
题型四、方差、标准差的计算与应用
10.(2022·广西北海·高一期末)在高一期中考试中,甲、乙两个班的数学成绩统计如下表:
班级 人数 平均分数 方差
甲 30 2
乙 20 3
其中,则甲、乙两个班数学成绩的方差为( )
A.2.2 B.2.6 C.2.5 D.2.4
11.(2022·江西上饶·高一期末)下列为高一期末考试某班10位同学的数学成绩:100,100,135,120,95,90,140,110,115,95.下列说法错误的是( )
A.这10位同学的数学成绩最高分为140 B.这10位同学的数学成绩均值为110
C.这10位同学的数学成绩中位数为100 D.这10位同学的数学成绩方差为270
12.(2021·安徽·寿县第一中学高一阶段练习)已知数据的平均数,标准差分别为,,数据的平均数,标准差分别为,,若,则( )
A., B.,
C., D.,
题型五:各数据加减乘除对方差、平均数的影响
13.(2021·江苏常州·高一期末)已知数据,,…,的平均数为2,方差为3,那么数据,,…,的平均数和方差分别为( )
A.2,3 B.5,6 C.5,12 D.4,12
14.(2021·辽宁·建平县实验中学高一期中)已知一组数据,,,的平均数为2,方差为3,则数据,,,的平均数与方差分别为( )
A., B., C., D.,
15.(2022·辽宁沈阳·高一期末)若样本,,,…平均数为10,方差为20,则样本,,,…,的平均数和方差分别为( )
A.平均数为20,方差为35 B.平均数为20,方差为40
C.平均数为15,方差为75 D.平均数为15,方差为80
题型六:频率分布直方图中的方差、标准差
16.(2022·甘肃省民乐县第一中学高一阶段练习)某学校对高一某班的同学进行了身高(单位:)调查,将得到的数据进行适当分组后(每组为左闭右开区间),画出如图所示的频率分布直方图.
(1)求直方图中的值;
(2)估计全班同学身高的中位数;
(3)估计全班同学身高的平均数及方差.(同一组中的数据用该组区间的中点值作代表)
17.(2022·江西·高一期末)为了了解某体育院校新生的体能情况,该校随机抽查了名学生,测试1分钟引体向上的成绩(次数),成绩均在内,按次数分成4组,第一组:,第二组:,第三组:,第四组:,得到如图所示的频率分布直方图,已知第一组有5人.
(1)求的值;
(2)以每组数据的中点值作为该组数据的代表值,估计新生引体向上的成绩的平均数和方差.
18.(2022·江西赣州·高一期末)随着新课程改革和高考综合改革的实施,学习评价更关注学科核心素养的形成和发展,为此,某市于2021年举行第一届高中文科素养竞赛,竞赛结束后,为了评估该市高中学生的文科素养,从所有参赛学生中随机抽取1000名学生的成绩(单位:分)作为样本进行估计,将抽取的成绩整理后分成五组,从左到右依次记为,,,,,并绘制成如图所示的频率分布直方图.
(1)请补全频率分布直方图并估计这1000名学生成绩的平均数和计算80%分位数(求平均值时同一组数据用该组区间的中点值作代表);
(2)现从以上各组中采用分层随机抽样的方法抽取20人.若第三组学生实际成绩的平均数与方差分别为74分和2,第四组学生实际成绩的平均数与方差分别为84分和1,求这20人中分数在区间所有人的成绩的方差.
【双基达标】
一、单选题
19.(2022·河南驻马店·高一期末)郑州地铁1号线的开通运营,极大方便了市民的出行.某时刻从二七广场站驶往博学路站的过程中,10个车站上车的人数统计如下:70,60,60,60,50,40,40,30,30,10.这组数据的平均数,众数,90%分位数的和为( )
A.125 B.135 C.165 D.170
20.(2022·陕西·武功县普集高级中学高一阶段练习)如图所示的表格记录了高三(1)班第一组和第二组各五名学生在一次英语听力测试训练中的成绩(单位:分),若这两组数据的中位数均为15,平均值相等,则( )
学生成绩
第一组 8 12 15 26
第二组 9 14 18 26
A.36 B.6 C.26 D.16
21.(2021·全国·高一专题练习)某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100 名学生的数学成绩,发现都在内现将这100名学生的成绩按照,,,,,,分组后,得到的频率分布直方图如图所示,则下列说法正确的是( )
A.频率分布直方图中a的值为
B.样本数据低于130分的频率为
C.总体的中位数(保留1位小数)估计为分
D.总体分布在的频数一定与总体分布在的频数相等
22.(2021·云南·昆明八中高一阶段练习)已知数据x1,x2,x3,x4的平均数为4,则数据3x1+2,3x2+2,3x3+2,3x4+2的平均数为( )
A.4 B.8 C.12 D.14
23.(2021·全国·高一课前预习)为庆祝中国共产党成立100周年,甲、乙、丙三个小组进行党史知识竞赛,每个小组各派5位同学参赛,若该组所有同学的得分都不低于7分,则称该组为“优秀小组”(满分为10分且得分都是整数),以下为三个小组的成绩数据,据此判断,一定是“优秀小组”的是( )
甲:中位数为8,众数为7
乙:中位数为8,平均数为8.4
丙:平均数为8,方差小于2
A.甲 B.乙 C.丙 D.无法确定
24.(2022·陕西·西安市第七十五中学高一阶段练习)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10日,每天新增疑似病例不超过7人”,过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下:
甲地:总体平均数为3,中位数为4;
乙地:总体平均数为1,总体方差大于0;
丙地:总体平均数为2,总体方差为3;
丁地:中位数为2,众数为3;
则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( )
A.甲地 B.乙地 C.丙地 D.丁地
25.(2022·河南南阳·高一阶段练习)已知一组数据,,,…,的标准差为2,将这组数据,,,…,中的每个数先同时减去2,再同时乘以3,得到一组新数据,则这组新数据的标准差为( )
A.2 B.4 C.6 D.
26.(2022·浙江省开化中学高一期末)为庆祝中国共产党成立100周年,深入推进党史学习教育,某中学党支部组织学校初、高中两个学部的党员参加了全省教育系统的党史知识竞赛活动,其中初中部20名党员竞赛成绩的平均分为a,方差为2;高中部50名党员竞赛成绩的平均分为b,方差为.若a=b,则该学校全体参赛党员竞赛成绩的方差为( )
A. B. C. D.
27.(2022·全国·高一)某年的足球联赛上,甲队每场比赛平均失球数是个,全年比赛失球个数的标准差为;乙队每场比赛平均失球数是个,全年比赛失球个数的标准差为,下列说法正确的是( )
A.甲乙两队相比,乙队很少失球
B.甲队比乙队技术水平更稳定
C.平均来说,甲队比乙队防守技术好
D.乙队有时表现很差,有时表现又非常好
28.(2022·陕西·西安市阎良区关山中学高一阶段练习)已知某学校的初中、高中年级的在校学生人数之比为9:11,该校为了解学生的课下做作业时间,用分层抽样的方法在初中、高中年级的在校学生中共抽取了100名学生,调查了他们课下做作业的时间,并根据调查结果绘制了如下频率分布直方图:
(1)在抽取的100名学生中,初中、高中年级各抽取的人数是多少?
(2)根据频率分布直方图,估计学生做作业时间的中位数和平均时长(同一组中的数据用该组区间的中点值作代表);
29.(2022·辽宁·高一期末)春见柑橘的学名是春见,俗称耙耙柑,2001年从中国柑橘研究所引进,广泛种植于四川 重庆 江西等地,四川省某个春见柑橘种植基地随机选取并记录了8棵春见柑橘树未使用新技术时的年产量(单位:千克)和使用了新技术后的年产量的数据的变化,得到如下表格:未使用新技术时的8棵春见柑橘树的年产量
末使用新技术时的8棵春见柑橘树的年产量
第一棵 第二棵 第二棵 第四棵 第五棵 第六棵 第七棵 第八棵
年产量 30 32 33 30 34 30 34 33
使用了新技术后的8棵春见柑橘树的年产量
第一棵 第二棵 第三棵 第四棵 第五棵 第六棵 第七棵 第八棵
年产量 40 39 40 37 42 38 42 42
已知该基地共有40亩地,每亩地有55棵春见柑橘树
(1)根据这8棵春见柑橘树年产量的平均值,估计该基地使用了新技术后,春见柑橘年总产量比未使用新技术时增加的百分比;
(2)已知使用新技术后春见柑橘的成本价为每千克5元,市场销售价格为每千克10元.若该基地所有的春见柑橘有八成按照市场价售出,另外两成只能按照市场价的八折售出,试估计该基地使用新技术后春见柑橘的年总利润是多少万元.
【高分突破】
一:单选题
30.(2022·全国·高一)已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入新数据4,5,6,此时样本容量为10,若此时平均数为,方差为,则( )
A., B.,
C., D.,
31.(2022·全国·高一)下列命题中不正确的是( )
A.一组数据1,2,3,3,4,5的众数大于中位数
B.数据6,5,4,3,3,3,2,2,2,1的分位数为5
C.若甲组数据的方差为5,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是乙
D.为调查学生每天平均阅读时间,某中学从在校学生中,利用分层抽样的方法抽取初中生20人,高中生10人.经调查,这20名初中生每天平均阅读时间为60分钟,这10名高中生每天平均阅读时间为90分钟,那么被抽中的30名学生每天平均阅读时间为70分钟
32.(2022·北京昌平·高一期末)农科院的专家为了了解新培育的甲 乙两种麦苗的长势情况,从种植有甲 乙两种麦苗的两块试验田中各抽取6株麦苗测量株高,得到的数据如下(单位:):
甲:9,10,11,12,10,20;
乙:8,14,13,10,12,21.
根据所抽取的甲 乙两种麦苗的株高数据,给出下面四个结论,其中正确的结论是( )
A.甲种麦苗样本株高的平均值大于乙种麦苗样本株高的平均值
B.甲种麦苗样本株高的极差小于乙种麦苗样本株高的极差
C.甲种麦苗样本株高的75%分位数为10
D.甲种麦苗样本株高的中位数大于乙种麦苗样本株高的中位数
33.(2022·辽宁·东港市第二中学高一)在全国人民的共同努力下,特别是医护人员的奋力救治下,“新冠肺炎”疫情得到了有效控制.如图是国家卫健委给出的全国疫情通报,甲 乙两个省份从2月7日到2月13日一周的新增“新冠肺炎”确诊人数的折线图.
则下列关于甲 乙两省新增确诊人数的说法,不正确的是( )
A.甲省的平均数比乙省低 B.甲省的方差比乙省大
C.甲省的中位数是27 D.乙省的极差是12
34.(2022·全国·高一)有一组样本数据,,……,由这组数据的得到的一组数据,,……,满足(c为非零常数),则( )
A.两组数据的样本平均数不同; B.两组数据的中位数相同;
C.两组数据的样本方差相同; D.两组数据的样本标准差不同.
35.(2021·全国·高一)中医药是包括汉族和少数民族医药在内的我国各民族医药的统称,反映了中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法.某科研机构研究发现,某品种中医药的药物成分甲的含量x与药物功效y之间满足.检测这种药品一个批次的6个样本,得到成分甲的含量的平均值为5,标准差为,则估计这批中医药的药物功效的平均值为( )
A.18 B.15 C.20 D.10
36.(2022·全国·高一)高三(1)班男女同学人数之比为,班级所有同学进行踢毽球(毽子)比赛,比赛规则是:每个同学用脚踢起毽球,落地前用脚接住并踢起,脚接不到毽球比赛结束.记录每个同学用脚踢起毽球开始到毽球落地,脚踢到毽球的次数,已知男同学用脚踢到毽球次数的平均数为,方差为,女同学用脚踢到毽球次数的平均数为,方差为,那么全班同学用脚踢到毽球次数的平均数和方差分别为( )
A., B., C., D.,
37.(2022·全国·高一)若个样本、、、、的平均数是,方差为,则对于样本、、、、的平均数与方差分别是( )
A.、 B.、 C.、 D.、
38.(2021·全国·高一)我们正处于一个大数据飞速发展的时代,对于大数据人才的需求也越来越大,大数据的相关岗位大致可分为四类:数据开发、数据分析、数据挖掘、数据产品.某市2019年这几类工作岗位的薪资(单位:万元/月)情况如下表所示:
数据开发 8% 25% 32% 35%
数据分析 15% 36% 32% 17%
数据挖掘 9% 12% 28% 51%
数据产品 7% 17% 41% 35%
由表中数据可得该市大数据相关的各类岗位的薪资水平高低情况为( )
A.数据挖掘>数据开发>数据产品>数据分析 B.数据挖掘>数据产品>数据开发>数据分析
C.数据挖掘>数据开发>数据分析>数据产品 D.数据挖掘>数据产品>数据分析>数据开发
39.(2021·全国·高一课时练习)为加强学生音乐素养的培育,东莞市某高中举行“校园十大歌手”比赛,比赛现场有7名评委给选手评分,另外,学校也提前发起了网络评分,学生们可以在网络上给选手评分,场内数百名学生均参与网络评分.某选手参加比赛后,现场评委的评分表和该选手网络得分的条形图如下图所示:
评委序号 ① ② ③ ④ ⑤ ⑥ ⑦
评分 10 8 9 8 9 10 9
记现场评委评分的平均分为,网络评分的平均分为,所有评委与场外学生评分的平均数为,那么下列选项正确的是( )
A. B.
C. D.与关系不确定
40.(2022·全国·高一专题练均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关,在下图两种分布形态中,分别对应平均数和中位数之一,则可能的对应关系是( )
A.为中位数,为平均数,为平均数,为中位数
B.为平均数,为中位数,为平均数,为中位数
C.为中位数,为平均数,为中位数,为平均数
D.为平均数,为中位数,为中位数,为平均数
41.(2021·广东江门·高一期末)为了更好了地解高中学生的身高发育情况,现抽取某中学高一年级的学生作为样木,其中某班的24位男生身高由低到高排序情况如下:164.0,165.0,165.0,166.0,167.0,168.0,168.0,169.0,170.0,170.0,171.0,171.0,172.0,172.0,172.0,173.0,174.0,175.0,175.0,176.0,176.0,177.0,177.0,178.0(单位:),则这24个数据的中位数、众数,以及预估该班男生的第30百分位数为( )
A.171、170、168.5 B.171、170、169
C.171.5、172、169 D.172、172、169
42.(2021·天津南开·高一期末)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为,众数为,平均值为,则( ).
A. B.
C. D.
二、多选题
43.(2022·山东威海·高一期末)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
则下列结论正确的是( )
A.估计该地农户家庭年收入不低于8.5万元的农户比例为30%
B.估计该地农户家庭年收入的第三四分位数为9万元
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地农户家庭年收入的中位数为8万元
44.(2021·全国·高一单元测试)创新,是一个民族进步的灵魂,是一个国家兴旺发达的不竭源泉.为支持“中小企业”创新发展,国家决定对部分创新型企业的税收进行适当减免,现在全国调查了100家中小企业年收入情况,并根据所得数据画出了样本的频率分布直方图,则下面结论正确的是( )
A.年收入在万元的中小企业约有16家
B.样本的中位数大于400万元
C.估计当地中小型企业年收入的平均数为376万元
D.样本在区间内的频数为18
45.(2022·全国·高一)已知一组数据丢失了其中一个,剩下的六个数据分别是,,,,,,若这组数据的平均数与众数的和是中位数的倍,则丢失的数据可能是( )
A. B. C. D.
46.(2022·全国·高一)某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100米体能测试成绩(单位:秒),将数据按照,,…,分成9组,制成了如图所示的频率分布直方图.
由直方图推断,下列选项正确的是( )
A.直方图中的值为0.38
B.由直方图估计本校高三男生100米体能测试成绩的众数为13.75秒
C.由直方图估计本校高三男生100米体能测试成绩不大于13秒的人数为54
D.由直方图估计本校高三男生100米体能测试成绩的中位数为13.7秒
47.(2022·江西宜春·高一期末)已知数据的平均数为,标准差为,则( )
A.数据的平均数为,标准差为
B.数据的平均数为,标准差为
C.数据的平均数为,方差为
D.数据的平均数为,方差为
48.(2021·辽宁·高一)下列说法中,正确的是( )
A.极差和标准差都能描述一组数据的离散程度
B.如果一组数中每个数减去同一个非零常数,则这一组数的平均数改变,方差不改变
C.一个样本的方差,则这组数据总和等于60
D.数据,,…,的方差为,则数据,,…,的方差为
49.(2022·全国·高一课时练习)已知数据x1,x2,…,xn的平均数为,标准差为s,则( )
A.数据x12,x22,…,xn2的平均数为2,标准差为s2
B.数据2x1,2x2,…,2xn的平均数为2,标准差为2s
C.数据x1+2,x2+2,…,xn+2的平均数为+2,方差为s2
D.数据2x1-2,2x2-2,…,2xn-2的平均数为2-2,方差为2s2
50.(2021·全国·高一课时练习)(多选)空气质量指数AQI是反映空气质量状况的指数,AQI指数越小,表明空气质量越好,空气质量指数与空气质量的对应关系如表所示,图1是某市2019年2月的空气质量指数的频率分布直方图,图2是2020年2月的空气质量指数的频率分布直方图一样,则下列叙述正确的是( )
空气质量指数(AQI)
优()
良()
轻度污染()
中度污染()
重度污染()
严重污染()
A.该市2020年2月的空气质量为优的频率为0.032
B.该市2020年2月的空气质量整体上优于2019年2月的空气质量
C.该市2020年2月的空气质量指数的中位数小于2019年2月的空气质量指数的中位数
D.该市2020年2月的空气质量指数的方差大于2019年2月的空气质量指数的方差
三、填空题
51.(2022·宁夏·银川二中高一期末)在某高传染性病毒流行期间,为了建立指标显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各个选项中,一定符合上述指标的是__________(填写序号).
①平均数; ②标准差; ③平均数且极差小于或等于2;
④平均数且标准差; ⑤众数等于1且极差小于或等于4.
52.(2022·全国·高一课时练习)在某年的足球联赛中,甲球队每场比赛的平均失球数是1.8,全年比赛失球个数的标准差为1.1;乙球队每场比赛的平均失球数是1.5,全年比赛失球个数的标准差是0.6.有下列说法:①平均说来甲球队的成绩比乙球队的成绩好;②乙球队比甲球队防守状况更稳定.其中正确的有________.(填序号)
53.(2021·河北·沧州市一中高一阶段练习)数据,,,平均数为6,标准差为2,若数据,,,的平均数为a,方差为b,则______.
54.(2021·全国·高一)2020年11月12日中国人民银行通过微信公众号宣布,“双十一”当日网联、银联共处理网络支付业务22.43亿笔、金额1.77万亿元.某公司对某地区10000名在2020年“双十一”当日网络购物者的消费情况进行统计,发现消费金额都在区间(单位:万元)内,其频率分布直方图如图所示,根据频率分布直方图,估计该地区网络购物者在“双十一”当日的消费金额的中位数为______万元(结果保留两位小数).
四、解答题
55.(2022·全国·高一)某工厂为了解甲 乙两条生产线所生产产品的质量,分别从甲 乙两条生产线生产的产品中各随机抽取了1000件产品,并对所抽取产品的某一质量指数进行检测,根据检测结果按,,,分组,得到如图所示的频率分布直方图,若工厂认定产品的质量指数不低于6为优良级产品,质量指数不低于5为合格级产品.
(1)用统计有关知识判断甲 乙两条生产线所生产产品的质量哪一条更好,并说明理由(同一组中的数据用该组区间的中点值作代表);
(2)质量部门认定:若一个工厂的产品合格率不低于75%,则可获得“品牌工厂”称号.根据上述两条生产线抽取的产品合格率情况,用样本估计总体的思想,估计该工厂是否能够获得“品牌工厂”称号?
56.(2022·全国·高一在一次高三年级统一考试中,数学试卷有一道满分为10分的选做题,学生可以从,两道题目中任选一题作答.某校有900名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从900名学生的选做题成绩中随机抽取一个容量为10的样本,为此将900名学生的选做题的成绩随机编号为001,002,,900.
(1)若采用随机数法抽样,并按照以下随机数表,以方框内的数字5为起点,从左向右依次读数,每次读取三位随机数,一行数读完之后接下一行左端写出样本编号的中位数.
05 26 93 70 60 22 35 85 15 13 92 03 51 59 77
59 56 78 06 83 52 91 05 70 74 07 97 10 88 23
09 98 42 99 64 61 71 62 99 15 06 1 29 16 93
58 05 77 09 51 51 26 87 85 85 54 87 66 47 54
73 32 08 11 12 44 95 92 63 16 29 56 24 29 48
26 99 61 65 53 58 37 78 80 70 42 10 50 67 42
32 17 55 85 74 94 44 67 16 94 14 65 52 68 75
87 59 36 22 41 26 78 63 06 55 13 08 27 01 50
15 29 39 39 43
(2)若采用分层随机抽样,按照学生选择题目或题目,将成绩分为两层,且样本中选择题目的成绩有8个,平均数为7,方差为4;样本中选择题目的成绩有2个,平均数为8,方差为1.试用样本估计该校900名学生的选做题得分的平均数与方差.
57.(2022·湖南·高一)一家人才测评机构对“创客园区”的20家小微企业的经理人进行自信心测试,获得的测试分数如下:
78 63 72 89 91 56 68 76 85 60
71 84 61 89 79 93 86 78 92 80
(1)以上述数据组成总体,求总体平均数与总体标准差.
(2)设计恰当的随机抽样方法,从总体中抽取一个容量为10的样本,求样本均值与标准差.
(3)利用上面的随机抽样方法,再抽取容量为10的样本,计算样本均值和标准差.将求得的结果与(2)中的结果进行比较,它们一样吗?
(4)利用(2)中的随机抽样方法,分别从总体中抽取一个容量为8,12,16,18的样本,求样本均值与标准差.分析样本容量与样本均值、样本标准差对总体的估计效果之间有什么关系.
58.(2022·全国·高一课时练习)某大学为了解学生对两家餐厅的满意度情况,从在两家餐厅都用过餐的学生中随机抽取了100人,每人分别对这两家餐厅进行满意指数打分(满意指数是指学生对餐厅满意度情况的打分,分数设置为分.根据打分结果按,分组,得到如图所示的频率分布直方图,其中餐厅满意指数在中有30人.
(1)求餐厅满意指数频率分布直方图中的值;
(2)利用样本估计总体的思想,估计餐厅满意指数和餐厅满意指数的平均数及方差(同一组中的数据用该组区间中点值作代表);
参考公式:,其中为的平均数,分别为对应的频率.
(3)如果一名新来同学打算从两家餐厅中选择一个用餐,你建议选择哪个餐厅?说明理由.
59.(2022·全国·高一单元测试)某工厂有工人名,其中名工人参加过短期培训(称为类工人),另外名工人参加过长期培训(称为类工人).现用分层抽样方法(按类,类分二层)从该厂的工人中共抽取名工人,调查他们的生产能力(生产能力指一天加工的零件数)
(1)类工人和类工人各抽取多少人
(2)将类工人的抽查结果分别绘制成频率分布直方图(如图1),根据频率分布直方图通过计算估计类工人的中位数,众数,平均数(同一组中的数据用该组区间的中点值作代表)
(3)就生产能力而言,类工人中个体间的差异程度与类工人个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)
60.(2022·江西·新余市第一中学高一期末)2021年7月24日,我国运动员杨倩以环的成绩获得东京奥运会射击女子米气步枪项目金牌,为中国代表团摘下本届奥运会的首枚金牌,也让《义勇军进行曲》成为第一首奏响在本届奥运会赛场上的国歌.在决赛赛场上,第二阶段前轮(第枪,每轮枪)是选手淘汰阶段,后轮(第枪,每轮枪)进入奖牌争夺阶段.杨倩在第二阶段成绩如下:
轮数
枪数
得分
(1)计算第二阶段前4轮和后3轮得分的均值,试根据此结果分析该选手在淘汰阶段和奖牌争夺阶段的发挥状态哪个更好;
(2)记后轮得分的均值为,标准差为,若数据落在内记为正常,否则不正常﹐请根据此结论判断该选手最后一枪在后轮个数据中是否为正常发挥 (参考数据:,计算结果精确到)
试卷第1页,共3页
【答案详解】
1.D
【解析】
【分析】
利用频率分布直方图求频数、众数、中位数、平均数的方法对各选项逐一计算判断作答.
【详解】
由频率分布直方图知,数据落在区间[140,160)内的频率最大,众数约为150kg,A不正确;
数据落在区间[80,140)内的频率为0.3<0.5,数据落在区间[80,160)内的频率为0.62>0.5,中位数落在区间[140,160)内,B不正确;
体重不低于200kg的频率为0.04,2000头生猪中约有80头体重不低于200kg,C不正确;
2000头生猪体重的平均数约为kg,D正确.
故选:D
2.B
【解析】
【分析】
设中位数为x,求出各组的频率,判断x在组,
解方程0.04+0.10+0.16+即可.
【详解】
设中位数为x,
组的频率为:0.04;
组的频率为:0.10;
组的频率为:0.16;
组的频率为:0.24;
组的频率为:0.22,
0.04+0.10+0.16+0.24=0.54>0.5
所以中位数在组,
有0.04+0.10+0.16+,
解得.
故选:B
3.A
【解析】
【分析】
根据中位数的概念列出方程,解之即可.
【详解】
由频率分布直方图,设学生每天锻炼身体的时间的中位数为,则:
,解得,
故选:A.
4.A
【解析】
【分析】
根据平均数,中位数,众数的概念,分别求出,即可求出结果.
【详解】
由题意可得,,,,
则.
故选:A.
5.D
【解析】
【分析】
根据平均数、中位数、众数的优缺点进行判断即可.
【详解】
众数体现了样本数据的最大集中点,但对其他数据信息的忽略使得无法客观反映总体特征;
中位数不受少数极端值的影响,对极端值的不敏感也会成为缺点;
平均数较好地反映样本数据全体的信息,但是样本数据质量较差时使用平均数描述数据的中心位置就会可能与实际情况产生较大差异,
故选:D
6.C
【解析】
【分析】
由百分比图知,成绩为100分、80分、60分、40分的百分比分别为,结合各项的描述即可判断其正误.
【详解】
由图知,及格率为,故A错误.
该测试满分同学的百分比为,即有名,B错误.
由图知,中位数为分,平均数为分,故C正确.
由题意,名学生成绩能得优秀的同学有,故D错误.
故选:C
7.C
【解析】
【分析】
由概率总和为1可得,由百分位数定义计算80%分位数,由频率分布直方图的频率计算人数,均值判断各选项.
【详解】
由得,A错;
成绩在区间[60,70)的频率为,人数为,B错;
平均成绩为,C正确;
低于90分的频率为,设样本数据的80%分位数约为分,
则,解得,D错.
故选:C.
8.C
【解析】
【分析】
由频率分布直方图,分别求出该公司职工的测试成绩不低于60分的频率 中位数 平均值 众数,能判断正确选项.
【详解】
解:由频率分布直方图,得:
对于A,该公司职工的测试成绩不低于60分的频率为:(0.02+0.015)×20=0.70,
∴该公司职工的测试成绩不低于60分的人数约占总人数的70%,故A错误;
对于B,测试成绩在[20,60)的频率为(0.005+0.01)×20=0.3,
测试成绩在[60,80)的频率为0.02×20=0.4,
∴该公司职工测试成绩的中位数约为:分,故B错误;
对于C,该公司职工测试成绩的平均值约为:
分,故C正确;
对于D,该公司职工测试成绩的众数约为:分,故D错误.
故选:C.
【点睛】
本题考查命题真假的判断,考查频率 中位数 平均值 众数 频率分布直方图的性质等基础知识,考查运算求解能力 数据分析能力等,是基础题.解题的关键在于熟练掌握频率分布直方图估计中位数,众数,平均数的基本方法.
9.C
【解析】
【分析】
根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.
【详解】
因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.
该地农户家庭年收入低于4.5万元的农户的比率估计值为,故A正确;
该地农户家庭年收入不低于10.5万元的农户比率估计值为,故B正确;
该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为,故D正确;
该地农户家庭年收入的平均值的估计值为(万元),超过6.5万元,故C错误.
综上,给出结论中不正确的是C.
故选:C.
【点睛】
本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于.
10.D
【解析】
【分析】
根据平均数和方差的计算性质即可计算.
【详解】
设甲、乙两班学生成绩分别为,甲班平均成绩为,乙班平均成绩为,因为甲、乙两班的平均成绩相等,所以甲、乙两班合在一起后平均成绩依然为,
因为,
同理,
∴甲、乙两班合在一起后的方差为:
.
故选:D.
11.C
【解析】
【分析】
根据数据分别计算出平均数,中位数,方差,并找出10个数据的最大数据即可.
【详解】
因为10位同学的数学成绩分别为:100,100,135,120,95,90,140,110,115,95,
所以这10位同学的数学成绩最高分为140,选项A正确;
这10位同学的数学成绩均值为,故选项B正确;
这10位同学的数学成绩中位数为,选项C错误;
这10位同学的数学成绩方差为
,选项D正确.
故选:C.
12.D
【解析】
【分析】
分别代入平均数和标准差的公式,得到和的关系,以及和的关系,计算求值.
【详解】
,
.
故选:D
13.C
【解析】
【分析】
利用平均数与方差的运算性质求解即可.
【详解】
解:因为数据,,,的平均数为2,方差为3,
所以数据,,,的平均数为,
方差为.
故选:.
14.C
【解析】
【分析】
根据题意,利用数据的平均数和方差的性质分析可得答案.
【详解】
根据题意,数据,,,的平均数为2,方差为3,则数据,,,的平均数,其方差.
故选:C.
15.D
【解析】
【分析】
利用平均数和方差的公式可算出答案.
【详解】
因为样本,,…,的平均数为10,方差为20,
所以有,.
所以,,…,的平均数为,
所以,,…,的方差为
.
故选:D
16.(1)
(2)中位数为171.25
(3)平均数为170;方差150
【解析】
【分析】
(1)根据所有矩形面积之和即频率之和为1,求得答案;
(2)根据中位数的求解方法列出方程,求得答案;
(3)分别利用平均数以及方差的计算方法,求得结果.
(1)
由图可得,解得.
(2)
设全班同学身高的中位数为,可知,得,解得,
故估计全班同学身高的中位数为171.25.
(3)
估计全班同学身高的平均数为,
估计全班同学身高的方差为
.
17.(1)50
(2)平均数的估计值为26,方差的估计值为20.25
【解析】
【分析】
(1)根据频数总数频率即可求解;
(2)由频率分布直方图求平均数的公式及方差公式即可求解.
(1)
解:根据频率分布直方图得第一组的频率为,所以,所以.
(2)
解:新生引体向上的成绩的平均数为
,
新生引体向上的成绩的方差为
,
所以新生引体向上的成绩的平均数的估计值为26,方差的估计值为20.25.
18.(1)直方图见解析,平均数67分,80%分位数76.67分
(2)
【解析】
【分析】
(1)根据题意求出成绩落在的频率,补全频率分布直方图,利用频率分布直方图求出平均数和80%分位数;
(2)根据分层抽样的性质求得第三组和第四组抽取的人数,进而求得该两组成绩的平均值,利用方差公式即可求出这两组成绩的方差.
(1)
成绩落在的频率为
补全的频率分布直方图,如图
样本的平均数(分)
设80%分位数为,则,
解得:(分}
(2)
由分层抽样可知,第三组和第四组分别抽取3人和2人
分层抽样的平均值:(分)
分层抽样的方差:
19.D
【解析】
【分析】
利用公式可求平均数和90%分位数,再求出众数后可得所求的和.
【详解】
这组数据的平均数为,
而,故90%分位数,
众数为,故三者之和为,
故选:D.
20.A
【解析】
【分析】
根据题意进行数据分析,分别求出x、y,即可求出.
【详解】
因为这两组数据的中位数均为15,所以.
因为这两组数据的平均值相等,所以,解得,故.
故选:A.
21.C
【解析】
【分析】
对于A,由频率分布直方图中所有小矩形面积之和为1,列出等式可求得a的值,进而作出判断;对于B,先计算高于130分的频率,然后再用1减去于高于130分的频率即可得到低于130分的频率,进而作出判断;对于C,先计算的频率和的频率,再求出总体的中位数,进而作出判断;对于D,根据样本分布在的频数一定与样本分布在的频数相等,总体分布在的频数不一定与总体分布在的频数相等作出判断即可.
【详解】
由频率分布直方图得:
,
解得,故A错误;
样本数据低于130分的频率为:,故B错误;
的频率为:,
的频率为:,
所以总体的中位数保留1位小数估计为:分,故C正确;
样本分布在的频数一定与样本分布在的频数相等,
总体分布在的频数不一定与总体分布在的频数相等,故D错误.
故选:C.
22.D
【解析】
【分析】
由题意可求得,可解决此题.
【详解】
数据,,,的平均数为4,,
数据,,,的平均数为,
故选:.
23.A
【解析】
【分析】
根据题意,结合“优秀小组”的定义依次分析选项,综合可得答案.
【详解】
甲:中位数为8,众数为7,可知甲组的得分依次为:7、7、8、9、10,根据“优秀小组”的概念可知甲组一定是“优秀小组”
当乙组得分依次为:6、8、8、10、10时,中位数为8,平均数为8.4,但乙组不符合“优秀小组”的概念,
当丙组得分依次为:6、8、8、8、10时,丙:平均数为8,方差为,但丙组不符合“优秀小组”的概念.
故选:A.
24.C
【解析】
【分析】
取特例可判断ABD;当总体平均数是2,若有一个数据超过7,则方差就接近3,符合要求.
【详解】
当连续10日新增疑似病例数为0,0,0,0,4,4,4,4,4,10时,显然总体平均数为3,中位数为4,故A错误;
当连续10日新增疑似病例数为0,0,0,0,0,0,0,0,0,10时,满足总体平均数为1,总体方差大于0,故B错误;
当连续10日新增疑似病例数为0,0,0,1,1,3,3,3,3,10时,满足中位数为2,众数为3,故D错误;
当总体平均数是2,若有一个数据超过7,则方差就超过3,故C正确;
故选:C.
25.C
【解析】
【分析】
利用数据的均值、方差的线性运算直接求得.
【详解】
因为数据,,,…,的标准差为2,所以方差为4.
由题意知,得到的新数据为,,,…,,
这组新数据的方差为,标准差为6.
故选:C
26.D
【解析】
【分析】
设初中部20名党员、高中部50名党员竞赛成绩分别为,,得,,然后利用方差的计算公式可得答案.
【详解】
设初中部20名党员竞赛成绩分别为,
高中部50名党员竞赛成绩的平均分,根据题意得
则,
,
所以,
,由于,
所以该学校全体参赛党员竞赛成绩的平均分为,
则该学校全体参赛党员竞赛成绩的方差为
.
故选:D.
27.C
【解析】
【分析】
利用甲乙两对的平均失球数大小判断选项AC的真假,失球个数的标准差大小判断选项BD的真假得解.
【详解】
解:乙队平均失球大于甲队平均失球,所以选项A错误;
乙队失球个数的标准差小于甲队失球个数的标准差,选项B和D错误,
甲队每场比赛平均失球数个,小于乙队每场比赛平均失球数个,所以平均来说,甲队比乙队防守技术好.
故选:C
28.(1)初中年级45人,高中年级55人;
(2)中位数,平均数.
【解析】
【分析】
(1)根据分层抽样是等比抽样的特点,结合已知数据,计算即可;
(2)根据频率分布直方图中中位数和平均数的计算,结合频率分布直方图计算即可.
(1)
因为初中、高中年级的在校学生人数之比为9:11,又采用分层抽样抽取了100人,
故100人中,初中年级抽取人数为:人;高中年级抽取人数为:人.
(2)
设学生做作业时间的中位数为,
则,解得,故学生做作业时间中位数为;
设学生做作业时间的平均数为,
则,
故学生做作业时间的平均数为.
29.(1);
(2)万元
【解析】
【分析】
(1)分别求得未使用新技术和使用新技术后的年产量平均值,从而求得增加的百分比.
(2)先求得使用新技术后的年总产量,然后计算总利润即可.
(1)
未使用新技术时的8棵春见相橘树的年产量的平均值:
千克,
使用了新技术后的8棵春见相橘树的年产量的平均值:
千克,
故可估计该基地使用了新技术后,春见柑橘年总产量比未使用新技术时增加的百分比约为.
(2)
该基地使用新技术后春见相橘的年总产量约为千克,
故该基地使用新技术后春见相橘的年总利润约为万元.
30.B
【解析】
【分析】
设这10个数据分别为:,进而根据题意求出和,进而再根据平均数和方差的定义求得答案.
【详解】
设这10个数据分别为:,根据题意,,
所以,.
故选:B.
31.A
【解析】
【分析】
由中位数以及众数判断A;由百分位数的定义计算判断B;计算乙组数据的方差判断C;计算被抽中的30名学生每天平均阅读时间从而判断D.
【详解】
对于A,中位数为和众数相等,故A错误;
对于B,将该组数据从小到大排列为,,则该组数据的分位数为5,故B正确;
对于C,乙组数据,方差为,则这两组数据中较稳定的是乙,故C正确;
对于D,被抽中的30名学生每天平均阅读时间为,故D正确;
故选:A
32.B
【解析】
【分析】
对A,由平均数求法直接判断即可;由极差概念可判断B,结合百分位数概念可求C;将甲乙两组数据排序,可判断D.
【详解】
甲组数据的平均数为,乙组数据的平均数为,故A错误;
甲种麦苗样本株高的极差为11,乙种麦苗样本株高的极差为13,故B正确;
,故甲种麦苗样本株高的75%分位数为第5位数,为12,故C错误;
甲种麦苗样本株高的中位数为,乙种麦苗样本株高的中位数为,故D错误.
故选:B
33.C
【解析】
【分析】
根据频率分布折线图,结合选项一一判断,即可得结论.
【详解】
对于A项:2月7日到2月13日一周时间内,
每天甲省的新增“新冠肺炎“确诊人数都小于或等于乙省的新增“新冠肺炎“确诊人数,
故甲省的平均数比乙省低,故A项正确;
对于B项:由折线图可知,乙省数据的波动范围小于甲省数据的波动范围,
故乙省方差小于甲省的方差,故B项正确;
对于C项:由折线图数据可得甲省的数据从小到大排列为:
9,11,13,24,27,28,28
故甲省的中位数为24,故C项错误;
对于D项:由折线图数据可得乙省的极差为,故D项正确,
故选:C.
34.C
【解析】
【分析】
根据两组数据的关系,结合平均值、中位数、方差、标准差的定义判断.
【详解】
设,,……的平均数是,,,……的平均数是,
由题意,如果,则,否则;
同理如果,,……的中位数是,则两者中位数相同,否则不相同;
设,,……的方差,,,……的方差是,
则,
又,,所以,,
所以,从而,所以方差相同,标准差也相同.
故选:C.
35.B
【解析】
【分析】
设这6个样本中成分甲的含量分别为,.,,,,,平均值为,根据方差公式计算可得,则,计算即可得出结果.
【详解】
设这6个样本中成分甲的含量分别为,.,,,,,平均值为,则 ,所以,所以,则.
故选:B.
36.D
【解析】
【分析】
设男同学为人,女同学为人,根据平均数公式及方差公式计算可得;
【详解】
解:设男同学为人,女同学为人,则全班的平均数为,
设男同学为,,,,女同学为,,,,则,所以男同学的方差①,女同学的方差②;由①可得,即,由②可得,即,所以全班同学的方差为
即
故选:D
37.D
【解析】
【分析】
设、、、、的平均数为,方差为,求出、的值,利用平均数和方差公式可求得样本、、、、的平均数与方差.
【详解】
设、、、、的平均数为,方差为,
则,,
由题意可得
,则,
,
所以, 样本、、、、的平均数为
,
方差为
.
故选:D.
38.B
【解析】
【分析】
根据题意和表格的数据分别计算数据开发、数据分析、数据产品的平均薪资,进而比较大小即可.
【详解】
由题中选项知数据挖掘的平均薪资最高,故只需计算并比较其他三类工作岗位的平均薪资.估计数据开发的平均薪资为;
估计数据分析的平均薪资为;
估计数据产品的平均薪资为.
故数据挖掘>数据产品>数据开发>数据分析.
故选:B.
39.C
【解析】
【分析】
根据表格数据及频率直方图求、,若场外学生有人可得且,即可比较的大小关系.
【详解】
由题设,,,
∴,
若场外学生有人,则,又,
∴,即.
故选:C
40.A
【解析】
【分析】
在频率分布直方图中,中位数两侧小矩形的面积相等,平均数是每组频率的中间值乘频数再相加之和,由此能求出结果.
【详解】
解:在频率分布直方图中,
中位数两侧小矩形的面积相等,
平均数是每组频率的中间值乘频数再相加之和,
结合两个频率分布直方图得:
为中位数,为平均数,为平均数,为中位数.
故选:A.
41.C
【解析】
【分析】
利用中位数,众数,百分位数的定义求解即可.
【详解】
解:这24个数据的中位数为,
众数为172,
∵,∴第30百分位数为第8个数169,
故选:C.
42.A
【解析】
【分析】
根据数据求出中位数,众数,平均数即可得.
【详解】
由已知5出现10次,出现次数最多,因此众数是5,即,30个数按序排好,第15个数是5,第16 个数是6,中位数是5.5,即.
平均数为,
∴.
故选:A.
43.AB
【解析】
【分析】
利用频率分布直方图中频率的求解方法,通过求解频率即可判断选项的正误.
【详解】
对于A,该地农户家庭年收入不低于8.5万元的农户比例为,故正确;
对于B,设该地农户家庭年收入的第三四分位数为万元,
则,则,故正确;
对于C,该地农户家庭年收入的平均值为
,故错误;
对于D,设该地农户家庭年收入的中位数为万元,
则,即,则中位数是,故错误.
故选:AB
44.CD
【解析】
【分析】
根据直方图求参数x判断A,由中位数的性质判断B,根据平均数的求法求平均数判断C,由频数的概念判断D.
【详解】
由直方图知:,可得,
∴万元的中小企业有家,A错误;
由图知:前三组的频率,易知中位数在区间,B错误;
由图知:当地中小型企业年收入的平均数万元,C正确;
内,D正确.
故选:CD
45.ABD
【解析】
【分析】
设丢失数据为,分别在、和三种情况下,根据平均数与众数的和是中位数的倍构造方程求得结果.
【详解】
设丢失的数据为,则这七个数据的平均数为,众数是.
这组数据的平均数与众数的和是中位数的倍,
若,则中位数为,此时,解得:;
若,则中位数为,此时,解得:;
若,则中位数为,此时,解得:.
综上所述:丢失的数据可能是,,.
故选:ABD.
46.BC
【解析】
【分析】
A:根据频率直方图中,所有小矩形的面积之和为1,进行求解判断即可;
B:根据众数的定义,结合频率直方图进行判断即可;
C:根据直方图,结合题意进行判断即可;
D:根据中位数的定义,结合结合频率直方图进行判断即可.
【详解】
A:因为频率直方图中,所有小矩形的面积之和为1,
所以,
因此本选项说法不正确;
B:分布在小组的矩形面积最大,因此众数出现在这个小组内,因此估计众数为
,因此本选项说法正确;
C:高三男生100米休能测试成绩不大于13秒的小组有:,,,
频率之和为:,因此估计估计本校高三男生100米休能测试成绩不大于13秒的人数为,所以本选项说法正确;
D:设中位数为,因此有,
所以本选项说法不正确,
故选:BC
47.BC
【解析】
【分析】
根据平均数、方差、标准差的定义逐项判断可得答案.
【详解】
, ,
对于A,与不存在关系,不一定相等,故错误;
对于B,,,所以数据的标准差为,故正确;
对于C,,,故正确;
对于D,数据的平均数为,方差为
,故错误.
故选:BC.
48.ABC
【解析】
【分析】
根据平均数、极差、方差及标准差的概念即得.
【详解】
根据极差和标准差的定义可知二者均可描述一组数据的离散程度,故A正确,
根据平均数及方差的计算公式可得,如果一组数中每个数减去同一个非零常数,则这一组数的平均数改变,方差不改变,故B正确;
由一个样本的方差,可知样本平均数为3,这组数据总和等于60,故C正确;
数据,,,的方差为,则数据,,,的方差为,故D错误.
故选:ABC.
49.BC
【解析】
【分析】
举反例得到A错误,再根据平均值和方差的性质依次判断每个选项得到答案.
【详解】
取,则,,,故,A错误;
数据的平均数为,标准差为,B正确;
数据的平均数为,方差为,C正确;
数据的平均数为,方差为,D错误.
故选:BC
50.BC
【解析】
【分析】
根据图2数据以及频率求法可判断A;由频率直方图求平均数的计算公式可判断B;根据中位数的求法可判断C;根据方差的意义可判断D.
【详解】
该市2020年2月的空气质量为优即,
由题图2可知该市2020年2月的空气质量为优的频率为
,故A不正确.
该市2020年2月的空气质量指数的平均数为
,
该市2019年2月的空气质量指数的平均数为
所以该市2020年2月的空气质量整体上优于2019年2月的空气质量,故B正确.
该市2020年2月的空气质量指数的中位数为,
该市2019年2月的空气质量指数的中位数为,
所以该市2020年2月的空气质量指数的中位数小于
2019年2月的空气质量指数的中位数,故C正确.
由题图1和2可知,2020年2月的空气质量指数的波动性小于
2019年2月的空气质量指数的波动性,
所以2020年2月的空气质量指数的方差小于
2019年2月的空气质量指数的方差,故D不正确.
故选:BC.
51.③⑤
【解析】
【分析】
按照平均数、极差、方差依次分析各序号即可.
【详解】
连续7天新增病例数:0,0,0,0,2,6,6,平均数是2<3,①错;
连续7天新增病例数:6,6,6,6,6,6,6,标准差是0<2,②错;
平均数且极差小于或等于2,单日最多增加4人,若有一日增加5人,
其他天最少增加3人,不满足平均数,所以单日最多增加4人,③对;
连续7天新增病例数:0,3,3,3,3,3,6,平均数是3且标准差小于2,④错;
众数等于1且极差小于或等于4,最大数不会超过5,⑤对.
故答案为:③⑤.
52.②
【解析】
【分析】
比较两支球队的平均值和标准差,根据数据的平均值和波动大小得到答案.
【详解】
甲球队的平均失球数大于乙球队的平均失球数,故乙球队成绩好于甲球队,①错误;
乙球队全年比赛失球个数的标准差小于甲球队全年比赛失球个数的标准差,故乙球队比甲球队防守状况更稳定,②正确.
故答案为:②.
53.49
【解析】
【分析】
利用平均数和方差的线性关系的性质直接求出a、b,即可求出a+b.
【详解】
数据,,,平均数为6,所以数据,,,的平均数为,即a=13;
数据,,,的标准差为2,所以数据,,,的方差为4,
所以数据,,,的方差为,即b=36,
所以13+36=49.
故答案为:49.
54.0.53
【解析】
【分析】
从小到大,利用小矩形面积之和为0.5来估计求解中位数
【详解】
由频率分布直方图,可知,解得,
设消费金额的中位数为x万元,则,得,
所以估计该地区网络购物者在“双十一”当日的消费金额的中位数为0.53万元.
故答案为:0.53
55.(1)甲生产线所生产产品的质量更好;
(2)该工厂不能够获得“品牌工厂”称号.
【解析】
【分析】
(1)根据频率分布直方图计算甲、乙两条生产线所生产产品的质量指数的平均数,比较大小即可得答案;
(2)由频率分布直方图,计算甲、乙两条生产线抽取的产品合格率,与75%比较大小即可作出判断.
(1)
解:甲生产线所生产产品的质量指数的平均数为:=3×0.05×2+5×0.15×2+7×0.2×2+9×0.1×2=6.4;
乙生产线所生产产品的质量指数的平均数为:=3×0.15×2+5×0.1×2+7×0.2×2+9×0.05×2=5.6.
因为,所以甲生产线生产产品质量的平均水平高于乙生产线生产产品质量的平均水平,
故甲生产线所生产产品的质量更好.
(2)
解:由题意,甲、乙两条生产线抽取的产品合格率为,
所以用样本估计总体的思想,估计该工厂不能够获得“品牌工厂”称号.
56.(1)中位数为
(2)平均数约为7.2,方差约为3.56
【解析】
【分析】
(1)从随机数表中,抽取符合条件的编号,再由小到大排序,然后利用中位数定义求解;
(2)根据样本中选择题目的成绩有8个,平均数为7,方差为4;样本中选择题目的成绩有2个,平均数为8,方差为1,利用平均数和方差公式求解.
(1)
解:由题意知:读取的编号依次是512,805,770,687,858,554,876,647,547,332.
由小到大排序,得332,512,547,554,647,687,770,805,858,876,
样本编号的中位数为.
(2)
设样本中选择题目的成绩的平均数为,方差为;
样本中选择题目的成绩的平均数为,方差为,
则,,,.
样本的平均数为,
方差为,
,
该校900名学生的选做题得分的平均数约为7.2,方差约为3.56.
57.(1)总体平均数,总体标准差
(2)见解析
(3)见解析
(4)见解析
【解析】
【分析】
(1)利用平均数公式和标准差公式求解即可,
(2)利用抓阄法进行抽样,抽出10个样本,然后利用平均数公式和标准差公式求解,
(3)抽出10个样本,利用平均数公式和标准差公式求解,
(4)利用平均数公式和标准差公式求解
(1)
总体平均数为,
总体方差为,
所以样本标准差为
(2)
利用抓阄法进行抽样,若抽出的10个样本分别为78,89,68,60,84,89,86,78 ,92,80,则
样本平均数为,
样本方差为,
所以样本标准差为,
(3)
若抽出的10个样本分别为78,84,72, 89,91,56,86,76,85,60,则
样本平均数为,
样本方差为 ,
所以样本标准差为,与(2)中的结果不一样,
(4)
若样本容量为8的样本是:72,89,68,61,93,71,80,92,则
平均数为,
方差为,
所以样本标准差为,
若样本容量为12的样本是:78,72,89,56,76,60,84,79,93,86,78,92,
则平均数为,
样本方差为,
所以样本标准差为
若样本容量为16的样本是:63,72,89,56,68,76,85,71,84,61,89,79,93,86,78,92,则
平均数为,
方差为,
所以样本标准差为,
若样本容量为18的样本是:78,63,72,89,91,56,68,76,85,60,71,84,61,89,79,93,86,92,则平均数为
样本方差为,
所以标准差为,
随着样本容量的增加,分别用样本平均数和样本标准差估计总体平均数和样本标准差的效果会越来越好,但是由样本的随机性,也有极个别的例外情况
58.(1),
(2)餐厅满意指数的平均数和方差分别为,;餐厅满意指数的平均数和方差分别为,
(3)答案见解析
【解析】
【分析】
(1)根据频率的含义和性质列方程,即可解得:,;
(2)根据平均数和方差的定义,然后运算即可;
(3)平均数和方差在实际生活中的应用,平均满意度越高,就越会受到欢迎.
(1)
因为餐厅满意指数在中有30人,则有:
解得:
根据总的频率和为1,则有:
解得:
综上可得:,
(2)
设餐厅满意指数的平均数和方差分别为餐厅满意指数的平均数和方差分别为,则有:
,
,
,
,
综上可得:餐厅满意指数的平均数和方差分别为,;餐厅满意指数的平均数和方差分别,
(3)
答案一:餐厅满意指数的平均数为,方差为,餐厅满意指数的平均数为,方差为,因为,所以推荐餐厅;
答案二:餐厅满意指数在的频率为,在的频率为,餐厅满意指数在和的频率都为,所以推荐餐厅;
(答案不唯一,符合实际情况即可)
59.(1);
(2);;
(3)类工人个体间的差异程度更小
【解析】
【分析】
(1)根据分层抽样的概念直接计算;
(2)根据频率分布直方图,利用中位数,众数,平均数的概念及公式直接计算;
(3)根据频率分布直方图直接可得结论.
(1)
解:由已知分层抽样可得:类工人抽取人,类工人抽取人;
(2)
解:中位数:设中位数为,由频率分布直方图可得,,所以,且,解得:,即中位数为;
众数:由频率分布直方图可得众数为;
平均数:,即平均数为;
(3)
根据频率分布直方图可判断类工人个体间的差异程度更小.
60.(1),;在淘汰阶段(前轮)的发挥状态更好
(2)不是
【解析】
【分析】
(1)由平均值的计算公式即可求解均值,比较大小即可作出判断;
(2)由(1)及标准差的计算公式求出标准差,根据题意即可作出判断.
(1)
解:设前轮得分的均值、后轮得分的均值分别为,由题可知:
前轮的均值,
后轮的均值,
因为,所以,
故该选手在淘汰阶段(前轮)的发挥状态更好.
(2)
解:由(1)可得,
故
于是,
,,
故,
因为,所以该选手最后一枪在后轮的个数据中不是正常发挥.