中小学教育资源及组卷应用平台
第九章 统计单元测试培优卷
一、单项选择题。本大题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的。
1.为了了解某校600名学生的学习情况,随机抽取了100名学生进行调查,在这个问题中样本是( )
A.100 B.100名学生
C.100名学生的学习情况 D.600名学生的学习情况
2.某科研单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则应抽取的老年人人数为( )
A.6 B.12 C.18 D.24
3.演讲比赛共有9位评委分别给出某选手的原始评分9.2,9.5,9.6,9.1,9.3,9.0,8.8,9.3,9.6,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.极差 B.中位数 C.平均数 D.方差
4.甲、乙两名同学12次考试中数学成绩的茎叶图如图所示,则下列说法正确的是( )
A.甲同学比乙同学发挥稳定,且平均成绩也比乙同学高
B.甲同学比乙同学发挥稳定,但平均成绩比乙同学低
C.乙同学比甲同学发挥稳定,且平均成绩也比甲同学高
D.乙同学比甲同学发挥稳定,但平均成绩比甲同学低
5.2021年,我国全年货物进出口总额391009亿元,比上年增长21.4%.其中,出口217348亿元,增长21.2%;进口173661亿元,增长21.5%.货物进出口顺差43687亿元,比上年增加7344亿元.如图是我国2017—2021年货物进出口总额统计图,则下面结论中不正确的是( )
A.2020年的货物进出口总额322215亿元 B.2020年的货物进出口顺差36343亿元
C.2017—2021年,货物进口总额逐年上升 D.2017—2021年,货物出口总额逐年上升
6.某教育机构为了调查学生在课外读物方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在元的同学有30人,则n的值为( )
A.55 B.50 C.1000 D.100
7.一组数据按从小到大的顺序排列为1,4,4,x,7,8(其中),若该组数据的中位数是众数倍,则该组数据的方差和60%分位数分别是( )
A.,5 B.5,5 C.,6 D.5,6
8.已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入新数据4,5,6,此时样本容量为10,若此时平均数为,方差为,则( )
A., B.,
C., D.,
二、多项选择题。本题共4小题,每小题5分,共20分。在每小题给出的选项中,有多项符合题目要求。全部选对的得5分,部分选对的得2分,有选错的得0分。
9.某公司生产三种型号的轿车,产量分别为1200辆,6000辆和2000辆.为检验该公司的产品质量,公司质监部门要抽取46辆进行检验,则下列说法正确的是( )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.三种型号的轿车依次抽取6辆,30辆,10辆
D.这三种型号的轿车,每一辆被抽到的概率都是相等的
10.一组数据6,7,8,a,12的平均数为8,则此组数据的( )
A.众数为7 B.极差为6
C.中位数为8 D.方差为
11.2022年第二十二届世界杯足球赛在卡塔尔举行,这是第一次在阿拉伯地区举办,第一次在北半球冬季举办,也是最后一届32支球队参加的世界杯赛,它吸引了全世界的目光.现使用分层抽样的方法,从到场观看世界杯某场比赛的球迷中随机抽取名,其中亚洲、欧洲、非洲、美洲球迷人数的比例为,若亚洲球迷抽到12人,则下列选项不正确的是( )
A.非洲球迷抽到15人 B.美洲球迷抽到8人
C. D.欧洲球迷比美洲球迷多18人
12.有甲、乙两组数据,甲:1、2、a、b、10,乙:1、2、5、6、11,其中,若甲组数据的平均数等于乙组数据的中位数,要使甲组数据的方差小于乙组数据的方差,则可以为( )
A. B. C. D.
三、填空题。本题共4小题,每小题5分,共20分。
13.总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取5个个体,选取方法是从如下随机数表的第1行的第7列和第8列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为__________.
第1行:78 16 62 32 08 02 62 42 01 52 53 69 97 28 01 98
第2行:32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
14.某班级在开学初进行了一次数学测试,男同学平均答对17道题,方差为11,女同学平均答对12道题,方差为16,班级男女同学人数之比为3:2,那么全班同学答对题目数的方差为______.
15.某科研课题组通过一款手机软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表:
周跑量 , , , , , , , , ,
人数 100 120 130 180 220 150 60 30 10
周跑量 小于20公里 20公里到40公里 不小于40公里
类别 休闲跑者 核心跑者 精英跑者
装备价格(单位:元) 2500 4000 4500
根据跑步爱好者的周跑量,将跑步爱好者分成以上三段,不同类别的跑者购买的装备价格不一样.根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费________元.
16.高一级共840名同学参加了数学单元测验,已知所有学生成绩的第80百分位数是85分,至少有________名学生的成绩大于或等于85分.
四、解答题。本题共6小题,共70分,第17题10分,其余每题12分。解答应写出文字说明、证明过程或演算步骤。
17.某工厂为了了解员工的工作效率,需调查,,三类工种的职工工作情况,已知在该厂的全体职工中,工种占,工种占,工种占.现用分层抽样的方法从全体职工中抽取一个样本容量为的样本.试确定:
(1)若,则在工种、工种、工种中分别应抽取多少人?
(2)若抽取的工种比工种多30人,则抽取的工种有多少人?
18.我们国家正处于老龄化社会中,老有所依也是政府的民生工程.某市共有户籍人口400万,老年人(年龄60岁及以上)约有66万,为了了解老年人的健康状况,政府从老年人中随机抽取600人并委托医疗机构免费为他们进行健康评估,健康状况共分为不能自理、不健康尚能自理、基本健康、健康四个等级,并以80岁为界限分成两个群体进行统计,样本分布情况如图:
(1)若采用分层抽样的方法从样本中不能自理的老年人中抽取16人进一步了解他们的生活状况,则两个群体中各应抽取多少人?
(2)估算该市80岁及以上的老年人占全市户籍人口的百分比.
19.在一次高三年级统一考试中,数学试卷有一道满分为10分的选做题,学生可以从,两道题目中任选一题作答.某校有900名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从900名学生的选做题成绩中随机抽取一个容量为10的样本,为此将900名学生的选做题的成绩随机编号为001,002,,900.
(1)若采用随机数法抽样,并按照以下随机数表,以方框内的数字5为起点,从左向右依次读数,每次读取三位随机数,一行数读完之后接下一行左端写出样本编号的中位数.
05 26 93 70 60 22 35 85 15 13 92 03 51 59 77
59 56 78 06 83 52 91 05 70 74 07 97 10 88 23
09 98 42 99 64 61 71 62 99 15 06 1 29 16 93
58 05 77 09 51 51 26 87 85 85 54 87 66 47 54
73 32 08 11 12 44 95 92 63 16 29 56 24 29 48
26 99 61 65 53 58 37 78 80 70 42 10 50 67 42
32 17 55 85 74 94 44 67 16 94 14 65 52 68 75
87 59 36 22 41 26 78 63 06 55 13 08 27 01 50
15 29 39 39 43
(2)若采用分层随机抽样,按照学生选择题目或题目,将成绩分为两层,且样本中选择题目的成绩有8个,平均数为7,方差为4;样本中选择题目的成绩有2个,平均数为8,方差为1.试用样本估计该校900名学生的选做题得分的平均数与方差.
20.2022年起,某省将实行“”高考模式,为让学生适应新高考的赋分模式,某校在一次校考中使用赋分制给高三年级学生的生物成绩进行赋分,具体赋分方案如下:先按照考生原始分从高到低按比例划定A、B、C、D、E共五个等级,然后在相应赋分区间内利用转换公式进行赋分A等级排名占比15%,赋分分数区间是86-100;B等级排名占比35%,赋分分数区间是71-85:C等级排名占比35%,赋分分数区间是56-70:D等级排名占比13%,赋分分数区间是41-55;E等级排名占比2%,赋分分数区间是30-40;现从全年级的生物成绩中随机抽取100名学生的原始成绩(未赋分)进行分析,其频率分布直方图如图所示:
(1)求图中a的值;
(2)求抽取的这100名学生的原始成绩的众数、平均数和中位数;
(3)用样本估计总体的方法,估计该校本次生物成绩原始分不少于多少分才能达到赋分后的B等级及以上(含B等级)?(结果保留整数)
21.在一个文艺比赛中,由8名专业人士和8名观众代表各组成一个评委小组,给参赛选手打分.下面是两组评委对同一名选手的打分:
小组A 42 45 50 47 49 53 51 47
小组B 53 36 71 49 46 65 62 58
(1)做出两组评委打分的茎叶图;
(2)每一个小组内评委打分的相似程度是不同的,我们可以用方差来进行刻画.请计算每一组数据中的方差;
(3)你能根据方差判断出小组A与小组B中哪一个更像是由专业人士组成的吗?请说明理由.
22.将某市20到80岁的居民按年龄分组为,,,,,,并制作频率分布直方图如下:
(1)根据频率分布直方图,估计该市20到80岁居民年龄的第80百分位数;
(2)为了解该市居民参与“健步走”活动的实际情况,从该市20到80岁的居民中随机抽取若干人作问卷调查.我们把年龄段的居民参与“健步走”活动的人数与该年龄段居民数之比称为年龄段居民“健步走”活动参与指数(简称健参指数),用表示.被调查居民各年龄段的健参指数如下:
年龄段
0.4 0.5 0.6 0.7 0.75 0.4
假若该市20到80岁的常住居民有100万人,利用样本估计总体的思想,解决下面的问题:
(i)估算该市20到80岁的居民中“健步走”活动的参与人数;
(ii)据权威部门对全国“健步走”活动参与人群调查发现,如果排除20岁以下和80岁以上的居民,60岁以下的人比60岁及以上的人更喜爱“健步走”活动.通过计算与的值,判断本次调查所得结果是否与权威部门给出的结论相符?若不相符,请你从统计学的角度分析产生差异的原因(结论开放,写出其中一条原因即可).
21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台
第九章 统计单元测试培优卷
一、单项选择题。本大题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的。
1.为了了解某校600名学生的学习情况,随机抽取了100名学生进行调查,在这个问题中样本是( )
A.100 B.100名学生
C.100名学生的学习情况 D.600名学生的学习情况
【答案】C
【分析】直接根据样本的概念得答案.
【详解】为了了解某校600名学生的学习情况,随机抽取了100名学生进行调查,在这个问题中样本是100名学生的学习情况.
故选:C.
2.某科研单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则应抽取的老年人人数为( )
A.6 B.12 C.18 D.24
【答案】A
【分析】根据分层抽样性质列方程求解.
【详解】设应抽取的老年人人数为,
由已知可得,
所以,
所以应抽取的老年人人数为6.
故选:A.
3.演讲比赛共有9位评委分别给出某选手的原始评分9.2,9.5,9.6,9.1,9.3,9.0,8.8,9.3,9.6,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.极差 B.中位数 C.平均数 D.方差
【答案】B
【分析】分别计算9个原始评分和7个有效评分的极差、中位数、平均数和方差的,即可得出答案.
【详解】从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分为:
9.2,9.5,9.6,9.1,9.3,9.0,9.3,
极差:,
将7个有效评分从小到大排列为:9.0,9.1,9.2,9.3,9.3,9.5,9.6,
所以中位数为:9.3;
平均数为:,
9个原始评分的极差为:,
将9个有效评分从小到大排列为:8.8,9.0,9.1,9.2,9.3,9.3,9.5,9.6,9.6,
所以中位数为:9.3;
平均数为:,
所以不变的数字特征是中位数.
故选:B.
4.甲、乙两名同学12次考试中数学成绩的茎叶图如图所示,则下列说法正确的是( )
A.甲同学比乙同学发挥稳定,且平均成绩也比乙同学高
B.甲同学比乙同学发挥稳定,但平均成绩比乙同学低
C.乙同学比甲同学发挥稳定,且平均成绩也比甲同学高
D.乙同学比甲同学发挥稳定,但平均成绩比甲同学低
【答案】C
【分析】由茎叶图中的数据,利用平均数及方差公式求出两人成绩的平均数,根据茎叶图中的数据的分散程度,及平均数的方差的统计意义得出得到结果.
【详解】由茎叶图中的数据,得甲同学次考试成绩的平均数是.
乙同学次考试成绩的平均数是,
甲同学数学成绩比较分散,乙同学数学成绩相对集中,
所以乙同学比甲同学发挥稳定,且平均成绩比甲同学高.
故选:C
5.2021年,我国全年货物进出口总额391009亿元,比上年增长21.4%.其中,出口217348亿元,增长21.2%;进口173661亿元,增长21.5%.货物进出口顺差43687亿元,比上年增加7344亿元.如图是我国2017—2021年货物进出口总额统计图,则下面结论中不正确的是( )
A.2020年的货物进出口总额322215亿元 B.2020年的货物进出口顺差36343亿元
C.2017—2021年,货物进口总额逐年上升 D.2017—2021年,货物出口总额逐年上升
【答案】C
【分析】根据2017—2021年货物进出口总额统计图,依次分析各个选项,即可得到答案.
【详解】对于A,2020年的货物进出口总额为亿元,故A正确;
对于B,2020年的货物进出口顺差为亿元,故B正确;
对于C,2020年的货物进口总额为142936亿元,相对于2019的货物进口总额143254亿元下降了,故C错误;
对于D,2017—2021年,货物出口总额逐年上升,故D正确.
故选:C
6.某教育机构为了调查学生在课外读物方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在元的同学有30人,则n的值为( )
A.55 B.50 C.1000 D.100
【答案】D
【分析】利用频率分布直方图得到支出在的同学的频率,再结合支出在(单位:元)的同学有30人,即可得解.
【详解】由题意,支出在(单位:元)的同学有30人
由频率分布直方图可知,支出在的同学的频率为,
故选:D
7.一组数据按从小到大的顺序排列为1,4,4,x,7,8(其中),若该组数据的中位数是众数倍,则该组数据的方差和60%分位数分别是( )
A.,5 B.5,5 C.,6 D.5,6
【答案】C
【分析】先求出x的值,再根据定义分别求解.
【详解】中位数 ,众数为4,,由题意知,解得,
该组数据的平均数为,
该组数据的方差是,
因为,所以该组数据的60%分位数是6;
故选:C.
8.已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入新数据4,5,6,此时样本容量为10,若此时平均数为,方差为,则( )
A., B.,
C., D.,
【答案】B
【分析】设这10个数据分别为:,进而根据题意求出和,进而再根据平均数和方差的定义求得答案.
【详解】设这10个数据分别为:,根据题意,,
所以,.
故选:B.
二、多项选择题。本题共4小题,每小题5分,共20分。在每小题给出的选项中,有多项符合题目要求。全部选对的得5分,部分选对的得2分,有选错的得0分。
9.某公司生产三种型号的轿车,产量分别为1200辆,6000辆和2000辆.为检验该公司的产品质量,公司质监部门要抽取46辆进行检验,则下列说法正确的是( )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.三种型号的轿车依次抽取6辆,30辆,10辆
D.这三种型号的轿车,每一辆被抽到的概率都是相等的
【答案】ACD
【分析】根据三种随机抽样方法的特点可判断ABD;然后根据分层抽样计算可判断C.
【详解】由三种随机抽样方法的特点可知AD正确,B错误;
由题知,三种型号的轿车依次抽取数为,,,故C正确.
故选:ACD
10.一组数据6,7,8,a,12的平均数为8,则此组数据的( )
A.众数为7 B.极差为6
C.中位数为8 D.方差为
【答案】ABD
【分析】由平均数定义求得参数,然后再由众数、极差、中位数、方差的定义求解.
【详解】由题意,,
因此众数是7,极差是,
5 个数从小到大排列为,中位数是7,
方差为,
故选:ABD.
11.2022年第二十二届世界杯足球赛在卡塔尔举行,这是第一次在阿拉伯地区举办,第一次在北半球冬季举办,也是最后一届32支球队参加的世界杯赛,它吸引了全世界的目光.现使用分层抽样的方法,从到场观看世界杯某场比赛的球迷中随机抽取名,其中亚洲、欧洲、非洲、美洲球迷人数的比例为,若亚洲球迷抽到12人,则下列选项不正确的是( )
A.非洲球迷抽到15人 B.美洲球迷抽到8人
C. D.欧洲球迷比美洲球迷多18人
【答案】ABC
【分析】根据题意得到,从而得到,在利用分层抽样求解即可.
【详解】由,解得人,
所以欧洲抽到人,非洲抽到人,
美洲抽到人,欧洲球迷比美洲球迷多18人.
故选:ABC
12.有甲、乙两组数据,甲:1、2、a、b、10,乙:1、2、5、6、11,其中,若甲组数据的平均数等于乙组数据的中位数,要使甲组数据的方差小于乙组数据的方差,则可以为( )
A. B. C. D.
【答案】BCD
【分析】根据平均数与方差的定义,得到,满足的条件,求解即可.
【详解】解:由题意可得,,
所以,平均数为5,
又乙组数据的平均数
因为甲组数据的方差小于乙组数据的方差,
所以,
即,
又,
所以可以为,,,,.
故选:BCD.
三、填空题。本题共4小题,每小题5分,共20分。
13.总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取5个个体,选取方法是从如下随机数表的第1行的第7列和第8列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为__________.
第1行:78 16 62 32 08 02 62 42 01 52 53 69 97 28 01 98
第2行:32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
【答案】04
【分析】根据随机数表读取编号在01,02,…,29,30之中的,重复的去掉即可求解.
【详解】从第1行的第7列和第8列数字开始由左到右依次选取两个数字满足要求的编号有:08,02,01,28,04,23…,所以第5个个体的编号为,04,
故答案为:04
14.某班级在开学初进行了一次数学测试,男同学平均答对17道题,方差为11,女同学平均答对12道题,方差为16,班级男女同学人数之比为3:2,那么全班同学答对题目数的方差为______.
【答案】
【分析】设男同学人数为,女同学人数为,计算全班同学答对题目数的平均数,再根据总体方差公式,计算总体方差即可.
【详解】依题意,设男同学人数为,女同学人数为,
则全班同学答对题目数的平均数为:,
所以全班同学答对题目数的方差为:.
故答案为:.
15.某科研课题组通过一款手机软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表:
周跑量 , , , , , , , , ,
人数 100 120 130 180 220 150 60 30 10
周跑量 小于20公里 20公里到40公里 不小于40公里
类别 休闲跑者 核心跑者 精英跑者
装备价格(单位:元) 2500 4000 4500
根据跑步爱好者的周跑量,将跑步爱好者分成以上三段,不同类别的跑者购买的装备价格不一样.根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费 元.
【答案】3720
【分析】根据平均数的概念求解,利用样本估计总计即可.
【详解】根据表中的数据可得,休闲跑者共有人,
核心跑者共有人,
精英跑者共有人,
所以估计该市每位跑步爱好者购买装备,平均需要花费为:
元.
故答案为:3720.
16.高一级共840名同学参加了数学单元测验,已知所有学生成绩的第80百分位数是85分,至少有 名学生的成绩大于或等于85分.
【答案】168
【分析】根据给定条件,结合百分位数的定义计算作答.
【详解】将840名学生的成绩按照由小到大的顺序排列,85分为第80百分位数,则比85分少的人数占80%,
因此成绩大于或等于85分的学生至少占20%,人数为,
所以至少有168名学生的成绩大于或等于85分.
故答案为:168
四、解答题。本题共6小题,共70分,第17题10分,其余每题12分。解答应写出文字说明、证明过程或演算步骤。
17.某工厂为了了解员工的工作效率,需调查,,三类工种的职工工作情况,已知在该厂的全体职工中,工种占,工种占,工种占.现用分层抽样的方法从全体职工中抽取一个样本容量为的样本.试确定:
(1)若,则在工种、工种、工种中分别应抽取多少人?
(2)若抽取的工种比工种多30人,则抽取的工种有多少人?
【答案】(1)A工种应抽取的人数为,B工种应抽取的人数为,C工种应抽取的人数为
(2)
【分析】(1)用样本容量乘以工种、工种、工种所占的比例,即得所求.
(2)由题意求得的值,再用的值乘以工种所占的比例,即为所求.
【详解】(1)解:若,则在工种中抽取的人数为,
工种中抽取的人数为,
工种中应抽取的人数为.
(2)解:若抽取的工种比工种多人,则,解得,
则抽取的工种的人数为.
18.我们国家正处于老龄化社会中,老有所依也是政府的民生工程.某市共有户籍人口400万,老年人(年龄60岁及以上)约有66万,为了了解老年人的健康状况,政府从老年人中随机抽取600人并委托医疗机构免费为他们进行健康评估,健康状况共分为不能自理、不健康尚能自理、基本健康、健康四个等级,并以80岁为界限分成两个群体进行统计,样本分布情况如图:
(1)若采用分层抽样的方法从样本中不能自理的老年人中抽取16人进一步了解他们的生活状况,则两个群体中各应抽取多少人?
(2)估算该市80岁及以上的老年人占全市户籍人口的百分比.
【答案】(1)80岁及以上的群体中抽取人,从80岁以下的群体中抽取人
(2)
【分析】(1)直接由分层抽样求解即可;
(2)先求出样本中80岁及以上老年人占比,再求出全市80岁及以上的老年人人数,最后计算百分比即可.
(1)两个群体的比为,应从80岁及以上的群体中抽取人,从80岁以下的群体中抽取人
(2)∵样本中80岁及以上老年人占比为,∴全市80岁及以上的老年人有万人,∴该市80岁及以上的老年人占全市户籍人口的百分比为.
19.在一次高三年级统一考试中,数学试卷有一道满分为10分的选做题,学生可以从,两道题目中任选一题作答.某校有900名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从900名学生的选做题成绩中随机抽取一个容量为10的样本,为此将900名学生的选做题的成绩随机编号为001,002,,900.
(1)若采用随机数法抽样,并按照以下随机数表,以方框内的数字5为起点,从左向右依次读数,每次读取三位随机数,一行数读完之后接下一行左端写出样本编号的中位数.
05 26 93 70 60 22 35 85 15 13 92 03 51 59 77
59 56 78 06 83 52 91 05 70 74 07 97 10 88 23
09 98 42 99 64 61 71 62 99 15 06 1 29 16 93
58 05 77 09 51 51 26 87 85 85 54 87 66 47 54
73 32 08 11 12 44 95 92 63 16 29 56 24 29 48
26 99 61 65 53 58 37 78 80 70 42 10 50 67 42
32 17 55 85 74 94 44 67 16 94 14 65 52 68 75
87 59 36 22 41 26 78 63 06 55 13 08 27 01 50
15 29 39 39 43
(2)若采用分层随机抽样,按照学生选择题目或题目,将成绩分为两层,且样本中选择题目的成绩有8个,平均数为7,方差为4;样本中选择题目的成绩有2个,平均数为8,方差为1.试用样本估计该校900名学生的选做题得分的平均数与方差.
【答案】(1)中位数为
(2)平均数约为7.2,方差约为3.56
【分析】(1)从随机数表中,抽取符合条件的编号,再由小到大排序,然后利用中位数定义求解;
(2)根据样本中选择题目的成绩有8个,平均数为7,方差为4;样本中选择题目的成绩有2个,平均数为8,方差为1,利用平均数和方差公式求解.
(1)
解:由题意知:读取的编号依次是512,805,770,687,858,554,876,647,547,332.
由小到大排序,得332,512,547,554,647,687,770,805,858,876,
样本编号的中位数为.
(2)
设样本中选择题目的成绩的平均数为,方差为;
样本中选择题目的成绩的平均数为,方差为,
则,,,.
样本的平均数为,
方差为,
,
该校900名学生的选做题得分的平均数约为7.2,方差约为3.56.
20.2022年起,某省将实行“”高考模式,为让学生适应新高考的赋分模式,某校在一次校考中使用赋分制给高三年级学生的生物成绩进行赋分,具体赋分方案如下:先按照考生原始分从高到低按比例划定A、B、C、D、E共五个等级,然后在相应赋分区间内利用转换公式进行赋分A等级排名占比15%,赋分分数区间是86-100;B等级排名占比35%,赋分分数区间是71-85:C等级排名占比35%,赋分分数区间是56-70:D等级排名占比13%,赋分分数区间是41-55;E等级排名占比2%,赋分分数区间是30-40;现从全年级的生物成绩中随机抽取100名学生的原始成绩(未赋分)进行分析,其频率分布直方图如图所示:
(1)求图中a的值;
(2)求抽取的这100名学生的原始成绩的众数、平均数和中位数;
(3)用样本估计总体的方法,估计该校本次生物成绩原始分不少于多少分才能达到赋分后的B等级及以上(含B等级)?(结果保留整数)
【答案】(1)
(2)众数75分;中位数分,平均数71分
(3)74分
【分析】(1)由各组频率之和为1列方程求解即可;
(2)由频率分布直方图中众数、平均数和中位数的计算公式代入即可得出答案;
(3)已知等级达到B及以上所占排名等级占比为,即为频率分布直方图的中位数,求解即可.
【详解】(1)由题意,解得;
(2)抽取的这100名学生的原始成绩的众数的估计值为分;
由频率直方图可得前三组的频率和为,
前四组的频率和为,故中位数落在第四组,
设中位数为x,则,解得,
故抽取的这100名学生的原始成绩的中位数的估计值为分,
抽取的这100名学生的原始成绩的平均数的估计值为:
分;
(3)由已知等级达到B及以上所占排名等级占比为,
由(2)可得,中位数,
故原始分不少于74分才能达到赋分后的B等级及以上.
21.在一个文艺比赛中,由8名专业人士和8名观众代表各组成一个评委小组,给参赛选手打分.下面是两组评委对同一名选手的打分:
小组A 42 45 50 47 49 53 51 47
小组B 53 36 71 49 46 65 62 58
(1)做出两组评委打分的茎叶图;
(2)每一个小组内评委打分的相似程度是不同的,我们可以用方差来进行刻画.请计算每一组数据中的方差;
(3)你能根据方差判断出小组A与小组B中哪一个更像是由专业人士组成的吗?请说明理由.
【答案】(1)答案见解析
(2),
(3)A组,理由见解析
【分析】(1)根据表格中数据和茎叶图特征即可做出两组评委打分的茎叶图;(2)分别求出两个小组的平均数,再利用方差公司即可求得两小组的方差;(3)根据方差的实际意义即可知A组更像是由专业人士组成的.
【详解】(1)利用表中数据即可做出茎叶图如下:
(2)根据平均数、方差公式计算:
小组A的平均数是,
即可得方差
小组B的平均数是,
即可得方差
即小组A的方差,小组B的方差.
(3)由于专业人士给分更符合专业规则,相似程度更高,由(2)可知小组A的方差,小组B的方差,因而,
根据方差越大数据波动越大,因此A组更像是由专业人士组成的.
22.将某市20到80岁的居民按年龄分组为,,,,,,并制作频率分布直方图如下:
(1)根据频率分布直方图,估计该市20到80岁居民年龄的第80百分位数;
(2)为了解该市居民参与“健步走”活动的实际情况,从该市20到80岁的居民中随机抽取若干人作问卷调查.我们把年龄段的居民参与“健步走”活动的人数与该年龄段居民数之比称为年龄段居民“健步走”活动参与指数(简称健参指数),用表示.被调查居民各年龄段的健参指数如下:
年龄段
0.4 0.5 0.6 0.7 0.75 0.4
假若该市20到80岁的常住居民有100万人,利用样本估计总体的思想,解决下面的问题:
(i)估算该市20到80岁的居民中“健步走”活动的参与人数;
(ii)据权威部门对全国“健步走”活动参与人群调查发现,如果排除20岁以下和80岁以上的居民,60岁以下的人比60岁及以上的人更喜爱“健步走”活动.通过计算与的值,判断本次调查所得结果是否与权威部门给出的结论相符?若不相符,请你从统计学的角度分析产生差异的原因(结论开放,写出其中一条原因即可).
【答案】(1)59岁
(2)(i)60万人,(ii)见解析
【分析】(1)根据百分位数的定义求解即可,
(2)(i)先根据频率分布直方图求出各年龄段的人数,再根据各个健参指数求出各年龄段参与“健步走”活动的人数,从而可求得结果,
(ii)通过(i)计算的数据计算与的值,进行比较
【详解】(1)因为前3组的频率和为,前4组的频率和为,
所以第80百分位数在第4组,设为,则
,解得,
所以该市20到80岁居民年龄的第80百分位数为59岁,
(2)(i)由频率分直方图可得
年龄在的人数为万人,
在的人数为万人,
在的人数为万人,
在的人数为万人,
在的人数为万人,
在的人数为万人,
所以参数“健步走”活动的人数为万人,
参数“健步走”活动的人数为万人,
参数“健步走”活动的人数为万人,
参数“健步走”活动的人数为万人,
参数“健步走”活动的人数为万,
参数“健步走”活动的人数为万人,
所以该市20到80岁的居民中“健步走”活动的参与人数为
万人,
(ii),,
因为,
所以由调查结果可知60岁以上的人比60岁及以下的人更喜爱“健步走”活动
所以本次调查所得结果与权威部门给出的结论不相符,
产生差异的主要原因调查的样本不一定具有代表性,或一次取样未必能客观的反映总体,或样本容量过小等
21世纪教育网(www.21cnjy.com)