课时素养评价三十五 获取数据的基本途径及相关概念
(20分钟 35分)
1.下面问题可以用普查的方式进行调查的是
( )
A.检验一批单杠的抗拉强度
B.检验全国大气中灰尘颗粒的含量
C.调查某班所有任课教师的业余爱好
D.检验一批儿童玩具的使用寿命
【解析】选C.A不能用普查的方式调查,因为这种试验具有破坏性;B用普查的方式无法完成;C可以用普查的方式进行调查;D该试验具有破坏性,且需要耗费大量的时间,在实际生产中无法实现.
2.为了解高考数学考试的情况,抽取2
000名考生的数学试卷进行分析,2
000称为
( )
A.个体
B.样本
C.样本容量
D.总体
【解析】选C.2
000是个数字,没有单位,由样本容量的定义知2
000是样本容量.
3.若对某校1
200名学生的耐力做调查,抽取其中120名学生,测试他们1
500米跑的成绩,得出相应的数值,在这项调查中,样本是指
( )
A.120名学生
B.1
200名学生
C.120名学生的成绩
D.1
200名学生的成绩
【解析】选C.本题抽取的是120名学生的成绩,因此每个学生的成绩是个体,这120名学生的成绩构成一个样本.
4.给出以下调查:
①了解某驾校训练班学员的训练成绩是否达标;
②了解一批炮弹的杀伤力;
③某饮料厂对一批产品质量进行检查;
④检验飞天设备中各零件产品的质量.
其中适宜用抽样调查的是________(将正确答案的序号全部填上).?
【解析】若调查的目的必须通过普查才能实现,一般用普查,但若存在一定的破坏性则用抽样调查,关键还是看实际需要.
驾校训练的司机直接影响驾驶安全,必须普查;炮弹的杀伤力调查具有破坏性,只能采用抽样调查;饮料质量的调查也具有破坏性,应该采用抽样调查;对飞天设备不能有一点疏忽,每一个零件的质量都需要检查,必须普查.
答案:②③
5.小明从网上查询得到某贫困地区10户居民家庭年收入(单位:万元)如表所示:
编号
1
2
3
4
5
6
7
8
9
10
年收入
1.2
1.3
1.8
2.0
4.6
1.7
0.9
2.1
1.0
1.6
根据以上数据,我们认为有一个数据是不准确的,需要剔除,这个数据是________.?
【解析】由于编号为5的数据为4.6,明显高于其他数据,所以这个数据是不准确的.
答案:4.6
6.下列调查项目中,哪些适合用普查?哪些适合用抽样调查?
(1)在中学生中,喜欢阅读大学生、中学生写的小说的学生占百分之多少;
(2)“五一”期间,乘坐火车的人比平时多很多,铁路部门要了解旅客是否都是购票乘车的;
(3)即将进入市场的大量猪肉是否符合防疫标准.
【解析】(1)适合用抽样调查,因为工作量太大.
(2)适合用普查,因为是了解是否都购票,所以应该采取普查.
(3)适合用普查,因为漏掉一批问题猪肉就会造成恶劣后果,所以必须普查.
(15分钟 30分)
一、选择题(每小题5分,共10分)
1.“中国天眼”为500米口径球面射电望远镜(Five-hundred-meter
Aperture
Spherical
Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是
( )
A.通过调查获取数据
B.通过试验获取数据
C.通过观察获取数据
D.通过查询获得数据
【解析】选C.“中国天眼”主要是通过观察获取数据.
2.为了了解某市高三毕业生升学考试中数学成绩的情况,从参加考试的学生中随机抽查了1
000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是
( )
A.总体指的是该市参加升学考试的全体学生
B.个体指的是1
000名学生中的每一名学生
C.样本容量指的是1
000名学生
D.样本是指1
000名学生升学考试的数学成绩
【解析】选D.因为是了解学生的数学成绩的情况,因此样本是指1
000名学生的数学成绩,而不是学生.
【补偿训练】
为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是
( )
A.总体是240
B.个体是每一名学生
C.样本是40名学生
D.样本容量是40
【解析】选D.总体是240名学生的身高,个体是每一名学生的身高,样本是所抽取的40名学生的身高,样本容量为40,A,B,C均错误.
二、填空题(每小题5分,共10分)
3.某校有4
000名学生,从不同班级抽取了400名学生进行调查,下表是这400名学生早晨醒来方式的统计表:
早晨醒来的方式
人数
别人叫醒
172
闹钟
88
自己醒来
64
其他
76
回答下列问题:
该问题中总体是________;样本是________;样本容量是________;个体是________.?
【解析】依据总体、个体、样本、样本容量的定义可知:该问题的总体为该校4
000名学生早晨醒来的方式;样本为抽取的400名学生早晨醒来的方式;样本容量为400;个体为每名学生早晨醒来的方式.
答案:该校4
000名学生早晨醒来的方式 抽取的400名学生早晨醒来的方式 400 每名学生早晨醒来的方式
4.(1)对某班学生视力做一个调查;
(2)某汽车生产厂要对所生产的某种品牌的轿车的抗碰撞情况进行检验;
(3)联合国教科文组织要对全世界适龄儿童的入学情况做一个调查.
对于上述3个实际问题所应选用的调查方法分别为________、________、________.?
【解析】根据普查、抽样调查的定义容易得出答案.
答案:普查 抽样调查 抽样调查
三、解答题
5.(10分)某学校根据高考考场布置要求,于高考前新买了45套听力设备.现需要检查这批听力设备的质量,是采用普查还是抽样调查?谈谈你的想法和理由.
【解析】采用普查.
高考是一场公平竞争,考场布置责任重大,要求十分严格,所配设备必须全部合格,且这批设备数量较少,全部检查是可行的,这样可确保万无一失.
PAGE课时素养评价
三十六 简单随机抽样
(15分钟 30分)
1.某工厂的质检人员采用随机数表法对生产的100件产品进行检查,若抽取10件进行检查,对100件产品采用下面的编号方法:①01,02,03,…,100;
②001,002,003,…,100;③00,01,02,…,99.其中正确的编号方法是
( )
A.①②
B.①③
C.②③
D.③
【解析】选C.采用随机数表法抽取样本,总体中各个个体的编号必须位数相同,这样保证每个个体被取到的可能性相同,故②③正确.
2.从10个篮球中任取一个,检查其质量,用随机数表法抽取样本,则应编号为
( )
A.1,2,3,4,5,6,7,8,9,10
B.-5,-4,-3,-2,-1,0,1,2,3,4
C.10,20,30,40,50,60,70,80,90,100
D.0,1,2,3,4,5,6,7,8,9
【解析】选D.利用随机数表法抽样时,必须保证所编号码的位数一致.
3.对简单随机抽样来说,某一个个体被抽到的可能性
( )
A.与第几次抽取有关,第一次抽到的可能性要大些
B.与第几次抽取无关,每次抽到的可能性都相等
C.与第几次抽取有关,最后一次抽到的可能性要大些
D.与第几次抽取无关,每次都是等可能抽取,但各次抽到的可能性不一样
【解析】选B.在简单随机抽样中,每个个体被抽到的可能性都相等,是一种等可能抽样;每个个体在第i(1≤i≤n)次中被抽到的可能性都相等.
【补偿训练】
已知总体容量为108,若用随机数表法抽取一个容量为10的样本,下列对总体的编号正确的是
( )
A.1,2,…,108
B.01,02,…,108
C.00,01,…,107
D.001,002,…,108
【解析】选D.用随机数表法选取样本时,样本的编号位数要一致.
4.对于下列抽样方法:
①运动员从8个跑道中随机抽取1个跑道;②从20个零件中一次性拿出3个来检验质量;③某班50名学生,指定其中成绩优异的2名学生参加一次学科竞赛.其中,属于简单随机抽样的是________.(把正确的序号都填上)?
【解析】对于②,一次性拿出3个来检验质量,违背简单随机抽样特征中的“逐个”抽取;对于③,指定其中成绩优异的2名学生,不满足等可能抽样的要求.
答案:①
【补偿训练】
某中学高一年级有700人,高二年级有600人,高三年级有500人,以每人被抽取的机会为0.03,从该中学学生中用简单随机抽样的方法抽取一个样本,则样本容量n为________.?
【解析】n=(700+600+500)×0.03=54.
答案:54
5.某电视台举行颁奖典礼,邀请20名港台、内地艺人演出,其中从30名内地艺人中随机挑选10人,从18名香港艺人中随机挑选6人,从10名台湾艺人中随机挑选4人.试用抽签法确定选中的艺人,并确定他们的表演顺序.
【解析】第一步先确定艺人:(1)将30名内地艺人从01到30编号,然后用相同的纸条做成30个号签,在每个号签上写上这些编号,然后放入一个不透明小筒中摇匀,从中逐个抽出10个号签,则相应编号的艺人参加演出;(2)运用相同的办法分别从10名台湾艺人中抽取4人,从18名香港艺人中抽取6人.
第二步确定演出顺序:确定了演出人员后,再用相同的纸条做成20个号签,上面写上1到20这20个数字,代表演出的顺序,放入不透明的盒中,让每个演员抽一张,每人抽到的号签上的数字就是这位演员的演出顺序,再汇总即可.
(30分钟 60分)
一、单选题(每小题5分,共20分)
1.下面的抽样方法是简单随机抽样的个数是
( )
①某班45名同学,学校指定个子最高的5名同学参加学校的一项活动;②从20个被生产线连续生产的产品中一次性抽取3个进行质量检验;③一儿童从玩具箱中的20件玩具中随机拿出一件玩,玩完放回再随机拿出一件,连续玩了5次.
A.1
B.2
C.3
D.0
【解析】选D.①不是,因为这不是等可能的;②不是,“一次性”抽取不是随机抽样;③是放回抽样.
2.高三某班有34位同学,座位号记为01,02,…,34,用下面的随机数表选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列和第7列数字开始,由左向右依次选取两个数字,则选出来的第4个志愿者的座号为
( )
49 54 43 54 82 17 37 93 23 78 87 35 20
96 43 84 26 34 91 64 57 24 55 06 88 77
04 74 47 67 21 76 33 50 25 83 92 12 06
A.23 B.09 C.16 D.02
【解析】选C.根据题意利用随机数表法,依次抽取的样本数据为:21,32,09,
16,17;所以第4个数据是16.
3.下列抽样的方法属于简单随机抽样的有
( )
A.从无限多个个体中抽取50个个体作为样本
B.从1
000个个体中一次性抽取50个个体作为样本
C.将1
000个个体编号,把号签放在一个足够大的不透明的容器内搅拌均匀,从中逐个抽取50个个体作为样本
D.箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样过程中,从中任意取出一个零件进行质量检验后,再把它放回箱子
【解析】选C.A中,简单随机抽样是从有限多个个体中抽取,所以A不属于;B中,简单随机抽样是逐个抽取,不是一次性抽取,所以B不属于;很明显C属于简单随机抽样;D中抽样是放回抽样,而简单随机抽样是不放回抽样,所以D不属于.
4.下面的抽样方法是简单随机抽样的是
( )
A.从无数张高考试卷中抽取50张试卷作为样本
B.从80台笔记本电脑中一次性抽取6台电脑进行质量检查
C.国家跳水队挑选最优秀的10名跳水运动员,备战下一届奥运会
D.用抽签法从10件产品中选取3件进行质量检验
【解析】选D.因为简单随机抽样要求样本总体个数为有限个,所以A不是;又因为B选项中是一次性抽取,所以选项B也不是;又因为挑选的是最优秀的跳水运动员,所以选项C也不是;由简单随机抽样的定义可知选项D正确.
【补偿训练】
采用抽签法从含有5个个体的总体中不放回地抽取一个容量为2的样本,可能的样本共有________个.?
【解析】假设5个个体分别记为a,b,c,d,e,容量为2的样本分别为ab,ac,ad,ae,
bc,bd,be,cd,ce,de,共10个.
答案:10
二、多选题(每小题5分,共10分,全部选对得5分,选对但不全的得3分,有选错的得0分)
5.对于简单随机抽样,下列说法中正确的是
( )
A.它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概率进行分析
B.它是从总体中逐个地进行抽取,以便在抽样实践中进行操作
C.它是一种放回抽样
D.它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了抽样的公平性
【解析】选ABD.由简单随机抽样的概念,知简单随机抽样是逐个不放回的抽样,故C不正确.ABD都是简单随机抽样的特点,均正确.
6.在容量为100的总体中用随机数表法抽取5个样本,总体编号为00,01,02,
03,…,99,则下列几组号码可能成为所得样本编号的是
( )
A.00,01,02,03,04
B.10,30,50,70,90
C.49,17,46,09,62
D.11,22,33,44,55
【解析】选ABCD.用随机抽样方法抽样,每个个体都有可能被抽到且各个个体被抽到的可能性相等.
三、填空题(每小题5分,共10分)
7.一个总体共有60个个体,个体的编号为00,01,02,…,59,现从中抽取一个容量为10的样本,请从随机数表的第8行第11列的数字开始,向右读,到最后一列后再从下一行左边开始继续向右读,依次获取样本号码,直到取满样本为止,则获得的样本号码是________.?
附表:(第8行~第10行)
6301637859 1695556719 9810507175 1286735807 4439523879(第8行)
3321123429 7864560782 5242074438 1551001342 9966027954(第9行)
5760863244 0947279654 4917460962 9052847727 0802734328(第10行)
【解析】第8行第11列的数字为1,由此开始,依次抽取号码,第一个号码为16,可取出;第二个号码为95>59,舍去,按照这个规则抽取号码,抽取的10个样本号码为16,55,19,10,50,12,58,07,44,39.
答案:16,55,19,10,50,12,58,07,44,39
【补偿训练】
用随机数表法从100名学生(男生25人)中抽选20人进行评教,某男学生被抽到的可能性是______,某女学生被抽到的可能性是______.?
【解析】因为样本容量为20,总体容量为100,所以总体中每个个体被抽到的可能性都为=0.2.
答案:0.2 0.2
8.“XX彩票”的中奖号码是从分别标有1,2,…,30搅拌均匀的三十个小球中逐个不放回地选出7个小球来按规则确定中奖情况,这种从30个号码中选7个号码的抽样方法是________.?
【解析】三十个小球相当于号签,搅拌均匀后逐个不放回地抽取,这是典型的抽签法.
答案:抽签法
【补偿训练】
要检查一个工厂产品的合格率,从1
000件产品中抽出50件进行检查,检查者在其中随机抽取了50件,这种抽样法可称为________.?
【解析】该题总体个数为1
000,样本容量为50,总体的个数较少,所抽样本的个数也较少,并且检查者是随机抽取的,故为简单随机抽样.
答案:简单随机抽样
四、解答题(每小题10分,共20分)
9.天津某中学从40名学生中选1人作为男篮拉拉队的成员,采用下面两种选法:
选法一 将这40名学生从1到40进行编号,相应地制作40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选.
选法二 将39个白球与1个红球(球除颜色外其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为拉拉队成员.
试问这两种选法是否都是抽签法?为什么?这两种选法有何共同之处?
【解析】选法一满足抽签法的特征,是抽签法,选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中39个白球无法相互区分.这两种选法相同之处在于每名学生被选中的可能性都相等,均为.
10.假设要抽查某种品牌的850颗种子的发芽率,抽取60颗进行试验.利用随机数表抽取种子时,先将850颗种子按001,002,…,850进行编号,如果从随机数表第8行第1组第2个数3开始向右读,请你依次写出最先检测的4颗种子的编号.
(下面摘取了随机数表第7行至第9行)
84421 75331 57245 50688 77047 44767
21763 35025 83921 20676
63016 37859 16955 56719 98105 07175
12867 35807 44395 23879
33211 23429 78645 60782 52420 74438
15510 01342 99660 27954
【解析】从第8行第1组第2个数3开始向右读,
第一个小于850的数字是301,
第二个数字是637,也符合题意,
第三个数字是859,大于850,舍去,
第四个数字是169,符合题意,
第五个数字是555,符合题意,
因此最先检测的4颗种子的编号依次是:301,637,169,555.
1.为调查小区平均每户居民的月用水量,下面是三名同学设计的方案:
学生甲:我把这个用水量调查表放在互联网上,只要登陆网站的人就可以看到这张表,他们填的表可以很快地反馈到我的电脑中,这样就可以很快估算出小区平均每户居民的月用水量;
学生乙:我给我们居民小区的每一个住户发一张用水调查表,只要一两天就可以统计出小区平均每户居民的月用水量;
学生丙:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给这些住户打电话,问一下他们的月用水量,然后就可以估算出小区平均每户居民的月用水量.
请问:这三位同学设计的方案中哪一个较合理?你有何建议?
【解析】学生甲的方法得到的样本只能够反映上网居民的用水情况,所得到的样本代表性差,不能很准确地获得平均每户居民的月用水量.
学生乙的方法实际上是普查,花费的人力、物力更多一些,但是如果统计过程不出错,就可以准确地得到平均每户居民的月用水量.
学生丙的方法是一种随机抽样的方法,所在小区的每户居民都装有电话的情况下,建议用随机抽样方法获得数据.用学生丙的方法,既节省人力、物力,又可以得到比较精确的结果.
2.某学生在一次理科竞赛中要回答的8道题是这样产生的:从15道物理题中随机抽3道;从20道化学题中随机抽3道;从12道生物题中随机抽2道.选用合适的抽样方法确定这个学生所要回答的三门学科的题的序号(物理题的序号为1~15,化学题的序号为16~35,生物题的序号为36~47).
【解析】采用抽签法,步骤如下:
第一步:将1~47这47个编号分别写到大小、形状都相同的号签上.
第二步:将物理、化学、生物题的号签分别放入三个不透明的容器中,搅拌均匀.
第三步:分别从装有物理、化学、生物题号签的容器中逐个抽取3个、3个、2个号签,并记录所得号签的编号,这就是所要回答的三门学科的题的序号.
PAGE课时素养评价
三十七 分
层
抽
样
(15分钟 30分)
1.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则合适的抽样方法是
( )
A.简单随机抽样
B.抽签法
C.直接运用分层抽样
D.先从老年人中剔除1人,然后再用分层抽样
【解析】选C.因为总体由差异明显的三部分组成,所以考虑用分层抽样.因为总人数为28+54+81=163,样本容量为36,按照抽样比进行分层抽样,老年人、中年人和青年人中应抽取的人数分别为×28≈6,×54≈12,×81≈18.
2.我国古代数学名著《九章算术》中有如下问题,“今有北乡8
758人,西乡有7
236人,南乡有8
356人,现要按人数多少从三个乡共征集487人,问从各乡征集多少人.”在上述问题中,需从南乡征集的人数大约是
( )
A.112
B.128
C.145
D.167
【解析】选D.从南乡征集的人数大约是8
356×≈167.
3.甲校有3
600名学生,乙校有5
400名学生,丙校有1
800名学生,为统计三校学生某方面的情况,计划采用分层随机抽样法抽取一个容量为90的样本,应在这三校分别抽取学生
( )
A.30人,30人,30人
B.30人,45人,15人
C.20人,30人,40人
D.30人,50人,10人
【解析】选B.先求抽样比==,然后各层按抽样比分别抽取,
甲校抽取3
600×=30(人),
乙校抽取5
400×=45(人),
丙校抽取1
800×=15(人).
【补偿训练】
某实验中学共有职工150人,其中高级职称的职工15人,中级职称的职工45人,普通职员90人,现采用分层抽样的方法抽取容量为30的样本,则抽取的高级职称、中级职称、普通职员的人数分别为( )
A.5,10,15
B.3,9,18
C.3,10,17
D.5,9,16
【解析】选B.分层抽样是按比例抽取的,
设抽取的高级职称的职工、中级职称的职工、普通职员的人数分别为a,b,c,则===,解得a=3,b=9,c=18.
4.甲、乙两套设备生产的同类型产品共4
800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测,若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.?
【解析】设乙设备生产的产品总数为x件,
由已知得:=,
解得x=1
800.
答案:1
800
【补偿训练】
为了调查某省各城市PM2.5的值,按地域把36个城市分成甲、乙、丙三组,对应的城市数分别为6,12,18.若用分层抽样的方法抽取12个城市,则乙组中应抽取的城市数为________.?
【解析】乙组城市数占总城市数的比例为=,样本容量为12,
故乙组中应抽取的城市数为12×=4.
答案:4
5.某一个地区共有5个乡镇,人口3万人,其人口比例为3∶2∶5∶2∶3,从3万人中抽取一个容量为300的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
【解析】因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法.
具体过程如下:第一步,将3万人分为5层,其中一个乡镇为一层.
第二步,按照各层的个体数占总体的个体数的比求得各乡镇应抽取的人数分别为60,40,100,40,60.
第三步,按照各层抽取的人数随机抽取各乡镇应抽取的样本.
第四步,将300人合到一起,即得到一个样本.
(30分钟 60分)
一、单选题(每小题5分,共20分)
1.“民以食为天,食以安为先”,食品安全是关系人们身体健康的大事.某店有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是
( )
A.4
B.5
C.6
D.7
【解析】选C.设抽样比为k,k===,所以抽取植物油类与果蔬类食品种数之和是10×+20×=2+4=6.
2.某中学有高中生3
000人,初中生2
000人,男、女生所占的比例如图所示.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则从初中生中抽取的男生人数是
( )
A.12
B.15
C.20
D.21
【解析】选A.由扇形图,得该中学有高中生3
000人,其中男生人数为3
000×30%=900,
女生人数为3
000×70%=2
100,
初中生2
000人,其中男生人数为2
000×60%=1
200,
女生人数为2
000×40%=800,
用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,
则=,
解得n=50,所以从初中生中抽取的男生人数为50×=12.
3.当前,国家正分批修建经济适用房以解决低收入家庭住房紧张的问题.已知甲、乙、丙三个社区现分别有低收入家庭360户、270户、180户,若第一批经济适用房中有90套住房用于解决这三个社区中90户低收入家庭的住房问题,采用分层抽样的方法决定各社区户数,则应从甲社区中抽取低收入家庭的户数为
( )
A.40
B.30
C.20
D.36
【解析】选A.抽样比为=,则应从甲社区中抽取低收入家庭的户数为360×=40.
4.从某地区15
000位老人中按性别分层抽取一个容量为500的样本,调查其生活能否自理的情况如表所示.
则该地区生活不能自理的老人中男性比女性多的人数约为
( )
A.60
B.100
C.15
00
D.2
000
【解析】选A.由分层抽样方法知所求人数为×15
000=60.
【补偿训练】
学校进行数学竞赛,将考生的成绩分成90分以下、90~120分、120~150分三种情况进行统计,发现三个成绩段的人数之比依次为5∶3∶1,现用分层抽样的方法抽取一个容量为m的样本,其中分数在90~120分的人数是45,则此样本的容量m的值为
( )
A.75
B.100
C.125
D.135
【解析】选D.由三个成绩段的人数之比依次为5∶3∶1及分数在90~120分的人数是45可知,=,解得m=135.
二、多选题(每小题5分,共10分,全部选对得5分,选对但不全的得3分,有选错的得0分)
5.为了保证分层抽样时,每个个体等可能地被抽取,下列说法不正确的是
( )
A.每层的个体数必须一样多
B.每层抽取的个体数相等
C.每层抽取的个体可以不一样多,但必须满足抽取ni=n·(i=1,2,…,k)个个体,其中k是层数,n是抽取的样本容量,Ni是第i层所包含的个体数,N是总体容量
D.只要抽取的样本容量一定,每层抽取的个体数没有限制
【解析】选ABD.每层的个体数不一定都一样多,所以选项A不正确;
又因为由于每层的容量不一定相等,每层抽同样多的个体,从整个总体来看,各层之间的个体被抽取的可能性显然就不一样了,所以选项B不正确;
对于第i层的每个个体,它被抽到的可能性与层数i无关,即对于每个个体来说,被抽入样本的可能性是相同的,所以选项C正确;
每层抽取的个体数是有限制的,所以选项D不正确.
6.某单位老年人、中年人、青年人的人数分布如表,用分层抽样的方法抽取17人进行单位管理问卷调查,若抽到3位老年人,则抽到的中年人的人数为
( )
类别
人数
老年人
15
中年人
?
青年人
40
A.抽到8位青年人
B.抽到6位中年人
C.中年人有6人
D.中年人有30人
【解析】选ABD.设该单位的中年人的人数为x,则由题表可知,=,
解得x=30.因此在抽取的17人中,中年人的人数为30×=6.
由抽样比可知抽到的青年人为8人.
【补偿训练】
某工厂生产A,B,C,D四种不同型号的产品,产品的数量之比依次为2∶3∶
5∶1,现用分层抽样的方法抽取一个容量为n的样本,若样本中A型号有16件,那么此样本的容量n为________.?
【解析】依题意得,=,
所以=,
解得n=88,所以样本容量为88.
答案:88
三、填空题(每小题5分,共10分)
7.古代科举制度始于隋而成于唐,完备于宋、元.明代则处于其发展的鼎盛阶段.其中表现之一为会试分南卷、北卷、中卷,按比例录取,其录取比例为11∶7∶2.若明宣德五年会试录取人数为100.则中卷录取人数为__________.?
【解析】由题意,明宣德五年会试录取人数为100,
则中卷录取人数为100×=10.
答案:10
【补偿训练】
某公司生产三种型号的轿车,产量分别为1
200辆,6
000辆和2
000辆.为检验该公司的产品质量,现用分层抽样的方法抽取46辆轿车进行检验,这三种型号的轿车依次应抽取的辆数为________.?
【解析】设三种型号的轿车依次应抽取x辆,y辆,z辆,则有解得
答案:6,30,10
8.某企业三月中旬生产A,B,C三种产品共3
000件,根据比例分配的分层抽样的结果,企业统计员制作了如下的统计表格:
产品类型
A
B
C
产品数量(件)
1
300
样本容量
130
由于不小心,表格中A,C两种产品的有关数据已被污染看不清楚了,统计员只记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是________件.?
【解析】抽样比为130∶1
300=1∶10,即每10个产品中抽取1个个体,
又A产品的样本容量比C产品的样本容量多10,故C产品的数量是[(3
000-
1
300)-100]×=800(件).
答案:800
四、解答题(每小题10分,共20分)
9.一批产品中有一级品100个,二级品60个,三级品40个,用分层抽样法从这批产品中抽取一个容量为20的样本.请利用分层抽样的方法抽取,写出抽样过程.
【解析】第一步,确定抽样比,因为100+60+40=200,所以=;
第二步,确定各层抽取的样本数,一级品:100×=10,二级品:60×=6,三级品:40×=4;
第三步,采用简单随机抽样的方法,从各层分别抽取样本;
第四步,把抽取的个体组合在一起构成所需样本.
10.某校高一年级有24个班,共1
000名学生,他们参加了一次数学测试.学校统计了所有学生的成绩,得到下列统计图.
(1)求该校高一年级学生本次测试成绩的平均数;
(2)假设随机抽取300名学生,按照比例分配的分层抽样的方法,试估计高一年级本次测试成绩的平均数.
【解析】(1)由题意并结合扇形统计图,可知男生共有1
000×60%=600(名),女生有1
000×40%=400(名).由成绩平均数条形图可得,该校高一年级学生本次测试成绩的平均数=(80×600+82.5×400)÷1
000=81.
(2)随机抽取300名学生,采用比例分配的分层抽样的方法,则男生样本数为300×=180,女生样本数为300×=120.故样本平均数为(180×80+120×82.5)÷300=81.根据样本平均数来估计总体平均数,可得高一年级本次测试成绩的平均数为81.
1.某工厂的三个车间在12月份共生产了3
600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽样,若从一、二、三车间抽取的产品数分别为a,b,c,且2b=a+c,则第二车间生产的产品数为
( )
A.800
B.1
000
C.1
200
D.1
500
【解析】选C.由2b=a+c,得第二车间生产的产品数为3
600×=3
600×=
1
200.
2.为了对某课题进行研究,从A,B,C三所高校中用分层抽样法抽取若干名教授组成研究小组,其中高校A有m名教授,高校B有72名教授,高校C有n名教授(其中0(1)若A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,求m,n.
(2)若高校B中抽取的教授数是高校A和C中抽取的教授总数的,求三所高校的教授的总人数.
【解析】(1)因为0所以高校B中抽取2人,所以高校A中抽取1人,高校C中抽取3人,
所以==,解得m=36,n=108.
(2)因为高校B中抽取的教授数是高校A和C中抽取的教授总数的,
所以(m+n)=72,解得m+n=108,
所以三所高校的教授的总人数为m+n+72=180.
PAGE课时素养评价
三十八 统
计
图
表
(20分钟 35分)
1.把过期的药品随意丢弃,会造成对土壤和水体的污染,危害人们的健康.如何处理过期药品,有关机构随机对若干家庭进行调查,调查结果如图.其中对过期药品处理不正确的家庭达到
( )
A.79%
B.80%
C.18%
D.82%
【解析】选D.对过期药品处理不正确的包括卖给不法收购者、拆开冲进下水道、扔到垃圾箱,所以应占82%.
2.在抽查产品尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组上的直方图高为h,则|a-b|=
( )
A.hm
B.
C.
D.h+m
【解析】选B.根据频率直方图中每组的高为,
可知=h,所以|a-b|=.
【补偿训练】
频率直方图中,小长方形的面积等于
( )
A.组距 B.频率 C.组数 D.频数
【解析】选B.根据小长方形的宽及高的意义,可知小长方形的面积为一组样本数据的频率.
3.某班三位同学的数学测试成绩及班级平均分的关系图如图所示:
其中说法不正确的是
( )
A.王伟同学的数学学习成绩高于班级平均水平,且较稳定
B.张诚同学的数学学习成绩波动较大
C.赵磊同学的数学学习成绩低于班级平均水平
D.在6次测试中,每一次成绩都是王伟第1,张诚第2,赵磊第3
【解析】选D.从图中看出王伟同学的数学学习成绩始终高于班级平均水平,学习情况比较稳定而且成绩优秀.张诚同学的数学成绩不稳定,总是在班级平均水平上下波动,而且波动幅度较大.赵磊同学的数学学习成绩低于班级平均水平,但他的成绩曲线呈上升趋势,表明他的数学成绩在稳步提高,第6次测试张诚没有赵磊的成绩好.
【补偿训练】
“义乌·中国小商品城指数”简称“义乌指数”.如图是2019年3月19日至2019年4月23日的“义乌指数”走势图,下面关于该指数图的说法正确的是
( )
A.4月2日的指数为图中的最高指数
B.4月23日的指数为图中的最低指数
C.3月19日至4月23日指数节节攀升
D.4月9日的指数比3月26日的指数高
【解析】选D.从图中可以看出最大(高)、最小(低)的值及曲线的变化情况,即4月16日的指数为图中的最高指数;3月19日的指数为图中的最低指数;3月19日至4月2日指数节节攀升;4月2日至4月9日指数不变;4月9日至4月16日指数略有上升;4月16日至4月23日指数下降;4月9日的指数比3月26日的指数高.
4.观察新生婴儿的体重(单位:g),其频率直方图如图所示,则新生婴儿的体重在[2
700,3
000)内的频率为
( )
A.0.001
B.0.01
C.0.003
D.0.3
【解析】选D.频率=×组距,
组距=3
000-2
700=300,=0.001,
所以频率=0.001×300=0.3.
【补偿训练】
为了了解汽车司机遵守交通规则的意识,小明所在的学习小组成员协助交通警察在某路口统计的某个时段来往汽车的车速(单位:千米/时)情况如图所示,根据统计图分析,这组车速数据的速度是________的车辆最多
( )?
A.56千米/时
B.58千米/时
C.60千米/时
D.62千米/时
【解析】选C.观察图表可知有3个52,8个56,9个58,10个60,4个62,2个64.
5.某班50名学生在一次百米测试中,成绩全部介于13
s与19
s之间.将测试结果按如下方式分成6组:第一组,成绩大于等于13
s且小于14
s;第二组,成绩大于等于14
s且小于15
s;……;第六组,成绩大于等于18
s且小于等于19
s.如图是按上述分组方法得到的频率直方图.设成绩小于17
s的学生人数占全班总人数的百分比为x,成绩大于等于15
s且小于17
s的学生人数为y,则从频率直方图中可以分析出x和y分别为________.?
【解析】由题可得各段中的分布人数分别为1,9,18,17,3,2,
所以成绩小于17s的人数为1+9+18+17=45,
故x==0.9,y=18+17=35.
答案:0.9,35
6.为了加强城市文明建设,让市民养成遵纪守法的习惯,市政府在每个红绿灯处设置了志愿者文明监督岗,志愿者老刘某天在市内的一个十字路口,对行人及骑自行车和电动车闯红灯的人数进行了统计.统计方法如下:
①时间:上午7:00~12:00,分5个时间段,每个时间段时长为1小时;
②在每个时间段里,随机选择一个红绿灯周期,每个红绿灯周期是90秒;
③对闯红灯和未闯红灯的人数进行统计.
下图是志愿者老刘对各时间段的一个红绿灯周期内闯红灯的人数制作的条形统计图和扇形统计图,但均不完整.请你根据统计图解答下列问题.
(1)估计这一天上午7:00~12:00在这个十字路口共有多少人闯红灯;
(2)请你把条形统计图补充完整;
(3)志愿者老刘统计,各时间段的一个红绿灯周期内闯红灯的人数占通过该十字路口人数的百分比依次是:15%,20%,12%,15%,25%.求这一天上午7:00~12:00这一时间段中,该十字路口平均每小时大约有多少人通过?
【解析】(1)根据题意可得40÷40%=100,
100×3
600÷90=4
000.
可以估计这一天上午7:00~12:00在这个十字路口共有4
000人闯红灯.
(2)7:00~8:00每个周期内人数:100×20%=20,10:00~11:00每个周期内人数:100-20-15-10-40=15,
补全条形统计图如图.
(3)(20÷15%+15÷20%+10÷12%+15÷15%+40÷25%)×3
600÷90÷5≈4
413.
该十字路口平均每小时大约有4
413人通过.
PAGE课时素养评价
三十九 用样本估计总体的集中趋势参数
(20分钟 35分)
1.奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为
( )
A.减少计算量
B.避免故障
C.剔除异常值
D.活跃赛场气氛
【解析】选C.因为在体操比赛的评分中使用的是平均分,记分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,尽量公平.
2.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数与标准值0.618比较,正确的结论是
( )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定
【解析】选A.计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近.
【补偿训练】
某排球队12名队员的年龄如表所示:
年龄/岁
18
19
20
21
22
人数
1
4
3
2
2
则该队队员年龄的众数与中位数分别是( )
A.19岁,19岁
B.19岁,20岁
C.20岁,20岁
D.20岁,22岁
【解析】选B.由众数的定义可知,数据19出现的次数最多,达4次,12个数据中,由小到大排列后第6个与第7个位置上的数都是20,这两个数的平均数也是20.所以该队队员年龄的众数与中位数分别是19岁,20岁.
3.某市4月份日平均气温统计图情况如图所示,则在日平均气温这组数据中,众数和中位数分别是
( )
A.13,13
B.13,13.5
C.13,14
D.16,13
【解析】选C.因为这组数据中,13出现了10次,出现次数最多,所以众数是13.因为第15个数和第16个数都是14,所以中位数是14.
【补偿训练】
某商场一天中售出某品牌运动鞋20双,其中各种尺码鞋的销量如表所示:
鞋的尺码(单位:cm)
23.5
24
24.5
25
25.5
26
销售量(单位:双)
3
4
4
7
1
1
则这20双鞋的尺码组成的一组数据中,众数是________,中位数是________,在众数和中位数中,商场最感兴趣的是________.?
【解析】因为这组数据中,25出现的次数最多,所以这组数据的众数是25;将该组数据从小到大排列后,处于中间位置的是第10个数和第11个数,均为24.5,故该组数据的中位数是24.5;在众数和中位数中,商场最感兴趣的是众数.
答案:25 24.5 众数
4.已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么这组数据的众数是________,平均数是________.?
【解析】因为中位数为5,所以=5,即x=6.
所以该组数据的众数为6,
平均数为=5.
答案:6 5
【补偿训练】
某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是________分.?
【解析】由题意得,该校数学建模兴趣班的平均成绩是=85(分).
答案:85
5.已知样本数据x1,x2,…,xn的平均数=5,则样本数据2x1+1,2x2+1,…,2xn+1的平均数为________.?
【解析】由x1,x2,…,xn的平均数=5,得2x1+1,2x2+1,…,2xn+1的平均数为2+1=2×5+1=11.
答案:11
6.某公司销售部有销售人员15人,为了制定某种商品的月销售定额,统计了这15人某月的销售量如表:
销售量
1
800
510
250
210
150
120
人数
1
1
3
5
3
2
(1)求这15位销售人员该月销售量的平均数、中位数及众数;
(2)假设销售部负责人把每位销售人员的月销售定额定为320件,你认为是否合理,为什么?如果不合理,请你制定一个较合理的销售定额.
【解析】(1)平均数为×(1
800×1+510×1+250×3+210×5+150×3+
120×2)=320,中位数为210,众数为210.
(2)不合理.因为15人中有13人的销售量达不到320件,也就是说,320虽是这一组数据的平均数,但它却不能反映销售人员的一般水平.销售定额为210件合理些,这是由于210既是中位数,又是众数,是绝大部分人都能达到的销售量.
(30分钟 60分)
一、单选题(每小题5分,共20分)
1.已知一组数据3,a,4,5的众数为4,则这组数据的平均数为
( )
A.3
B.4
C.5
D.6
【解析】选B.由数据3,a,4,5的众数为4,可得a为4,再求这组数据3,4,4,5的平均数为4.
2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为me,众数为mo,平均数为,则
( )
A.me=mo=
B.me=mo<
C.meD.mo【解析】选D.由题图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即me=5.5,5出现的次数最多,故mo=5,=×[2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10]
≈5.97.于是得mo3.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组成绩的平均数、众数、中位数分别是
( )
A.85分、85分、85分
B.87分、85分、86分
C.87分、85分、85分
D.87分、85分、90分
【解析】选C.由题意知,该学习小组共有10人,因此众数和中位数都是85分,
平均数为=87分.
4.某单位定期对员工的专业知识、工作业绩、出勤情况三个方面进行考核(考核的满分均为100分),三个方面依次按3∶5∶2确定最后得分.小王经过考核后所得的分数依次为90分、88分、83分,那么小王的最后得分是
( )
A.87分
B.87.5分
C.87.6分
D.88分
【解析】选C.小王的最后得分=90×+88×+83×=27+44+16.6=87.6(分).
【补偿训练】
在一次“爱心互助”捐款活动中,高一某班第一小组8名同学捐款的金额(单位:元)如表所示:
金额/元
5
6
7
10
人数
2
3
2
1
则这8名同学捐款金额的最大值、最小值、平均数分别为
( )
A.10元,5元,3.5元
B.10元,5元,6元
C.10元,5元,6.5元
D.10元,5元,7元
【解析】选C.这8名同学捐款金额的最大值为10元,最小值为5元,
平均数为=6.5(元).
二、多选题(每小题5分,共10分,全部选对得5分,选对但不全的得3分,有选错的得0分)
5.已知一组数据:12,5,9,5,14,则下列说法正确的是
( )
A.平均数是9
B.中位数是9
C.众数是5
D.均值为5
【解析】选ABC.数据描述类的题目,主要考查了平均数、中位数、众数的计算,题目数据比较简单,先从简单的众数入手,C是正确的,其次从小到大排列:5,5,9,12,14,B是正确的,再算平均数,所以A也正确,均值实际上是平均数,所以选项D错误.
6.小华所在的年级一班共有50名学生,一次体检测量了全班学生的身高,由此求得该班学生的平均身高是1.65米,而小华的身高是1.66米,则下列说法正确的是
( )
A.1.65米是该班学生身高的平均水平
B.班上比小华高的学生人数不会超过25人
C.这组身高数据的中位数不一定是1.65米
D.这组身高数据的众数不一定是1.65米
【解析】选ACD.本题考查了一组数据中的中位数、平均数、众数的概念及三者的求法,由平均数所反映的意义知A选项正确,由中位数与平均数的关系确定C选项正确,由众数与平均数的关系确定D选项正确,由于平均数受一组数据中的极端值的影响,故B选项错误.
三、填空题(每小题5分,共10分)
7.样本a1,a2,a3,…,a10的平均数为12,样本b1,b2,…,b8的平均数为5,则样本a1,b1,a2,b2,…,a8,b8,a9,a10的平均数为________.?
【解析】由题知新样本的平均数为=.
答案:
【补偿训练】
某住宅小区6月份随机抽查了该小区6天的用水量(单位:吨),结果分别是30,34,32,37,28,31,那么,请你估计该小区6月份(30天)的总用水量约是________吨.?
【解析】(30+34+…+31)÷6=32(吨),所以估计该小区6月份(30天)的总用水量约是32×30=960(吨).
答案:960
8.从甲、乙、丙三个厂家生产的同一种产品中分别抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下:甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.
三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数.
甲:________,乙:________,丙:________.?
【解析】对甲分析:8出现的次数最多,故运用了众数;对乙分析:8既不是众数,也不是中位数,求平均数可得,平均数=×(4+6+6+6+8+9+12+13)=8,故运用了平均数;对丙分析:共8个数据,最中间的是7和9,故其中位数是8,即运用了中位数.
答案:众数 平均数 中位数
四、解答题(每小题10分,共20分)
9.高一(3)班有男同学27名,女同学21名.在一次语文测验中,男同学得分的平均数是82分,中位数是75分,女同学得分的平均数是80分,中位数是80分.
(1)求这次测验全班成绩的平均数(精确到0.01);
(2)估计全班成绩不超过80分的同学至少有多少人;
(3)分析男同学得分的平均数与中位数相差较大的主要原因.
【解析】(1)利用平均数计算公式,得全班成绩的平均数=×(82×27+80×21)≈81.13(分).
(2)因为男同学得分的中位数是75分,
所以至少有14名男同学得分不超过75分.
又因为女同学得分的中位数是80分,
所以至少有11名女同学得分不超过80分.
所以全班至少有25人得分不超过80分.
(3)男同学得分的平均数与中位数相差较大,说明男同学中两极分化现象严重,得分高的和得分低的相差较大.
10.下面是某快餐店所有工作人员一周的收入表:
老板
大厨
二厨
采购员
杂工
服务生
会计
3
000元
450元
350元
400元
320元
320元
410元
(1)计算所有人员的周平均收入;
(2)这个平均收入能反映打工人员的周收入的一般水平吗?为什么?
(3)去掉老板的收入后,再计算平均收入,这能代表打工人员的周收入的水平吗?
【解析】(1)周平均收入=(3
000+450+350+400+320+320+410)=750(元).
(2)这个平均收入不能反映打工人员的周收入水平,可以看出打工人员的收入都低于平均收入,因为老板收入特别高,这是一个异常值,对平均收入产生了较大的影响,并且他不是打工人员.
(3)去掉老板的收入后的周平均收入=(450+350+400+320+320+410)=375(元).
这能代表打工人员的周收入水平.
【补偿训练】
某电冰箱专卖店出售容积为182
L、185
L、228
L、268
L四种型号的同一品牌的冰箱,每出售一台,售货员就做一个记录,月底得到一组由15个268,66个228,18个185和11个182组成的数据.
(1)这组数据的平均数有实际意义吗?
(2)这组数据的中位数、众数分别是多少?
(3)专卖店总经理关心的是中位数还是众数?
【解析】(1)这组数据的平均数没有实际意义,对专卖店经营没有任何参考价值.
(2)这组数据共有110个,中位数为228,众数为228.
(3)专卖店总经理最关心的是众数,众数是228,说明容积为228
L型号的冰箱销售量最大,它能为专卖店带来较多的利润,所以这种型号的冰箱要多进些.
1.某校欲招聘一名数学教师,学校对甲、乙、丙三位候选人进行了三项能力测试,各项测试成绩满分均为100分,根据结果择优录用.三位候选人的各项测试成绩如表所示:
测试项目
测试成绩/分
甲
乙
丙
教学能力
85
73
73
科研能力
70
71
65
组织能力
64
72
84
(1)如果根据三项测试的平均成绩,谁将被录用,说明理由;
(2)根据实际需要,学校将教学、科研和组织三项能力测试得分按5∶3∶2的比例确定每人的成绩,谁将被录用,说明理由.
【解析】(1)甲的平均成绩为(85+70+64)÷3=73(分),
乙的平均成绩为(73+71+72)÷3=72(分),
丙的平均成绩为(73+65+84)÷3=74(分),所以候选人丙将被录用.
(2)甲的测试成绩为(85×5+70×3+64×2)÷(5+3+2)=76.3(分),乙的测试成绩为(73×5+71×3+72×2)÷(5+3+2)=72.2(分),
丙的测试成绩为(73×5+65×3+84×2)÷(5+3+2)=72.8(分),所以候选人甲将被录用.
2.为了让学生了解环保知识,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)进行统计.请你根据下面尚未完成的频率分布表和频率直方图,解答下列问题:
组号
分组
频数
频率
1
[50,60)
4
0.08
2
[60,70)
8
0.16
3
[70,80)
10
0.20
4
[80,90)
16
0.32
5
[90,100]
合计
(1)填充频率分布表中的空格;
(2)如图,不具体计算,补全频率直方图;
(3)估计这900名学生竞赛的平均成绩(同一组中的数据用该组区间的中点值作代表).
【解析】(1)=50,即样本容量为50.
第5组的频数为50-4-8-10-16=12,
从而第5组的频率为=0.24.
又各小组频率之和为1,所以频率分布表中的四个空格应分别填12,0.24,50,1.
(2)根据小长方形的高与频数成正比,设第一个小长方形的高为h1,第二个小长方形的高为h2,第五个小长方形的高为h5.
由等量关系得=,=,补全的频率直方图如图所示.
(3)50名学生竞赛的平均成绩为
==79.8≈80(分).
利用样本估计总体的思想可得这900名学生竞赛的平均成绩约为80分.
PAGE课时素养评价
四十 用样本估计总体的离散程度参数
(20分钟 35分)
1.下列说法正确的是
( )
A.在两组数据中,平均数较大的一组极差较大
B.平均数反映数据的集中趋势,方差反映数据波动的大小
C.方差的求法是求出各个数据与平均值的差的平方后再求和
D.在记录两个人射击环数的两组数据中,方差大说明射击水平稳定
【解析】选B.平均数表示一组数据的集中趋势,平均数的大小并不能说明该组数据极差的大小,所以A错误;方差公式s2=(xi-)2,所以C错误;方差大说明射击水平不稳定,所以D错误.
2.现有10个数,其平均数为3,且这10个数的平方和是100,那么这组数据的标准差是
( )
A.1
B.2
C.3
D.4
【解析】选A.由s2==-,得s2=×100-32=1,即标准差s=1.
【补偿训练】
一组数据按从小到大的顺序排列为1,2,2,x,5,10,其中x≠5,已知该组数据的中位数是众数的倍,则该组数据的标准差为________.?
【解析】由题意,可得该组数据的众数为2,所以=×2=3,解得x=4,故该组数据的平均数为=4.所以该组数据的方差为×[(1-4)2+(2-4)2+
(2-4)2+(4-4)2+(5-4)2+(10-4)2]=9,即标准差为3.
答案:3
3.甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为,,标准差分别为s甲,s乙,则
( )
A.<,s甲B.<,s甲>s乙
C.>,s甲D.>,s甲>s乙
【解析】选C.由题图知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知>.题图中数据显示甲同学的成绩比乙同学稳定,所以s甲4.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.
若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是
( )
A.众数
B.平均数
C.中位数
D.标准差
【解析】选D.对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.
5.对一个做直线运动的质点的运动过程观测了8次,得到如表所示的数据.
观测序号i
1
2
3
4
5
6
7
8
观测数据ai
40
41
43
43
44
46
47
48
上述统计数据的平均数是______,方差是______.?
【解析】上述统计数据的平均数=×(40+41+43+43+44+46+47+48)=44,
方差=×[(40-44)2+(41-44)2+(43-44)2+(43-44)2+(44-44)2+(46-44)2+(47-
44)2+(48-44)2]=7.
答案:44 7
6.某学校有高中学生500人,其中男生320人,女生180人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的平均数为173.5
cm,方差为17
cm2,女生样本的平均数为163.83
cm,方差为30.03
cm2.
(1)根据以上信息,能够计算出总样本的平均数和方差吗?为什么?
(2)如果已知男、女样本量按比例分配,你能计算出总样本的平均数和方差各为多少吗?
(3)如果已知男、女的样本量都是25,你能计算出总样本的平均数和方差各为多少吗?它们分别作为总体平均数和方差的估计合适吗?为什么?
【解析】(1)不能,因为本题没有给出男、女生的样本量,或者男、女生样本量的比例,故无法计算出总样本的平均数和方差.
(2)总样本的平均数为×173.5+×163.83≈170.02(cm).
总样本的方差为×[17+(173.5-170.02)2]+×[30.03+(163.83-170.02)2]≈43.24(cm2).
(3)总样本的平均数为×173.5+×163.83≈168.67(cm).
总样本的方差为×[17+(173.5-168.67)2]+×[30.03+(163.83-168.67)2]≈46.89(cm2).
不能作为总体平均数和方差的估计,因为此分层抽样中,每个个体被抽到的可能性不完全相同,因而样本的代表性差.
【补偿训练】
已知母鸡产蛋的最佳温度在10℃左右,下面是在甲、乙两地六个时刻测得的温度,你认为甲、乙两地哪个地方更适合母鸡产蛋?
【解析】①=×(-5+7+15+14-4-3)
=4(℃),
=×(1+4+10+7+2+0)=4(℃).
②极差:甲地温度极差=15-(-5)=20(℃);
乙地温度极差=10-0=10(℃).
③标准差:
s甲=
≈8.4(℃);
s乙=
≈3.5(℃).
显然两地的平均温度相等,乙地温度的极差、标准差较小,说明了乙地温度波动较小.
因此,乙地比甲地更适合母鸡产蛋.
(30分钟 60分)
一、单选题(每小题5分,共20分)
1.样本a,3,5,7的平均数是b,且a,b是方程x2-5x+4=0的两根,则这个样本的方差是
( )
A.3
B.4
C.5
D.6
【解析】选C.x2-5x+4=0的两根是1,4.
当a=1时,a,3,5,7的平均数是4;
当a=4时,a,3,5,7的平均数不是1.所以a=1,b=4.则方差s2=[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5.
2.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是
( )
A.57.2,3.6
B.57.2,56.4
C.62.8,63.6
D.62.8,3.6
【解析】选D.每一个数据都加上60,所得新数据的平均数增加60,而方差保持不变.
3.若某同学连续3次考试的名次(3次考试均没有出现并列名次的情况)不超过3,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续3次考试名次的数据,推断一定是尖子生的是
( )
A.甲同学:平均数为2,众数为1
B.乙同学:平均数为2,方差小于1
C.丙同学:中位数为2,众数为2
D.丁同学:众数为2,方差大于1
【解析】选B.甲同学:若平均数为2,众数为1,则有一次名次应为4,故排除A;乙同学:平均数为2,设乙同学3次考试的名次分别为x1,x2,x3,则方差s2=[(x1-
2)2+(x2-2)2+(x3-2)2]<1,则(x1-2)2+(x2-2)2+(x3-2)2<3,所以x1,x2,x3均不大于3,符合题意;丙同学:中位数为2,众数为2,有可能是2,2,4,不符合题意;丁同学:有可能是2,2,6,不符合题意.
【补偿训练】
在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是
( )
A.甲地:总体平均数为3,中位数为4
B.乙地:总体平均数为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体平均数为2,总体方差为3
【解析】选D.根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能存在大于7的数;选项B中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D中,根据方差公式,如果有大于7的数存在,那么方差不会为3.
4.甲、乙、丙三人投掷飞镖,他们成绩(环数)的频数条形统计图如图所示,则甲、乙、丙三人训练成绩的标准差s甲,s乙,s丙的大小关系是
( )
A.s丙>s乙>s甲
B.s甲>s丙>s乙
C.s丙>s甲>s乙
D.s乙>s丙>s甲
【解析】选C.由题干甲图可知,
==6,
=×[6×(3-6)2+6×(4-6)2+6×(5-6)2+6×(6-6)2+6×(7-6)2+6×(8-6)2+6×(9-6)2]=4,
标准差s甲==2;
由题干乙图可知,==6,
=×[3×(3-6)2+5×(4-6)2+8×(5-6)2+10×(6-6)2+8×(7-6)2+5×(8-6)2+3×(9-6)2]≈2.6,
标准差s乙≈;由题干丙图可知,
==6,
=×[8×(3-6)2+5×(4-6)2+3×(5-6)2+10×(6-6)2+3×(7-6)2+5×(8-6)2+8×(9-6)2]≈4.5,
标准差s丙≈.故s丙>s甲>s乙.
二、多选题(每小题5分,共10分,全部选对得5分,选对但不全的得3分,有选错的得0分)
5.一组数据的平均数是,标准差是s,将这组数据中的每个数据都乘以2,所得到的一组新数据的平均值和标准差分别是
( )
A.
B.2
C.s
D.2s
【解析】选BD.设该组数据为x1,x2,…,xn,都乘以2后的新数据为2x1,2x2,…,2xn.
由题意知=,
则=2.
又s=,
所以=2s.
6.某班有50名学生,其中有30名男生和20名女生,随机询问了该班6名男生和4名女生在某次数学测验中的成绩,6名男生的成绩分别为86分,94分,88分,92分,90分,90分,4名女生的成绩分别为90分,93分,93分,88分,则下列说法正确的有
( )
A.这种抽样方法是按比例分配的分层抽样
B.该班男生成绩的平均数小于该班女生成绩的平均数
C.这6名男生成绩的方差大于这4名女生成绩的方差
D.抽取的10名学生成绩的平均数和方差分别为90.4分和6.04分2
【解析】选ACD.因为该班有30名男生和20名女生且抽取的男生和女生的比为3∶2,所以这种抽样方法是按比例分配的分层抽样,A正确;
抽取的6名男生成绩的平均数==90(分),抽取的4名女生成绩的平均数==91(分),虽然<,但并不一定能说明该班男生成绩的平均数小于该班女生成绩的平均数,B不一定正确;这6名男生成绩的方差=×[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2+(90-90)2]=(分2),这4名女生成绩的方差=×[(90-91)2+(93-91)2+(93-91)2+(88-91)2]=(分2),因为>,所以C正确;被抽取的10名学生成绩的平均数=×90+×91=90.4(分),被抽取的10名学生成绩的方差s2=×+×+(91-90.4)2=4.096+1.944=6.04(分2),D正确.
三、填空题(每小题5分,共10分)
7.已知一组数据x1,x2,x3,x4,x5的平均数=2,方差s2=,那么另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为________,方差为________.?
【解析】平均数为′=3-2=3×2-2=4,方差为s′2=9s2=9×=3.
答案:4 3
【补偿训练】
已知k1,k2,…,kn的方差为5,则3(k1-4),3(k2-4),…,3(kn-4)的方差为________.?
【解析】设k1,k2,…,kn的平均数为,则3(k1-4),3(k2-4),…,3(kn-4)的平均数为3(-4),所以s2=[3(ki-4)-3(-4)]2=[3(ki-)]2=9×(ki-)2=
9×5=45.
答案:45
8.某医院急救中心随机抽取20位病人等待急诊的时间记录如表:
等待时间/分钟
[0,5)
[5,10)
[10,15)
[15,20)
[20,25]
频数
4
8
5
2
1
用上述分组资料计算出病人平均等待时间的估计值=________,病人等待时间方差的估计值s2=________.?
【解析】=×(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5(分钟),s2=
×[(2.5-9.5)2×4+(7.5-9.5)2×8+(12.5-9.5)2×5+(17.5-9.5)2×2+(22.5-9.5)2×1]=28.5(分钟2).
答案:9.5分钟 28.5分钟2
四、解答题(每小题10分,共20分)
9.某班40人随机分成两组,第1组15人,第2组25人,两组学生一次数学考试的成绩(单位:分)情况如表:
组别
平均分
标准差
第1组
84
6
第2组
80
4
求全班学生这次数学考试的平均成绩和方差.
【解析】由题意,知第1组这次数学考试的平均分=84(分),方差=62=
36(分2),
第2组这次数学考试的平均分=80(分),方差=42=16(分2),
故全班学生这次数学考试的平均成绩=×84+×80=81.5(分),
方差s2=×[36+(84-81.5)2]+×[16+(80-81.5)2]=27.25(分2).
10.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:
(1)填写下表:
平均数
方差
中位数
命中9环及以上
甲
7
1.2
1
乙
5.4
3
(2)请从四个不同的角度对这次测试进行分析:
①结合平均数和方差分析偏离程度;
②结合平均数和中位数分析谁的成绩好些;
③结合平均数和命中9环以上的次数分析谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
【解析】(1)乙的打靶环数依次为2,4,6,8,7,7,8,9,9,10,所以=×(2+
4+6+8+7+7+8+9+9+10)=7;乙的打靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数为=7.5;甲的打靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.
于是填充后的表格如表所示:
平均数
方差
中位数
命中9环及以上
甲
7
1.2
7
1
乙
7
5.4
7.5
3
(2)①甲、乙的平均数相同,均为7,但<,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙的打靶成绩比甲好.
③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的打靶成绩比甲好.
④从题干折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.
【补偿训练】
为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如表:
天数
[150,180)
[180,210)
[210,240)
[240,270)
[270,300)
[300,330)
[330,360)
[360,390]
灯管数
1
11
18
20
25
16
7
2
(1)试估计这种日光灯的平均使用寿命.
(2)若定期更换,可选择多长时间统一更换合适?
【解析】(1)各组的组中值分别为165,195,225,255,285,315,345,375,由此可算得这种日光灯的平均使用寿命约为165×1%+195×11%+225×18%+255×20%+
285×25%+315×16%+345×7%+375×2%=267.9≈268(天).
(2)×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2
128.60.故标准差为≈46.
估计这种日光灯的平均使用寿命约为268天,标准差约为46天,故在222~314天之间统一更换较合适.
为选派一名学生参加全市实践活动技能竞赛,A,B两位同学在学校的学习基地现场进行加工直径为20
mm的零件测试,他俩各加工的10个零件直径的相关数据如图所示(单位:mm):
A,B两位同学各加工的10个零件直径的平均数与方差如表:
平均数
方差
A
20
0.016
B
20
根据测试得到的有关数据,试解答下列问题:
(1)计算,结合平均数与方差,说明谁的成绩好些;
(2)结合图中折线走势情况,你认为派谁去参赛较合适?请说明你的理由.
【解析】(1)=×[5×(20-20)2+3×(19.9-20)2+(20.1-20)2+(20.2-20)2]
=0.008,所以>,所以在平均数相同的情况下,B的波动较小,所以B的成绩好些.
(2)从题干图中折线趋势可知:
尽管A的成绩前面起伏大,但后来逐渐稳定,误差小,预测A的潜力大,所以派A去参赛较合适.
PAGE课时素养评价
四十一 用频率直方图估计总体分布
(20分钟 35分)
1.有一个容量为45的样本数据,数据的分组及各组的频数如下:(12.5,15.5],
3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,
30.5],4.由此估计,不大于27.5的数据约为总体的
( )
A.91%
B.92%
C.95%
D.30%
【解析】选A.不大于27.5的样本数为3+8+9+11+10=41,约占总体的百分比为×100%≈91%.
2.某班的全体学生参加英语测试,成绩的频率直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是
( )
A.45
B.50
C.55
D.60
【解析】选B.设该班的学生人数为n,
则20×(0.005+0.01)n=15,n=50.
3.某工厂对一批元件进行抽样检测.经检测,抽出的元件的长度(单位:mm)全部在93至105之间.将抽出的元件的长度以2为组距分成6组:[93,95),[95,97),
[97,99),[99,101),[101,103),[103,105],得到如图所示的频率直方图.若长度在[97,103)内的元件为合格品,根据频率直方图,估计这批元件的合格率是
( )
A.80%
B.90%
C.20%
D.85.5%
【解析】选A.由频率分布直方图可知元件长度在[97,103)内的频率为1-
(0.027
5+0.027
5+0.045
0)×2=0.8,故这批元件的合格率为80%.
4.对某小区100户居民的月均用水量进行统计,得到样本的频率直方图如图所示,则估计此样本的众数、中位数分别为
( )
A.2.25,2.5
B.2.25,2.02
C.2,2.5
D.2.5,2.25
【解析】选B.众数是指样本中出现频率最高的数,在频率直方图中通常取该组区间的中点,所以众数为=2.25.中位数是频率为0.5的分界点,由频率直方图,可知前4组的频率和为(0.08+0.16+0.30+0.44)×0.5=0.49,因此中位数出现在第5组,设中位数为x,则(x-2)×0.5=0.01,解得x=2.02.
5.已知100名学生某月饮料消费支出情况的频率直方图如图所示.则这100名学生中,该月饮料消费支出超过150元的人数是________.?
【解析】根据频率直方图,得消费支出超过150元的频率为(0.004+0.002)×50=
0.3,所以消费支出超过150元的人数是100×0.3=30.
答案:30
6.某制造商为运动会生产一批直径为40
mm的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm,保留两位小数)如下:
40.02 40.00 39.98 40.00 39.99
40.00 39.98 40.01 39.98 39.99
40.00 39.99 39.95 40.01 40.02
39.98 40.00 39.99 40.00 39.96
(1)完成下面的频率分布表,并画出频率直方图;
分组
频数
频率
[39.95,39.97)
[39.97,39.99)
[39.99,40.01)
[40.01,40.03]
合计
(2)假定乒乓球的直径误差不超过0.02
mm为合格品,若这批乒乓球的总数为
10
000只,试根据抽样检查结果估计这批产品的合格数.
【解析】(1)频率分布表:
分组
频数
频率
[39.95,39.97)
2
0.10
5
[39.97,39.99)
4
0.20
10
[39.99,40.01)
10
0.50
25
[40.01,40.03]
4
0.20
10
合计
20
1
频率直方图:
(2)因为抽样的20只产品中在[39.98,40.02]范围内有18只,所以合格率为×100%=90%,
所以10
000×90%=9
000(只).
即根据抽样检查结果,可以估计这批产品的合格数为9
000只.
【补偿训练】
从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125]
频数
6
26
38
22
8
(1)根据上表作出这些数据的频率直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
【解析】(1)频率直方图如图.
(2)质量指标值的样本平均数为80×0.06+90×0.26+100×0.38+110×
0.22+120×0.08=100.
质量指标值的样本方差为s2=(80-100)2×0.06+(90-100)2×0.26+(100-100)2×0.38+(110-100)2×0.22+(120-100)2×0.08=104.
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.
(30分钟 50分)
一、单选题(每小题5分,共20分)
1.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用的时间的数据,结果用下面的条形统计图表示.根据条形统计图可得这50名学生这一天平均每人的课外阅读时间为
( )
A.0.6时
B.0.9时
C.1.0时
D.1.5时
【解析】选B.这50名学生这一天平均每人的课外阅读时间为(0×5+0.5×20+
1.0×10+1.5×10+2.0×5)÷50=0.9(时).
2.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为
( )
A.20
B.18
C.16
D.12
【解析】选D.志愿者的总人数为
=50,所以第三组的人数为50×0.36=18,
有疗效的人数为18-6=12.
3.某养猪场定购了一批仔猪,从中随机抽查了100头仔猪的体重(单位:斤),经数据处理得到如图①的频率直方图,其中体重最轻的14头仔猪的体重的茎叶图如图②,为了将这批仔猪分栏喂养,需计算频率直方图中的一些数据,其中a+b的值为
( )
A.0.144
B.0.152
C.0.76
D.0.076
【解析】选B.由题意得c+d=×=0.024且[2(c+d)+a+b]×5=1.所以2×0.024+a+b=0.2.所以a+b=0.152.
【补偿训练】
如图是某学校抽取的学生体重的频率直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为10,则抽取的学生人数为
( )
A.20
B.30
C.40
D.50
【解析】选C.前3组的频率之和等于1-(0.012
5+0.037
5)×5=0.75,第2小组的频率是0.75×=0.25,设样本容量为n,则=0.25,即n=40.
4.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率直方图如图,
则这20名工人中一天生产该产品的数量的中位数为
( )
A.65
B.64
C.62.5
D.60
【解析】选C.设20名工人中一天生产该产品的数量的中位数为x,则0.2+(x-55)
×0.04=0.5,x=62.5.
二、多选题(每小题5分,共10分,全部选对得5分,选对但不全的得3分,有选错的得0分)
5.在某次高中学科竞赛中,4
000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点值作代表,则下列说法正确有
( )
A.成绩在[70,80)分的考生人数最多
B.不及格的考生人数为1
000
C.考生竞赛成绩的平均分为70.5分
D.考生竞赛成绩的中位数为75分
【解析】选ABC.A选项,由频率直方图可得成绩在[70,80)的频率最高,因此考生人数最多,故A正确;B选项,由频率直方图可得成绩在[40,60)的频率为0.25,因此,不及格的人数为4
000×0.25=1
000,故B正确;C选项,由频率直方图可得平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;D选项,因为成绩在[40,70)的频率为0.45,成绩在[70,80)的频率为0.3,所以中位数为70+10×≈71.67(分),故D错误.
【补偿训练】
某次考试中,某班级的数学成绩统计图如下(每组数据包含左端点,不包含右端点).则下列说法错误的是( )
A.分数在70~80的人数最多
B.该班的总人数为40
C.分数在90~100的人数最少
D.及格(≥60分)的人数是26
【解析】选ABC.从表中可以看出,分数在70~80的有14人,人数最多,所以选项A正确;该班共有4+12+14+8+2=40人,所以选项B正确;从表中可以看出,分数在90~100的有2人,人数最少,所以选项C正确;及格(≥60分)的人数为12+14
+8+2=36人,所以选项D错误.
6.某班进行了一次数学测试,全班学生的成绩都落在区间[50,100]内,其成绩的频率直方图如图所示,则该班学生这次数学测试成绩的中位数和众数的估计值为( )
A.81.5
B.75
C.81.25
D.85
【解析】选CD.因为(0.005+0.015+0.025)×10=0.45<0.5,(0.005+0.015+0.025+
0.040)×10=0.85>0.5,所以该班学生这次数学测试成绩的中位数落在[80,90)内.设中位数为x,因为(0.005+0.015+0.025)×10+0.04×(x-80)=0.5,所以所求中位数为x=81.25.众数为85.
三、填空题(每小题5分,共10分)
7.某校为了了解学生的睡眠情况,随机调查了50名学生,得到他们在某一天各自的睡眠时间的数据,结果用如图所示的条形图表示.根据条形图可得这50名学生这一天平均每人的睡眠时间为________h.?
【解析】根据条形统计图得平均每人的睡眠时间为5.5×0.1+6×0.3+6.5×
0.4+7×0.1+7.5×0.1=6.4(h).
答案:6.4
【补偿训练】
某电子商务公司对10
000名网络购物者2018年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率直方图如图所示.
(1)直方图中的a=________;?
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.?
【解析】(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.
(2)消费金额在区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故消费金额在区间[0.5,0.9]内的频率为1-0.4=0.6.
因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10
000=6
000.
答案:(1)3 (2)6
000
8.对某市“四城同创”活动中800名志愿者的年龄进行抽样调查,统计后得到频率直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)年龄组[25,30)对应小矩形的高度为________;?
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)内的人数为________.?
【解析】(1)设年龄组[25,30)对应小矩形的高度为h,则5×(0.01+h+0.07+
0.06+0.02)=1,解得h=0.04.
(2)由(1)得志愿者年龄在[25,35)内的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)内的人数约为0.55×800=440.
答案:(1)0.04 (2)440
四、解答题
9.(10分)(2019·全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值.
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【解析】(1)由已知得0.70=a+0.20+0.15,故a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
PAGE课时素养评价
四十二 百
分
位
数
(15分钟 30分)
1.某市2019年5月份某一周的日最高气温(单位:℃)分别为25,28,30,29,31,
32,28,则这周的日最高气温的75百分位数为
( )
A.28
℃
B.29
℃
C.31
℃
D.32
℃
【解析】选C.将数据由小到大排列为25,28,28,29,30,31,32,因为7×75%=5.25,所以这周的日最高气温的75百分位数为31
℃.
2.近年来,某市私家车数量持续增长,2015年至2019年该市私家车数量依次为15,19,22,26,30(单位:万辆),则该组数据的中位数是________,10百分位数是________,20百分位数是________.?
【解析】这组数据从小到大排列后,22处于最中间的位置,故这组数据的中位数是22.因为5×10%=0.5,所以该组数据的10百分位数是15,因为5×20%=1,所以该组数据的20百分位数是=17.
答案:22 15 17
3.某学习小组10名同学在一次数学测试中的得分分别为85,78,66,91,67,
78,67,87,96,88,则这10名同学成绩的60百分位数为________.?
【解析】这组数据按照从小到大排列后为66,67,67,78,78,85,87,88,91,
96,10×60%=6,所以这10名同学成绩的60百分位数为=86.
答案:86
4.一组样本数据的频率直方图如图所示,试估计此样本数据的50百分位数为________.?
【解析】样本数据低于10的比例为0.08
+0.32=0.40,样本数据低于14的比例为0.40
+0.36=0.76,所以此样本数据的50百分位数在[10,14]内,估计此样本数据的50百分位数为10+×4=.
答案:
5.根据新修订的《环境空气质量标准》指出空气质量指数在0~50,各类人群可正常活动.某市环保局在2019年对该市进行为期一年的空气质量检测,得到每天的空气质量指数,从中随机抽取50个作为样本进行分析报告,样本数据分组区间为[0,10),[10,20),[20,30),[30,40),[40,50),由此得到样本的空气质量指数频率直方图,如图.
(1)求a的值;
(2)根据样本数据,试估计这一年度的空气质量指数的80百分位数.
【解析】(1)由题意,得10×(0.032+0.03+a+0.01+0.008)=1.解得a=0.02.
(2)因为(0.01+0.02+0.032)×10=0.62<0.8,
0.62+0.03×10=0.92>0.8,所以80百分位数应位于[30,40)内.
由30+10×=36,可以估计这一年度的空气质量指数的80百分位数为36.
(30分钟 60分)
一、单选题(每小题5分,共20分)
1.某校调查某班30名同学所穿的鞋的尺码如表所示:
码号
33
34
35
36
37
人数
7
6
14
1
2
则这组数据的25百分位数是
( )
A.33
B.34
C.35
D.36
【解析】选B.因为30×25%=7.5,所以这组数据的25百分位数为34.
2.某公园对“十一”黄金周7天假期的游客人数进行了统计,如表所示:
日期
10月1日
10月2日
10月3日
10月4日
10月5日
10月6日
10月7日
旅游人数(万)
1.5
2.2
2.2
3.8
1.5
2.2
0.6
则该公园“十一”黄金周七天假期游客人数的平均数和25百分位数分别是
( )
A.2万、1.5万
B.2万、2.2万
C.2.2万、2.2万
D.2万、1.85万
【解析】选A.游客人数的平均数=×(1.5+2.2+2.2+3.8+1.5+2.2+0.6)=2(万).将数据由小到大排列得:0.6,1.5,1.5,2.2,2.2,2.2,3.8,因为7×25%=1.75,所以这组数据的25百分位数为1.5万.
3.在某次考试中,10名同学的得分如下:84,77,84,83,68,78,70,85,79,95.则这一组数据的众数、中位数和75百分位数分别为
( )
A.84,68,83
B.84,78,83
C.84,81,84
D.78,81,84
【解析】选C.将所给数据按从小到大的顺序排列是68,70,77,78,79,83,84,
84,85,95,显然众数为84,而本组数据共10个,中间两个数是79,83,它们的平均数为81,即中位数为81.因为10×75%=7.5,所以这一组数据的75百分位数为84.
4.某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分如图所示,假设得分值的中位数为m1,60百分位数为m2,众数为m3,则
( )
A.m1B.m3C.m3D.m2【解析】选B.由题图知m3=5;
由中位数的定义,知第15个数与第16个数的平均数为m1==5.5;由百分位数的定义,且30×60%=18,则第18个数与第19个数的平均数为m2==6.故m3二、多选题(每小题5分,共10分,全部选对得5分,选对但不全的得3分,有选错的得0分)
5.某班8名学生的体重(单位:kg)分别是:42,48,40,47,43,58,47,45,则下列结论正确的是
( )
A.极差是18
B.25百分位数是42.5
C.中位数是46
D.平均数是47
【解析】选ABC.因为所给数据的最大值是58,最小值是40,所以极差是58-40=18.将所给数据按从小到大的顺序排列是40,42,43,45,47,47,48,58.因为这组数据共8个,处于中间位置的是第4个数和第5个数,故这组数据的中位数是=46.因为8×25%=2,所以这组数据的25百分位数是=42.5.平均数是46.25.
6.甲乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则
( )
A.甲成绩的平均数等于乙成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的80百分位数等于乙的成绩的80百分位数
D.甲的成绩的极差大于乙的成绩的极差
【解析】选AC.由题图可知,甲成绩的平均为6,乙成绩的平均数为6,所以A选项正确;甲的成绩的中位数为6,乙的成绩的中位数为5,所以B选项错误;甲的成绩的80百分位数为(7+8)÷2=7.5,乙的成绩的80百分位数(6+9)÷2=7.5,所以二者相等,所以C选项正确;甲的成绩的极差为4,乙的成绩的极差也为4,所以D选项错误.
三、填空题(每小题5分,共10分)
7.某校从高一年级中随机抽取部分学生,将他们的期末数学测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率直方图.据此统计,期末数学测试成绩不少于60百分位数的分数至少为________.?
【解析】因为(0.005+0.015+0.03)×10=0.5,
0.5+0.025×10=0.75>0.6,故60百分位数应位于第四小组内.由70+10×=74,得期末数学测试成绩不少于60百分位数的分数至少为74分.
答案:74
8.已知30个数据的60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是________.?
【解析】由于30×60%=18,设第19个数据为x,则(7.8+x)÷2=8.2,解得x=8.6,即第19个数据是8.6.
答案:8.6
四、解答题(每小题10分,共20分)
9.某超市为了解顾客的购物量及结算时间等信息,安排一名员工随机收集了100位顾客的相关数据:
一次购物量
1至4件
5至8件
9至12件
13至16件
17件及以上
顾客数(人)
x
30
25
y
10
结算时间(分钟/人)
1
1.5
2
2.5
3
已知这100位顾客中的一次购物量超过8件的顾客占55%.请确定x,y的值,并计算顾客一次购物的结算时间的80百分位数.
【解析】由已知,得25+y+10=55,x+y=35,所以x=15,y=20.
可知:将这100位顾客购物结算时间从小到大排列,第80个数据和第81个数据都是2.5,所以顾客一次购物的结算时间的80百分位数为2.5.
10.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:高一参赛学生成绩的60百分位数.
【解析】由题图可知,第1个小矩形的面积为0.3,第2个小矩形的面积为0.4,则60百分位数一定位于[60,70)内,由60+10×=67.5,可以估计高一参赛学生成绩的60百分位数约为67.5.
我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(单位:吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(单位:吨),估计x的值,并说明理由.
【解析】(1)由频率直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1.解得a=0.30.
(2)由(1)知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+
0.02=0.12.
由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300
000×0.12=36
000.
(3)因为前6组的频率之和为
0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85.
而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3,
由0.3×(x-2.5)
=0.85-0.73,解得x=2.9.
所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
PAGE