课时素养评价
一 从普查到抽样
(20分钟·35分)
1.下列调查工作适合采用普查的是
( )
A.环保部门对淮河水域的水污染情况的调查
B.电视台对某新闻节目收视率的调查
C.质检部门对各厂家生产的电池使用寿命的调查
D.企业在给职工做工作服前进行的尺寸大小的调查
【解析】选D.A、B中的调查,从理论上来说采用普查是可行的,但是普查会费时费力;C中,质检部门对各厂家生产的电池使用寿命的调查不能采用普查,因为调查时的检验对电池具有破坏性;D中,企业在给职工做工作服前进行的尺寸大小的调查必须采用普查,否则工人的工作服会不合体.
2.下列调查中属于抽样调查的是
( )
①每隔5年进行一次人口数量调查;
②某商品的质量优劣;
③某报社对某个事情进行舆论调查;
④调查班内某小组成员的作业完成情况.
A.②③
B.①④
C.③④
D.①②
【解析】选A.①④属于普查,②③属于抽样调查.
3.现从80件产品中随机抽出10件进行质量检验,下列说法正确的是
( )
A.80件产品是总体
B.10件产品是样本
C.样本容量是80
D.样本容量是10
【解析】选D.80件产品的质量是总体,故A错.10件产品的质量是样本,故B错.总体容量是80,故C错.
4.下列调查样本的四种方式中,具有代表性的是
( )
A.为了调查我国初中学生的平均体重,小明建议在本校初中三个年级各抽1个班调查
B.在南京科技馆随机抽取全年中的20天调查借阅情况,考察南京读者借阅图书的情况
C.为了估计泰山一年的登山总人数,小齐利用五一假期做了3天的登山人数统计
D.为了了解某校中学生有多少人已经患上近视眼,从每个班随机抽取5名学生做调查
【解析】选D.A中样本只包括了“本校”,不能代表“全国初中”;B中样本只包括了“科技馆”,不能代表“南京”;C中样本只包括了“五一假期”,不能代表“全年”;D中样本涉及了这所中学的每个班,又强调了“随机抽取”,因此可以代表整所中学的情况.
5.(1)对某班学生视力做一个调查.
(2)某啤酒瓶生产厂,要对所生产的啤酒瓶的抗压情况进行检验.
(3)联合国教科文组织要对全世界适龄儿童的入学情况做一个调查.
对于上述3个实际问题所应选用的调查方法分别为________、________、________.?
【解析】由抽样调查与普查概念可知(1)为普查,(2)(3)为抽样调查.
答案:普查 抽样调查 抽样调查
6.为了准确调查我国某一时期的人口数量、人口分布、民族人口、城乡人口、受教育的程度、迁移流动、就业状况、人口住房等多方面情况,需要采用什么样的统计方法呢?
【解析】要获得系统、全面、准确的信息,在对总体没有破坏性的前提下,如果想获得第一手的统计数据及资料,普查无疑是一个非常好的方法.要求全面准确调查我国的人口状况,因此应当用普查的方法进行调查.
(30分钟·55分)
一、选择题(每小题5分,共20分)
1.对于下列调查:
①某商场对所进的一批盒装牛奶中含钙量进行调查;
②某种灯泡使用寿命的测定;
③入学报考者的学历调查;
④要了解高一(1)班50名学生的身高.
其中不属于抽样调查的是
( )
A.①②
B.③④
C.②③
D.①④
【解析】选B.根据抽样调查与普查的概念可知③④一般采用普查的方法,①②是采用抽样调查的方法.
2.下列调查方式合适的是
( )
A.为了了解炮弹的杀伤力,采用普查的方式
B.为了了解全国中学生的睡眠状况,采用普查的方式
C.为了了解人们保护水资源的意识,采用抽样调查的方式
D.对载人航天器“神舟十号”零部件的检查,采用抽样调查的方式
【解析】选C.A、了解炮弹的杀伤力,有破坏性,故适合抽样调查方式,故本选项错误;
B、了解全国中学生的睡眠状况,工作量大,适合抽样调查方式,故本选项错误;
C、为了了解人们保护水资源的意识,工作量大,适合抽样调查方式,故本选项正确;
D、对载人航天器“神舟十号”零部件的检查十分重要,故进行普查检查,故本选项错误.
3.若对某校1
200名学生的耐力做调查,抽取其中120名学生,测试他们1
500米跑的成绩,得出相应的数值,在这项调查中,样本是指
( )
A.120名学生
B.1
200名学生
C.120名学生的成绩
D.1
200名学生的成绩
【解析】选C.本题抽取的是120名学生的成绩,因此每个学生的成绩是个体,这120名学生的成绩构成一个样本.
4.某市为了分析全市9
800名初中毕业生的数学考试成绩,抽取50本试卷,每本都是30份,则样本容量是
( )
A.30
B.50
C.1
500
D.9
800
【解题指南】抽取50本,每本30份,这说明这个样本中个体的总数为50×30=
1
500份.
【解析】选C.样本容量是样本个体的数量.注意:A,B错在未理解样本容量的意义,D是总体中个体的数量.
【补偿训练】
学校以年级为单位开展广播操比赛,全年级有13个班级,每个班级有50个学生,规定每班抽25个学生参加比赛,这时样本容量是
( )
A.13 B.50 C.650 D.325
【解析】选D.13个班级,每班抽25个学生,则这个样本的容量为13×25=325.
二、填空题(每小题5分,共15分)
5.随着人们健康意识的提高,有色食品的质量引起消费者的特别关注,检验员为了检查彩色豆腐是否具有染色现象,应采用________的方法检验.?
【解析】这是具有破坏性的检验,不可能进行普查,应当采取抽样调查的方法进行检验,对随机抽取的部分产品进行检验,根据得到的检验结果,就可以得到这批产品是否具有染色现象,因为同一批豆腐,从中随机抽取一部分代表全体产品的质量是合理的.
答案:抽样调查
【补偿训练】
某地区发现了新型流感病毒,在病毒发作区,对与病毒携带者亲密接触的人要进行检查,所采用的方法是________.?
【解析】要全面检查与病毒携带者亲密接触的人,不可以进行抽样调查.
答案:普查
6.下列调查中:①考察一片草皮的平均高度;②检查某食品单位职工的身体状况;③考察参加某次考试的3万名考生的数学答题情况;④检验一个人的血液中白细胞的含量是否正常,适合用抽样调查方法获取数据的是________.(填序号)?
【解析】①该问题用普查的方法很难实现,适合用抽样调查的方法获取数据;
②体检必须了解每个职工的身体状况,不适合用抽样调查的方法获取数据;
③3万名考生的答题情况用普查的方法获取数据不合适,适合用抽样调查的方法获取数据;④该问题只能用抽样调查的方法获取数据.
答案:①③④
7.下列调查中,样本不合理的是________.(填序号)?
①调查高一年级每个班数学成绩在前十名的学生,以了解哪名老师最受学生欢迎;
②从一万多名工人中,经过选举,确定100名代表,由他们投票表决,了解工人对厂长的信任情况;
③到老年公寓进行调查,了解全市老年人的健康状况;
④医生为了解病人的血液的各项指标是否正常,只是将病人指尖刺破,抽取少量的血液进行检验.
【解析】
题号
判断
原因分析
①
不合理
前十名的学生不能代表其他同学,故样本不具有代表性
②
合理
是合理样本
③
不合理
老年公寓中的老年人不能代表全市老年人,故样本不具有代表性
④
合理
是合理样本
答案:①③
【补偿训练】
为制定本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高做调查,现有三种调查方案:
①测量少年体校中180名男子篮球、排球队员的身高;
②查阅有关外地180名男生身高的统计资料;
③在本市的市区和郊县各任选一所完全中学、两所初级中学,在这六所学校有关的年级(1)班中,用抽签的方法分别选出10名男生,然后测量身高.
为了达到估计本市初中这三个年级男生身高分布的目的,则上述调查方案比较合理的是________.(填序号)?
【解析】①中,少年体校的男子篮球、排球的运动员的身高一定高于一般的情况,因此无法用测量的结果去估计总体的结果;②中,用外地学生的身高也不能准确地反映本地学生身高的实际情况;而③中的调查方案比较合理,能达到估计本市初中这三个年级男生身高分布的目的.
答案:③
三、解答题(每小题10分,共20分)
8.假设你是一名食品卫生工作人员,要对某食品店的一批小包装饼干进行卫生达标检验,应当选用何种调查方式?为什么?
【解题指南】从调查所需时间和费用以及是否具有破坏性考虑选择何种调查方式.
【解析】应该用抽样调查的方法对该批小包装饼干进行卫生达标检验.采用普查的方法来检验食品是否卫生达标是不合适的.因为这里检查的目的是决定是否让这批小包装饼干出售,检测具有一定的破坏性,普查的结果使得这批小包装饼干完全不能出售,与检查的目的相违背,所以不宜采用普查.
9.某年春季,某著名的全国性连锁服装店进行了一项关于当年秋季服装流行色的民意调查,调查者通过向顾客发放饮料,并让顾客通过挑选饮料瓶的颜色来对自己喜欢的服装颜色“投票”.这次调查结果显示,某大城市服装颜色的众数(大多数人的选择)为红色,而当年全国服装协会发布的秋季服装流行色是咖啡色.这个结果是否意味着该城市的人比其他城市的人较少倾向于选择咖啡色?你认为这两种调查结果的差异是由什么引起的?
【解析】这个结果意味着该城市光顾这家连锁店的人比其他城市的人较少倾向于选择咖啡色,由于光顾这家连锁店的人是一种比较容易得到的样本(方便样本),不一定能代表该城市其他人的想法.而该城市的调查结果来自于该城市光顾这家连锁店的人,这个样本也不能很好地代表全国民众的观点,从而带来了调查结果的差异.
【补偿训练】
儿童的喂养及辅食添加是影响儿童生长发育、身体健康的重要因素,喂养不当及辅食添加不正确,容易导致儿童贫血及其他疾病,影响儿童生长发育.为了了解某地区农村儿童的喂养、辅食添加情况、发现存在的问题、确定儿童的喂养及辅食添加的促进措施,欲在该地农村进行一次3岁以下儿童的喂养、辅食添加情况和贫血相关因素的调查研究.请给出一个合理的调查方案(该地区共10个县).
【解析】可采用如下抽样:先从该地区10个县中随机抽取4个县,再在随机抽取的各县中随机抽取5个乡(镇),在随机抽取的乡(镇)中再随机抽取5个行政村,在被抽中的行政村中各抽取24户有3岁以下儿童的住户,在样本户的3岁以下儿童中随机抽取1名儿童.当抽样村符合要求的家庭不足24户时,将其全部调查,不够的户在邻村补齐(邻村是指距离最近的非抽样村)(根据实际情况,也可有其他合理的抽样).
1.在一次竞选中,规定一个人获胜的条件是:
(1)在竞选中得票最多;
(2)得票数不低于总票数的一半.如果在计票时,周鹏得票数据丢失,试根据统计数据回答问题:
候选人
赵明
钱红
孙华
李丽
周鹏
得票数
300
100
30
60
x
请问如果周鹏获胜,那么周鹏的得票数x的最小值为______.?
【解析】根据条件,如果周鹏获胜,周鹏的得票数x不低于总票数的一半,即≥?x≥490且x∈N,即周鹏得票数至少为490票.
答案:490
2.下面的问卷是为了调查学生的学习习惯而设计的,你认为这份问卷好不好?为什么?
姓名______________?
性别______________?
年龄______________?
年级______________?
今天晚上你学习了吗?______________?
学了多少?______________?
你对学习效果的评价是:______________?
主要学习什么?______________?
今天晚上吃的什么饭?______________?
【解析】这份问卷的设计不好,首先,从合理性上分析:本次调查的是学生的学习习惯,有些问题与主题无关.如今天晚上吃的什么饭?
其次,设计的问题不好回答,如学了多少?
最后,缺乏逻辑性,前后问题的逻辑性不强.
【拓展延伸】问卷调查的一般步骤
(1)根据问卷主题,确定问题.
(2)精简问题并修改完善问卷.
(3)发放问卷并回收.
(4)对回收的合格答卷进行数据统计,并做出科学分析.
PAGE课时素养评价二 简单随机抽样
(20分钟·35分)
1.简单随机抽样中,某一个体被抽到的可能性
( )
A.与第几次抽样有关,第一次抽到的可能性大一些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽到的可能性要大些
D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不一定
【解析】选B.在简单随机抽样中,每一个个体被抽到的可能性都相等,与第几次抽样无关,故A,C,D不正确,B正确.
2.下列问题中,最适合用简单随机抽样的是
( )
A.某电影院有32排座位,每排有40个座位,座位号是1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检查
C.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人.教育部门为了了解学校机构改革意见,要从中抽取一个容量为20的样本
D.某乡农田有山地8
000亩,丘陵12
000亩,平地24
000亩,洼地4
000亩,现抽取农田480亩估计全乡农田平均产量
【解析】选B.根据简单随机抽样的特点进行判断.选项A的总体容量较大,用简单随机抽样比较麻烦;选项B的总体容量较小,用简单随机抽样比较方便;选项C中,由于学校各类人员对这一问题的看法可能差异很大,不宜采用简单随机抽样;选项D中,总体容量较大,且各类田地的产量差别很大,也不宜采用简单随机抽样.
3.下列抽样试验中,用抽签法方便的是
( )
A.从某厂生产的3
000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的10万件产品中抽取10件进行质量检验
【解析】选B.A总体容量较大,样本容量也较大,不适宜用抽签法;B总体容量较小,样本容量也较小,可用抽签法;C中甲、乙两厂生产的两箱产品有明显区别,不能用抽签法;D总体容量较大,不适宜用抽签法.
4.(2020·徐州高一检测)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取4个个体,选取方法从随机数表的第1行第4列由左到右由上到下开始读取,则选出来的第4个个体的编号为
( )
第1行 78 16 65 71 02 30 60 14 01 02 40 60 90 28 01 98
第2行 32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
A.10
B.01
C.09
D.06
【解析】选C.从随机数表的第1行第4列由左到右开始读取,满足条件的数依次为:10,06,01,09.
5.某种福利彩票的中奖号码是从号码1~36中选出7个号码来确定的,这种从36个号码中选7个号码的抽样方法是________.?
【解析】总体和样本都比较少,首选抽签法.
答案:抽签法
6.为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,如何用简单随机抽样抽取样本?
下面抽取了第5行到9行的随机数表
16
22
77
94
39 49
54
43
54
82 17
37
93
23
78
87
35
20
96
43 84
26
34
91
64(第5行)
84
42
17
53
31 57
24
55
06
88 77
04
74
47
67
21
76
33
50
25 83
92
12
06
76(第6行)
63
01
63
78
59 16
95
55
67
19 98
10
50
71
75
12
86
73
58
07 44
39
52
38
79(第7行)
33
21
12
34
29 78
64
56
07
82 52
42
07
44
38
15
51
00
13
42 99
66
02
79
54(第8行)
57
60
86
32
44 09
47
27
96
54 49
17
46
09
62
90
52
84
77
27 08
02
73
43
28(第9行)
【解析】方法一 (抽签法):
①将这40件产品编号为1,2,…,40;
②做好大小、形状相同的号签,分别写上这40个号码;
③将这些号签放在一个不透明的容器内,搅拌均匀;
④逐个抽取10个号签;
⑤然后对这10个号签对应的产品检验.
方法二 (随机数表法):
①将40件产品编号,可以编为00,01,02,…,38,39;
②在随机数表中任选一个数作为开始,例如从第7行第9列的数5开始;
③从选定的数5开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34,至此,10个样本号码已经取满,于是,所要抽取的样本号码是16,19,10,12,07,39,38,33,21,34.
(30分钟·60分)
一、选择题(每小题5分,共25分)
1.下面抽样方法是简单随机抽样的是
( )
A.从平面直角坐标系中抽取5个点作为样本
B.可口可乐公司从仓库中的1
000箱可乐中一次性抽取20箱进行质量检查
C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动
D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编号)
【解析】选D.A中平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;B中一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;C中50名战士是最优秀的,不符合简单随机抽样的等可能性,故错误.
2.从总数为N的一批零件中抽取一个容量为50的样本,若每个零件被抽取的可能性为25%,则N为
( )
A.150 B.200 C.100 D.120
【解析】选B.因为每个个体被抽到的机会相等,都是=0.25,所以N=200.
3.某社团有男生30名,女生20名,从中抽取一个容量为5的样本,恰好抽到2名男生和3名女生.有以下3种说法:
①该抽样可能是简单随机抽样;
②该抽样中,每个人被抽到的可能性都是;
③该抽样中,男生被抽到的可能性大于女生被抽到的可能性.
其中说法正确的为
( )
A.①②③
B.①②
C.②③
D.①③
【解析】选B.①因为总体个数不多,可以对每个个体进行编号,所以该抽样可能是简单随机抽样,故①正确;
②在随机抽样中,每个人被抽到的可能性都是=,故②正确;
③该抽样中,男生被抽到的可能性为=,女生被抽到的可能性为,故前者小于后者,因此③不正确.
4.(2020·泰安高一检测)某班由50个编号为01,02,03,…,50的学生组成,现在要选取8名学生参加合唱团,选取方法是从随机数表的第1行的第11列开始由左到右依次选取两个数字,则该样本中选出的第8名同学的编号为
( )
49
54
43
54
82
17
37
93
23
78
30
35
20
96
23
84
26
34
91
64
50
25
83
92
12
06
76
57
23
55
06
88
77
04
74
47
67
21
76
33
50
25
83
92
12
06
76
49
54
43
54
82
74
47
A.20
B.25
C.26
D.34
【解析】选D.从随机数表的第1行的第11列开始由左到右依次选取两个数字,选出来的8名学生的编号分别为:17,37,(93舍去)23,(78舍去)30,35,20,(96舍去)(23舍去)(84舍去)26,34,所以样本选出来的第8名同学的编号为34.
5.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性和“第二次被抽到”的可能性分别是
( )
A.,
B.,
C.,
D.,
【解析】选A.简单随机抽样中每个个体被抽取的机会均等,都为.
二、填空题(每个5分,共15分)
6.从10个篮球中任取一个,检查其质量,用随机数法抽取样本,编号如下:
(1)1,2,3,4,5,6,7,8,9,10.
(2)-5,-4,-3,-2,-1,0,1,2,3,4.
(3)10,20,30,40,50,60,70,80,90,100.
(4)0,1,2,3,4,5,6,7,8,9.
其中编号正确的是________(填序号).?
【解析】用随机数法抽样时,编号的位数应相同,并且不能有负数.
答案:(4)
7.假设要抽查某企业生产的某种品牌的袋装牛奶的质量是否达标,现从800袋牛奶中抽取50袋进行检验.利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第3行第1列开始向右读,最先读到的6袋牛奶的编号是614,593,379,242,203,722,请你以此方式继续向右读数,随后读出的2袋牛奶的编号是________、________.(下面摘取了随机数表第1行到第5行)?
78226 85384 40527 48987 60602 16085 29971
61279
43021 92980 27768 26916 27783 84572 78483
39820
61459 39073 79242 20372 21048 87088 34600
74636
63171 58247 12907 50303 28814 40422 97895
61421
42372 53183 51546 90385 12120 64042 51320
22983
【解析】最先读到的6袋牛奶的编号是614,593,379,242,203,722,
向右读下一个数是104,再下一个数是887,887大于799,故舍去,再下一个数是088.
答案:104 088
8.一个布袋中有6个同样质地的小球,从中不放回地抽取3个小球,则某一特定小球被抽到的可能性是________;第三次抽取时,剩余小球中的某一特定小球被抽到的可能性是________.?
【解析】因为简单随机抽样时每个个体被抽到的可能性为=,所以某一特定小球被抽到的可能性是.因为此抽样是不放回抽样,所以第一次抽样时,每个小球被抽到的可能性均为;第二次抽取时,剩余5个小球中每个小球被抽到的可能性均为;第三次抽取时,剩余4个小球中每个小球被抽到的可能性均为.
答案:
三、解答题(每小题10分,共20分)
9.某电视台举行颁奖典礼,邀请20名港台、内地艺人演出,其中从30名内地艺人中随机选出10人,从18名香港艺人中随机挑选6人,从10名台湾艺人中随机挑选4人.试用抽签法确定选中的艺人,并确定他们的表演顺序.
【解析】1,先确定内地艺人:(1)将30名内地艺人从01到30编号,然后用相同的纸条做成30个号签,在每个号签上写上这些编号,然后放入一个不透明小筒中摇匀,从中抽出10个号签,则相应编号的艺人参加演出;(2)运用相同的办法分别从10名台湾艺人中抽取4人,从18名香港艺人中抽取6人;
2,确定演出顺序:确定了演出人员后,再用相同的纸条做成20个号签,上面写上01到20这20个数字,代表演出的顺序,让每个演员抽一张,每人抽到的号签上的数字就是这位演员的演出顺序,再汇总即可.
10.某大学为了支援我国西部教育事业,决定从2020年应届毕业生中报名的18名志愿者当中选取6人组成志愿小组.请用抽签法和随机数法设计抽样方案.
【解析】抽签法:
第一步,将18名志愿者编号,号码为1,2,3,…,18.
第二步,将18个号码分别写在18张形状、大小完全相同的纸条上,并揉成团,制成号签.
第三步,将18个号签放入一个不透明的盒子里,充分搅匀.
第四步,从盒子中逐个抽取6个号签,并记录上面的编号.
第五步,与所得号码对应的志愿者,就是志愿小组的成员.
随机数表法:
第一步,将18名志愿者编号,号码为01,02,03,…,18.
第二步,在随机数表中任选一个数字作为开始数字.
第三步,从已选的这个数字开始,向右读,每次读取两位数字,凡不在01~18中的数,或已读过的数,都跳过去不做记录,依次可得到6个号码.
第四步,与以上号码对应的志愿者,就是志愿小组的成员.
1.从一群游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续游戏.过了一会儿,再从中任取m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为
( )
A. B.k+m-n C. D.不能估计
【解析】选C.设参加游戏的小孩有x人,则=,x=.
2.下列抽取样本时运用了哪种抽样方法?并说明原因.
设一个总体中的个体数N=345,要抽取一个容量为n=15的样本,现采用如下方法:从随机数表中任意选取三列构成三位数字号码,从中依次取出不同的三位数字号码,当数在001~345时,该号码抽入样本;当数在401~745时,则该数减去400的号码抽入样本中,其余的000,346~400,746~999的号码都不要;当某号码已抽入样本中,而再次遇到该号码被抽入样本时,只算一次.
【解析】运用了简单随机抽样中的随机数法.简单随机抽样的要求是给个体编号,逐个不放回抽取,操作的个体数量不宜太多,每个个体被抽取的机会均等,只有符合这些特点才是简单随机抽样.本题虽然取数时,设计了特别的规则,但是从随机数表中任意取数符合简单随机抽样的特点,所以本题运用了简单随机抽样法中的随机数法.
PAGE课时素养评价
三 分层抽样与系统抽样
(20分钟·35分)
1.(2020·怀宁高一检测)现要完成下列3项抽样调查:①从20罐奶粉中抽取4罐进行食品安全卫生检查;②高二年级有2
000名学生,为调查学生的学习情况抽取一个容量为20的样本;③从某社区100
户高收入家庭,270户中等收入家庭,80户低收入家庭中选出45户进行消费水平调查.较为合理的抽样方法是
( )
A.①系统抽样,②简单随机抽样,③分层抽样
B.①简单随机抽样,②分层抽样,③系统抽样
C.①分层抽样,②系统抽样,③简单随机抽样
D.①简单随机抽样,②系统抽样,③分层抽样
【解析】选D.在①中因为个体数量较少,采用简单随机抽样即可;在②中,因为个体数量多,故采用系统抽样较好;在③中,因为高收入家庭,中等收入家庭和低收入家庭的消费水平差异明显,故采用分层抽样较好.
2.在对101个人进行抽样时,先采用抽签法从中剔除一个人,再在剩余的100人中随机抽取10
人,那么下列说法正确的是
( )
A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
B.每个人在整个抽样过程中被抽到的机会均等,因为每个人被剔除的可能性相等,那么,不被剔除的机会也是均等的
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
【解析】选B.由于第一次剔除时采用抽签法,对每个人来说可能性相等,然后随机抽取10人,对每个人的机会也相等,所以总的来说,每个人被抽到的机会是均等的.
3.(2020·沧州高一检测)为调查学生观看电影《我和我的祖国》的情况,采用分层抽样的方法,从某中学3
000人(其中高一年级1
200人,高二年级1
000人,高三年级800人)中抽取n人.已知从高一抽取了18人,则从高二和高三年级共抽取的人数为
( )
A.24
B.27
C.30
D.32
【解析】选B.根据分层抽样的等比例抽样的性质,
设从高二和高三抽取x人,可得=,
解得x=27.
4.有20个同学,编号为1~20,现在从中抽取4人的作文卷进行调查,用系统抽样方法确定所抽的编号为
( )
A.5,10,15,20
B.2,6,10,14
C.2,4,6,8
D.5,8,11,14
【解析】选A.将20个同学分成4个组,每组5个号,间距为5.
5.某单位有职工72人,现需用系统抽样法从中抽取一个样本,若样本容量为n,则不需要剔除个体,若样本容量为n+1,则需剔除2个个体,则n=________.?
【解析】由题意知n为72的约数,n+1为70的约数,其中72的约数有1,2,3,4,6,8,9,12,18,24,36,72,其中加1能被70整除的有1,4,6,9,其中n=1不符合题意,故n=4或6或9.
答案:4或6或9
6.某学校有30个班级,每班50名学生,上级要到学校进行体育达标验收.需要抽取10%的学生进行体育项目的测验.请你制定一个简便易行的抽样方案.(写出实施步骤)
【解析】该校共有1
500名学生,需抽取容量为1
500×10%=150的样本.抽样的实施步骤:
可将每个班的学生按学号分成5段,每段10名学生.用简单随机抽样的方法在1~10中抽取一个起始号码l,则每个班的l,10+l,20+l,30+l,40+l.如果l=6,那么6,16,26,36,46号学生入样.将30个班取出的学生放在一起即组成一个容量为150的样本.
【拓展提升】辨析:简单随机抽样、系统抽样、分层抽样
(1)共同点:都能保证在抽样过程中,每个个体被抽到的概率是相等的,体现了这些抽样方法的客观性和公平性.
(2)联系:简单随机抽样是最简单和最基本的抽样方法,通常用抽签法和随机数法来实现,在进行系统抽样和分层抽样的时候都要用到简单随机抽样的方法.
(3)适用条件:当总体中的个体数较少的时候,常采用简单随机抽样方法;当总体中的个体数较多的时候,常采用系统抽样方法;当已知总体由差异明显的几部分组成的时候,常采用分层抽样方法.
(30分钟·60分)
一、选择题(每小题5分,共25分)
1.问题:①有1
000个乒乓球分别装在3个箱子内,其中红色箱子内有500个,蓝色箱子内有200个,黄色箱子内有300个,现从中抽取一个容量为100的样本;
②从20名学生中选出3名参加座谈会.
方法:Ⅰ.简单随机抽样;Ⅱ分层抽样.其中问题与方法能配对的是
( )
A.①Ⅰ,②Ⅱ
B.①Ⅱ,②Ⅰ
C.①Ⅱ,②Ⅱ
D.①Ⅰ,②Ⅰ
【解析】选B.对于①,由于箱子颜色差异较为明显,可采用分层抽样方法抽取样本;对于②,由于总体容量、样本容量都较小,宜采用简单随机抽样.
2.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n等于
( )
A.54 B.90 C.45 D.126
【解析】选B.依题意得×n=18,解得n=90,即样本容量为90.
3.某学校的教师配置及比例如图所示,为了调查各类教师的薪资状况,现采用分层抽样的方法抽取部分教师进行调查,在抽取的样本中,青年教师有30人,则该样本中的老年教师人数为
( )
A.10
B.12
C.18
D.20
【解析】选B.设样本中的老年教师人数为x人,由分层抽样的特点得:=,所以x=12.
4.(2020·桂林高一检测)高二(1)班有学生52人,现将所有学生随机编号,用系统抽样方法,抽取一个容量为4的样本,已知5号、18号、44号学生在样本中,则样本中还有一个学生的编号是
( )
A.11
B.21
C.31
D.41
【解析】选C.高二(1)班有学生52人,现将所有学生随机编号,用系统抽样方法,
抽取一个容量为4的样本,则抽样间隔f==13,
因为5号、18号、44号学生在样本中,
所以样本中还有一个学生的编号是18+(18-5)=31.
5.经问卷调查,某班学生对摄影分别持“喜欢”“不喜欢”和“一般”三种态度,其中持“一般”态度的比“不喜欢”的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的是5位“喜欢”摄影的同学,1位“不喜欢”摄影的同学和3位持“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班学生人数的一半还多( )
A.2人
B.3人
C.4人
D.5人
【解析】选B.因为分层抽样是按比例抽取,依题意可设对摄影“不喜欢”的有x人,则对摄影“喜欢”的有5x人,持“一般”态度的有3x人,由此可得3x-x=12,x=6.所以全班共有5×6+6+3×6=54(人),故“喜欢”摄影的比全班学生人数的一半还多30-27=3(人).
二、填空题(每题5分,共15分)
6.某公司生产三种型号的轿车,产量分别为1
200辆,6
000辆和2
000辆.为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取的辆数为______、______、________.?
【解析】设三种型号的轿车依次抽取x辆,y辆,z辆,则有解得
答案:
6 30 10
7.(2020·百色高一检测)某同学为了调查支付宝中的75名好友的蚂蚁森林种树情况,对75名好友进行编号,分别为1,2,…,75,采用系统抽样的方法抽取一个容量为5的样本,已知11号,26号,56号,71号好友在样本中,则样本中还有一名好友的编号是________.?
【解析】依题意可知,系统抽样的组距为=15,故抽取的编号为26+15=41.
答案:41
8.一个总体中的100个个体的编号分别为0,1,2,3,…,99,依次将其分成10个小段,段号分别为0,1,2,…,9.现要用系统抽样的方法抽取一个容量为10的样本,规定如果在第0段随机抽取的号码为m,那么依次错位地取出后面各段的号码,即第k段中所抽取的号码的个位数为m+k或m+k-10(1+k≤10),则当m=6时,所抽取的10个号码依次是________.?
【解析】在第0段随机抽取的号码为6,则根据题意得在第1段抽取的号码应是17,第2段抽取的号码应是28,往后类推即可,故各段所抽取的10个号码依次是6,17,28,39,40,51,62,73,84,95.
答案:6,17,28,39,40,51,62,73,84,95
【延伸探究】若把题干中的依次错位地取号码的方法修改为“按分组的间隔抽取其他样本”,则结论如何?
【解析】抽样距为10,第0段随机抽取的号码为6,则其他各段抽取的号码分别是16,26,36,46,56,66,76,86,96,即所抽取的10个号码依次是6,16,26,36,
46,56,66,76,86,96.
【误区警示】在进行系统抽样时,既可以按等距抽样,也可以规定其他方式的抽样.
三、解答题(每小题10分,共20分)
9.某高级中学共有学生3
000名,各年级男、女人数如表:
高一年级
高二年级
高三年级
女生
523
x
y
男生
487
490
z
已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.17.
(1)问高二年级有多少名女生?
(2)现对各年级用分层抽样的方法在全校抽取300名学生,问应在高三年级抽取多少名学生?
【解析】(1)由题意得=0.17,解得x=510.
所以高二年级有510名女生.
(2)高三年级人数为y+z=3
000-(523+487+490+510)=990.
现用分层抽样的方法在全校抽取300名学生,应在高三年级抽取的人数为×990=99(名).
所以在高三年级抽取99名学生.
10.下面给出某村委调查本村各户收入情况所作的抽样,阅读并回答问题:
本村人口:1
200人,户数300,每户平均人口数4人;应抽户数:30户;
抽样间隔:=40;
确定随机数字:取一张人民币,编码的后两位数为12;确定第一样本户:编码的后两位数为12的户为第一样本户;确定第二样本户:12+40=52,52号为第二样本户;…
(1)该村委采用了何种抽样方法?
(2)抽样过程中存在哪些问题,并修改.
(3)何处是用简单随机抽样.
【解析】(1)系统抽样.
(2)本题是对某村各户进行抽样,而不是对某村人口抽样,抽样间隔为=10,其他步骤相应改为确定随机数字:取一张人民币,编码的后两位数为02(或其他00~09中的一个),确定第一样本户:编号为02的户为第一样本户;确定第二样本户:02+10=12,编号为12的户为第二样本户;…
(3)确定随机数字用的是简单随机抽样,取一张人民币,编码的后两位数为02.
1.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.若用分层抽样方法,则40岁以下年龄段应抽取______人.?
【解析】分层抽样时,由于40岁以下年龄段占总数的50%,故容量为40的样本中在40岁以下年龄段中应抽取40×50%=20(人).
答案:20
2.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中的一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.
(1)在游泳组中,试确定青年人、中年人、老年人分别所占的比例.
(2)在游泳组中,试确定青年人、中年人、老年人分别应抽取的人数.
【解析】(1)设登山组人数为x,则总人数为4x,在游泳组中,青年人、中年人、老年人各占比例分别为a,b,c,则有=47.5%,=10%;解得b=50%,c=10%.
故a=100%-50%-10%=40%,即在游泳组中,青年人、中年人、老年人各占比例分别为40%,50%,10%.
(2)因为抽取的是一个容量为200的样本,又登山组的职工占活动总人数的,所以200×=50.故游泳组中应抽取200-50=150(人).
故游泳组中青年人应抽取150×40%=60(人);
中年人应抽取150×50%=75(人);
老年人应抽取150×10%=15(人).
PAGE课时素养评价
四 统
计
图
表
(20分钟·30分)
1.下面哪种统计图没有数据信息的损失,所有的原始数据都可以从该图中得到
( )
A.条形统计图
B.茎叶图
C.扇形统计图
D.折线统计图
【解析】选B.所有的统计图中,仅有茎叶图完好无损地保存着所有的原始数据信息.
2.如图所示是从一批产品中抽样得到的数据的条形统计图,由图可看出数据出现机会最大的范围是
( )
A.(8.1,8.2)
B.(8.2,8.3)
C.(8.4,8.5)
D.(8.6,8.7)
【解析】选C.由题图可以看出数据出现在(8.4,8.5)范围内的机会最大.
3.王明把自己一周的支出情况,用如图所示的统计图来表示,下面说法正确的是
( )
A.从图中可以看出各项消费额占总消费额的百分比
B.从图中可以直接看出具体消费数额
C.从图中可以直接看出总消费数额
D.从图中可以直接看出各项消费额在一周中具体变化情况
【解析】选A.根据扇形统计图只能反映出各部分在总体中所占的百分比,不能得到具体的原始数据和数据的变化情况.
4.2019年上海市居民的支出构成情况如表所示:
食品
衣着
家庭设备用品及服务
医疗保健
交通和通讯
教育文化娱乐服务
居住
杂项商品和服务
39.4%
5.9%
6.2%
7.0%
10.7%
15.9%
11.4%
3.5%
用下列哪种统计图表示上面的数据最合适
( )
A.条形统计图
B.茎叶图
C.扇形统计图
D.折线统计图
【解析】选C.扇形统计图可以将所有的百分比表示得很清楚.
5.甲、乙两个小组各8名同学的英语口语测试成绩的茎叶图如图所示.甲、乙两组的平均成绩分别为________.?
【解析】甲组的总成绩是76+81+82+83+84+86+87+90=669,所以平均成绩是669×=83.625;
乙组的总成绩是74+79+79+80+82+84+89+91=658,所以平均成绩是658×=
82.25.
答案:83.625,82.25
【补偿训练】
某赛季甲、乙两名篮球运动员每场比赛得分原始记录如下:
甲运动员的得分:
13,23,8,26,38,16,33,14,28,39;
乙运动员的得分:
49,24,12,31,50,44,15,25,36,31.
用茎叶图将甲、乙运动员的成绩表示出来.
【解析】制作茎叶图的方法是:将所有的两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.甲、乙运动员的得分茎叶图如图.
6.英才学校四个年级的学生人数分布如扇形图所示,通过对全体学生暑假期间所读课外书情况的调查,制成各年级读书情况的条形图,如图所示.已知英才学校被调查的四个年级共有学生1
500人,则高一年级学生暑假期间共读课外书的本数为________.?
【解析】由扇形图可知,高一学生共有(1-24%-28%-22%)×1
500=26%×1
500=390(人).所以高一年级学生暑假期间共读课外书390×6.2=2
418(本).
答案:2
418
(30分钟·60分)
一、选择题(每小题5分,共25分)
1.高一(1)班在一次考试中统计某道单选题的答题情况如图所示:
根据以上统计信息,下列判断错误的是
( )
A.选A的有8人
B.选B的有4人
C.选C的有25人
D.该班共有50人参加考试
【解析】选C.由条形统计图,可知选D的有10人,
结合扇形统计图可得样本容量为=50,
结合扇形图可知,选A的人数为50×0.16=8人;
选B的人数为50×0.08=4人;选C的人数为50×0.56=28人.
2.某工厂一年中各月份的收入、支出情况的统计如图所示,下列说法中错误的是
( )
A.收入最高值与收入最低值的比是3∶1
B.结余最高的月份是7月份
C.1至2月份的收入的变化率与4至5月份的收入的变化率相同
D.前6个月的平均收入为40万元
【解析】选D.由题图可知收入最高值为90万元,收入最低值为30万元,其比是3∶1,故A项正确;结余最高为7月份,为80-20=60,故B项正确;1至2月份的收入的变化率与4至5月份的收入的变化率相同,故C项正确;前6个月的平均收入为(40+60+30+30+50+60)=45万元,故D项错误.
3.近年来,随着5G网络的普及和智能手机的更新换代,各种方便的APP相继出世,其功能也是五花八门.某大学为了调查在校大学生使用APP的主要用途,随机抽取了56
290名大学生进行调查,各主要用途与对应人数的结果统计如图所示,现有如下说法:
①可以估计使用APP主要听音乐的大学生人数多于主要看社区、新闻、资讯的大学生人数;
②可以估计不足10%的大学生使用APP主要玩游戏;
③可以估计使用APP主要找人聊天的大学生超过总数的.
其中正确的个数为
( )
A.0
B.1
C.2
D.3
【解析】选C.使用APP主要听音乐的人数为5
380,使用APP主要看社区、新闻、资讯的人数为4
450,所以①正确;
使用APP主要玩游戏的人数为8
130,而调查的总人数为56
290,≈0.14,故超过10%的大学生使用APP主要玩游戏,所以②错误;使用APP主要找人聊天的大学生人数为16
540,因为>,所以③正确.
4.图(1)是某品牌汽车2019年月销量统计图,图(2)是该品牌汽车月销量占所属汽车公司当月总销量的份额统计图,则下列说法错误的是
( )
A.该品牌汽车2019年全年销量中1月份月销量最多
B.该品牌汽车2019年上半年的销售淡季是5月份,下半年的销售淡季是10月份
C.2019年该品牌汽车所属公司7月份的汽车销量比8月份多
D.该品牌汽车2019年下半年月销量相对于上半年,波动性小,变化较平稳
【解析】选C.根据图(1)中的条形统计图可知,该品牌汽车2019年全年销量中,1月份月销量最多,A选项正确;该品牌汽车2019年上半年销量最少的月份是5月份,下半年销量最少的月份是10月份,B选项正确;由条形统计图中的波动性可知,该品牌汽车2019年下半年月销量相对于上半年,波动性小,变化较平稳,D选项正确;由图(1)和图(2)可知,该品牌汽车7月份和8月份的销量相等,但该品牌汽车7月份的销量占该品牌汽车所属公司当月总销量的比例较8月份的大,所以2019年该品牌汽车所属公司7月份的汽车销量比8月份少,C选项错误.
5.小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为
( )
A.30%
B.10%
C.3%
D.不能确定
【解析】选C.由题图2知,小波一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%.
二、填空题(每小题5分,共15分)
6.某校高一(1)班有50名学生,综合素质评价“运动与健康”方面的等级统计如图所示,则该班“运动与健康”评价等级为A的人数是________.?
【解析】该班“运动与健康”评价等级为A的人数是:50×38%=19人.
答案:19
7.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图(如图)表示,据此可估计该校上学期200名教师中,使用多媒体进行教学的次数在[15,25)内的人数为________.?
【解析】由茎叶图知,抽取的20名教师中使用多媒体进行教学的次数在[15,25)内的人数为6,频率为,故200名教师中使用多媒体进行教学的次数在[15,25)内的人数为×200=60.
答案:60
8.甲、乙两个小组各10名学生的英语口语测试成绩(单位:分)如下:
甲组:76 90 84 86 81 87 86 82 85 83
乙组:82 84 85 89 79 80 91 89 79 74
成绩更整齐的是________.?
【解析】茎叶图如图所示(中间的茎为十位上的数字):
由茎叶图容易看出甲组的成绩是对称的,叶的分布有集中在茎8上;乙组的成绩也大致对称,叶的分布有集中在茎8上.从叶在茎上的分布情况看,甲组的成绩更整齐一些.
答案:甲
三、解答题(每小题10分,共20分)
9.如图是A,B两所学校艺术节期间收到的各类艺术作品的情况的统计图:
(1)从图中能否看出哪所学校收到的水粉画作品数量多?为什么?
(2)已知A学校收到的剪纸作品比B学校的多20件,收到的书法作品比B学校的少100件,请问这两所学校收到艺术作品的总数分别是多少件?
【解析】(1)不能.因为两所学校收到艺术作品的总数不知道.
(2)设A学校收到艺术作品的总数为x件,B学校收到艺术作品的总数为y件,
则解得
即A学校收到艺术作品的总数为500件,B学校收到艺术作品的总数为600件.
10.贵阳市是我国西部的一个多民族城市,总人口数为370万(2006年普查统计),图1和图2是2006年该城市民族人口统计图,请你根据提供的信息回答下列问题:
(1)2006年贵阳市少数民族总人口数是多少万?
(2)2006年贵阳市总人口数中苗族所占的百分比是多少?
(3)2006年贵阳市参加高考的人数是40
000人,请你估计贵阳市2006年参加高考的少数民族学生的人数.
【解析】(1)因为370×15%=55.5(万人),所以2006年贵阳市少数民族总人口数是55.5万人.
(2)因为55.5×40%=22.2(万人),
所以22.2÷370=0.06=6%,
所以2006年贵阳市总人口数中苗族所占的百分比是6%.
(3)40
000×15%=6
000(人),所以2006年贵阳市参加高考的少数民族学生约为
6
000人.
【补偿训练】
甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别列出甲、乙两人五次的测试成绩;
(2)根据折线统计图,对两人的训练成绩作出评价.
【解析】(1)甲、乙两人五次的测试成绩分别为:
甲:10,13,12,14,16;
乙:13,14,12,12,14.
(2)从折线统计图看,甲的成绩基本呈上升状态,而乙的成绩在12分~14分波动,所以甲的成绩在不断提高,而乙的成绩则无明显的提高.
1.为比较甲、乙两名高二学生的数学素养,对课程标准中规定的数学六大素养进行指标测验(指标值满分为5分,分值高者为优),根据测验情况绘制了如图所示的六大素养指标雷达图,则下面叙述正确的是
( )
A.乙的数据分析素养优于甲
B.乙的数学建模素养优于数学抽象素养
C.甲的六大素养整体水平优于乙
D.甲的六大素养中数据分析最差
【解析】选C.根据雷达图得到如下数据:
数学抽象
逻辑推理
数学建模
直观想象
数学运算
数据分析
甲
4
5
4
5
4
5
乙
3
4
3
3
5
4
2.初中生的视力状况受到全社会的广泛关注.某市有关部门对全市3万名初中生视力状况进行了一次抽样调查,如图是利用所得数据绘制的频数条形统计图(长方形的高表示该组人数),根据图中所提供的信息回答下列问题:
(1)本次调查共抽查了多少名初中生?
(2)这次调查中的样本是什么?
(3)如果视力在4.9~5.1(含4.9,5.1)均属正常,那么全市约有多少名初中生的视力正常?
【解析】(1)共抽查了20+40+90+60+30=240(名)初中生.
(2)样本是240名初中生的视力.
(3)全市约有30
000×=7
500(名)初中生的视力正常.
PAGE课时素养评价
五 平均数、中位数、众数、极差、方差 标准差
(20分钟·35分)
1.近几年,我国农村电子商务发展迅速,使得农副产品能够有效地减少流通环节,降低流通成本,直接提高了农民的收益.某农村电商对一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )
A.46.5,48,60
B.47,48,60
C.46.5,48,55
D.46.5,51,60
【解析】选A.由题中茎叶图共有30个数据,所以中位数为=46.5,
茎叶图中出现次数最多的数是48,故众数是48,图中最大的数是72,最小的是12,可得极差为72-12=60.
2.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是
( )
A.众数
B.平均数
C.中位数 D.标准差
【解析】选D.只有标准差不变,其中众数、平均数和中位数都加2.
3.如图是某次民族运动会上,七位评委为某民族舞蹈节目打出分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为
( )
A.84,4.84
B.84,1.6
C.85,1.6
D.85,4
【解析】选C.由题意知平均分==85,s2=[(84-85)2+
(84-85)2+(84-85)2+(86-85)2+(87-85)2]=×8=1.6.
4.某市教体局将从甲、乙、丙、丁四人中选一人参加全省100米仰泳比赛,现将他们最近集训的10次成绩(单位:秒)的平均数与方差制成如下表格,根据表中数据,应选________选手参加全省的比赛
( )?
甲
乙
丙
丁
平均数
59
57
59
57
方差
12
12
10
10
A.甲 B.乙 C.丙 D.丁
【解析】选D.结合表格数据判断,四人中用时最短,波动性最小的是丁.
5.已知一组数据x1,x2,…,xn的方差为2,若数据ax1+b,ax2+b,…,axn+b(a>0)的方差为8,则a的值为________.?
【解析】因为一组数据x1,x2,…,xn的方差为2,
数据ax1+b,ax2+b,…,axn+b(a>0)的方差为8,
所以2a2=8,由a>0,解得a=2.所以a的值为2.
答案:2
6.某农科所为寻找高产稳定的油菜品种,选了三个不同的油菜品种进行试验,每一品种在五块试验田试种.每块试验田的面积为0.7公顷,产量情况如下表:
品种
各试验田产量(kg)
1
2
3
4
5
1
21.5
20.4
22.0
21.2
19.9
2
21.3
23.6
18.9
21.4
19.8
3
17.8
23.3
21.4
19.1
20.8
试评定哪一品种既高产又稳定.
【解析】=21.0
kg,=21.0
kg,=20.48
kg;=0.572,=2.572,=
3.597
6,所以=>,<<.所以第一个品种既高产又稳定.
【补偿训练】
某校在统计一班级50名学生的数学考试成绩时,将两名学生的成绩统计错了,一个将115分统计为95分,1个将65分统计为85分,若根据统计的数据得出平均分为90分,标准差为5分,则该50名学生实际成绩的平均分及标准差分别为多少?
【解析】设没统计错的数据为x1,x2,…,x48,统计错的两个成绩为x49=95,x50=85,实际成绩为x1,x2,…,x48,t49=115,t50=65,那么,(x1+x2+…+x48+95+85)=90,
所以(x1+x2+…+x48)=90-,
所以=(x1+x2+…+x48+t49+t50)
=(x1+x2+…+x48)+×(115+65)=90-+=90.由=[(x1-90)2+…+(x48-90)2+(95-90)2+(85-90)2].
=[(x1-90)2+…+(x48-90)2+(115-90)2+(65-90)2]得:-=×(252+252-52-52)=×1
200=24,所以=+24=52+24=49,所以s2=7,即该50名学生实际成绩的平均分为90分,标准差为7分.
(30分钟·60分)
一、选择题(每小题5分,共25分)
1.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数和方差分别为
( )
A.5, B.5, C.4, D.4,
【解析】选A.由题意知,-1,0,4,x,7,14的中位数为5,所以×(4+x)=5,解得x=6;
所以这组数据的平均数为=×(-1+0+4+6+7+14)=5,方差为s2=×[(-1-5)2+
(0-5)2+(4-5)2+(6-5)2+(7-5)2+(14-5)2]=.
2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则
( )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
【解析】选C.由条形统计图知:
甲射靶5次的成绩分别为:4,5,6,7,8;
乙射靶5次的成绩分别为:5,5,5,6,9,
所以==6;
==6.
所以=,故A项不正确.
甲的成绩的中位数为6,乙的成绩的中位数为5,故B项不正确.
=[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=×10=2,=[(5-6)2+(5-6)2
+(5-6)2+(6-6)2+(9-6)2]=×12=,因为2<,所以<,故C项正确.甲的成绩的极差为:8-4=4,乙的成绩的极差为:9-5=4,故D项不正确.
3.王明同学随机抽查某市10个小区所得到的绿化率情况如表所示:
小区绿化率(%)
20
25
30
32
小区个数
2
4
3
1
则关于这10个小区绿化率情况,下列说法错误的是
( )
A.方差是13%
B.众数是25%
C.中位数是25%
D.平均数是26.2%
【解析】选A.根据表格数据,众数为25%,选项B正确;中位数为25%,选项C正确;
平均数为=26.2,选项D正确;
方差为[2(20-26.2)2+4(25-26.2)2+3(30-26.2)2+(32-26.2)2]=15.96,选项A错误.
4.(2020·全国卷Ⅲ)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为
( )
A.0.01 B.0.1 C.1 D.10
【解析】选C.因为数据axi+b(i=1,2,…,n)的方差是数据xi(i=1,2,…,n)的方差的a2倍,所以所求数据方差为102×0.01=1.
5.对“小康县”的经济评价标准:①年人均收入不小于7
000元;②年人均食品支出不大于收入的35%.某县有40万人口,年人均收入如表所示,年人均食品支出如图所示.则该县( )
年人均收入(元)
0
2
000
4
000
6
000
8
000
10
000
12
000
16
000
人数(万人)
6
3
5
5
6
7
5
3
A.是小康县
B.达到标准①,未达到标准②,不是小康县
C.达到标准②,未达到标准①,不是小康县
D.两个标准都未达到,不是小康县
【解析】选B.由图表可知年人均收入为(2
000×3+4
000×5+6
000×5+8
000
×6+10
000×7+12
000×5+16
000×3)÷40=7
050(元)>7
000元,达到了标准①;年人均食品支出为(1
400×3+2
000×5+2
400×13+3
000×10+3
600×9)÷40=
2
695(元),则年人均食品支出占收入的×100%≈38.2%>35%,未达到标准②.所以不是小康县.
二、填空题(每小题5分,共15分)
6.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
运动员
第一次
第二次
第三次
第四次
第五次
甲
87
91
90
89
93
乙
89
90
91
88
92
则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.?
【解题指南】利用平均数公式与方差公式求解.
【解析】==90,
==90,
故=[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,
=[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.
答案:2
7.若40个数据的平方和是56,平均数是,则这组数据的方差是________,标准差是________.?
【解析】设这40个数据为xi(i=1,2,…,40),平均数为.则s2=×[(x1-)2+(x2-)2+…+(x40-)2]
=[++…++40-2(x1+x2+…+x40)]=×
=×=0.9.
所以s===.
答案:0.9
8.某老师从星期一到星期五收到的信件数分别是10,6,8,5,6,则该组数据的方差s2=________.?
【解析】==7,
s2=(9+1+1+4+1)=3.2.
答案:3.2
三、解答题(每小题10分,共20分)
9.某车间20名工人年龄数据如表:
(1)求这20名工人年龄的众数与极差;
(2)以十位数为茎,个位数为叶,画出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差.
【解题指南】第(1)问众数和极差可根据概念直接从表里得出,第(2)问茎叶图也容易画出,第(3)问先求平均数,再利用公式求方差.
【解析】(1)这20名工人年龄的众数为30,极差为40-19=21.
(2)这20名工人年龄的茎叶图为:
(3)年龄的平均数==30,
故方差s2=×[(-11)2+3×(-2)2+3×(-1)2+5×02+4×12+3×22+102]=12.6.
10.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的数据如下:
甲
60
80
70
90
70
乙
80
60
70
80
75
问:甲、乙谁的平均成绩较好?谁的各门功课发展较平衡?
【解析】=×(60+80+70+90+70)=74,
=×(80+60+70+80+75)=73,
=×(142+62+42+162+42)=104,
=×(72+132+32+72+22)=56,
因为>,>,
所以甲的平均成绩较好,乙的各门功课发展较平衡.
1.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是
( )
A.甲地:总体平均数为3,中位数为4
B.乙地:中位数为2,众数为3
C.丙地:总体平均数为2,总体方差为3
D.丁地:总体平均数为1,总体方差大于0
【解析】选C.A中,若连续10天数据为0,0,0,0,4,4,4,4,4,10,满足平均数为3,中位数为4,但不符合标志,则A错误;
B中,若连续10天数据为0,0,1,1,2,2,3,3,3,10,满足中位数为2,众数为3,但不符合标志,则B错误;
C中,当总体平均数是2,若有一个数超过7,则方差s2>×=3.6.
因为总体方差为3,所以说明连续10天,每天新增疑似病例不超过7人,则C正确;
D中,若连续10天数据为0,0,0,0,0,0,0,0,0,10,满足总体平均数为1,方差大于0,但不符合标志,则D错误.
2.某校甲班、乙班各有49名学生,两班在一次数学测验中的成绩(满分100分)统计如下表:
班级
平均分
众数
中位数
标准差
甲班
79
70
87
19.8
乙班
79
70
79
5.2
(1)请你对下面的一段话给予简要分析:
甲班的小刚回家对妈妈说:“昨天的数学测验,全班平均79分,得70分的人最多,我得了85分,在班里算是上游了!”
(2)请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议.
【解析】(1)由中位数可知,85分排在第25名之后,从名次上讲,85分不算是上游.但也不能单以名次来判断学习成绩的好坏,小刚得了85分,说明他对这阶段的学习内容掌握较好.
(2)甲班学生成绩的中位数为87分,说明高于或等于87分的学生占一半以上,而平均分为79分,标准差很大,说明低分也多,两极分化严重,建议对学习有困难的同学多给一些帮助;
乙班学生成绩的中位数和平均分均为79分,标准差小,说明学生成绩之间差别较小,成绩很差的学生少,但成绩优异的学生也很少,建议采取措施提高优秀率.
PAGE课时素养评价
六 估计总体的分布
(20分钟·35分)
1.已知样本7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,20,那么这组数据落在[8.5,11.5)内的频率为
( )
A.0.5
B.0.4
C.0.3
D.0.2
【解析】选B.样本的总数为20,数据落在[8.5,11.5)内的个数为8,故所求频率为=0.4.
2.一个容量为80的样本最大值是140,最小值是51,组距为10,则可以分成
( )
A.10组 B.9组 C.8组 D.7组
【解析】选B.组数=极差/组距,本题中的极差=140-51=89,所以组数为8.9≈9.
3.观察新生婴儿的体重(单位:g),其频率分布直方图如图所示,则新生婴儿体重在[2
700,3
000)内的频率为
( )
A.0.001
B.0.1
C.0.03
D.0.3
【解析】选D.由图可知当新生婴儿体重在[2
700,3
000)内时,=0.001,而组距为300,所以频率为0.001×300=0.3.
【误区警示】解答此类题目时,常常把矩形的高误认为频率导致解答错误.
4.下列说法中错误的是
( )
①用样本的频率分布估计总体频率分布时,样本容量越大,所分的组数越多,估计越精确;
②一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n的值为240;
③频率分布直方图中,小矩形的高等于该组的频率;
④将频率分布直方图中小矩形上面一边的一个端点顺次连接起来,就可以得到频率折线图.
A.①③
B.②③
C.②③④
D.①②③④
【解析】选C.大样本往往更接近于总体,所以①正确;②中n=40÷0.125=320,所以②错误;③中频率分布直方图中,小矩形的高等于该小组的,所以③错误;④中应将频率分布直方图中各小矩形上端的中点顺次连接起来得到频率折线图,所以④错误.
5.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.?
【解析】志愿者的总人数为=50,
所以第三组人数为50×0.36×1=18,
所以有疗效的人数为18-6=12.
答案:12
6.某高校在自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下所示.
组号
分组
频数
频率
第1组
[160,165)
5
0.050
第2组
[165,170)
①
0.350
第3组
[170,175)
30
②
第4组
[175,180)
20
0.200
第5组
[180,185]
10
0.100
合计
100
1.000
(1)请先求出频率分布表中①②位置相应的数据,再作出频率分布直方图.
(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3,4,5组中用分层抽样抽取6名学生进入第二轮面试,求第3,4,5组每组各抽取多少名学生进入第二轮面试.
【解题指南】由频率分布表的性质特点易知第2组的频数和第3组的频率,再根据分层抽样的方法计算出各组应抽取的人数.
【解析】(1)由题意可知,第2组的频数为0.350×100=35,第3组的频率为=0.300,
频率分布直方图如下:
(2)因为第3,4,5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,第3组:×6=3(名),第4组:×6=2(名),第5组:×6=1(名),所以第3,4,5组分别抽取3名,2名,1名.
(30分钟·60分)
一、选择题(每小题5分,共25分)
1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为
( )
A.4
B.8
C.12 D.16
【解析】选B.设该组样本频数为n,则=0.25,
所以n=32×=8.
2.在样本的频率分布直方图中,共有9个小长方形,若中间一个长方形的面积等于其他8个小长方形面积的和的,且样本容量为200,则中间一组的频数为
( )
A.0.2
B.0.25
C.40
D.50
【解析】选D.设中间一组的频率为x,则其他8组的频率为1-x,由题意知x=,得x=,所以中间一组的频数为×200=50.
3.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是
( )
【解析】选A.组距为5,故排除C、D,由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、也分别相等,比较四个选项知A正确.
4.对某种电子元件使用寿命跟踪调查得到如图所示的样本频率分布直方图,由图可知一批电子元件中寿命在100~300小时的电子元件的数量与寿命在300~600小时的电子元件的数量比是
( )
A.
B.
C.
D.
【解析】选C.因为“频率之比=数量之比”,所以所求为∶=1∶4.
5.某地区对当地3
000户家庭的2018年所得年收入情况进行调查统计,年收入的频率分布直方图如图所示,数据(单位:千元)的分组依次为[20,40),[40,60),
[60,80),[80,100],则年收入不超过6万的家庭大约为
( )
A.900户
B.600户
C.300户
D.150户
【解析】选A.由频率分布直方图可得,年收入不超过6万的家庭的频率为(0.005+0.010)×20=0.3.
可得年收入不超过6万的家庭大约为3
000×0.3=900户.
二、填空题(每小题5分,共15分)
6.从某小区抽取100户居民进行月用电量调查,发现其用电量的度数在[50,350],频率分布直方图如图所示.
(1)直方图中x的值为________.?
(2)在这些用户中,用电量落在区间[100,250]内的户数为________.?
【解题指南】各小矩形的面积即每小组的频率,面积和为1,矩形的高是频率比组距.
【解析】(1)50x=1-50×(0.001
2+0.002
4×2+0.003
6+0.006
0)=0.22,x=
0.004
4.
(2)100×(0.18+0.3+0.22)=70.
答案:(1)0.004
4 (2)70
7.某乡镇供电所为了调查农村居民用电量情况,随机抽取了500户居民去年的用电量(单位:kW·h),将所得数据整理后,画出频率分布直方图如图.直方图中从左到右前3个小矩形的面积之比为1∶2∶3,该乡镇月均用电量在37~39(kW·h)的居民共有________户.?
【解析】设频率分布直方图中从左到右前3个小矩形的面积分别为P,2P,3P.由频率分布直方图可知,最后两个小矩形的面积之和为(0.087
5+0.037
5)×2=
0.25.因为频率分布直方图中各小矩形的面积之和为1,所以P+2P+3P=0.75,即P=0.125.则2P=0.25,那么可知月均用电量在37~39(kW·h)的居民共有0.25×500=125(户).
答案:125
8.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为________.?
【解析】由题意和直方图知,第一小组和第二小组的人数为:(0.5+1.1)×0.1×100=16(人),
第三小组的人数为:100-16-62=22(人),
则第四小组的人数为:a-22(人),
所以=0.32,解得a=54.
答案:54
三、解答题(每小题10分,共20分)
9.抽查100袋洗衣粉,测得它们的质量如下(单位:g):
494 498 493 505 496 492 485 483
508 511 495 494 483 485 511 493
505 488 501 491 493 509 509 512
484 509 510 495 497 498 504 498
483 510 503 497 502 511 497 500
493 509 510 493 491 497 515 503
515 518 510 514 509 499 493 499
509 492 505 489 494 501 509 498
502 500 508 491 509 509 499 495
493 509 496 509 505 499 486 491
492 496 499 508 485 498 496 495
496 505 499 505 496 501 510 496
487 511 501 496
(1)列出样本的频率分布表;
(2)画出频率分布直方图,频率折线图;
(3)估计质量不足500
g的频率.
【解析】(1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于=8,要分9组,组数合适,于是决定取组距为4,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:
[482.5,486.5),[486.5,490.5),…,[514.5,518.5).
列出频率分布表:
分组
频数
频率
[482.5,486.5)
8
0.08
[486.5,490.5)
3
0.03
[490.5,494.5)
17
0.17
[494.5,498.5)
21
0.21
[498.5,502.5)
14
0.14
[502.5,506.5)
9
0.09
[506.5,510.5)
19
0.19
[510.5,514.5)
6
0.06
[514.5,518.5)
3
0.03
合计
100
1.00
(2)频率分布直方图与频率折线图如图.
(3)设质量不足500
g的频率为b,根据频率分布表得,
≈,故b≈0.54.
因此质量不足500
g的频率约为0.54.
10.为提高全省高中教师的新课程实施能力,全面推进素质教育,山东省对全省高中教师进行了全员网络远程培训.培训结束后,某市为了解参训教师的成绩情况,从本市参加培训的5
000名教师中随机抽取了100名,对他们的成绩(单位:分)进行统计分析,并画出了成绩的频率分布直方图如下.根据频率分布直方图,完成下面问题:
(1)这100名教师培训成绩的中位数应在哪个小组?请说明理由;
(2)如果成绩在300分以上(含300分)者为优秀学员,估计该市优秀学员的人数.
【解析】(1)100个数据的中位数是第50和第51两个数据的平均数,前两个小组的频率和为0.002×100×2=0.4,其频数为0.4×100=40<50,故中位数不在前两个小组;前三个小组的频率之和为(0.002+0.002+0.004)×100=0.8,频数之和为0.8×100=80>50,故中位数应在第三小组.
(2)由频率分布直方图可知,优秀学员的频率为
(0.001+0.001)×100=0.2,所以估计该市优秀学员的人数为5
000×0.2=
1
000(人).
PAGE课时素养评价
七 估计总体的数字特征
(20分钟·35分)
1.样本101,98,102,100,99的标准差为
( )
A.
B.0
C.1
D.2
【解析】选A.样本平均数=100,方差为s2=2,
所以标准差s=.
2.一个容量为40的样本数据依次为x1,x2,…,x40,若这个样本的标准差为s=,记s
=,则s
=
( )
A.2
B.
C.
D.4
【解析】选A.设s
=x.由题意得:=,即=,所以x=2.
3.对某同学的6次数学测试成绩(满分100分)进行统计,作出的茎叶图如图所示,给出关于该同学数学成绩的以下说法:
①中位数为83;②众数为83;③平均数为85;④极差为12.
其中正确说法的序号是
( )
A.①②
B.②③
C.③④
D.②④
【解析】选B.将各数据按从小到大排列为:78,83,83,85,90,91,可见:中位数是=84,①错误,众数是83,②正确,
=85,③正确.
极差是91-78=13,④错误,
所以,只有②③正确.
4.甲乙两名学生六次数学测验成绩(百分制)如图所示.
①甲同学成绩的中位数大于乙同学成绩的中位数;
②甲同学的平均分比乙同学高;
③甲同学的平均分比乙同学低;
④甲同学成绩的方差小于乙同学成绩的方差.
上面说法正确的是
( )
A.③④
B.①②④
C.②④
D.①③
【解析】选A.甲的中位数81,乙的中位数87.5,故①错,排除B,D;甲的平均分=×(76+72+80+82+86+90)=81,乙的平均分′=×(69+78+87+88+92+96)=85,故②错,③对,排除C.
5.《中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精浓度在20~
80
mg/100
mL(不含80)之间,属于酒后驾车;血液酒精浓度在80
mg/100
mL(含80)以上时,属醉酒驾车.据《法制晚报》报道,某年2月15日至2月28日,全国查处酒后驾车和醉酒驾车共28
800人,如图是对这28
800人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为________.?
【解析】(0.01×10+0.005×10)×28
800=4
320(人).
答案:4
320
【补偿训练】
某校从甲、乙两班各随机抽取了5名学生的某课程的学分,用茎叶图表示(如图),s1,s2分别表示甲、乙两班各5名学生学分的标准差,则s1__________s2(填“>”“<”或“=”).?
【解析】由茎叶图可计算得=14,=14,
则s1==,
s2==,所以s1
答案:<
6.为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图.
(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为,,估计-的值.
【解析】(1)设甲校高三年级学生总人数为n.
由题意知=0.05,解得n=600.
样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为1-=.
(2)设甲、乙两校样本平均数分别为′1,′2.
根据样本茎叶图可知30(′1-′2)=30′1-30′2
=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=
15.
因此′-′=0.5,故-的估计值为0.5分.
(30分钟·60分)
一、选择题(每小题5分,共25分)
1.一组数据的平均数、方差分别是,s2,将这组数据中的每一个数都乘以2,得到一组新数据,这组新数据的平均数、方差分别是
( )
A.,s2
B.2,2s2
C.2,4s2
D.,s2
【解析】选C.因为本题中新数据中每一个数都是原数据的2倍,所以新样本中的每一个数据是原样本中每个数据的2倍,所以新样本的平均数是原样本平均数的2倍,方差为原样本方差的4倍.
2.(2020·天津高考)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为
( )
A.10
B.18
C.20
D.36
【解析】选B.根据直方图,直径落在区间[5.43,5.47)内的零件频率为:
(6.25+5.00)×0.02=0.225,则区间[5.43,5.47)内零件的个数为:80×
0.225=18.
3.某校对高二年级进行了一次学业水平模块测试,从该年级学生中随机抽取部分学生,将他们的数学测试成绩分为6组:[40,50),[50,60),[60,70),[70,80),
[80,90),[90,100]加以统计,得到如图所示的频率分布直方图,已知高二年级共有学生600名,若成绩不少于80分的为优秀,据此估计,高二年级在这次测试中数学成绩优秀的学生人数为
( )
A.80
B.90
C.120
D.150
【解析】选D.根据频率分布直方图,得;成绩不少于80分的频率为(0.015+0.010)×10=0.25,
所以估计成绩优秀的学生人数为600×0.25=150.
4.(2020·太原高一检测)随着新政策的实施,海淘免税时代于2016年4月8日正式结束,新政策实施后,海外购物的费用可能会增加.为了解新制度对海淘的影响,某网站调查了喜欢海淘的1
000名网友,其态度共有两类:第一类是会降低海淘数量,共有400人,第二类是不会降低海淘数量,共有600人,若从这1
000人中按照分层抽样的方法抽取10人后进行打分,其打分的茎叶图如图所示,图中有数据缺失,但已知“第一类”和“第二类”网民打分的平均数相等,则“第一类”网民打分的方差为
( )
A.159
B.179
C.189
D.209
【解题指南】根据分层抽样比,可得“第一类”抽取4人,“第二类”抽取6人.由茎叶图可知“第一类”缺失一个数据,设为m,根据平均数相等可求得m,由方差公式即可求得“第一类”的方差.
【解析】选B.抽取的网民中,“第一类”抽取4人,缺失一个数据,设缺失的数据为m,“第二类”抽取6人,则=,解得m=56,其两组数的平均数都是65,
则“第一类”网民打分的方差为:
s2=[2(56-65)2+(60-65)2+(88-65)2]=179.
5.胡萝卜中含有大量的β-胡萝卜素,进入人体消化器官后,可以转化为维生素A,现由a,b两个品种的胡萝卜所含的β-胡萝卜素含量(单位:mg)得到的茎叶图如图所示,则下列说法不正确的是( )
A.<
B.a的方差大于b的方差
C.b品种的众数为3.31
D.a品种的中位数为3.27
【解析】选C.由茎叶图得:b品种所含β-胡萝卜素普遍高于a品种,所以<,故A正确;
a品种的数据波动比b品种的数据波动大,所以a的方差大于b的方差,故B正确;
b品种的众数为3.31与3.41,故C错误;
a品种的数据的中位数为=3.27,故D正确.
二、填空题(每小题5分,共15分)
6.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.?
【解析】因为频率分布直方图中的各个小矩形的面积之和为1,所以有10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.
由频率分布直方图可知在[120,130),[130,140),[140,150]三组内的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为100×10×0.010=10,所以从身高在[140,150]内抽取的学生人数为×10=3.
答案:0.030 3
7.设样本数据x1,x2,…,x10的均值和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为________.?
【解析】样本数据x1,x2,…,x10的均值′=(x1+x2+…+x10)=1,方差s′2=
[(x1-1)2+(x2-1)2+…+(x10-1)2]=4,
新数据x1+a,x2+a,…,x10+a的均值
=(x1+a+x2+a+…+x10+a)=(x1+x2+…+x10)+a=1+a,
新数据x1+a,x2+a,…,x10+a的方差
s2=[(x1+a-1-a)2+(x2+a-1-a)2+…+(x10+a-1-a)2]
=[(x1-1)2+(x2-1)2+…+(x10-1)2]=4.
答案:1+a,4
8.已知样本9,10,11,x,y的平均数是10,方差是2,则xy=________.?
【解析】由平均数公式得=10,
即x+y=20,
=2,即+=8,
即x2+y2-20+200=8,
可得x2+y2=20+8-200=208,
因为202==x2+y2+2xy=208+2xy,解得xy=96.
答案:96
三、解答题(每小题10分,共20分)
9.某校高一学生共有500人,为了了解学生的历史学习情况,随机抽取了50名学生,对他们一年来4次考试的历史平均成绩进行统计,得到不完整的频率分布直方图如图所示,后三组频数成等比数列.
(1)求第五、六组的频数,补全频率分布直方图;
(2)若每组数据用该组区间中点值(例如区间[70,80)的中点值是75)作为代表,试估计该校高一学生历史成绩的平均分.
(3)估计该校高一学生历史成绩在70~100分范围内的人数.
【解析】(1)设第五、六组的频数分别为x,y.
由题设得,第四组的频数是0.024×10×50=12.
则x2=12y.又x+y=50-(0.012+0.016+0.03+0.024)×10×50,即x+y=9,所以x=6,y=3.
补全频率分布直方图如图.
(2)该校高一学生历史成绩的平均分
=(45×0.012+55×0.016+65×0.03+75×0.024+85×0.012+95×0.006)×10=67.6.
(3)该校高一学生历史成绩在70~100分范围内的人数为500×(0.024+
0.012+0.006)×10=210.
10.某校高三文科500名学生参加了3月份的高考模拟考试,学校为了了解高三文科学生的历史、地理学习情况,从500名学生中抽取100名学生的成绩进行统计分析,抽出的100名学生的地理、历史成绩如下表:
地理历史
[80,100]
[60,80)
[40,60)
[80,100]
8
m
9
[60,80)
9
n
9
[40,60)
8
15
7
若历史成绩在[80,100]区间的占30%,
(1)求m,n的值;
(2)请根据上面抽出的100名学生地理、历史成绩,填写地理、历史成绩的频数分布表:
[80,100]
[60,80)
[40,60)
地理
历史
根据频数分布表中的数据估计历史和地理的平均成绩及方差(同一组数据用该组区间的中点值为代表),并估计哪个学科成绩更稳定.
【解析】(1)因为由历史成绩在[80,100]区间的占30%,所以=0.3,得m=13,
所以n=100-8-9-8-15-9-9-7-13=22.
(2)可得:
[80,100]
[60,80)
[40,60)
地理
25
50
25
历史
30
40
30
==70,
=
=200,==70,
==240.
从以上计算数据来看,地理学科的成绩更稳定.
PAGE课时素养评价
八 统计活动:结婚年龄的变化
(20分钟·35分)
1.下列统计活动中,不适宜用问卷调查的方式收集数据的是
( )
A.某停车场中每天停放的蓝色汽车的数量
B.七年级同学家中电视机的数量
C.每天早晨同学们起床的时间
D.各种手机在使用时所产生的辐射
【解析】选D.对于A.停车场中停放的蓝色汽车的数量可以进行统计具体数目,故本选项不符合要求;对于B.七年级同学家中电视机的数量可以进行统计,故本选项不符合要求;对于C.同学们每天起床的时间可以进行统计,故本选项不符合要求;对于D.各种手机在使用时所产生的辐射只能进行估计,故本选项符合要求.
2.为了了解商场某日旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得的数据整理后,画出频率分布直方图如图.已知图中从左至右前3个小组的频率之比为1∶2∶3,第4小组与第5小组的频率分别为0.175和0.075,第2小组的频数为10,则抽取的顾客人数是
( )
A.80 B.40 C.60 D.100
【解题指南】由第4组与第5组的频率和得到前3组的频率和,又根据前3组的频率之比即可得到第2组的频率,结合第2组的频数可得抽取的顾客人数.
【解析】选B.已知第4小组与第5小组的频率分别为0.175和0.075,
所以前3组的频率和为0.75.又因为从左至右前3个小组的频率之比为
1∶2∶3,
所以从左至右第2个小组的频率为0.25.
又频数为10,所以抽取的顾客人数是=40人.
3.用随机数法从100名学生(男生25人)中抽取20人进行评价,某男同学被抽到的概率是
( )
A.
B.
C.
D.
【解析】选C.
从个体数为N=100的总体中抽取一个容量为n=20的样本,每个个体被抽到的概率都是=.
4.为了了解某地区高三学生的身体发育情况,抽查了该地区200名年龄为17~18岁的男生体重(kg),得到频率分布直方图如图:
根据频率分布直方图可得这200名学生中体重在[64.5,76.5](kg)的学生人数是
( )
A.42 B.58 C.84 D.116
【解析】选D.由图可知:64.5~76.5段的频率为1-(0.01+0.03+0.05×2
+0.07)×2=0.58,则频数为200×0.58=116人.
5.某大学对1
000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图如图所示,现规定不低于70分为合格,则合格的人数是________.?
【解析】不低于70分的小矩形有三个,频率之和是(0.035+0.015+0.010)
×10=0.6,所以1
000×0.6=600(人),即合格的人数是600.
答案:600
6.某中学部分学生参加全国高中数学竞赛,取得了优异成绩,指导老师统计了所有参赛同学的成绩(成绩都为整数,试题满分120分),并且绘制了“频数分布图”,请回答:
(1)该中学参加本次数学竞赛的有多少人?
(2)如果90分以上(含90分)获奖,那么获奖率是多少?
(3)这次竞赛成绩的中位数落在哪段内?
(4)图中还提供了其他信息,再写出两条.
【解析】(1)由分布图可知,
4+6+8+7+5+2=32(人).
(2)90分以上(含90分)的人数为7+5+2=14(人),
所以×100%=43.75%.
(3)参赛同学共有32人.按成绩排序后,第16,17个是最中间的两个.而第16个和第17个都落在80~90分之间,
所以这次竞赛成绩的中位数落在80~90分内.
(4)答案不唯一,如①落在80~90分段内的人数最多,有8人;
②参赛同学成绩均不低于60分.
(30分钟·60分)
一、选择题(每小题5分,共25分)
1.下列统计活动中,不适宜用问卷调查的是
( )
A.某中学高一年级一班学生每晚的睡眠时间
B.某校要了解在校教师的年龄状况
C.某市场要了解居民的环保意识
D.了解某地甜瓜的甜度和含水量
【解析】选D.对于A.人数不多,容易调查,因而适宜用问卷调查.
对于B.人数不多,容易调查,结果好统计,因而适宜用问卷调查.
对于C.环保意识可以通过设计问题来调查,因而适宜用问卷调查.
对于D.甜度和含水量不是每个人都可以了解的,因而不适宜用问卷调查,故应选此项.
2.下面是四位同学对他们学习小组将要共同进行的一次统计活动分别设计的活动程序,其中正确的是
( )
【解析】选C.统计调查一般分为以下几步:收集数据、整理数据、描述数据、分析数据.
3.某所学校在一个学期的开支分布的扇形统计图如图1所示,在该学期的水、电、交通开支(单位:万元)如图2所示,则该学期的电费开支占总开支的百分比为( )
A.12.25%
B.11.25%
C.10.25%
D.9.25%
【解析】选B.由图1,图2可知:该学期的电费开支占总开支的百分比为×20%=11.25%.
4.给出如图所示的三幅统计图及四个结论:
①从折线图能看出世界人口的变化情况;
②2050年非洲人口将达到大约15亿;
③2050年亚洲人口比其他各洲人口的总和还要多;
④从1957年到2050年各洲中北美洲人口增长速度最慢.
其中结论正确的有
( )
A.①② B.①③ C.①④ D.②④
【解析】选B.①从折线图中能看出世界人口的变化情况,故①正确;
②从条形图中可得到2050年非洲人口大约将达到20亿,故②错;
③从扇形图中能够明显地得到结论:2050年亚洲人口比其他各洲人口的总和还要多,故③正确;
④由题中三幅统计图并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故④错误.
因此正确的结论有①③.
5.某校为了解高一高二各班体育节的表现情况,统计了高一高二各班的得分情况并绘成如图所示的茎叶图,则下列说法正确的是
( )
A.高一年级得分中位数小于高二年级得分中位数
B.高一年级得分方差大于高二年级得分方差
C.高一年级得分平均数等于高二年级得分平均数
D.高一年级各班级得分最低为34
【解析】选C.高一年级成绩的中位数为=55.5,高二年级成绩的中位数为=52.5,所以A不正确;高一年级各班级得分分布更集中更均匀,故高一年级得分方差小于高二年级得分方差,故B不正确;高一年级得分平均数=55高二年级得分平均数=55,故C正确;高一年级各班级得分的最低分为43,故D不正确.
二、填空题(每小题5分,共15分)
6.某人5次上班途中所花的时间(单位:min)分别为x,y,10,11,9.若这组数据的平均数为10,方差为2,则|x-y|的值为________.?
【解析】由平均数公式,得(x+y+10+11+9)×=10,则x+y=20.又因为方差为2,所以[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]×=2,得x2+y2=208,2xy=192,所以|x-y|===4.
答案:4
7.为了解某县2019年初中毕业生数学质量检测成绩等级的分布情况,随机抽取了该县若干名初中毕业生的数学质量检测成绩,按A,B,C,D四个等级进行统计分析,并绘制了如图所示的统计图:
请根据以上统计图提供的信息,解答下列问题:
(1)本次抽取的学生有________名.?
(2)在抽取的学生中,C级人数所占的百分比是________.?
(3)根据抽样调查结果,2019年该县1
430名初中毕业生数学质量检测成绩为A级的人数为________人.?
【解析】(1)20÷20%=100(名).
(2)×100%=30%.
(3)1
430×20%=286(人).
答案:(1)100 (2)30% (3)286
8.为了开展“家电下乡”活动,政府调查某地区家庭拥有冰箱的情况,从该地区的10万户居民中,随机抽查了96户,这96户拥有冰箱的情况如下:
冰箱
城镇(户)
农村(户)
有
36
42
无
4
14
若该地区城镇与农村住户之比为3∶5,估计该地区家庭中没有冰箱的总户数为__________.?
【解析】样本中农村没有冰箱的比例为P=×100%=25%,城镇中没有冰箱的比例为Q=×100%=10%,则该地区没有冰箱的总户数约为105××25%
+105××10%=15
625+3
750=19
375(户).
答案:19
375
三、解答题(每小题10分,共20分)
9.某网站欲调查网民对当前网页的满意程度,在登录的所有网民中,收回有效帖子共50
000份,其中持各种态度的份数如表所示:
很满意
满意
一般
不满意
10
800
12
400
15
600
11
200
为了了解网民的具体想法和意见,以便决定如何更改才能使网页更完美,打算从中抽选500份,为使样本更具代表性,每类中各应抽选出多少份?并且写出具体操作过程.
【解析】每个个体被抽到的频率是=,
10
800×=108,
12
400×=124,15
600×=156,11
200×=112,每类中各应抽选出有效帖子的份数:很满意的108份,满意的124份,一般的156份,不满意的112份.
在很满意的有效帖子中采用简单随机抽样的方法随机抽取108份,
在满意的有效帖子中采用简单随机抽样的方法随机抽取124份,
在一般的有效帖子中采用简单随机抽样的方法随机抽取156份,
在不满意的有效帖子中采用简单随机抽样的方法随机抽取112份.
10.共享电动单车入住某市一周年以来,因其“绿色出行,低碳环保”的理念而备受人们的喜爱,值此周年之际,某机构为了了解共享电动单车使用者的年龄段、使用频率、满意度等三个方面的信息,在全市范围内发放5
000份调查问卷,回收到有效问卷3
125份,现从中随机抽取80份,分别对使用者的年龄段、26~35岁使用者的使用频率、26~35岁使用者的满意度进行汇总,得到如下三个表格:
使用者年龄段
25岁以下
26~35岁
36~45岁
45岁以上
人数
20
40
10
10
表(一)
使用频率
0~6次/月
7~14次/月
15~22次/月
23~31次/月
人数
5
10
20
5
表(二)
满意度
非常满意(9~10)
满意(8~9)
一般(7~8)
不满意(6~7)
人数
15
10
10
5
表(三)
(1)依据上述表格完成下列三个统计图形:
(2)某城区现有常住人口30万,请用样本估计总体的思想,试估计年龄在26~35岁,每月使用共享电动单车在7~14次的人数.
【解析】(1)
(2)由表(一)可知:年龄在26~35岁的有40人,占总抽取人数的一半,用样本估计总体的思想可知,某城区30万人口中年龄在26~35岁的约有30×=15(万人);
又因为年龄在26~35岁每月使用共享电动单车在7~14次的有10人,占总抽取人数的,
用样本估计总体的思想可知,某城区年龄在26~35岁的15万人中每月使用共享电动单车在7~14次的约有15×=(万人),
所以年龄在26~35岁,每月使用共享电动单车在7~14次的人数约为万人.
1.某次统计活动得到的结论与实际有较大差别,其原因可能是
( )
A.调查方式不科学
B.没有选用合适的分析数据的方法
C.确定的调查对象不合要求
D.以上都有可能
【解析】选D.结论与实际相差较大原因是多方面的,调查方式不科学,没有选用合适的分析数据的方法,确定的调查对象不合要求,这些原因都有可能.
2.某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下:
0~0.5,4;0.5~1,8;1~1.5,15;1.5~2,22;2~2.5,25;2.5~3,14;3~3.5,6;3.5~4,4;4~4.5,2.
(1)列出样本的频率分布表;
(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数;
(3)当地政府制定了人均月用水量为3
t的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?
【解析】(1)频率分布表如表所示:
分组
频数
频率
0~0.5
4
0.04
0.5~1
8
0.08
1~1.5
15
0.15
1.5~2
22
0.22
2~2.5
25
0.25
2.5~3
14
0.14
3~3.5
6
0.06
3.5~4
4
0.04
4~4.5
2
0.02
合计
100
1
(2)频率分布直方图如图:
众数:2.25,中位数:2.02,平均数:2.02.
(3)人均月用水量在3
t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民人均月用水量在3
t以上,88%的居民人均月用水量在3
t以下,因此政府的解释是正确的.
PAGE课时素养评价
九 相 关 性
(20分钟·35分)
1.下列关系中为相关关系的有
( )
①学生的学习态度和学习成绩之间的关系;
②老师的执教水平与学生的学习成绩之间的关系;
③学生的身高与学生的学习成绩之间的关系;
④家庭的经济条件与学生的学习成绩之间的关系.
A.①②
B.①③
C.②③
D.②④
【解析】选A.由相关关系定义可知,①②是相关关系,③④无相关关系.
2.对于给定的两个变量的统计数据,下列说法正确的是
( )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
【解析】选C.给出一组样本数据,总可以作出相应的散点图,但不一定都能分析出两个变量的关系,更不一定具有线性相关或函数关系.
3.在下列各图中,相关关系最强的是
( )
【解析】选A.对于A,图中各点成带状分布,这组变量具有较强的线性相关关系;对于B,C,D,样本点成片状分布,两个变量的线性相关关系相对较弱,或不具有相关关系.
4.下列两个变量之间的关系不是函数关系的是________.?
①圆的周长和它的半径;
②正n边形的边数和内角和;
③人的体重和身高.
【解析】①②均是函数关系,③是相关关系.
答案:③
5.如图所示,表示两个变量不具有相关关系的有________.?
【解析】①是确定的函数关系;
②中的点大致分布在一条直线周围;
③中的点大致分布在一条直线周围;
④中点的分布没有任何规律可言,x,y不具有相关关系.
答案:①④
6.某个男孩的年龄与身高的统计数据如下:
年龄(岁)
1
2
3
4
5
6
身高(cm)
78
87
98
108
115
120
画出散点图,并判断它们是否具有相关关系.
【解析】散点图如下:
由散点图可清楚地看到,在一定的范围内,这个男孩的年龄与身高具有明显的正相关关系,即该男孩的身高随着年龄的增大而增大.
(30分钟·55分)
一、选择题(每小题5分,共20分)
1.下列两个量之间的关系是相关关系的为
( )
A.匀速直线运动的物体的运动时间与位移的关系
B.学生的成绩和体重
C.路上酒后驾驶的人数和交通事故发生的多少
D.水的体积和质量
【解析】选C.A选项,匀速直线运动的物体的运动时间与位移的关系是函数关系;B选项,成绩与体重之间不具有相关性;C选项,路上酒后驾驶的人数和交通事故发生的多少是相关关系;D选项,水的体积与质量是函数关系.
2.某地在国庆节7天假期中的楼房认购量(单位:套)与成交量(单位:套)的折线图如图所示,小明同学根据折线图对这7天的认购量与成交量作出如下判断:
①成交量的中位数为16;
②认购量与日期正相关;
③日成交量超过日平均成交量的有2天,则上述判断中正确的个数为
( )
A.3
B.2
C.1
D.0
【解析】选D.由图可知:成交量由小到大分别为8,13,16,26,32,38,166,中位数为26,①错误;10月1日认购量为223套而10月2日认购量为105套,由此可知认购量与日期不成正相关,故②错误;平均成交量为=,超过平均成交量的只有1天,故③错误.
3.已知x,y是两个变量,下列四个散点图中,x,y具有负相关关系的是
( )
【解析】选C.由图可知C选项中的散点图描述了y随着x的增加而减小的变化趋势.
4.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
月份
1
2
3
4
5
6
人均销售额
6
5
8
3
4
7
利润率(%)
12.6
10.4
18.5
3.0
8.1
16.3
根据表中数据,下列说法正确的是
( )
A.利润率与人均销售额成正比例函数关系
B.利润率与人均销售额成反比例函数关系
C.利润率与人均销售额成正相关关系
D.利润率与人均销售额成负相关关系
【解析】选C.根据题意,画出利润率与人均销售额的散点图,如图所示:
由散点图知,利润率与人均销售额成正相关关系.
二、填空题(每小题5分,共15分)
5.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②实数与数轴上对应点的关系;③小麦的产量与降雨量之间的关系.其中,具有相关关系的是______.(填序号)?
【解析】相关关系是一种不确定性的关系,显然②具有确定性关系.
答案:①③
6.下列两个变量之间的关系,是函数关系的有________.?
①球的体积和它的半径;
②人的血压和体重;
③底面积为定值的长方体的体积和高;
④城镇居民的消费水平和平均工资.
【解析】①③是函数关系,②④关系不确定,是相关关系.
答案:①③
7.某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下表对应数据:
x
10
15
17
20
25
28
32
y
1
1.3
1.8
2
2.6
2.7
3.3
能否判断y与x具有线性相关关系______(填写“能”或“否”),如果y与x具有线性相关关系,那么它们是______(填写“正相关”或“负相关”).?
【解析】利用表中的对应数据,画出散点图如下:
由图可知,所有数据点大致分布在一条直线附近,因此,能够判断y与x之间具有线性相关关系,且为正相关.
答案:能 正相关
三、解答题(每小题10分,共20分)
8.下表是某小卖部6天卖出热茶的杯数与当天气温的对比表:
气温(℃)
25
18
12
10
4
0
杯数
18
30
37
35
50
54
(1)根据表中的数据画出散点图;
(2)你能从散点图中发现气温与卖出的热茶杯数近似成什么关系吗?
【解析】(1)根据表中的数据画出某小卖部6天卖出热茶的杯数与当天气温的散点图,如图:
(2)从散点图上可以看出气温与卖出的热茶杯数近似地成线性关系.说明了当气温越高时,所卖出的热茶的杯数就越少.
9.为了了解人的身高与体重的关系,随机地抽取9名15岁的男生,测得如下数据:
身高/cm
165
157
155
175
168
157
178
160
163
体重/kg
52
44
45
55
54
47
62
50
53
(1)怎样通过身高与体重的具体的数据说明它们不是函数关系?
(2)如果把身高看作横坐标,体重看作纵坐标,在坐标系中画出对应点是怎样的图形?从画出的图形中,你发现了什么规律?
【解析】(1)同一身高157
cm对应着不同的体重44
kg和47
kg,所以体重不是身高的函数.
(2)从图中发现随着身高的增长,体重基本上是呈直线增加的趋势.
1.高一年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,
(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;?
(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.?
【解析】(1)由题图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙.(2)由题图可知,比丙的数学成绩排名还靠前的人比较多;比丙的语文成绩排名还靠前的人数比较少,所以丙的语文成绩的排名更靠前,故填语文.
答案:(1)乙 (2)语文
2.有时候,一些东西吃起来口味越好,对我们的身体越有害,下表给出了不同类型的某种食品的数据.第二行表示此种食品所含热量的百分比,第三行数据表示由一些美食家以百分制给出的对此种食品口味的评价:
品牌
A
B
C
D
E
F
G
H
I
J
所含热量的百分比
25
34
20
19
26
20
19
24
19
13
口味评价
89
89
80
78
75
71
65
62
60
52
(1)作出散点图;
(2)你能从散点图中发现两者之间的近似关系吗?
(3)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系;
(4)对于食品,为什么人们更喜欢吃位于直线上方的食品而不是下方的?
【解析】(1)散点图如图所示.
(2)从图上看基本近似成线性相关关系.
(3)直线如图所示.
(4)因为当直线上方的食品和下方的食品所含热量相同时,直线上方的食品口味更好.
PAGE课时素养评价
十 最小二乘估计
(20分钟·35分)
1.某商品的销售量y(单位:件)与销售价格x(单位:元/件)负相关,则其回归方程可能是
( )
A.y=-10x+200
B.y=10x+200
C.y=-10x-200
D.y=10x-200
【解析】选A.结合图像(图略),知选项B,D为正相关,选项C不符合实际意义,只有选项A正确.
2.已知一组观测值具有线性相关关系,若对于y=bx+a,求得b=0.51,=61.75,
=38.14,则线性回归方程为
( )
A.y=0.51x+6.65
B.y=6.65x+0.51
C.y=0.51x+42.30
D.y=42.30x+0.51
【解析】选A.a=-b=38.14-0.51×61.75≈6.65.
则线性回归方程为y=0.51x+6.65.
3.已知x与y之间的一组数据:
x
0
1
2
3
y
1
3
5
7
若y与x线性相关,则y与x的回归直线y=bx+a必过定点
( )
A.(2,2)
B.(1.5,0)
C.(1,2)
D.(1.5,4)
【解析】选D.因为==1.5,
==4,所以回归直线必过点(1.5,4).
4.某设备使用年限x(年)与所支出的维修费用y(万元)的统计数据(x,y)分别为(2,1.5),(3,4.5),(4,5.5),(5,6.5),由最小二乘法得到线性回归方程为y=1.6x+a,若计划维修费用超过15万元时将该设备报废,则该设备的使用年限为
( )
A.8年
B.9年
C.10年
D.11年
【解析】选D.依题意=3.5,=4.5,(3.5,4.5)在回归直线上,4.5=1.6×
3.5+a,a=-1.1,所以y=1.6x-1.1,
由y=1.6x-1.1>15,得x>10,
估计第11年维修费用超过15万元.
5.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温x(℃)
18
13
10
-1
用电量y(度)
24
34
38
64
由表中数据得回归直线方程y=bx+a中的b值大约为-2,预测当气温为-4
℃时,用电量约为________度.?
【解析】根据题意知==10,
==40.
所以a=40-(-2)×10=60,y=-2x+60.
所以当x=-4时,y=(-2)×(-4)+60=68,
所以用电量约为68度.
答案:68
6.假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知y对x呈线性相关关系.试求:
(1)线性回归方程y=bx+a;
(2)估计使用年限为10年时,维修费用是多少?
【解析】(1)制表如下:
i
1
2
3
4
5
合计
xi
2
3
4
5
6
20
yi
2.2
3.8
5.5
6.5
7.0
25
xiyi
4.4
11.4
22.0
32.5
42.0
112.3
4
9
16
25
36
90
=4,=5,=90,xiyi=112.3
于是有b===1.23.
a=-b=5-1.23×4=0.08.
故线性回归方程是y=1.23x+0.08.
(2)根据线性回归方程是y=1.23x+0.08,
当x=10年时,y=1.23×10+0.08=12.38(万元),
即估计使用年限为10年时,维修费用是12.38万元.
(30分钟·60分)
一、选择题(每小题5分,共25分)
1.已知x与y之间的几组数据如表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是
( )
A.b>b′,a>a′
B.b>b′,aC.ba′
D.b【解题指南】审题时,要注意“直线方程”和“回归直线”的区别.
【解析】选C.过(1,0)和(2,2)的直线方程为y=2x-2,
画出六点的散点图,回归直线的大概位置如图所示,
显然b′>b,a>a′.
2.具有线性相关关系的变量x,y的一组数据如表所示.若根据表中数据得出y与x的线性回归方程为y=3x-1.5,则m的值是
( )
x
0
1
2
3
y
-1
1
m
8
A.4
B.4.5
C.5.5
D.6
【解析】选A.由题意==1.5,==,
所以=3×1.5-1.5,解得m=4.
3.(2020·徐州高一检测)凤鸣山中学的高中女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,3,…n),用最小二乘法近似得到线性回归方程为y=0.85x-85.71,则下列结论中不正确的是
( )
A.y与x具有正线性相关关系
B.回归直线过样本的中心点(,)
C.若该中学某高中女生身高增加1
cm,则其体重约增加0.85
kg
D.若该中学某高中女生身高为160
cm,则可断定其体重必为50.29
kg
【解析】选D.根据线性回归方程y=0.85x-85.71,可知函数图象单调递增,可以判断y与x具有正线性相关关系,所以A选项说法正确;回归直线过样本的中心点(,),所以B选项说法正确;根据斜率得该中学某高中女生身高增加1
cm,则其体重约增加0.85
kg,所以C选项说法正确;该中学某高中女生身高为160
cm,根据线性回归方程只能估计其体重,D选项说“可断定其体重必为50.29
kg”,这种说法错误.
4.已知变量x与变量y的取值如下表所示,且2.5( )
x
2
3
4
5
y
2.5
m
n
6.5
A.y=0.8x+2.3
B.y=2x+0.4
C.y=-1.5x+8
D.y=-1.6x+10
【解析】选A.已知线性回归方程必过(,),=3.5,=×(6.5+m+n+2.5),
又2.55.根据下表中的数据可以得到线性回归直线方程y=0.7x+0.35,则实数m,n应满足
( )
x
3
m
5
6
y
2.5
3
4
n
A.n-0.7m=1.7
B.n-0.7m=1.5
C.n+0.7m=1.7
D.n+0.7m=1.5
【解析】选A.由题意:
=(3+m+5+6)=(14+m),
=(2.5+3+4+n)=(9.5+n),
故(9.5+n)=0.7×(14+m)+0.35,
解得:n-0.7m=1.7.
二、填空题(每小题5分,共15分)
6.某数学老师身高176
cm,他爷爷、父亲和儿子的身高分别是173
cm,170
cm和182
cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为______cm.?
【解析】因为儿子的身高与父亲的身高有关,所以设儿子的身高为y(单位:cm),父亲身高为x(单位:cm),根据数据列表:
x
173
170
176
y
170
176
182
由数据列表,得回归系数b=1,a=3.
于是儿子身高与父亲身高的线性回归方程为y=x+3.
当x=182时,y=185.
故预测该老师的孙子的身高为185
cm.
答案:185
7.以下关于线性回归的判断,正确的有________个.?
①若散点图中所有点都在一条直线附近,则这条直线为回归直线;
②散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;
③已知线性回归方程为y=0.50x-0.81,则x=25时,y的估计值为11.69;
④线性回归方程的意义是它反映了样本整体的变化趋势.
【解析】能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a,b得到的直线y=a+bx才是回归直线,所以①不对;②正确;将x=25代入y=0.50x-0.81,解得y=11.69,所以③正确;④正确.
答案:3
8.某市农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月4日的每天昼夜温度与实验室每天每100颗种子中的发芽数,得到如下数据:
日期
12月1日
12月2日
12月3日
12月4日
温差
11
13
12
8
发芽数(颗)
26
32
26
17
根据表中12月1日至12月3日的数据,求得线性回归方程y=bx+a中的a=-8,则求得的b=________;若用12月4日的数据进行检验,检验方法如下:先用求得的线性回归方程计算发芽数y,再与实际发芽数y作差,若差值的绝对值不超过2颗,则认为得到的线性回归方程是可靠的,则求得的线性回归方程________(填“可靠”或“不可靠”).?
【解析】由题得==12.==28,
所以样本中心点为(12,28),所以28=b×12-8,所以b=3;因为y=3x-8,所以12月4日的估计值为y=3×8-8=16,又|17-16|=1,没有超过2,所以求得的线性回归方程可靠.
答案:3 可靠
三、解答题(每小题10分,共20分)
9.调查某公司的五名推销员,其工作年限与年推销金额如下表:
推销员
A
B
C
D
E
工作年限x(年)
2
3
5
7
8
年推销金额y(万元)
3
3.5
4
6.5
8
(1)在图中画出年推销金额关于工作年限的散点图,并从散点图中发现工作年限与年推销金额之间关系的一般规律.
(2)利用最小二乘法求年推销金额关于工作年限的回归直线方程.
(3)利用(2)中的回归方程,预测工作年限为10年的推销员的年推销金额.
附:b=,a=-b.
【解析】(1)年推销金额关于工作年限的散点图如图:
从散点图可以看出,各点散布在从左下角到右上角的区域里,因此,
工作年限与年推销金额正相关,即工作年限越长,年推销金额越大.
(2)由表中数据可得:
=×(2+3+5+7+8)=5,
=×(3+3.5+4+6.5+8)=5,
b==
=,a=-b=5-×5=,所以年推销金额关于工作年限的回归直线方程为y=x+.
(3)当x=10时,y=×10+=.
所以预测工作年限为10年的推销员的年推销金额为万元.
10.受“非洲猪瘟”的影响,10月份起,某地猪肉的单价随着每周供应量的不足而上涨,
具体情形统计如下表所示:
自受影响后第
x周
1
2
3
4
5
猪肉单价y(元/斤)
16
18.5
20.6
23.7
26.2
(1)求猪肉单价y关于x的线性回归方程y=bx+a;
(2)当地有关部门已于11月初购入进口猪肉,如果猪肉单价超过30元/斤,则释放进口猪肉增加市场供应量以调控猪肉价格,试判断自受影响后第几周开始需要释放进口猪肉?
参考数据:xiyi=340.6,参考公式:b=,a=-b
【解析】(1)==3,
==21.
=12+22+32+42+52=55,xiyi=340.6.
所以b==2.56,
a=21-2.56×3=13.32.故y=2.56x+13.32.
(2)当x=6时,y=28.68,当x=7时,y=31.24,所以应从第7周开始释放进口猪肉.
1.根据如下样本数据得到的线性回归方程y=bx+a,则下列判断正确的是
( )
x
2
3
4
5
6
y
4.0
2.5
-0.5
0.5
-2
A.b<0,0.9b+a=4
B.b>0,4b+a=0.9
C.a<0,0.9b+a=4
D.a>0,4b+a=0.9
【解析】选D.因为随着x增加,y大体减少,所以b<0,因为=
=4,==0.9,所以0.9=4b+a,所以a>0.
2.某地实施乡村振兴战略,对农副产品进行深加工以提高产品附加值,已知某农产品成本为每件3元,加工后的试营销期间,对该产品的价格与销售量统计得到如下数据:
单价x(元)
6
6.2
6.4
6.6
6.8
7
销量y(万件)
80
74
73
70
65
58
数据显示单价x与对应的销量y满足线性相关关系.
(1)求销量y关于单价x的线性回归方程y=bx+a;
(2)根据销量y关于单价x的线性回归方程,要使加工后收益P最大,应将单价定为多少元?
参考公式:b==,a=-b.
【解析】(1)由题意得,=×(6+6.2+6.4+6.6+6.8+7)=6.5,
=×(80+74+73+70+65+58)=70;
则(xi-)=-5-1.2-0.3-0-1.5-6=-14,
=0.25+0.09+0.01+0.01+0.09+0.25=0.7,
所以b==-20,
a=-b=70-×6.5=200,
所以所求线性回归方程为y=-20x+200.
(2)由题意可得,P=y=,
整理得P=-20(x-6.5)2+245,
当x=6.5时,P取得最大值为245.
所以要使收益达到最大,应将单价定为6.5元.
PAGE