5.1.4 用样本估计总体-第1课时 用样本的数字特征估计总体的数字特征(课件 学案 练习)高中数学人教B版(2019)必修 第二册

文档属性

名称 5.1.4 用样本估计总体-第1课时 用样本的数字特征估计总体的数字特征(课件 学案 练习)高中数学人教B版(2019)必修 第二册
格式 zip
文件大小 11.7MB
资源类型 教案
版本资源 人教B版(2019)
科目 数学
更新时间 2025-09-14 20:34:03

文档简介

(共33张PPT)
5.1 统计
5.1.4 用样本估计总体
第1课时 用样本的数字特征估计总体的数字特征
◆ 课前预习
◆ 课中探究
◆ 课堂评价
◆ 备课素材
【学习目标】
1.会用样本的数字特征估计总体的数字特征;
2.会应用相关知识解决实际统计问题.
知识点一 用样本的数字特征估计总体的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反
映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方
差)与总体对应的值相差不会太大.
需要强调的是,估计一般是有误差的.例如,如果总体平均数记为 ,样本均值
记为,一般来说,,, 都有可能.但是,大数定律可以保证,当样
本的容量越来越大时,估计的误差很小的可能性将越来越大.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)样本容量越大,样本平均数越接近总体平均数.( )

(2)样本的数字特征有随机性.( )

[解析] 在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.
知识点二 分层抽样的数字特征
分层抽样的平均数与方差(以分两层抽样的情况为例)
假设第一层有个数,分别为,, ,,平均数为,方差为; 第二层有 个
数,分别为,, ,,平均数为,方差为.则, ,
,.如果记样本均值为,样本方差为 ,则
,
.
探究点一 用样本的数字特征估计总体的数字特征
例1(1) (多选题)为比较甲、乙两地某月14时的气温
情况,随机选取该月中的5天,将这5天中14时的气温数据
(单位: )制成如图所示的茎叶图.用样本估计总体,
下列结论正确的是( )
AD
A.甲地该月14时的平均气温低于乙地该月14时的平均气温
B.甲地该月14时的平均气温高于乙地该月14时的平均气温
C.甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差
D.甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差
[解析] 因为, ,所以
.因为,,所以 ,所以
.故选 .
(2)(多选题)[2024·辽宁葫芦岛高一期末] 某校高
一年级部分学生的一次物理考试成绩的频率分布直方
图如图所示,已知成绩在 内的人数为30,则下
列说法正确的是( )
BD
A. 的值为0.15
B.学生成绩的众数估计为65
C.学生成绩的中位数估计为66.6
D.学生成绩的平均数估计为71
[解析] 对于A, ,解得
,故A错误;
对于B,成绩在 内的频率最大,学生成绩的众数估计为65,故B正确;
对于C,因为 ,所以学生成绩的中位数估计为70,故C错误;
对于D,学生成绩的平均数估计为
,故D正确.故选 .
变式 [2023·上海杨浦中学高一月考] 为创建“全国文明城区”,某市随机抽取了
甲、乙两区,派出一个考核组对这两个区的创建工作进行量化考核.量化考核过
程中,在两个区各随机抽取20个单位量化考核成绩,得到如下数据及如图所示
的频率分布直方图,以此作为依据对甲、乙两个区的工作进行分析.关于甲、乙
两个区的考核成绩,下列结论正确的是( )
A.估计甲区考核成绩的平均数是80
B.甲区考核成绩的众数小于乙区考核成绩的众数
C.甲区的考核成绩比乙区的稳定
D.甲区考核成绩的 分位数是83

[解析] 对于A,甲区考核成绩的平均数
,故估计甲区考核成绩的平均数为 ,A错误;
对于B,由图可知甲区考核成绩的众数为79,乙区考核成绩的众数为 ,
B错误;
对于C,由茎叶图和频率分布直方图可知乙区的考核成绩更集中,故乙区考核成
绩比甲区稳定,C错误;
对于D,因为,所以甲区考核成绩的分位数为 ,D
正确.故选D.
[素养小结]
样本的数字特征分为两大类:一类是反映样本数据集中趋势的特征数,例如平均
数;另一类是反映样本数据波动大小的特征数,例如方差、标准差.通常我们用样
本的平均数和方差来近似代替总体的平均数和方差,从而实现对总体的估计.
探究点二 分层抽样的均值
例2 为了了解某校甲、乙两个班某次数学考试的成绩,用分层抽样的方法从两
个班抽取25人进行成绩统计,得到如下结果.
甲班:46,58,61,64,69,71,72,74,76,77,78,84,84,87,96.
乙班:57,62,65,72,75,77,81,84,84,92.
已知甲、乙两个班共有100人,则估计甲、乙两个班该次数学考试成绩的平均数
约为( )
B
A.73.2 B.73.8 C.74.1 D.74.9
[解析] 由题意可知,从甲班抽取了15人,从乙班抽取了10人.因为甲、乙两个班共有100人,所以甲班有 (人),乙班有 (人).
样本中甲班学生成绩的平均数为

样本中乙班学生成绩的平均数为

可以估计总体平均数为 .故选B.
变式 [2024·重庆八中高一期末] 为迎接冬季长跑比
赛,某校对全体高二学生举行了一次关于冬季长跑相
关知识的测试,统计人员从高二学生中随机抽取100名
学生的成绩作为样本进行统计,测试满分为100分,统
(1)估计这100名学生的平均成绩;
解:由题图可知,这100名学生的平均成绩为
.
计后发现所有学生的测试成绩都在区间 内,并制成如图所示的频率分布
直方图.
(2)若在区间内的学生测试成绩的平均数为74,在区间 内的学
生测试成绩的平均数为89,据此估计在 内的所有学生测试成绩的平均数.
解:在区间 内的学生测试成绩的平均数为74,
在区间的学生频率为 ,
在区间 内的学生测试成绩的平均数为89,
在区间的学生频率为 ,
所以在 内的所有学生测试成绩的平均数为
.
[素养小结]
求分层抽样的均值,有以下两步:(1)确定样本是由几层构成;(2)根据分层抽
样的均值公式求解.
探究点三 分层抽样的方差
例3 在某项活动中,设计了由7位评委打分和8位热心观众打分的环节,经统计
得选手甲的得分情况如下:
平均数 方差
评委打分情况 8.7 0.01
热心观众打分情况 9.0 1.40
(1)计算选手甲得分的平均数;
解:由分层抽样平均数的计算公式知,
选手甲得分的平均数为 .
(2)计算选手甲得分的方差(结果保留两位小数).
解:选手甲得分的方差为
.
变式 在例3的前提下,若评委打分的平均数与热心观众打分的平均数分别按
, 的比例记入选手甲得分的综合平均数.
(1)计算选手甲得分的综合平均数;
解:选手甲得分的综合平均数 .
(2)计算选手甲得分的方差(结果保留两位小数).
解:选手甲得分的方差
.
[素养小结]
求分层抽样的方差,有三步:(1)确定总平均数;(2)确定各层数据的方差;(3)
根据分层抽样的方差公式求出样本数据的方差.
1.某校有两个兴趣小组,甲小组30人,平均年龄为16.5岁,乙小组25人,平均
年龄为17.2岁,则两个小组成员的平均年龄大约为( )
B
A.16岁 B.17岁 C.18岁 D.19岁
[解析] 根据分层抽样平均数的计算公式得平均年龄
.故选B.
2.某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周
的课外锻炼时间(单位: )进行了统计,统计数据如下表所示,据此估计该
校学生一周进行课外锻炼的时间的 分位数是( )
7 8 9 10 11
人数 6 10 9 8 7
B
A.9 B.8.5 C.8 D.7
[解析] 由已知得,从该校抽取的学生人数为 ,
,那么 分位数是第16和第17个数的平均数,第16和第17个数
分别为8,9,所以分位数是 ,所以估计该校学生一周进行课外锻
炼的时间的 分位数是8.5.故选B.
3.高一(1)班某次考试中,30名男生的平均成绩为95分,方差为161,20名女
生的平均成绩为90分,方差为96,则高一(1)班全班同学这次考试成绩的方差
为( )
C
A.135 B.138 C.141 D.146
[解析] 全班同学的平均成绩 ,所以全班同
学考试成绩的方差 .
4.(多选题) [2024·重庆八中高一期末] 某校组织全体
学生参加了主题为“奋斗百年路,启航新征程”的知识竞
赛,随机抽取200名学生的成绩作为样本进行统计,发
现抽取的学生的成绩都在50分至100分之间,进行适当
分组后(每组的取值区间均为左闭右开),画出频率分
布直方图,如图所示,则下列说法正确的是( )
BC
A.成绩在区间 内的学生有46人
B.图中 的值为0.030
C.估计全校学生成绩的中位数约为86.67
D.估计全校学生成绩的 分位数为90
[解析] 对于A,成绩在区间内的学生有 (人),
故A错误;
对于B,由图可知, ,解得
,故B正确;
对于C, ,
,设全校学生成绩的中位数为
,则,解得 ,故C正确;
对于D,设全校学生成绩的分位数为,则 ,解
得,故D错误.故选 .
5.某校有高中生500人,其中男生320人,女生180人.为了获得全体高中生身高
的信息,按照分层抽样的方法抽取样本,男生的样本量为32,女生的样本量为
18,通过计算得男生身高的样本均值为 ,方差为17,女生身高的样本均值
为,方差为 ,则所有数据的样本均值为_______,方差为______.
170.02
43.24
[解析] 所有数据的样本均值为 ,
方差为
.
分层随机抽样的平均数与方差的应用
例 [2023·陕西咸阳实验中学高一月考] 某市
为了了解学生的体能情况,从全市所有高一学
生中按 的比例随机抽取了200人进行一分
钟跳绳测试,将所得数据整理后,分为6组画
出频率分布直方图(如图所示),由于操作失
误,第一组和第二组的数据丢失,但知道第二
组的频率是第一组的2倍.
(1)求和 的值.
解:由题意得
解得
(2)若次数在120以上(含120次)为优秀,试估计全市高一学生的优秀率是多
少?全市高一学生中优秀学生的人数约为多少?
解:由图可知,优秀率为 ,
所以全市高一学生中优秀学生的人数约为 .
(3)估计全市高一学生跳绳次数的中位数和平均数.
解:前三组的频率和为 ,
则中位数约为 .
平均数约为5.1.4 用样本估计总体
第1课时 用样本的数字特征估计总体的数字特征
【课前预习】
知识点一
诊断分析
(1)√ (2)√ [解析] (2)在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.
【课中探究】
例1 (1)AD (2)BD [解析] (1)因为==29,==30,所以<.因为==,==2,所以>,所以s甲>s乙.故选AD.
(2)对于A,(0.005+0.010+2a+0.025+0.030)×10=1,解得a=0.015,故A错误;对于B,成绩在(60,70]内的频率最大,学生成绩的众数估计为65,故B正确;对于C,因为(0.005+0.015+0.030)×10=0.5,所以学生成绩的中位数估计为70,故C错误;对于D,学生成绩的平均数估计为(45×0.005+55×0.015+65×0.030+75×0.025+85×0.015+95×0.010)×10=71,故D正确.故选BD.
变式 D [解析] 对于A,甲区考核成绩的平均数=(57×2+58+59+67+68×2+69×2+79×6+87+88×2+89+98)÷20=74.8,故估计甲区考核成绩的平均数为74.8,A错误;
对于B,由图可知甲区考核成绩的众数为79,乙区考核成绩的众数为=75,B错误;
对于C,由茎叶图和频率分布直方图可知乙区的考核成绩更集中,故乙区考核成绩比甲区稳定,C错误;
对于D,因为75%×20=15,所以甲区考核成绩的75%分位数为=83,D正确.故选D.
例2 B [解析] 由题意可知,从甲班抽取了15人,从乙班抽取了10人.
因为甲、乙两个班共有100人,所以甲班有100×=60(人),乙班有100×=40(人).
样本中甲班学生成绩的平均数为×(46+58+61+64+69+71+72+74+76+77+78+84+84+87+96)=,
样本中乙班学生成绩的平均数为×(57+62+65+72+75+77+81+84+84+92)=74.9,
可以估计总体平均数为=73.84≈73.8.故选B.
变式 解:(1)由题图可知,这100名学生的平均成绩为10×(45×0.005+55×0.020+65×0.025+75×0.030+85×0.015+95×0.005)=69.5.
(2)在区间[70,80)内的学生测试成绩的平均数为74,
在区间[70,80)的学生频率为0.030×10=0.3,
在区间[80,100]内的学生测试成绩的平均数为89,
在区间[80,100]的学生频率为(0.015+0.005)×10=0.2,
所以在[70,100]内的所有学生测试成绩的平均数为74×+89×=80.
例3 解:(1)由分层抽样平均数的计算公式知,
选手甲得分的平均数为×(7×8.7+8×9.0)=8.86.
(2)选手甲得分的方差为×[0.01+(8.7-8.86)2]+×[1.40+(9.0-8.86)2]≈0.77.
变式 解:(1)选手甲得分的综合平均数=8.7×70%+9.0×30%=8.79.
(2)选手甲得分的方差=×[0.01+(8.7-8.79)2]+×[1.40+(9.0-8.79)2]≈0.78.
【课堂评价】
1.B [解析] 根据分层抽样平均数的计算公式得平均年龄=×(30×16.5+25×17.2)≈17.故选B.
2.B [解析] 由已知得,从该校抽取的学生人数为6+10+9+8+7=40,40×40%=16,那么40%分位数是第16和第17个数的平均数,第16和第17个数分别为8,9,所以40%分位数是=8.5,所以估计该校学生一周进行课外锻炼的时间的40%分位数是8.5.故选B.
3.C [解析] 全班同学的平均成绩=×(30×95+20×90)=93,所以全班同学考试成绩的方差s2=×[161+(95-93)2]+×[96+(90-93)2]=141.
4.BC [解析] 对于A,成绩在区间[90,100)内的学生有200×(0.040×10)=80(人),故A错误;对于B,由图可知,10×(0.005+0.010+0.015+x+0.040)=1,解得x=0.030,故B正确;对于C,10×(0.005+0.010+0.015)=0.3,10×(0.005+0.010+0.015+0.030)=0.6,设全校学生成绩的中位数为a(805.170.02 43.24 [解析] 所有数据的样本均值为×173.5+×163.83≈170.02,
方差为×[17+(173.5-170.02)2]+×[30.03+(163.83-170.02)2]≈43.24.5.1.4 用样本估计总体
第1课时 用样本的数字特征估计总体的数字特征
【学习目标】
1.会用样本的数字特征估计总体的数字特征;
2.会应用相关知识解决实际统计问题.
◆ 知识点一 用样本的数字特征估计总体的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.
需要强调的是,估计一般是有误差的.例如,如果总体平均数记为μ,样本均值记为,一般来说,μ>,μ=,μ<都有可能.但是,大数定律可以保证,当样本的容量越来越大时,估计的误差很小的可能性将越来越大.
【诊断分析】 判断正误.(请在括号中打“√”或“×”)
(1)样本容量越大,样本平均数越接近总体平均数.(  )
(2)样本的数字特征有随机性. (  )
◆ 知识点二 分层抽样的数字特征
分层抽样的平均数与方差(以分两层抽样的情况为例):
假设第一层有m个数,分别为x1,x2,…,xm,平均数为,方差为s2; 第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为t2.                 
◆ 探究点一 用样本的数字特征估计总体的数字特征
例1 (1)(多选题)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.用样本估计总体,下列结论正确的是(  )
A.甲地该月14时的平均气温低于乙地该月14时的平均气温
B.甲地该月14时的平均气温高于乙地该月14时的平均气温
C.甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差
D.甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差
(2)(多选题)[2024·辽宁葫芦岛高一期末] 某校高一年级部分学生的一次物理考试成绩的频率分布直方图如图所示,已知成绩在(80,90]内的人数为30,则下列说法正确的是 (  )
A.a的值为0.15
B.学生成绩的众数估计为65
C.学生成绩的中位数估计为66.6
D.学生成绩的平均数估计为71
变式 [2023·上海杨浦中学高一月考] 为创建“全国文明城区”,某市随机抽取了甲、乙两区,派出一个考核组对这两个区的创建工作进行量化考核.量化考核过程中,在两个区各随机抽取20个单位量化考核成绩,得到如下数据及如图所示的频率分布直方图,以此作为依据对甲、乙两个区的工作进行分析.关于甲、乙两个区的考核成绩,下列结论正确的是 (  )
A.估计甲区考核成绩的平均数是80
B.甲区考核成绩的众数小于乙区考核成绩的众数
C.甲区的考核成绩比乙区的稳定
D.甲区考核成绩的75%分位数是83
[素养小结]
样本的数字特征分为两大类:一类是反映样本数据集中趋势的特征数,例如平均数;另一类是反映样本数据波动大小的特征数,例如方差、标准差.通常我们用样本的平均数和方差来近似代替总体的平均数和方差,从而实现对总体的估计.
◆ 探究点二 分层抽样的均值
例2 为了了解某校甲、乙两个班某次数学考试的成绩,用分层抽样的方法从两个班抽取25人进行成绩统计,得到如下结果.
甲班:46,58,61,64,69,71,72,74,76,77,78,84,84,87,96.
乙班:57,62,65,72,75,77,81,84,84,92.
已知甲、乙两个班共有100人,则估计甲、乙两个班该次数学考试成绩的平均数约为 (  )
A.73.2 B.73.8
C.74.1 D.74.9
变式 [2024·重庆八中高一期末] 为迎接冬季长跑比赛,某校对全体高二学生举行了一次关于冬季长跑相关知识的测试,统计人员从高二学生中随机抽取100名学生的成绩作为样本进行统计,测试满分为100分,统计后发现所有学生的测试成绩都在区间[40,100]内,并制成如图所示的频率分布直方图.
(1)估计这100名学生的平均成绩;
(2)若在区间[70,80)内的学生测试成绩的平均数为74,在区间[80,100]内的学生测试成绩的平均数为89,据此估计在[70,100]内的所有学生测试成绩的平均数.
[素养小结]
求分层抽样的均值,有以下两步:(1)确定样本是由几层构成;(2)根据分层抽样的均值公式求解.
◆ 探究点三 分层抽样的方差
例3 在某项活动中,设计了由7位评委打分和8位热心观众打分的环节,经统计得选手甲的得分情况如下:
平均数 方差
评委打分情况 8.7 0.01
热心观众打分情况 9.0 1.40
(1)计算选手甲得分的平均数;
(2)计算选手甲得分的方差(结果保留两位小数).
变式 在例3的前提下,若评委打分的平均数与热心观众打分的平均数分别按70%,30%的比例记入选手甲得分的综合平均数.
(1)计算选手甲得分的综合平均数;
(2)计算选手甲得分的方差(结果保留两位小数).
[素养小结]
求分层抽样的方差,有三步:(1)确定总平均数;(2)确定各层数据的方差;(3)根据分层抽样的方差公式求出样本数据的方差.
1.某校有两个兴趣小组,甲小组30人,平均年龄为16.5岁,乙小组25人,平均年龄为17.2岁,则两个小组成员的平均年龄大约为 (  )
A.16岁 B.17岁
C.18岁 D.19岁
2.某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间(单位:h)进行了统计,统计数据如下表所示,据此估计该校学生一周进行课外锻炼的时间的40%分位数是 (  )
锻炼时间/h 7 8 9 10 11
人数 6 10 9 8 7
A.9 B.8.5
C.8 D.7
3.高一(1)班某次考试中,30名男生的平均成绩为95分,方差为161,20名女生的平均成绩为90分,方差为96,则高一(1)班全班同学这次考试成绩的方差为 (  )
A.135 B.138
C.141 D.146
4.(多选题) [2024·重庆八中高一期末] 某校组织全体学生参加了主题为“奋斗百年路,启航新征程”的知识竞赛,随机抽取200名学生的成绩作为样本进行统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组的取值区间均为左闭右开),画出频率分布直方图,如图所示,则下列说法正确的是 (  )
A.成绩在区间[90,100)内的学生有46人
B.图中x的值为0.030
C.估计全校学生成绩的中位数约为86.67
D.估计全校学生成绩的80%分位数为90
5.某校有高中生500人,其中男生320人,女生180人.为了获得全体高中生身高的信息,按照分层抽样的方法抽取样本,男生的样本量为32,女生的样本量为18,通过计算得男生身高的样本均值为173.5,方差为17,女生身高的样本均值为163.83,方差为30.03,则所有数据的样本均值为    ,方差为    . 5.1.4 用样本估计总体
第1课时 用样本的数字特征估计总体的数字特征
1.B [解析] 这位同学该科目的最终成绩为80×20%+90×30%+95×50%=90.5(分).
2.A [解析] 由茎叶图得a==75,b==76,则a3.D [解析] 因为抽样比例为,所以样本中男生有30×=12(人),女生有20×=8(人),所以样本的平均身高为=,由此估计该班全体学生的平均身高约为.故选D.
4.D [解析] 对于A,该地初一年级学生做作业的时间超过3小时的概率估计为(0.3+0.2+0.1+0.1)×0.5=0.35=35%,故A中结论正确.对于B,该地初一年级学生做作业的时间超过2小时的概率估计为(0.5+0.4+0.3+0.2+0.1+0.1)×0.5=0.8,所以估计该地初一年级有一半以上的学生做作业的时间超过2小时,故B中结论正确.对于C,该地初一年级学生做作业的时间超过4小时的概率估计为(0.1+0.1)×0.5=0.1=10%,故C中结论正确.对于D,该地初一年级学生做作业的时间在2小时至3小时之间的概率估计为(0.5+0.4)×0.5=0.45,所以估计该地初一年级没有一半以上的学生做作业的时间在2小时至3小时之间,故D中结论错误.故选D.
5.D [解析] M=×[24+(15-12)2]+×[29+(10-12)2]=33.
6.C [解析] 根据题意,估计甲厂所生产的袋装食品的质量的平均数=×(5×7+5×8+5×9+5×10)=8.5,方差=×[5×(7-8.5)2+5×(8-8.5)2+5×(9-8.5)2+5×(10-8.5)2]=1.25;乙厂所生产的袋装食品的质量的平均数=×(4×7+6×8+6×9+4×10)=8.5,方差=×[4×(7-8.5)2+6×(8-8.5)2+6×(9-8.5)2+4×(10-8.5)2]=1.05;丙厂所生产的袋装食品的质量的平均数=×(6×7+4×8+4×9+6×10)=8.5,方差=×[6×(7-8.5)2+4×(8-8.5)2+4×(9-8.5)2+6×(10-8.5)2]=1.45.因为>>,所以s3>s1>s2,故选C.
7.A [解析] 由已知得,中位数为=99.5,故A中说法错误;因为120×0.75=90,第90,91个数据分别为120,120,=120,所以居民用电量在第一阶梯的范围为(0,120],故B中说法正确;因为120×0.95=114,第114,115个数据分别为135,135,=135,所以居民用电量在第二阶梯的范围为(120,135],故D中说法正确;居民用电量在第三阶梯的范围为(135,+∞),故C中说法正确.故选A.
8.ACD [解析] 对于A,图②中5月份有AQI值超过200的异常值,故A正确;对于B,C,图②中5月份的箱体高度比6月份的箱体高度小,说明5月的AQI比6月的AQI集中,故B错误,C正确;对于D,虽然5月有严重污染天气,但从图②中5月份箱体整体上比6月份箱体偏下且箱体高度小,AQI整体集中于较小值,说明从整体上看,该地区2023年5月的空气质量略好于6月,故D正确.故选ACD.
9.BCD [解析] 对于A,由=+=+,可得(-)=0,则=或m=n,故A不正确.对于B,因为=+,所以-=(-),若>,则<,故B正确.对于C,因为=,所以=+=,因为s2=故选BCD.
10.156 [解析] 根据题意,估计该校初一年级学生的平均身高为=156(cm).
11.甲 [解析] ∵=9.00,=×0.34≈0.057,=9.00,=×1.04≈0.173,<,∴甲的技术更稳定.
12.5.7% [解析] 该地拥有2套或2套以上住房的家庭估计有99 000×+1000×=5700(户),则该地拥有2套或2套以上住房的家庭所占比例的合理估计为×100%=5.7%.
13.解:(1)∵0.04+0.14+10a+0.22+0.20+10a+0.08=1,∴a=0.016.
估计调查的500位同学中每天户外锻炼时长在40 min~70 min的人数为500×(0.20+0.16+0.08)=220.
(2)高一年级同学每天进行户外锻炼的平均时长估计为5×0.04+15×0.14+25×0.16+35×0.22+45×0.20+55×0.16+65×0.08=37(min).
(3)∵0.04+0.14+0.16+0.22=0.56,0.04+0.14+0.16+0.22+0.20=0.76,
∴高一年级同学每天进行户外锻炼的时长的75%分位数在(40,50]之间.
设高一年级同学每天进行户外锻炼的时长的75%分位数为x,
则0.56+0.020(x-40)=0.75,解得x=49.5.
14.解:(1)抽样比为=,
则样本中男生的人数为900×=45,女生的人数为(1500-900)×=30.
(2)抽取的样本中男生坐位体前屈成绩的平均数=13.2,方差=13.36,
抽取的样本中女生坐位体前屈成绩的平均数=15.2,方差=17.56,
则总体样本的平均数=×(45×13.2+30×15.2)=14,
总体样本的方差s2=×{45×[13.36+(13.2-14)2]+30×[17.56+(15.2-14)2]}=×(630+570)=16.
估计全体学生的坐位体前屈成绩的方差为16.5.1.4 用样本估计总体
第1课时 用样本的数字特征估计总体的数字特征
一、选择题
1.一位同学某一科的考试成绩(单位:分)为:单元测验80,期中成绩90,期末成绩95.学校规定的最终成绩的计算方式是:单元测验占20%,期中成绩占30%,期末成绩占50%.则这位同学该科目的最终成绩是 (  )
A.92分 B.90.5分
C.90分 D.88.5分
2.为全面地了解学生对任课教师教学的满意程度,特在某班开展教学调查.采用简单随机抽样的方法,从该班抽取20名学生,根据他们对语文、数学教师教学的满意度评分(百分制),绘制出茎叶图(如图所示).设该班学生对语文、
数学教师教学的满意度评分的中位数的估计值分别为a,b,则(  )
A.ab
C.a=b D.无法确定
3.某中学高二(1)班共有50名学生,其中男生30名,女生20名,采用分层抽样的方法,从全班学生中抽取20人测量其身高.已知在抽取的样本中,男生的平均身高为a,女生的平均身高为b,由此估计该班全体学生的平均身高约为 (  )
A. B.
C. D.
4.[2024·陕西咸阳实验中学高一月考] 某地教育局为了解“双减”政策的落实情况,在辖区内初一年级在校学生中抽取了100名学生,调查了他们做作业的时间,得到如图所示的频率分布直方图,则下列结论不正确的是 (  )
A.该地初一年级学生做作业的时间超过3小时的概率估计为35%
B.估计该地初一年级有一半以上的学生做作业的时间超过2小时
C.估计该地初一年级有10%的学生做作业的时间超过4小时
D.估计该地初一年级有一半以上的学生做作业的时间在2小时至3小时之间
5.下表为某同学统计并计算得出的一些数据:
数据 平均数 方差 总平均数 总方差
A组(10个数据) 15 24 12 M
B组(15个数据) 10 29
总方差一栏M处的数据应为 (  )
A.26 B.28 C.30 D.33
6.对甲厂、乙厂、丙厂所生产的袋装食品各抽检20袋,称其质量(单位:kg),得到如图所示的统计图.
甲厂、乙厂、丙厂所生产的袋装食品的质量的标准差分别用s1,s2,s3表示,用样本估计总体,则(  )
A.s2>s1>s3 B.s1>s3>s2
C.s3>s1>s2 D.s3>s2>s1
7.为了解某市家庭用电量的情况,该市统计局调查了120户居民去年一年的月均用电量(单位:kW·h),数据从小到大排序如下表.为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯电价,使75%的居民用电量在第一阶梯内,20%的居民用电量在第二阶梯内,其余5%的居民用电量在第三阶梯内,则下列说法不正确的是 (  )
8 18 22 31 42 48 49 50 51 56 57 57 60 61 61
61 62 62 63 63 65 66 67 69 70 70 71 72 72 74
76 77 77 78 78 80 80 82 82 82 83 84 84 88 88
89 90 91 93 93 94 95 96 96 96 97 98 98 98 99
100 100 100 101 101 101 105 106 106 106 107 107 107 107 108
108 109 109 110 110 110 111 112 113 113 114 115 116 118 120
120 120 121 123 124 127 127 127 130 130 130 131 131 132 132
132 133 133 134 134 134 135 135 135 135 136 137 137 138 139
A.该市居民用电量的中位数为99
B.估计该市居民用电量在(0,120]为第一阶梯
C.估计该市居民在第三阶梯用电量不少于135 kW·h
D.若该市某家庭用电量为123 kW·h,则估计该家庭将按第二阶梯电价缴费
8.(多选题)箱线图是用来表示一组或多组数据分布情况的统计图,因形似箱子而得名.在箱线图中(如图①),箱体中部的粗实线表示中位数;中间箱体的上、下底分别是数据的第三四分位数(75%分位数)和第一四分位数(25%分位数);整个箱体的高度为四分位距,位于最下面和最上面的实横线分别表示最小值和最大值(有时候箱子外部会有一些点,它们是数据中的异常值).图②为某地区2023年5月和6月的空气质量指数(AQI)箱线图.AQI越小,空气质量越好;AQI超过200,说明污染严重.据此估计 (  )
A.该地区2023年5月有严重污染天气
B.该地区2023年6月的AQI比5月的AQI集中
C.该地区2023年5月的AQI比6月的AQI集中
D.从整体上看,该地区2023年5月的空气质量略好于6月
9.(多选题)记男生样本x1,x2,…,xm的平均数为,方差为;女生样本y1,y2,…,yn的平均数为,方差为;男女总样本x1,x2,…,xm,y1,y2,…,yn的平均数为,方差为s2.则下列说法正确的是 (  )
A.若=(+),则=
B.若>,则<
C.若=,=,则s2=
D.s2=[+]+[+(-)2]
二、填空题
10.某校为了解初一年级学生的平均身高,按分层抽样的方法抽取了150名男生,100名女生,他们的平均身高分别为160 cm和150 cm,则估计该校初一年级学生的平均身高为     cm.
11.从甲、乙两人手工制作的产品中各自随机抽取6件,测得其直径(单位:cm)如下:
甲:9.00,9.20,9.00,8.50,9.10,9.20;
乙:8.90,9.60,9.50,8.50,8.60,8.90.
据以上数据估计两人技术的稳定性,可知技术更稳定的是    .
12.某地有居民100 000户,其中普通收入家庭99 000户,高收入家庭1000户.用简单随机抽样的方法从普通收入家庭中抽取990户,高收入家庭中抽取100户进行调查.调查发现共有120户家庭拥有2套或2套以上住房,其中普通收入家庭50户,高收入家庭70户,依据这些数据并结合所掌握的统计知识,你认为该地拥有2套或2套以上住房的家庭所占比例的合理估计是    .
三、解答题
13.[2024·江西吉安高一期末] 为了解同学们每天进行户外锻炼的时长,某兴趣小组在高一年级随机调查了500位同学,得到如图所示的频率分布直方图.
(1)求a的值,并估计调查的500位同学中每天户外锻炼时长在40 min~70 min的人数;
(2)用样本估计总体,估计高一年级同学每天进行户外锻炼的平均时长(同一组中的数据用该组区间的中点值为代表);
(3)求高一年级同学每天进行户外锻炼的时长的75%分位数.
14.某学校对在校1500名学生进行了一次坐位体前屈测试,按学生性别采用分层抽样的方法抽取75人,已知这1500名学生中男生有900人,且抽取的样本中男生坐位体前屈成绩的平均数和方差分别为13.2和13.36,女生坐位体前屈成绩的平均数和方差分别为15.2和17.56.
(1)求样本中男生和女生的人数;
(2)求抽取的总样本的平均数,并估计全体学生的坐位体前屈成绩的方差.