(共41张PPT)
第 1 页:封面
标题:28.2 用样本估计总体
副标题:从样本数据到总体特征的科学推断
落款:初中数学教研组
第 2 页:学习目标与知识衔接
一、学习目标
理解用样本估计总体的数学依据(样本的代表性与随机性),明确估计的核心逻辑
掌握用样本均值估计总体均值、用样本比例估计总体比例的方法,能进行简单计算
认识估计的误差与样本容量的关系,理解科学抽样对提高估计准确性的意义,提升数据分析能力
二、知识衔接(回顾旧知)
上节课核心:抽样调查的概念(总体、个体、样本、样本容量)、优势(高效、经济)及关键原则(随机性、代表性);
思考提问:通过抽样调查获得样本数据后,如何利用这些数据推断总体的情况?比如样本的平均身高能否代表总体的平均身高?样本的合格率能否推断总体的合格率?(引出 “用样本估计总体” 的课题)。
第 3 页:一、用样本估计总体的依据与核心逻辑
1. 估计的数学依据
核心前提:只有当样本具有随机性(每个个体被选中机会均等)和代表性(样本特征与总体特征一致)时,用样本估计总体才具有合理性;
理论依据:在随机抽样中,样本是总体的 “缩影”—— 随着样本容量的增大,样本数据的特征(如均值、比例)会逐渐接近总体的真实特征,这种规律称为 “大数定律”(初中阶段直观理解为 “样本越大,估计越准”)。
2. 估计的核心逻辑
用样本估计总体的本质是 “以局部推断整体”,具体流程如下:
3. 实例直观理解
情境:估计一箱苹果(共 100 个)的平均重量;
操作:随机抽取 10 个苹果(样本),称重得平均重量为 200g;
估计:推断这箱苹果的平均重量约为 200g,总重量约为 100×200=20000g;
合理性:若抽样随机(不挑大或小),样本能反映总体,估计结果可信;若仅挑大苹果,样本无代表性,估计结果偏大。
第 4 页:二、用样本估计总体的常用方法(一):均值估计
1. 核心概念:样本均值与总体均值
样本均值:样本中所有个体数据的平均数,记为\(\bar{x}\),计算公式:\(
\bar{x} = \frac{x_1 + x_2 + \dots + x_n}{n}
\)
(\(x_1, x_2, \dots, x_n\)为样本数据,\(n\)为样本容量);
总体均值:总体中所有个体数据的平均数,记为\(\mu\)(总体均值通常未知,需用样本均值\(\bar{x}\)估计)。
2. 估计方法:用样本均值\(\bar{x}\)估计总体均值\(\mu\)
估计逻辑:若样本具有代表性,样本均值会接近总体均值,因此可直接用样本均值作为总体均值的估计值,即\(\mu \approx \bar{x}\);
实例计算:
例 1:为估计某年级学生的数学平均成绩,随机抽取 30 名学生的成绩(单位:分)如下:
85, 92, 78, 90, 88, 80, 85, 95, 82, 86,
89, 75, 83, 91, 87, 84, 86, 88, 90, 81,
79, 85, 87, 93, 84, 82, 89, 86, 92, 85
求样本均值,并估计该年级学生的数学平均成绩。
解:1. 计算样本总和:将 30 个数据相加,得总和为 2550 分;
2. 计算样本均值:\(\bar{x} = \frac{2550}{30} = 85\)分;
3. 估计总体均值:该年级学生的数学平均成绩约为 85 分。
3. 拓展应用:估计总体总量
总体总量:总体中所有个体数据的总和(如总体总重量、总体总成绩);
估计方法:总体总量 ≈ 总体个数 × 样本均值;
例 2:某果园有 100 棵苹果树,随机抽取 5 棵树,测得每棵树的产量(单位:kg)为 45, 50, 48, 52, 47,估计该果园的苹果总产量。
解:1. 样本均值\(\bar{x} = \frac{45 + 50 + 48 + 52 + 47}{5} = 48.4\)kg;
2. 总体总产量 ≈ 100 × 48.4 = 4840kg。
第 5 页:三、用样本估计总体的常用方法(二):比例估计
1. 核心概念:样本比例与总体比例
样本比例:样本中具有某种特征的个体数占样本容量的百分比,记为\(\hat{p}\),计算公式:\(
\hat{p} = \frac{\text{ · · °}}{n} \times 100\%
\)
总体比例:总体中具有某种特征的个体数占总体个数的百分比,记为\(p\)(总体比例通常未知,需用样本比例\(\hat{p}\)估计)。
2. 估计方法:用样本比例\(\hat{p}\)估计总体比例\(p\)
估计逻辑:若样本随机且有代表性,样本中某特征的比例会接近总体中该特征的比例,因此\(p \approx \hat{p}\);
实例计算:
例 3:为了解某小区居民的垃圾分类知晓率,随机抽取 80 户居民调查,其中 64 户知晓垃圾分类方法,估计该小区的垃圾分类知晓率。
解:1. 样本比例\(\hat{p} = \frac{64}{80} \times 100\% = 80\%\);
2. 估计总体比例:该小区的垃圾分类知晓率约为 80%。
3. 拓展应用:估计总体中某特征的个体数
估计方法:总体中某特征的个体数 ≈ 总体个数 × 样本比例;
例 4:某工厂生产了 5000 件产品,随机抽取 200 件检测,发现 18 件不合格,估计这批产品中不合格的件数。
解:1. 样本不合格比例\(\hat{p} = \frac{18}{200} \times 100\% = 9\%\);
2. 总体不合格件数 ≈ 5000 × 9% = 450 件。
第 6 页:四、估计的误差与样本容量的关系
1. 估计误差的存在性
必然存在误差:用样本估计总体时,由于样本只是总体的一部分,即使抽样科学,估计值与总体真实值之间也会存在差异,这种差异称为 “抽样误差”(区别于 “测量误差”“记录误差” 等人为失误);
误差的表现:如样本均值为 85 分,总体真实均值可能为 84.5 分或 85.5 分,误差在合理范围内是可接受的。
2. 样本容量对误差的影响(核心规律)
规律总结:在抽样方法科学的前提下,样本容量越大,抽样误差越小,估计越准确;反之,样本容量越小,误差越大,估计越不可靠;
实例验证:
情境:估计全校 1000 名学生的平均身高;
样本容量 10:误差可能较大(如样本均值 165cm,总体均值 163cm,误差 2cm);
样本容量 100:误差会减小(如样本均值 163.2cm,总体均值 163cm,误差 0.2cm);
注意事项:样本容量并非越大越好,需平衡 “估计准确性” 与 “调查成本”(如样本容量过大,会增加人力、时间成本,性价比降低)。
3. 减少误差的其他方法
确保抽样的随机性(避免主观选择样本);
提高样本的代表性(如分层抽样,覆盖总体的不同特征群体);
控制调查过程中的人为误差(如规范测量方法、仔细记录数据)。
第 7 页:五、实际应用案例:综合估计
案例:某超市估计每月牛奶销量
背景:超市想估计每月(按 30 天算)的牛奶销量,以便制定进货计划;
步骤 1:确定总体与样本:
总体:未来 30 天的每日牛奶销量;
样本:随机抽取过去 10 天的每日牛奶销量(单位:箱):25, 28, 26, 30, 27, 29, 26, 28, 30, 27;
步骤 2:用样本均值估计每日平均销量:
样本均值\(\bar{x} = \frac{25+28+26+30+27+29+26+28+30+27}{10} = 27.6\)箱;
估计每日平均销量约为 27.6 箱;
步骤 3:估计每月总销量:
每月总销量 ≈ 30 × 27.6 = 828 箱;
步骤 4:误差评估:
样本容量 10,误差较小,且抽样随机(涵盖不同日期),估计结果可信,超市可按每月 830 箱左右进货(预留少量库存应对波动)。
第 8 页:六、易错点解析与避坑技巧
1. 常见易错点
易错点 1:用非随机样本估计总体 —— 如仅用实验班成绩估计全校成绩,样本无代表性,估计结果偏差大;
易错点 2:忽略误差,将估计值当作真实值 —— 如样本合格率 95%,直接说 “总体合格率就是 95%”,正确表述应为 “总体合格率约为 95%”;
易错点 3:样本容量过小仍盲目估计 —— 如仅抽 5 人估计全校 1000 人的身高,误差过大,结果无意义;
易错点 4:比例计算时混淆 “部分与总体”—— 如样本中合格产品 38 件,样本容量 40,误算比例为\(\frac{38}{100} = 38\%\),正确应为\(\frac{38}{40} = 95\%\)。
2. 避坑技巧
“三查估计前提”:估计前先查样本是否随机、是否有代表性、样本容量是否足够;
“表述留有余地”:用 “约”“大概”“估计” 等词体现误差,避免绝对化表述;
“比例计算核对”:计算样本比例时,确认分子是 “样本中某特征的个体数”,分母是 “样本容量”,再乘以 100%;
“误差理性看待”:理解误差不可避免,只要误差在合理范围内(如估计平均身高误差 1cm),结果就有参考价值。
第 9 页:课堂练习(分层设计)
一、基础题
为估计某鱼塘中鱼的平均重量,随机捕捞出 20 条鱼,称重得总重量为 40kg,则样本均值为______kg,估计该鱼塘中鱼的平均重量约为______kg(答案:2;2);
某班有 50 名学生,随机抽取 10 名学生调查视力,其中 8 名视力正常,样本视力正常比例为______,估计该班视力正常的学生约为______人(答案:80%;40)。
二、提升题
某品牌袋装饼干共生产 10000 袋,随机抽取 50 袋检测净含量,样本平均净含量为 102g,估计这批饼干的总净含量约为______kg(答案:1020);
随机抽取某小区 120 户居民,发现其中 36 户使用新能源汽车,估计该小区 800 户居民中使用新能源汽车的户数,并说明估计的合理性(答案:240 户;合理性:样本随机且容量足够,比例具有代表性)。
三、拓展题
甲、乙两组分别估计同一批零件的合格率:甲组抽 50 件,合格率 92%;乙组抽 100 件,合格率 90%。哪个组的估计更可信?为什么?(答案:乙组更可信;理由:样本容量更大,抽样误差更小)。
第 10 页:课堂小结与作业布置
一、课堂小结
核心逻辑:用样本估计总体的前提是样本具有随机性和代表性,本质是 “以局部推断整体”;
常用方法:
均值估计:总体均值 ≈ 样本均值,总体总量 ≈ 总体个数 × 样本均值;
比例估计:总体比例 ≈ 样本比例,总体某特征个体数 ≈ 总体个数 × 样本比例;
误差规律:样本容量越大,误差越小,需平衡准确性与成本;
关键原则:抽样科学(随机、有代表性)、表述严谨(体现误差)、理性看待误差。
二、作业布置
必做:教材中 “用样本估计总体” 基础计算题(2 道均值估计、2 道比例估计);
选做:设计一个小调查,估计你所在学校学生的每日平均体育锻炼时间,写出调查步骤、样本数据、估计过程及结果;
思考:为什么分层抽样(如按年级抽样本)比简单随机抽样更能提高估计的准确性?
2025-2026学年华东师大版数学九年级下册【示范课精品课件】
授课教师: . 班 级: . 时 间: .
28.2 用样本估计总体
第28章 样本与总体
a
i
T
u
j
m
i
a
N
g
鱼缸里面有几条鱼?
鱼塘里面有多少条鱼?
情境引入
概念学习
要使样本具有代表性,不偏向总体中的某些个体,有一个对每个个体都公平的办法,那就是用抽签的办法决定哪些个体进入样本.统计学家们称这种理想的抽样方法为简单随机抽样.
简单的随机抽样
简单随机抽样
简单的随机抽样的方法
(1)先将每个个体编号;
(2)然后将写有这些编号的纸条全部放入一个盒子,搅拌均匀;
(3)再用抽签的办法,抽出一个编号不放回,那个编号的个体就被选入样本.
做一做
用简单随机抽样的方法抽取三个样本,每个样本含有 5 个个体,下图是第一个样本的选取,请自行完成第二、三个样本的选取:
随机数 (学号) 111 254 167 94 276
成绩 80 86 66 91 67
第一个样本
随机数 (学号)
成绩
第二个样本
随机数 (学号)
成绩
第三个样本
从以上的抽样过程可以看到,抽样之前,我们不能预测到哪些个体会被抽中,像这样不能够事先预测结果的特性叫做随机性.
随机抽样特性
例1 某校生物兴趣小组的同学们想探求人的各种血型(A、B、AB、O型四种)在人群中的比例,于是他们就在医院中心血库采血室门前调查了从上午 8:00到 9:00 这一小时内参加献血的人员.
1.本问题中的总体、样本分别是什么?
典例精析
总体是人的各种血型,样本是一小时内参加献血的人员的血型;
2. 他们的抽样是简单的随机抽样吗?
3. 你想出了什么样的调查方案?
他们的抽样不是简单的随机抽样,因为他们的做法不符合随机抽样的规则.
如在大街上随机询问经过此地的人员的血型等方法,只要抽样的样本是具有随机性即可.
抽样是否是随机抽样取决于该抽样是否符合随机抽样的规则,是否具有随机性,只有对每一个个体都公平的抽样,才是随机抽样.
方法归纳
练一练
某中学为了解学生的视力情况,需要抽取部分学生进行调查,下列抽取方法中最合适的是( )
A. 随机抽取一部分男生
B. 随机抽取一个班级的学生
C. 随机抽取一个年级的学生
D. 在各个年级中,每班随机抽取 20 名学生
D
合作探究
比一比:仍以这 300 名学生的考试成绩为例,考察抽样调查的结果是否与总体的情况一致.
1.对总体情况进行分析,根据已知数据,以10分的距离将成绩分段,统计每个分数段学生出现的频数,列表如下:
成绩段 39.5--49.5 49.5--59.5 59.5--69.5 69.5--79.5 79.5--89.5 89.5--100
频数 1 9 62 85 96 47
频数分布表
简单随机抽样调查可靠吗
2.根据上表绘制直方图,如下:
0
20
40
60
80
100
120
39.5
49.5
59.5
69.5
79.5
89.5
100
人数
成绩
频数分布直方图
这个分数段的学生最多
这个分数段的学生较少
不及格的学生最少
总体的平均数为:78.1
方差为:116.3
3.根据前面获取的三个样本,分别绘制频数分布直方图,计算出平均数和方差.
0
1
2
3
4
5
39.5
49.5
59.5
69.5
79.5
89.5
100
人数
成绩
样本一
平均数为:78
方差为:100.4
0
1
2
3
4
5
39.5
49.5
59.5
69.5
79.5
89.5
100
人数
成绩
样本二
平均数为:74.2
方差为:14.56
0
1
2
3
4
5
39.5
49.5
59.5
69.5
79.5
89.5
100
人数
成绩
样本三
平均数为:80.8
方差为:42.16
这三张图与总体频数分布直方图相像吗?样本的平均数与总体的接近吗?
不同样本的平均数与方差差异较大,可能是因为样本太小了!
4. 用简单随机抽样的方法,获取两个样本容量为 10的样本,绘制频数分布直方图,计算平均数和方差.
0
1
2
3
4
5
39.5
49.5
59.5
69.5
79.5
89.5
100
人数
成绩
0
1
2
3
4
5
39.5
49.5
59.5
69.5
79.5
89.5
100
人数
成绩
样本一平均数为:79.7
方差为:88.41
样本二平均数为:83.3
方差为:132.61
5.用简单随机抽样的方法,获取两个样本容量为 40 的样本,绘制频数分布直方图,计算平均数和方差.
0
4
8
12
16
20
39.5
49.5
59.5
69.5
79.5
89.5
100
人数
成绩
0
4
8
12
16
20
39.5
49.5
59.5
69.5
79.5
89.5
100
人数
成绩
样本一平均数为:75.65
方差为:103.5275
样本二平均数为:77.1
方差为:114.49
随着样本容量的增加,样本的平均数和方差有接近于总体的平均数和方差的趋势.
由简单随机抽样获得样本容量较大的样本,可以用样本平均数、样本方差估计总体平均数和总体方差.
例2 某养鱼专业户为了估计湖里有多少条鱼,先捕上 100 条做上标记,然后放回到湖里,过一段时间待带标记的鱼完全混合于鱼群后,再捕上 200 条鱼,发现其中带标记的鱼有 20 条,湖里大约有多少条鱼
解: 设湖里大约有 x 条鱼,
则 100∶x=20∶200
∴ x=1000.
答:湖里大约有 1000 条鱼.
1.某课外兴趣小组为了解所在地区的老年人的健康状况,分别作了四种不同的抽样调查,你认为抽样合理的是( )
A. 在公园调查了 1000 名老年人的健康状况
B. 在医院调查了 1000 名老年人的健康状况
C. 调查了 100 名小区内老年邻居的健康状况
D. 利用派出所的户籍网随机调查了该地区 10% 的老年人的健康状况
D
2.某大学为了了解法学院 1500 名新生的身高情况,采用随机调查的方式用 300 名新生的身高为样本进行统计,其中身高在 170 cm--175 cm 的有 75 人,那么估计法学院新生身高在 170 cm--175 cm 的人数约是( )
A. 300 B. 325 C. 375 D. 450
C
3.小芳家今年 6 月份头 6 天的用电量如下表:
日期 1日 2日 3日 4日 5日 6日
用电量(度) 3.6 4.8 5.4 4.2 3.4 3.2
请你用统计知识,估计小芳家 6 月份总用电量是( )
A. 162 B. 120 C. 96 D. 123
D
4. 积极行动起来,共建节约型社会!我市某居民小区200 户居民参加了节水行动,先统计了 10 户家庭一个月的节水情况,将有关数据整理如下:
节水量(单位:吨) 0.5 1 1.5 2
家庭数(户) 2 3 4 1
请你估计该 200 户家庭这个月节约用水的总量是( )
A. 240 吨 B. 360 吨 C. 180 吨 D. 200 吨
A
5.为估计一次性木质筷子的用量,某年从某县共 600 家高、中、低档饭店抽取 10 家作样本,这些饭店每天消耗的一次性筷子盒数分别为:
0.6、3.7、2.2、1.5、2.8、1.7、1.2 、2.1、3.2、1.0
(1)通过对样本的计算,估计该县 1999 年消耗了多少盒一次性筷子(每年按 350 个营业日计算);
解:(1)
所以,该县这一年消耗一次性筷子为
2×600×350 = 420000 (盒).
(2) 第二年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是 10 个样本饭店,每个饭店平均每天使用一次性筷子 2.42 盒.求该县第一年、第二年这两年一次性木质筷子用量平均每年增长的百分率(第二年该县饭店数、全年营业天数均与第一年相同);
(2) 设平均每年增长的百分率为 x,则 2(1 + x)2 = 2.42,解得 x1 =-2.1(不合题意,舍去) ,x2 = 0.1 = 10%.
所以,平均每年增长的百分率为 10%.
(3) 在 (2) 的条件下,若生产一套学生桌椅需木材
0.07 m3,求该县第二年使用一次性筷子的木材可以生产多少套学生桌椅.计算中需用的有关数据为:每盒筷子 100 双,每双筷子的质量为 5 g,所用木材的密度为 0.5×103 kg/m3;
(3) 可以生产学生桌椅套数为
(套).
(4) 假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做,简要地用文字表述出来.
(4) 先抽取若干个县(或市、州)作样本,再分别从这些县(或市、州)中抽取若干家饭店作样本,统计一次性筷子的用量.
返回
1.为调查某大型企业员工对企业的满意程度,以下样本最具代表性的是( )
A.企业男员工
B.企业年满50岁及以上的员工
C.用企业人员名册,随机抽取三分之一员工
D.企业新进员工
C
2.为了解甲、乙、丙、丁四所学校学生对“122交通安全专题”相关知识的掌握情况,小明计划进行抽样调查,你认为以下方案中最合理的是( )
A.抽取甲校七年级学生进行调查
B.在四所学校随机抽取200名学生进行调查
C.在乙校中随机抽取200名学生进行调查
D.在四所学校各随机抽取200名学生进行调查
D
返回
返回
3.要了解某校初中学生的课外作业负担情况,若采用抽样调查的方法进行调查,则下面哪种调查方式具有代表性( )
A.调查全体女生
B.调查全体男生
C.调查七、八、九年级各100名学生
D.调查九年级全体学生
C
4.[2024合肥期末]某课外兴趣小组为了解所在地区老年人的健康状况,分别作了四种不同的抽样调查.你认为抽样比较合理的是( )
A.在公园调查了800名老年人的健康状况
B.在医院调查了800名老年人的健康状况
C.调查了20名老年邻居的健康状况
D.利用派出所的户籍网随机调查了该地区15%的老年人的健康状况
D
返回
5.某冰箱生产厂家对某地区两个经销本厂冰箱的大型商场进行调查,调查结果显示:该厂冰箱的销售量占这两个商场同类产品销售量的45%,于是,该厂在广告中宣传,他们的产品销售量在国内同类产品销售量中占45%.小明根据自己所学的统计知识,判断这个宣传数据不可靠,他的依据是_________________________
__________.
返回
所取的样本容量太小,样本
缺乏代表性
6.小龙的妈妈让小龙去买一盒火柴,并叮嘱小龙,一定要试试火柴是否好用.小龙回家后,高兴地告诉妈妈:“火柴好用,我每根都试过了.”
(1)小龙采取的是哪种调查?
【解】小龙采取的是普查.
返回
(2)你认为小龙采取的方法是否合适?请说明理由.
【解】小龙采取的方法不合适,因为具有破坏性,所以应用抽样调查.
7.某食品加工厂有5条生产线,每条生产线一天能出产品20箱.质检员将对某日产品进行抽检,下列抽检方案中,最适宜的是( )
A.在该日的100箱产品中随机抽取1箱
B.抽取该日每条生产线的最后1箱产品
C.在该日每条生产线的产品中随机抽取1箱
D.抽取该日其中一条生产线的20箱产品
C
返回
简单随机抽样
方法
概念
1. 样本具有代表性
2. 用抽签的办法决定哪些个体进入样本
1. 先将每个个体编号;
2. 然后将写有这些编号的纸条全部放入一个盒子,搅拌均匀;
3. 再用抽签的办法,抽出一个编号,那个编号的个体就被选入样本.
样本容量较大
用样本估计总体
必做作业:从教材习题中选取;
选做作业:完成练习册本课时的习题.
谢谢观看!