统计学初步
课标领航
本章概述
1.近几年来,本章主要考查随机抽样和分层抽样的基础知识,以及用样本估计总体的分布和数字特征.题型以选择题、填空题为主,考查热点是抽样方法、频率分布表、频率分布直方图、茎叶图、平均数与方差.
2.数理统计学的核心是如何根据样本的情况对总体的情况作出一种推断.这里又包括两类问题:一类是如何从总体中抽取样本;另一类是如何根据对样本的整理、计算和分析,对总体的情况作出推断.
3.随机抽样的方法有简单随机抽样、系统抽样和分层抽样这三种.在进行系统抽样和分层抽样时都要用到简单随机抽样.当总体中的个数较少时,常采用简单随机抽样;当总体中的个数较多时,常采用系统抽样;当已知总体由差异明显的几部分组成时,常采用分层抽样.
4.对于抽取不同数值较多或可以在实数区间内取值的总体,常用频率分布直方图来表示相应样本的频率分布.由于总体分布通常不易知道,我们往往是用样本的频率分布去估计总体分布.一般样本容量越大,这种估计就越精确.
5.借助散点图可以直观地看出两个变量之间是否有相关关系.用最小二乘法思想建立的线性回归方程,能定量地描述两个变量间的关系.
6.本章的重点是三种抽样方法的理解与应用,频率分布直方图及茎叶图的绘制与统计,用样本估计总体的平均数和方差;难点是对方差意义的理解以及统计知识在实际问题中的应用.
学法指导
学习本章时,既要充分掌握各种统计方法、原理及思想,又要大量地参加实践活动,实地考察统计;既要大胆地猜想,又要细心、耐心地计算;同时要借助于科学计算工具,作出精确的图表,尽量减少误差.
总体和个体
总体、个体和总体均值
样本与样本均值
方差和标准差
方
差
和
标
准
差
课堂互动讲练
课前自主学案
学习目标
1.会求样本的众数、中位数、平均数、标准差、方差;
2.掌握用样本的数字特征来估计总体数字特征的方法;
3.会用相关知识解决简单的统计实际问题.
课前自主学案
初中学过的众数、中位数、平均数,其定义分别是
(1)在一组数据中__________________的数据叫做这组数据的众数.
(2)将一组数据按大小顺序排列,把处在
_________________的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
温故夯基
出现次数最多
最中间位置
(3)平均数:样本数据的算术平均数,即 =_______________________(n∈N+).
1.相关概念
(1)总体:我们所要调查对象的全体叫做
_________
(2)个体:总体中的每个成员叫做__________
(3)样本:从总体中抽取一部分个体,称这些个体为_________,也称为_________________
(4)样本容量:样本中个体的数量叫做
________________,简称样本量.
(5)抽样:从总体中抽取样本的工作称为_______
知新益能
总体.
个体.
样本
观测数据.
样本容量
抽样.
2.方差和标准差
(1)总体方差:当y1,y2…,yN是总体的全部个体,μ是总体均值时,称σ2=____________________________________是总体的平均平方误差,简称为总体方差或方差.
样本标准差.
总体标准差.
方差
1.如何求样本数据的方差与标准差?
问题探究
课堂互动讲练
众数、中位数、平均数的应用
考点突破
众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.
高一(3)班有男同学27名,女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.
(1)求这次测验全班平均分(精确到0.01);
(2)估计全班成绩在80分以下(含80分)的同学至少有多少人?
(3)分析男同学的平均分与中位数相差较大的主要原因是什么?
【思路点拨】 根据各种数据的定义及意义判断.
例1
(3)男同学的平均分与中位数的差别较大,说明男同学中两极分化现象严重,得分高的和低的相差较大.
【名师点评】 平均数对极端值敏感,而中位数对极端值不敏感.因此两者结合,可较好地分析总体的情况.另外,据此也可估计其他同类班级的情况.
变式训练1 某工厂员工及工资情况如下表(单位:元):
员工
经理
管理人员
高级技工
工人
学徒
合计
周工资
2200
250
220
200
100
人数
1
6
5
10
1
23
合计
2200
1500
1100
2000
100
6900
(1)指出这个问题的众数、中位数和平均数;
(2)此问题中的平均数能反映该工厂员工的工资水平吗?为什么?
解:(1)由表格可知,众数是200元,中位数是220元,平均数为:6900÷23=300(元).
(2)虽然平均数为300元/周,但由表格可知,只有经理的工资在平均数以上,其余人的工资都在平均数以下,故用平均数不能客观、真实地反映该工厂员工的工资水平.
方差及标准差的应用
方差反映了一组数据围绕平均数波动的大小.为了得到以样本数据的单位表示的波动幅度通常用标准差,即样本方差的算术平方根,是样本数据到平均数的一种平均距离.
甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
例2
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定?
【名师点评】 用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值,在实际中,当所得数据平均数不同时,须先分析平均水平,再计算标准差(方差),分析稳定情况.
变式训练2 从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米的苗长得高?
(2)哪种玉米的苗长得整齐?
探索型问题是一种具有开放性和发散性的问题,是指根据已知条件(或给出结论),探求相应结论(或条件)是否存在的一类问题,其具体形式是追溯或补足命题成立应具备的(或缺少)的条件(或结论).或者由特殊事例类比推广到一般结论.这类题型没有明确的结论,解题方向不明、自由度大,需要先通过对问题进行观察、分析、比较、概括后方能得出结论.或者再对所得出的结论予以证明.
开放探究问题
在一次科技知识竞赛中,两组学生的成绩如下表:
例3
分数
50
60
70
80
90
100
人数
甲组
2
5
10
13
14
6
乙组
4
4
16
2
12
12
已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.
【思路点拨】 这是一道计算众数、方差、中位数、高分段等的开放型问题,大家计算这些数据并不难,但在没有提示的情况下,要根据这些数据进行分析和判断,可能会令很多同学束手无策.由此可见,打好扎实的基础功底、提高数学素质比单纯会算要重要得多.另外,从这道题也可看出,解数学题也要有一定的文字表达能力.
(3)甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩在80分以上(包含80分)的有33人,乙组成绩在80分以上(包含80分)的有26人,从这一角度看,甲组的成绩较好.
【名师点评】 要正确解答这道题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.
变式训练3 假定以下数据是甲、乙两个供货商的交货天数.甲:
10,9,10,10,11,11,9,11,10,10;
乙:8,10,14,7,10,11,10,8,15,12.
估计两个供货商的交货情况,并问哪个供货商的交货时间短一些,哪个供货商的交货时间较具有一致性与可靠性.
从交货天数的平均数来看,甲供货商的供货天数短一些;从方差来看,甲供货商的交货天数较稳定,因此甲供货商的交货时间较具有一致性与可靠性.
1.样本平均数和样本方差是反映样本的两个特征数,平均数反映了这组数据的平均水平,方差或标准差反映了这组数据的稳定与波动,集中与离散程度.
2.性质
方法感悟
(2)数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等.
(3)若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.