【2012年优化方案】数学 湘教版必修5:第12章 统计学初步本章优化课件(6份打包)

文档属性

名称 【2012年优化方案】数学 湘教版必修5:第12章 统计学初步本章优化课件(6份打包)
格式 zip
文件大小 3.7MB
资源类型 教案
版本资源 湘教版
科目 数学
更新时间 2012-10-15 11:59:47

文档简介

(共30张PPT)
12.2.3 分层抽样和系统抽样
12.2.3 









课堂互动讲练
知能优化训练
课前自主学案
学习目标
1.了解系统抽样、分层抽样的方法;
2.记住系统抽样和分层抽样的适用范围;
3.掌握系统抽样、分层抽样的步骤及三种抽样之间的关系.
课前自主学案
1.简单随机抽样方法有____________和
____________
2.简单随机抽样的特点:_______________、____________、_________、____________
温故夯基
抽签法
随机数法.
总体个数有限
逐个抽取
不放回
公平性.
1.分层抽样的概念
(1)定义:一般地,在抽样时,将总体
______________________,然后
_________________,从____________地抽取一定数量的个体,将________取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)层数:用N表示总体A的个体总数,用N i表示第i层的个体总数时,有N=N1+N2+…+NL,则Wi=_________,(i=1,2,…,L)称为第i层的层数.
知新益能
分成互不交叉的层
按照一定的比例
各层独立
各层
(3)简单估计:_________________________称为总体μ的简单估计(其中μ表示总体A的总体均值, (i=1,2,…,L)表示从第i层抽出样本的样本均值).
2.系统抽样
(1)如果总体中的个体按一定的方式排列,在规定的范围内随机抽取一个个体,然后按照_____________规则确定其他个体的抽样方法称为系统抽样方法.
(2)最简单的系统抽样:取得一个个体后,按________________抽取其他个体.
制定好的
相同的间隔
1.分层抽样是公平的吗?
提示:是公平的.在分层抽样的过程中,每个个体被抽到的可能性是相同的,与层数及分层无关.
2.系统抽样的特点是什么?
提示:特点为:(1)适用于总体中个体数较大且个体差异不明显的情况;
(2)是等可能抽样,每个个体被抽到的可能性相等.
问题探究
课堂互动讲练
分层抽样
考点突破
某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示:
电视台为了进一步了解观众的具体想法和意见,打算从中再抽取60人进行更为详细的调查,应怎样进行抽样?
例1
很喜爱 喜爱 一般 不喜爱
2435 4567 3926 1072
因此,采用分层抽样的方法在“很喜爱”、“喜爱”、“一般”、“不喜爱”的人中分别抽取12人、23人、20人和5人.
【名师点评】 各部分之间有明显的差异是分层抽样的依据,至于各层内用什么方法抽样是灵活的,可用简单随机抽样,也可采用系统抽样.分层抽样中,无论哪一层的个体,被抽中的机会均等,体现了抽样的公平性.
变式训练1 某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人.教育部门为了解学校机构改革意见,要从中抽取一个容量为20的样本.应怎样进行抽取?
因行政和后勤人员人数较少,可分别按01~16号和01~32号编号,然后用抽签法分别抽取2人和4人.而教师较多,所以对教师112人采用000,001,…,111编号,用随机数法抽取14人.这样就得到了符合要求的容量为20的样本.
系统抽样
系统抽样适用于总体容量较大,且个体之间无明显差异的情况.
为了调查某路口一个月的车流量情况,交警采用系统抽样的方法,样本距为7,从每周中随机抽取一天,他正好抽取的是星期日,经过调查后做出报告.你认为交警这样的抽样方法有什么问题?应当怎样改进?如果是调查一年的车流量情况呢?
例2
【思路点拨】 该题实际上是考查系统抽样的特征——等距离抽取样本.
【解】 交警所统计的数据以及由此所推断出来的结论,只能代表星期日的交通流量.由于星期日是休息时间,很多人不上班,不能代表其他几天的情况.
改进方法可以将所要调查的时间段的每一天先随机地编号,再用系统抽样方法来抽样,或者使用简单随机抽样来抽样亦可.
如果是调查一年的交通流量,使用简单随机抽样法显然已不合适,比较简单可行的方法是把样本距改为8.
【名师点评】 系统抽样的样本距相等,若第一次抽取的是星期日,则以后抽取的都应是星期日,这可能会使样本产生误差.
变式训练2 为了了解某地区今年高一学生期末考试数学学科的成绩,拟从参加考试的15000名学生的数学成绩中抽取容量为150的样本.请用系统抽样写出抽取过程.
解:(1)对全体学生的数学成绩进行随机编号:1,2,3,…,15000.
(2)分段,由于样本容量与总体容量的比是1∶100,我们将总体平均分为150个部分,其中每一部分包含100个个体.
(3)在第一部分即1号到100号中用简单随机抽样抽取一个号码,比如是56.
(4)以56作为起始数,然后顺次抽取156,256,356,…,14956.这样就得到容量为150的一个样本.
抽取样本要根据样本容量的多少,及有无明显的差异等信息特征来确定采用的抽样方法.简单随机抽样是基本的抽样方法,可穿插在其它抽样方法中使用.
选择合适的抽样方法抽样,写出抽样过程.
(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个;
(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个;
三种抽样方法的综合应用
例3
(3)有甲厂生产的300个篮球,抽取10个;
(4)有甲厂生产的300个篮球,抽取30个.
【思路点拨】 综合三种抽样方法的适用范围和实际情况,灵活选取适当的方法进行抽取.
【解】 (1)总体容量较小,用抽签法.
①将30个篮球编号,编号为00,01,…,29;
②将以上30个编号分别写在完全一样的一张小纸条上,揉成大小相同的小球,制成号签;
③把号签放入一个不透明的袋子中,充分搅拌;
④从袋子中逐个抽取3个号签,并记录上面的号码;
⑤找出和所得号码对应的篮球即可得到样本.
(2)总体由差异明显的两个层次组成,需选用分层抽样法.
②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.
(3)总体容量较大,样本容量较小,宜用随机数表法.
①将300个篮球用随机方式编号,编号为001,002,…,300;
③从数“7”开始向右读,每次读三位,凡不在001~300中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到10个号码,这就是所要抽取的10个样本个体的号码.
(4)总体容量较大,样本容量也较大,宜用系统抽样法.
②在第一段000,001,002,…,009这10个编号中用简单随机抽样抽出一个(如002)作为起始号码;
③将编号为002,012,022,…,292的个体抽出,组成了所要抽取的样本.
【名师点评】 抽样方法的选取:
(1)若总体没有差异明显的层次,则考虑采用简单随机抽样或系统抽样.
当总体容量较小时宜用抽签法;当总体容量较大,样本容量较小时宜用随机数表法;当总体容量较大,样本容量也较大时宜用系统抽样.
(2)若总体由差异明显的几个层次组成,则选用分层抽样.
(3)当总体容量较大,样本容量也较大时,可采用系统抽样法.
变式训练3 某学校有职工140人,其中教师91人,教辅行政人员28人,总务后勤人员21人.为了了解职工的某种情况,要从中抽取一个容量为20的样本.以下的抽样方法中,依次为简单随机抽样、系统抽样、分层抽样顺序的是(  )
方法1:将140人从1~140编号,然后制作出编号1~140的形状、大小相同的号签,并将号签放入同一不透明的箱子里均匀搅拌,然后从中抽取20个号签,编号与号签相同的20个人被选出;
方法2:将140人分成20组,每组7人,并将每组7人按1~7编号,在第一组采用抽签法抽出k号(1≤k≤7),其余各组k号也被抽出,20个人被选出;
方法3:按20∶140=1∶7的比例,从教师中抽出13人,从教辅行政人员中抽出4人,从总务后勤人员中抽出3人.从各类人员中抽取所需人员时,均采用随机数法,可抽到20人.
A.方法2,方法1,方法3
B.方法2,方法3,方法1
C.方法1,方法2,方法3
D.方法3,方法1,方法2
解析:选C.结合简单随机抽样,系统抽样,分层抽样的含义判断方法1是简单随机抽样,方法2是系统抽样,方法3是分层抽样.
三种抽样方法的异同点
方法感悟
知能优化训练
本部分内容讲解结束
点此进入课件目录
按ESC键退出全屏播放
谢谢使用(共26张PPT)
12.2 抽样调查方法
12.2.1 随机抽样
12.2.2 调查问卷的设计
12.2.2 







课堂互动讲练
知能优化训练
课前自主学案
学习目标
1.理解并掌握简单随机抽样的概念、特点和步骤;
2.掌握简单随机抽样的两种方法;
3.能合理地从实际问题的总体中抽取样本.
课前自主学案
1.总体:我们所要考察对象的全体叫做________,其中每一个考察对象叫做_______
2.样本:从总体中抽出的若干个个体组成的集合叫做总体的一个 _______,样本中个体的数量叫做_______________
温故夯基
总体
个体.
样本
样本容量.
1.简单随机抽样的定义
一般地,设一个总体有N个个体,从中逐个_________地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会_________,就把这种抽样方法叫做简单随机抽样.
知新益能
不放回
都相等
抽签法
随机数法
其中,随机数法即利用随机数表、随机数骰子或_________产生的随机数进行抽样.
计算机
1.简单随机抽样为什么是公平的?
提示:简单随机抽样是在特定的总体中抽取样本.总体中每一个个体被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机会是独立的.当总体容量和样本容量不大时,采用抽签法.抽签时,样本数据来自“搅拌均匀”的总体,抽取时不带有主观或客观的影响因素,所以每个个体有相同的机会被抽中;当总体容量和样本容量较大时,采用随机数法.
问题探究
利用随机数表、随机数骰子或计算机产生随机数时,出现任何一个数字都是随机的、等可能的,且从总体中抽取任何一个个体的号码也是随机的、等可能的.故简单随机抽样是公平的.
2.利用随机数表读数时,开始位置和读数方向可以任意选择吗?
提示:可以,但是通常要在抽样前确定好.
课堂互动讲练
简单随机抽样的概念及特点
考点突破
简单随机抽样主要有四个特点:(1)总体个数有限;(2)逐个抽取;(3)不放回;(4)公平性:每个个体被抽到的可能性相同.
下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;
(3)某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴四川参加抗震救灾工作;
(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.
例1
【思路点拨】 先逐个判断抽样的特点,再与简单随机抽样的概念比较得出结论.
【解】 (1)不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.
(2)不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.
(3)不是简单随机抽样.因为这50名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.
(4)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.
【名师点评】 要判断所给的抽样方法是否是简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的几个特点.
变式训练1 下列抽取样本的方式是否属于简单随机抽样?
(1)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;
(2)从20件玩具中一次性抽3件进行质量检查.
解:(1)不是简单随机抽样.由于它是放回抽样.
(2)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.
随机数法的应用
对于总体容量不大,即易编号时,可采用这种方法.
即:编号—选起始数—读数—取数.
有一批机器编号为1,2,3,…,112,请用随机数表法抽取10台入样,写出抽样过程.
例2
【思路点拨】 各机器的编号数位不一致.用随机数表直接读数不方便,需将编号进行调整,然后再按规定读号成样即可.
【解】 第一步:将原来的编号调整为001,002,003,…,112.
第二步:在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第9行第7个数“3”向右读.
第三步:从“3”开始向右读,每次取三位,凡不在001~112中的数跳过去不读.
前面已经读过的数不读,依次可得到074,100,094,052,080,003,105,107,083,092
第四步:对应原来编号74,100,94,52,80,3,105,107,83,92的机器便是要抽取的对象
【名师点评】 在用随机数表法抽样时,会遇到以下问题:要求用题中所给的编号抽取样本,但所给编号位数不一致,这时,可用以下方法进行调整.
(1)在数位前添加“0”,凑齐位数,如1,2,…,100,可调整为001,002,…,100;
(2)把原来的号码加上100的倍数,如1,2,3,…,100每数加100的倍数可调整为101,102,…,200.
变式训练2 设某校共有100名教师,为了支援西部教育事业,现要从中随机抽出12名教师组成暑期西部讲师团,请写出利用随机数表法抽取该样本的步骤.
解:其步骤如下:
第一步:将100名教师编号:00,01,02,…,99.
第二步:在随机数表中任取一数作为起始数,如从第12行第9列开始.
第三步:依次向右读取(读数的方向也可以是向左、向上、向下等),可以依次得到75,84,16,07,44,99,83,11,46,32,24,20共12个数.与这12个编号对应的教师组成样本.
这样我们就得到一个容量为12的样本.
一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时可用抽签法.
要在20名学生中抽取5名进行问卷调查,试写出抽取样本的过程.
抽签法的应用
例3
【思路点拨】 总体容量和样本容量均较小,适合抽签法.
【解】 (1)先将20名学生进行编号,编号为1,2,…,20;
(2)把号码写在形状、大小均相同的号签上;
(3)将号签放在某个不透明的箱子中充分搅拌,使之均匀,然后依次从箱子中抽取5个号签,于是和这5个号签上的号码对应的5名学生就构成了一个样本.
【名师点评】 利用抽签法抽取样本时应注意以下问题:
(1)编号时,如果已有编号(如学号、标号等)可不必重新编号.
(2)号签要求大小、形状完全相同.
(3)号签要搅拌均匀.
(4)要逐一不放回抽取.
变式训练3 要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,并写出抽样过程.
解:应使用抽签法,步骤如下:
①将30辆汽车编号,号码是1,2,3,…,30;
②将1~30这30个编号写到大小、形状都相同的号签上;
③将写好的号签放入一个不透明的容器中,并搅拌均匀;
④从容器中每次抽取一个号签,连续抽取3次,并记录下上面的编号;
⑤所得号码对应的3辆汽车就是要抽取的对象.
1.它要求被抽取样本的总体的个数有限,以便对每个个体被抽到的机会进行分析.
2.从总体中逐个进行抽取,具有可操作性.
3.这是一种不放回抽样.由于在抽样的实践中常常采用不放回抽样,使简单随机抽样具有较广泛的实用性,而且由于在所抽取的样本中没有被重复抽取的个体,所以便于分析与计算.
方法感悟
4.这是一种等机会的抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的机会相等,而且在整个抽样过程中,各个个体被抽取的机会都相等,从而保证了抽样的公平性.
知能优化训练
本部分内容讲解结束
点此进入课件目录
按ESC键退出全屏播放
谢谢使用(共43张PPT)
第12章 统计学初步
课标领航
本章概述
1.近几年来,本章主要考查随机抽样和分层抽样的基础知识,以及用样本估计总体的分布和数字特征.题型以选择题、填空题为主,考查热点是抽样方法、频率分布表、频率分布直方图、茎叶图、平均数与方差.
2.数理统计学的核心是如何根据样本的情况对总体的情况作出一种推断.这里又包括两类问题:一类是如何从总体中抽取样本;另一类是如何根据对样本的整理、计算和分析,对总体的情况作出推断.
3.随机抽样的方法有简单随机抽样、系统抽样和分层抽样这三种.在进行系统抽样和分层抽样时都要用到简单随机抽样.当总体中的个数较少时,常采用简单随机抽样;当总体中的个数较多时,常采用系统抽样;当已知总体由差异明显的几部分组成时,常采用分层抽样.
4.对于抽取不同数值较多或可以在实数区间内取值的总体,常用频率分布直方图来表示相应样本的频率分布.由于总体分布通常不易知道,我们往往是用样本的频率分布去估计总体分布.一般样本容量越大,这种估计就越精确.
5.借助散点图可以直观地看出两个变量之间是否有相关关系.用最小二乘法思想建立的线性回归方程,能定量地描述两个变量间的关系.
6.本章的重点是三种抽样方法的理解与应用,频率分布直方图及茎叶图的绘制与统计,用样本估计总体的平均数和方差;难点是对方差意义的理解以及统计知识在实际问题中的应用.
学法指导
学习本章时,既要充分掌握各种统计方法、原理及思想,又要大量地参加实践活动,实地考察统计;既要大胆地猜想,又要细心、耐心地计算;同时要借助于科学计算工具,作出精确的图表,尽量减少误差.
12.1 总体和个体
12.1.1 总体、个体和总体均值
12.1.2 样本与样本均值
12.1.3 方差和标准差
12.1.3 






课堂互动讲练
知能优化训练
课前自主学案
学习目标
1.会求样本的众数、中位数、平均数、标准差、方差;
2.掌握用样本的数字特征来估计总体数字特征的方法;
3.会用相关知识解决简单的统计实际问题.
课前自主学案
初中学过的众数、中位数、平均数,其定义分别是
(1)在一组数据中__________________的数据叫做这组数据的众数.
(2)将一组数据按大小顺序排列,把处在
_________________的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
温故夯基
出现次数最多
最中间位置
(3)平均数:样本数据的算术平均数,即 =_______________________(n∈N+).
1.相关概念
(1)总体:我们所要调查对象的全体叫做
_________
(2)个体:总体中的每个成员叫做__________
(3)样本:从总体中抽取一部分个体,称这些个体为_________,也称为_________________
(4)样本容量:样本中个体的数量叫做
________________,简称样本量.
(5)抽样:从总体中抽取样本的工作称为_______
知新益能
总体.
个体.
样本
观测数据.
样本容量
抽样.
2.方差和标准差
(1)总体方差:当y1,y2…,yN是总体的全部个体,μ是总体均值时,称σ2=____________________________________是总体的平均平方误差,简称为总体方差或方差.
样本标准差.
总体标准差.
方差
1.如何求样本数据的方差与标准差?
问题探究
课堂互动讲练
众数、中位数、平均数的应用
考点突破
众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.
高一(3)班有男同学27名,女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.
(1)求这次测验全班平均分(精确到0.01);
(2)估计全班成绩在80分以下(含80分)的同学至少有多少人?
(3)分析男同学的平均分与中位数相差较大的主要原因是什么?
【思路点拨】 根据各种数据的定义及意义判断.
例1
(3)男同学的平均分与中位数的差别较大,说明男同学中两极分化现象严重,得分高的和低的相差较大.
【名师点评】 平均数对极端值敏感,而中位数对极端值不敏感.因此两者结合,可较好地分析总体的情况.另外,据此也可估计其他同类班级的情况.
变式训练1 某工厂员工及工资情况如下表(单位:元):
员工 经理 管理人员 高级技工 工人 学徒 合计
周工资 2200 250 220 200 100
人数 1 6 5 10 1 23
合计 2200 1500 1100 2000 100 6900
(1)指出这个问题的众数、中位数和平均数;
(2)此问题中的平均数能反映该工厂员工的工资水平吗?为什么?
解:(1)由表格可知,众数是200元,中位数是220元,平均数为:6900÷23=300(元).
(2)虽然平均数为300元/周,但由表格可知,只有经理的工资在平均数以上,其余人的工资都在平均数以下,故用平均数不能客观、真实地反映该工厂员工的工资水平.
方差及标准差的应用
方差反映了一组数据围绕平均数波动的大小.为了得到以样本数据的单位表示的波动幅度通常用标准差,即样本方差的算术平方根,是样本数据到平均数的一种平均距离.
甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
例2
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定?
【名师点评】 用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值,在实际中,当所得数据平均数不同时,须先分析平均水平,再计算标准差(方差),分析稳定情况.
变式训练2 从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米的苗长得高?
(2)哪种玉米的苗长得整齐?
探索型问题是一种具有开放性和发散性的问题,是指根据已知条件(或给出结论),探求相应结论(或条件)是否存在的一类问题,其具体形式是追溯或补足命题成立应具备的(或缺少)的条件(或结论).或者由特殊事例类比推广到一般结论.这类题型没有明确的结论,解题方向不明、自由度大,需要先通过对问题进行观察、分析、比较、概括后方能得出结论.或者再对所得出的结论予以证明.
开放探究问题
在一次科技知识竞赛中,两组学生的成绩如下表:
例3
分数 50 60 70 80 90 100
人数 甲组 2 5 10 13 14 6
乙组 4 4 16 2 12 12
已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.
【思路点拨】 这是一道计算众数、方差、中位数、高分段等的开放型问题,大家计算这些数据并不难,但在没有提示的情况下,要根据这些数据进行分析和判断,可能会令很多同学束手无策.由此可见,打好扎实的基础功底、提高数学素质比单纯会算要重要得多.另外,从这道题也可看出,解数学题也要有一定的文字表达能力.
(3)甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩在80分以上(包含80分)的有33人,乙组成绩在80分以上(包含80分)的有26人,从这一角度看,甲组的成绩较好.
【名师点评】 要正确解答这道题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.
变式训练3 假定以下数据是甲、乙两个供货商的交货天数.甲:
10,9,10,10,11,11,9,11,10,10;
乙:8,10,14,7,10,11,10,8,15,12.
估计两个供货商的交货情况,并问哪个供货商的交货时间短一些,哪个供货商的交货时间较具有一致性与可靠性.
从交货天数的平均数来看,甲供货商的供货天数短一些;从方差来看,甲供货商的交货天数较稳定,因此甲供货商的交货时间较具有一致性与可靠性.
1.样本平均数和样本方差是反映样本的两个特征数,平均数反映了这组数据的平均水平,方差或标准差反映了这组数据的稳定与波动,集中与离散程度.
2.性质
方法感悟
(2)数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等.
(3)若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.
知能优化训练
本部分内容讲解结束
点此进入课件目录
按ESC键退出全屏播放
谢谢使用(共28张PPT)
本章优化总结
 
本章优化总结
专题探究精讲
章未综合检测
知识体系网络
知识体系网络
专题探究精讲
抽样方法的应用
考点突破
应用三种抽样方法时需搞清楚它们的使用原则.
(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法;
(2)当总体容量较大,样本容量较小时可用随机数表法;
(3)当总体容量较大,样本容量也较大时可用系统抽样法;
(4)当总体由明显差异的几部分构成时,采用分层抽样法.
一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):
例1
轿车A 轿车B 轿车C
舒适型 100 150 z
标准型 300 450 600
按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆.
(1)求z的值;
(2)B类,C类轿车各应抽取多少?
(3)在C类轿车中,按型号分层抽样,应各抽取多少?
【思路点拨】 按类分层或者是按型号分层,抽样比是相同的.
用样本估计总体
总体估计要解决的问题主要是:运用频率分布表、频率分布直方图、茎叶图、样本数据的平均数、标准差等概念解决一些简单的实际问题.
解决上述问题的关键是在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、茎叶图,体会它们各自的特点;能根据实际问题的需求合理选取样本,用样本的数字特征去估计总体的数字特征.
某车站在春运期间为了改进服务,随机抽样调查了100名旅客从开始在购票窗口排队到购到车票所用的时间t(以下简称购票用时,单位:min),下面是这次抽样的频率分布表和频率分布直方图,解答下列问题:
例2
分组 频数 频率
一组 0≤t<5 0 0
二组 5≤t<10 10
三组 10≤t<15 10 0.10
四组 15≤t<20
五组 20≤t<25 30 0.30
合计 100 1.00
(1)这次抽样的样本容量是多少?
(2)在表中填写出缺失的数据并补全频率分布直方图.
(3)旅客购票用时的平均数可能落在哪一小组?
(4)若每增加一个购票窗口可使平均购票用时减少5 min,要使平均购票用时不超过10 min,那么你估计最少要增加几个窗口?
分组 频数 频率
一组 0≤t<5 0 0
二组 5≤t<10 10 0.10
三组 10≤t<15 10 0.10
四组 15≤t<20 50 0.50
五组 20≤t<25 30 0.30
合计 100 1.00
【名师点评】 用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理.
总体的平均数与标准差往往通过样本的平均数、标准差来估计.一般地,样本容量越大,对总体的估计越准确.
(1)从数字特征上描述一组数据的情况
平均数、众数、中位数描述其集中趋势,方差、极差和标准差描述其波动大小,也可以说方差、标准差和极差反映各个数据与其平均数的离散程度.
用样本的数字特征估计总体的数字特征
(2)方差和标准差的运用
一组数据的方差或标准差越大,说明这组数据波动越大,方差的单位是原数据的单位的平方,标准差的单位与原单位相同.
甲、乙两人在相同的
条件下各射靶10次,每次射
靶成绩(单位:环)如图所示.
例3
(1)填写下表:
平均数 方差 中位数 命中9环及以上
甲 7 1.2 1
乙 5.4 3
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
③从平均数和命中9环以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
【思路点拨】 从折线图中列出每次射击的环数,可填充表格,据此可估计总体情况.
平均数 方差 中位数 命中9环及以上
甲 7 1.2 7 1
乙 7 5.4 7.5 3
(2)①甲、乙的平均数相同:均为7,但s甲<s乙,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙平均水平相同,而乙的中位数比甲大,可预见乙射靶环数的优秀次数比甲的多,所以乙的成绩比甲好些.
③甲、乙平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,有潜力可挖.
【名师点评】 样本的平均数常和方差配合使用来反映样本数据的稳定性,从而估计总体.
两个变量之间的相关关系即不确定性关系的研究,通常先作变量的散点图,根据散点图判断这两个变量最接近于何种确定性关系(函数关系),然后用这个关系分析预测原来两个变量的关系,这就是回归分析,其中线性回归分析是常用的一种回归分析.
回归分析
下面是我国某地居民生活污水排放量的一组数据:
例4
年份 2003 2004 2005 2006 2007 2008 2009 2010
排放量 151 189.1 194.8 203.8 220.9 227.7 232.3
试估计2004年该地居民生活污水排放量,并预测2016年生活污水排放量(单位:108 t).
【思路点拨】 要估计或预测,可考虑先剔除1999年,使样本容量为7,然后再求回归直线方程,将年份与污水排放量的相关关系表达出来.
【解】 作出散点图如下:
由图可以看出,污水排放量与年份呈线性相关.
设2003年为第1年,…,2010年为第8年,列表,用科学计算器进行计算:
i 1 2 3 4 5 6 7
xi 1 3 4 5 6 7 8
yi 151 189.1 194.8 203.8 220.9 227.7 232.3
xiyi 151 567.3 779.2 1019 1325.4 1593.9 1858.4
【名师点评】 知道x与y呈线性相关关系,无需进行相关性检验,否则,应先画出散点图,观察散点图是否呈现出线性相关关系;如果是,可以用最小二乘法估计出线性回归方程;如果散点图呈现出其他的曲线关系,即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(共39张PPT)
12.4 数据的相关性
12.4.1 相关性
12.4.2 回归直线
12.4.2 



线
课堂互动讲练
知能优化训练
课前自主学案
学习目标
1.理解两个变量的相关关系的概念;
2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系;
3.会求回归直线方程.
课前自主学案
1.用样本估计总体主要有:用样本的_____________估计总体的频率分布;用样本的_____________估计总体的数字特征.
2.样本的数字特征主要有_________、________、__________、________及____________
3.在现实生活中两个变量之间的函数关系是一种_______的关系.
温故夯基
频率分布
数字特征
平均数
众数
中位数
方差
标准差.
确定
1.相关关系
与函数关系不同,相关关系是一种_________性关系.
2.两个变量的线性相关
(1)散点图:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形.
(2)正相关与负相关
①正相关:散点图中的点散布在从________到___________的区域.
非确定
左下角
右上角
知新益能
②负相关:散点图中的点散布在从__________到__________的区域.
3.回归直线的方程
(1)回归直线:如果散点图中点的分布从整体上看大致在____________附近,就称这两个变量之间具有______________关系,这条直线叫做回归直线.
(2)回归方程:_____________对应的方程叫回归直线的方程,简称回归方程.
(3)回归直线方程y=bx+a,其中
左上角
右下角
一条直线
线性相关
回归直线
b是回归方程的斜率,a是截距.
4.最小二乘估计
我们可以求Q(a,b)=_________________的最小值,如果常数a,b使Q(a,b)达到最小,就称直线l:y=bx+a为{xi}与{yi}的回归直线,回归直线中的a、b分别是固有值a0、b0的最小二乘估计.
1.相关关系与函数关系有什么不同?
提示:函数关系是一种确定的关系,相关关系是一种非确定的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
2.回归直线通过样本点的中心,对照平均数与样本数据之间的关系,你能说说回归直线与散点图中各点之间的关系吗?
问题探究
3.“回归直线”方程能否按解析几何中求直线方程的方法来求?
提示:不能.求回归直线方程的方法是用最小二乘估计.因为所有数据点都分布在一条直线附近时,这样的直线可画出许多条,而“回归直线”是这些直线中“最贴近”已知数据的,但并不一定过数据中的某个点,故一般不按解析几何中求直线方程的方法来求.
课堂互动讲练
相关关系的判断
考点突破
在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.由于变量间的相关关系带有不确定性,这就需要通过收集大量的数据,对数据进行统计分析,发现规律,从而作出科学的判断.
以下是在某地搜集到的不同楼盘新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:
例1
房屋面积x(m2) 115 110 80 135 105
销售价格y(万元) 24.8 21.6 19.4 29.2 22
(1)画出数据对应的散点图;
(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?
【思路点拨】 先建立直角坐标系,画出散点图,再判断相关关系.
【解】 (1)数据对应的散点图如图所示.
(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关关系,且是正相关.
【名师点评】 两个随机变量x和y相关关系的确定方法:
(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;
(2)表格、关系式法:结合表格或关系式进行判断;
(3)经验法:借助积累的经验进行分析判断.
变式训练1 某地农业技术指导站的技术员,经过在7块并排大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据:(单位:千克)
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
施化肥量x和水稻产量y是否具有相关关系?
解:作出散点图进行分析.散点图如下:
从散点图可以看出施化肥量x和水稻产量y的确存在一定相关关系,大体上随着施化肥量的增加,水稻的产量也在增加.
求回归直线方程
据最小二乘估计思想的公式,用待定系数法求出a,b,从而确定回归直线方程.
5个学生的数学和物理成绩(单位:分)如下表:
例2
学生
学科  A B C D E
数学 80 75 70 65 60
物理 70 66 68 64 62
画出散点图,判断它们是否具有相关关系,若相关,求出回归方程.
【解】 以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示.
由散点图可知,两者之间具有相关关系,且为线性相关.
列表,计算
i 1 2 3 4 5
xi 80 75 70 65 60
yi 70 66 68 64 62
x i y i 5600 4950 4760 4160 3720
6400 5625 4900 4225 3600
变式训练2 随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查10个家庭,得数据如下表:
家庭编号 1 2 3 4 5 6 7 8 9 10
xi(收入)/千元 0.8 1.1 1.3 1.5 1.5 1.8 2.0 2.2 2.4 2.8
yi(支出)/千元 0.7 1.0 1.2 1.0 1.3 1.5 1.3 1.7 2.0 2.5
(1)判断家庭平均收入与月平均生活支出是否相关;
(2)若二者线性相关,求回归直线方程.
解:(1)作出散点图:
观察发现各个数据对应的点都在一条直线附近,所以二者有线性相关关系
利用回归直线,我们可以进行预测.若回归直线方程为y=bx+a,则x=x0处的估计值为:y=bx0+a.
某5名学生总成绩和数学成绩(单位:分)如下表所示:
利用回归方程对总体进行估计
例3
学生 A B C D E
总成绩(x) 482 383 421 364 362
数学成绩(y) 78 65 71 64 61
 (1)作出散点图;
(2)求数学成绩y对总成绩x的回归方程;
(3)如果一个学生的总成绩为450分,试预测这个学生的数学成绩.
【思路点拨】 进行线性回归分析的关键是求出线性回归直线方程.由于求回归系数a、b的运算量很大,故可用列表法并借助计算器求解.
【解】 (1)散点图如图所示:
(2)列表:
i 1 2 3 4 5
xi 482 383 421 364 362
yi 78 65 71 64 61
x i y i 37596 24895 29891 23296 22082
【名师点评】 (1)回归分析是寻找相关关系中非确定性关系的某种确定性;
(2)求回归直线方程,关键在于正确地求出系数a,b,由于a,b的计算量大,计算时要仔细,避免计算失误.
变式训练3 一台机器由于使用时间较长,生产的零件有一些会缺损,按不同转速生产出来的零件有缺损的统计数据如下表:
转速x(转/秒) 16 14 12 8
每小时生产缺损零件数y(件) 11 9 8 5
(1)作出散点图;
(2)如果y与x线性相关,求出回归直线方程;
(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围?
解:(1)根据表中的数据画出散点图如图:
(2)设回归直线方程为:y=bx+a,并列表如下:
i 1 2 3 4
xi 16 14 12 8
yi 11 9 8 5
xiyi 176 126 96 40
1.在研究两个变量是否存在某种关系时,必须从散点图入手,对于散点图,可以做出如下判断:(1)如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变量之间的关系,即变量之间具有函数关系;(2)如果所有的样本点都落在某一函数曲线附近,那么变量之间具有相关关系;(3)如果所有的样本点都落在某一直线附近,那么变量之间具有线性相关关系.
方法感悟
2.知道x与y呈线性相关关系,无需进行相关性检验,否则,应首先进行相关性检验,如果本身两个变量不具备相关关系,或者说,它们之间相关关系不显著,即使求出回归直线方程也是毫无意义的,而且用其估计和预测的量也是不可信的.
3.利用回归方程估计总体,只是反映了x与y的一种近似的相关关系,即y值并不一定是真实值.(共32张PPT)
12.3 用样本分布估计总体分布
12.3.1 频率分布表
12.3.2 频率分布直方图
12.3.3 频率折线图
12.3.4 数据茎叶图
12.3.4 





课堂互动讲练
知能优化训练
课前自主学案
学习目标
 1.理解用样本的频率分布估计总体的方法;
2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图;
3.能够利用图形解决实际问题.
课前自主学案
1.抽样的方法有:_______________、
____________和______________
2.在抽样的过程中必须保证每个个体被抽到的可能性________
温故夯基
简单随机抽样
系统抽样
分层抽样.
相等.
1.频率分布表:为了能直观地显示样本的频率分布情况,通常我们会将样本的________,样本中出现该事件的________以及计算所得的相应_________列在一张表中,这样的表就叫做频率分布表.
2.频率分布直方图:在频率分布直方图中,横轴表示各组的端点,纵轴表示频率.
知新益能
容量
频数
频率
注:有的频率分布直方图中,用纵轴表示频率/组距,那么各小长方形的面积就表示数据落在各小组内的频率.
3.频率分布折线图:连接频率分布直方图中各小长方形_______________,就得到频率分布折线图.
4.茎叶图:顾名思义,茎是指______的一列数,叶就是从茎的________生长出来的数.一般地,中间的数字表示数据的十位数,旁边的数字分别表示两组数据得分的个位数.
上端的中点
中间
旁边
1.将数据的样本进行分组的目的是什么?
提示:从样本中的一个个数字中很难直接看出样本所包含的信息,通过分组,并计算其频率,目的是通过描述样本数据分布的特征,从而估计总体的分布情况.
问题探究
2.如何确定组距和组数?
提示:组距与组数的确定没有统一固定的标准.将数据分组时,组数力求合理,以使数据的分布规律能清楚地呈现出来.组数太多或太少都会影响我们了解数据的分布情况.一般样本容量越大,分组就越多.
课堂互动讲练
列频率分布表,画频率分布直方图、折线图
考点突破
频率分布表是反映总体频率分布的表格,一般内容有数据的分组、频率的统计、频数和频率等内容.根据这个表格,就可以在坐标系中画频率分布直方图.横坐标表示数据的分组,纵坐标表示频率,将直方图中长方形上端的中点连接起来就是折线图.这三者是相互统一的.
美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图;
例1
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
【解】 (1)以4为组距,列表如下:
分组 频数累计 频数 频率
[41.5,45.5)


正正正
正 2
7
8
16
5
4
2 0.04550.1591
0.1818
0.3636
0.1136
0.0909
0.0455
[45.5,49.5)
[49.5,53.5)
[53.5,57.5)
[57.5,61.5)
[61.5,65.5)
[65.5,69.5]
合计 44 1.00
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在[50,60)岁之间,45岁以下及65岁以上就任的总统所占的比例相对较小.
【名师点评】 (1)利用样本在某一范围内的频率,近似地估计总体在这一范围内的频率.
(2)一般地,频率分布表除最下边的区间是闭区间外,其他区间均为左闭右开区间.
变式训练1 调查某校高三年级男生的身高,随机抽取了40名高三男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 168 160 174 165 168 174 159 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161
(1)作出频率分布表;
(2)画出频率分布直方图、频率分布折线图.
解:(1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29.确定组距为3,则组数为10,列表如下:
分组 频数 频率(%)
[150.5,153.5) 1 2.5
[153.5,156.5) 1 2.5
[156.5,159.5) 4 10.0
[159.5,162.5) 5 12.5
[162.5,165.5) 8 20.0
[165.5,168.5) 11 27.5
[168.5,171.5) 6 15.0
[171.5,174.5) 2 5.0
[174.5,177.5) 1 2.5
[177.5,180.5] 1 2.5
合计 40 100.0
(2)频率分布直方图及频率分布折线图如图所示:
茎叶图及其应用
茎叶图是一种既能保留原始数据又能展示数据分布情况的表和图的结合.
某中学高二(2)班甲、乙两名同学自上高中以来每场数学考试成绩情况如下:
甲的得分:
95,81,75,91,86,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
例2
【思路点拨】 用中间的数字表示两位同学得分的十位数和百位数,两边的数字分别表示两人每场数学考试成绩的个位数.作茎叶图先确定中间数取数据的哪几位,填写数据时边读边填.比较时从数据分布的对称性、中位数、稳定性等方面来比较.
【解】 甲、乙两人数学成绩的茎叶图如图所示:
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88.因此乙同学发挥比较稳定,总体得分情况比甲同学好.
【名师点评】 (1)在绘制茎叶图时应注意重复出现的数据应重复记录,不能遗漏.同时要注意到,在表示含三位有效数字以上的数据时,不宜用茎叶图.
(2)绘制茎叶图的关键是分清茎和叶.一般地说,如果数据是整数(至少为两位数)的,除个位数字以外的其它数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据特点合理选择茎和叶.
用样本的频率分布估计总体的分布,是列频率分布表和画频率分布直方图的主要目的.在估计时,只需要求出相应的样本分布中的有关数据即可推知总体分布的情况.
为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:
频率分布直方图、折线图的综合应用
例3
[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2;
(1)列出频率分布表;
(2)画出频率分布直方图以及频率分布折线图;
(3)据上述图表,估计数据落在[10.95,11.35)范围内的可能性是百分之几?
(4)数据小于11.20的可能性是百分之几?
【思路点拨】 根据画频率分布直方图的步骤先画频率分布直方图,再画折线图.
【解】 (1)频率分布表如下:
分组 频数 频率
[10.75,10.85) 3 0.03
[10.85,10.95) 9 0.09
[10.95,11.05) 13 0.13
[11.05,11.15) 16 0.16
[11.15,11.25) 26 0.26
[11.25,11.35) 20 0.20
[11.35,11.45) 7 0.07
[11.45,11.55) 4 0.04
[11.55,11.65] 2 0.02
合计 100 1.00
(2)频率分布直方图及频率分布折线图,如图
(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为1-(0.03+0.09)-(0.07+0.04+0.02)=0.75=75%,即数据落在[10.95,11.35)范围内的可能性是75%.
(4)数据小于11.20的可能性即数据小于11.20的频率,设为x,则(x-0.41)÷(11.20-11.15)
=(0.67-0.41)÷(11.25-11.15),
所以x-0.41=0.13,即x=0.54,
从而估计数据小于11.20的可能性是54%.
【名师点评】 频率分布表能比较准确地反映样本的频率分布,而频率分布直方图则能直观地反映样本的频率分布,频率分布折线图的优点是它反映了数据的变化趋势.
变式训练2 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至31日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了如图所示的频率分布直方图.已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数量最多?有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?
几种表示频率分布的方法的优点与不足
方法感悟
优点 不足
频率分布表 表示数量较确切 分析数据分布的总体态势不方便
频率分布直方图 表示数据分布情况非常直观 原有的具体数据信息被抹掉了
优点 不足
频率分布折线图 能反映数据的变化趋势 不能显示原有数据信息
茎叶图 一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况 样本数据较多或数据位数较多时,不方便表示数据
同课章节目录