【2012优化方案】北师大版必修3 数学 课件 第1章(8份)

文档属性

名称 【2012优化方案】北师大版必修3 数学 课件 第1章(8份)
格式 rar
文件大小 5.1MB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2011-10-06 19:50:02

文档简介

(共23张PPT)
第1章 统计
课标领航
本章概述
1.三种抽样方法:简单随机抽样、系统抽样、分层抽样.
2.用样本的频率分布估计总体的频率分布及用样本的特征数估计总体的特征数的方法.
3.线性回归方程的建立.
本章重点是理解随机抽样的必要性和重要性,学会运用简单随机抽样、分层抽样和系统抽样方法;学会列频率分布表,画频率分布直方图、频率折线图及茎叶图,并用来估计总体.本章难点是统计思想、回归思想的建立,对总体分布的估计.
学法指导
学习本章时,既要充分掌握各种统计方法、原理及思想,又要大量地参加实践活动,实地考察统计;既要大胆地猜想,又要细心、耐心地计算;同时要借助于科学计算工具,作出精确的图表,尽量减少误差.
§1 从普查到抽样
§1 
从普查到抽样
课堂互动讲练
知能优化训练
课前自主学案
学习目标
1.了解抽样调查的概念及优点,体会常见抽样的统计方法.
2.会对一些实际问题进行合理的抽样调查.
3.结合具体的实际问题,理解抽样调查的必要性与重要性.
课前自主学案
统计学是研究如何合理收集、整理、
________数据的学科,它可以帮助我们从数据中提取有用的信息,并为制定______提供依据,统计学有助于提高我们的归纳能力.
温故夯基
分析
决策
1.普查的特点
普查主要有两个特点:(1)所取得的资料更加______________;(2)主要调查在特定时段的社会经济现象_______的数量.
全面、系统
总体
知新益能
2.抽样调查
一部分
数据
全体
抽取
及时
人力
物力
1.如何理解普查与抽样调查的特点?
问题探究
提示:
方式 抽样调查 普查


节省人力、物力和财力 需要大量的人力、物力和财力
可以用于带有破坏性的检查 不能用于带有破坏性的检查
结果与实际情况之间有误差 在操作正确的情况下,能得到准确结果
2.抽样调查应注意哪些问题?
提示:抽样调查应注意以下几点:
(1)抽样时,要保证每一个个体都可能被抽到,并且被抽到的机会是均等的.
(2)在抽样调查时,要尽可能避免人为因素的干扰.
(3)抽样调查要尽可能控制误差,尽量增加样本的数量.
(4)注意选取的样本要具有代表性.
课堂互动讲练
概念辨析题
考点突破
明确所要考查的对象,理解相关概念.
(2011年大连质检)2010年某县主管部门从全县4600名五年级的小学生中抽取520名学生进行视力情况的统计分析,下列说法正确的是__________.
例1
①4600名学生是总体;
②每名学生是个体;
③抽取的520名学生的视力情况是一个样本;
④4600是总体容量;
⑤520名学生的视力情况是样本容量.
【思路点拨】 先弄清考查对象是什么,再根据概念作以判断.
【解析】 研究对象是视力情况,则4600是总体容量,4600名学生的视力情况是总体,每名学生的视力情况是个体,520名学生的视力情况是一个样本,样本容量是520,因此③④正确.
【答案】 ③④
【名师点评】 解决此类问题关键是明确总体与个体的意义,总体容量与样本容量的实质,它们一类是研究对象,一类是数量.
自我挑战 某校从高中一年级500名学生中抽取100名学生进行体重的统计分析,则下列说法中正确的是(  )
A.500名学生是总体
B.每名学生是个体
C.抽取的100名学生的体重是一个样本
D.抽取的100名学生是样本容量
解析:选C.本题考查的对象是“学生的体重”这项指标,故A、B不正确.而样本容量是数量,故D不正确,应选C.
普查与抽样调查的比较
明确普查与抽样调查的优缺点,尤其在抽样调查中要注意以下事项:
(1)样本抽取具有随机性:即在抽取样本时总体的每个个体被抽到的可能性相等.
(2)样本抽取具有代表性:当总体数目较大且个体有明显差异时,要注意样本的代表性.
近两年我国出现了大面积的“电荒”,很多城市拉闸限电,人们也纷纷响应政府号召,节约用电.现在你的任务是调查你所在年级各位同学家庭的每月平均用电量,并号召大家节约用电.结合本节学到的知识,你觉得应该如何实施此次调查呢?在抽样调查时,总体和样本各是什么?普查和抽样调查哪一个更好一些呢?
例2
【思路点拨】
【解】 视情况而定,若这一年级的人数较多时,用抽样调查的方法较好.若这一年级的人数不多时用普查的方法较好.
在抽样调查时,总体是全年级各位同学家庭的每月平均用电量.样本是被调查学生家庭的每月平均用电量.
当全年级人数较多时用抽样调查,迅速、及时又节约人力、物力和财力;当全年级人数较少时用普查,所取得的资料全面、系统,更具说服力.
【易误警示】 本题易出现没有分情况讨论而直接选择调查方式的错误,导致该种错误的原因是普查与抽样调查的特点没有理解到位.
1.普查是一项非常艰巨的工作,它要对所有的对象进行调查.当检验对象很大或检验对检验对象具有破坏性时,采用普查的方法是行不通的,要进行抽样调查.
2.抽样调查的优点:(1)迅速、及时;(2)节约人力、物力和财力.
3.在具体问题中,用普查还是抽样调查的方式,要根据它们的特点和适用范围进行判断.
方法感悟
知能优化训练
本部分内容讲解结束
点此进入课件目录
按ESC键退出全屏播放
谢谢使用(共35张PPT)
2.2 分层抽样与系统抽样
2.2 
分层抽样与系统抽样
课堂互动讲练
知能优化训练
课前自主学案
学习目标
1.通过实例理解分层抽样与系统抽样的方法.
2.理解并掌握分层抽样与系统抽样的具体应用.
课前自主学案
1.简单随机抽样方法有__________和
_______________
2.简单随机抽样的特点:_______________、___________、__________、___________
3.抽签法的优点是_______________
温故夯基
抽签法
随机数法.
总体个数有限
逐个抽取
不放回
公平性.
简便易行.
1.分层抽样
将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照____________随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为_______________
知新益能
所占比例
类型抽样.
2.系统抽样
系统抽样是将总体的个体进行编号,等距分组,在第一组中按照_________________抽取第一个样本.然后按_____________ (称为抽样距)抽取其他样本.这种抽样方法有时也叫____________或____________
简单随机抽样
相同间隔
等距抽样
机械抽样.
1.如何进行分层抽样?
提示:(1)将相似的个体归为一类,即为一层,分层时要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于样本容量与总体个数之比.
问题探究
2.如何理解系统抽样的特点?
提示:(1)系统抽样适用于:总体容量较大,且个体之间无明显的差异.
(2)剔除多余的个体及第1段抽样都用简单随机抽样.
(3)抽样过程是等可能抽样,即每个个体被抽到的可能性相等.
课堂互动讲练
分层抽样
考点突破
一个单位有500名职工,其中不到35岁的有125人,35岁到49岁的有280人,50岁以上的有95人.为了了解这个单位与职工身体状况有关的某项指标,如何从中抽取一个容量为100的样本.
例1
【思路点拨】
【解】 用分层抽样来抽取样本,步骤是:
(1)分层:按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁以上的职工.
(2)确定样本容量与总体容量之比100∶500=1∶5.
【名师点评】 若总体由差异明显的几个层次组成,往往采用分层抽样的方法,若有某些层面应抽取的个体数目不是整数时,可作适当的调整.
自我挑战1 厂家生产的一批1200件产品是由三台机器生产的,其中甲机器生产240件,乙机器生产360件,丙机器生产600件.现用分层抽样的方法,从中抽取一个容量为30的样本检查这批产品合格率,试说明这种抽样方法是公平的.
系统抽样
系统抽样的实质是“等距抽样”(即在抽样过程中,抽样的间隔相等),要取多少个样本就将总体分成多少组,每组中取一个.
要从1002个学生中选取一个容量为20的样本,试用系统抽样的方法给出抽样过程.
例2
【思路点拨】
【解】 因为1002=20×50+2,为了保证“等距”分段,应先剔除2人.
第一步:将1002名学生用随机方式编号.
第二步:从总体中剔除2人(剔除方法可用随机数法),将剩下的1000名学生重新编号(编号分别为000,001,002,…,999),并分成20段.
第三步:在第一段000,001,002,…,049这50个编号中用简单随机抽样抽出一个号(如003)作为起始号码.
第四步:将编号为003,053,103,…,953的个体抽出,组成样本.
自我挑战2 下列问题中,最适合用系统抽样抽取样本的是(  )
A.从10名学生中,随机抽2名学生参加义务劳动
B.从全校3000名学生中,随机抽100名学生参加义务劳动
C.从某市30000名学生中,其中小学生有14000人,初中生有10000人,高中生有6000人,抽取300名学生,了解该市学生的近视情况
D.从某班周二值日小组6人中,随机抽取1人擦黑板
解析:选B.A中总体个体无差异,但个数较少,适合用简单随机抽样;同样D中也适合用简单随机抽样;C中总体中个体有差异,不适合用系统抽样;B中总体中有3000个个体,个数较多且无差异,适合用系统抽样.
抽取样本要根据样本容量多少,及有无明显的差异等信息特征来确定采用的抽样方法.简单随机抽样是基本的抽样方法,可穿插在其他抽样方法中使用.
三种抽样方法的比较
为了考察某学校教学水平,将抽取这个学校高三年级的部分学生本学年的考试成绩进行考察,为了全面反映实际情况,采取以下三种方式进行抽查(已知该学校高三年级共有20个教学班,并且每个班内的学生按随机方式编好了学号,假定该校每班学生人数都相同): ①从全年级20个班中任意抽取一个班,再从该班任意抽取20人,考察他们的学习成绩;
②每个班都抽取1人,共计20人,考察这20个学生的成绩;
例3
③把学生按成绩分成优秀、良好、普通三个级别,从其中共抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人).
根据上面的叙述,回答下列问题:
(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?
(2)上面三种抽取方式中各自采用何种抽样方法?
(3)试分别写出上面三种抽取方式各自抽取样本的步骤.
【思路点拨】 三种抽样有各自的适用范围,可选择合适的抽样方法,然后写出抽样过程即可,注意系统抽样中,当总体个数不能被样本容量整除时,要采用简单随机抽样的方法剔除部分个体.
【解】 (1)上面三种抽取方式中,其总体都是高三全体学生本年度的考试成绩,个体都是指高三年级每个学生本年度的考试成绩.其中第一种抽取方式中样本为所抽取的20名学生本年度的考试成绩,样本容量为20;
第二种抽取方式中样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第三种抽取方式中样本为所抽取的100名学生本年度的考试成绩,样本容量为100.
(2)上面三种抽取方式中,第一种方式采用的是简单随机抽样法;第二种方式采用的是系统抽样法和简单随机抽样法;第三种方式采用的是分层抽样法和简单随机抽样法.
(3)第一种方式抽样的步骤如下:
第一步:在这20个班中用抽签法任意抽取一个班;
第二步:从这个班中按学号用随机数表法或抽签法抽取20名学生,考察其考试成绩.
第二种方式抽样的步骤如下:
第一步:在第一个班中,用简单随机抽样法任意抽取某一学生,计其学号为a;
第二步:在其余的19个班中,选取学号为a的学生,共计20人.
第三种方式抽样的步骤如下:
第一步:分层.因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应把全体学生分成三个层次;
【名师点评】 设计抽样方法时,一方面要使样本具有较强的代表性,不仅使每个个体有同样的机会被抽中,还要体现总体构成的不同,另一方面应当使抽样过程简便易行.解决此类问题,先分析总体构成是否有明显差别,然后再分析总体容量和样本容量,根据它们的特点确定抽样方法.
1.分层抽样的一般步骤
方法感悟
2.系统抽样的一般步骤
3.三种抽样方法的比较
类别 特点 相互联系 适用条件 共同点
简单随机抽样 从总体中逐个抽取 1.简单随机抽样是基础,分层抽样和系统抽样转化为简单随机抽样;
2.分层抽样在各层中采用简单随机抽样或系统抽样;
3.系统抽样在确定第一个个体时,采用简单随机抽样. 个体数目较少 抽样
过程
中,
每个
个体
被抽
到的
概率
相等
分层抽样 将总体分成几层,在每层中按照所占比例随机抽取  总体是由差异明显的几部分组成,可以分为几个不同类型
系统抽样 将总体平均分成几段,按等距的规则抽取样本 个体数目较多,样本容量较大,个体无明显差异
知能优化训练
本部分内容讲解结束
点此进入课件目录
按ESC键退出全屏播放
谢谢使用(共40张PPT)
§4 数据的数字特征
§4 
数据的数字特征
课堂互动讲练
知能优化训练
课前自主学案
学习目标
1.掌握各种基本数字特征的概念、意义以及它们各自的特点.
2.重视数据的计算,体会统计思想.
课前自主学案
1.统计图表的作用是:从数据中获取有用的信息,_______________地理解相应的结果.
2.条形统计图的优点是:当数据量很大时更能反映数据分布的大致情况,并且能够清晰地表示出各个区间的_______________
缺点是:条形图损失了数据的部分信息.
温故夯基
直观、准确
具体数目.
3.茎叶图的优点是:①茎叶图上没有信息的损失,所有的_____________都可以从这个茎叶图中得到;②茎叶图可以随时记录,方便表示与比较.
缺点是:当数据量很大时不直观,不清晰.
原始数据
知新益能
位于中间
位于中间两个数的
平均数
出现次数最多
统计量
最大值
最小值
1.如何理解众数、平均数、中位数的异同?
提示:(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会相应引起平均数的变动.
问题探究
(3)众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,众数往往更能反映问题.
(4)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.
2.如何理解方差与标准差的意义和应用?
提示:(1)引入方差、标准差刻画数据的原因
单从众数、中位数、平均数、最大值、最小值、极差来分析数据,各个数据的波动情形无法更好更全面的体现.
(2)方差、标准差的意义
方差、标准差描述了一组数据围绕平均数波动的大小,体现了样本数据到平均数的一种平均距离.
(3)实际应用
方差与原始数据单位不同,平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但实际解决问题时一般采用标准差.
3.方差和标准差都是用来描述一组数据波动情况的特征数,方差和标准差的大小与数据的波动有何关系?
提示:方差(标准差)越大,波动越大,稳定性越差;方差(标准差)越小,波动越小,稳定性越好.
课堂互动讲练
众数、中位数、平均数的应用
考点突破
众数体现了样本数据最大集中点;中位数是样本数据所占频率的等分线;平均数与每一个样本数据有关.
某企业员工的月工资资料如下(单位:元):
例1
800 800 800 800 800 1000
1000 1000 1000 1000 1000 1000
1000 1000 1000 1200 1200 1200
1200 1200 1200 1200 1200 1200
1200 1200 1200 1200 1200 1200
1200 1200 1200 1200 1200 1500
1500 1500 1500 1500 1500 1500
2000 2000 2000 2000 2000 2500
2500 2500
(1)计算该公司员工月工资的平均数、中位数和众数;
(2)假如你去这家企业应聘职位,你会如何看待员工的收入情况?
【思路点拨】 (1)根据平均数、中位数和众数的定义可以分别求得;(2)主要根据月工资的平均数来看待员工的收入情况,当然也要考虑中位数和众数.
(2)由于该公司员工月工资的中位数和众数与平均数比较接近,所以主要考虑月工资的平均数1320元作为月工资的代表.
这样以该公司月平均工资1320元与同类企业的工资待遇作比较即可.
【名师点评】 平均数是将所有的数据都考虑进去得到的度量,它是反映数据集中趋势最常用的量,中位数可靠性较差,当一组数据中个别数据变动较大时,常用中位数表示数据的集中趋势.而众数求法较简便,也经常被用到.考查一组数据的特征时,这三个数字特征要结合在一起考虑.
大多情况下人们会把眼光仅停留在工资表中的最大与最小值处,把最高工资作为一个单位工资的评价,这是一种错误的评价方式.
方差、标准差的计算与应用
(2011年白城检测)某学校对男、女学生进行有关“习惯与礼貌”的评分,记录如下:
男:
54,70,57,46,90,58,63,46,85,73,55,66,38,44,56,75,35,58,94,52
女:
77,55,69,58,76,70,77,89,51,52,63,63,69,83,83,65,100,74
(1)请用茎叶图表示上面的数据,并根据图估计男、女生得分的平均数,标准差的大小;
(2)分别计算男、女生得分的平均数、标准差,由此,你能得出什么结论?
例2
【思路点拨】
【解】 (1)用茎叶图表示数据如下:
从茎叶图中可以看出,男生的得分分布主要在茎叶图的上方而且相对较散,女生的得分分布则相对集中在茎叶图的中部.由此,我们可以估计:男生得分的平均数比女生的小,而标准差比女生的大.
(2)男生得分的平均数、标准差分别为60.75、16.0,女生得分的平均数、标准差分别为70.8、12.7.由此可以得出:女生得分较高且比较稳定.
【名师点评】 (1)平均数与方差是重要的数字特征数,是对总体的一种简明的描述,它们反映的情况有着重要的实际意义,从而要掌握其计算公式,为正确分析其含义打下基础.
(2)当两组数据的平均数相同或相近时,用方差或标准差比较它们的波动大小,样本方差或标准差越大,样本数据的波动越大,稳定性越差,反之,样本数据波动就越小,稳定性越好.
自我挑战1 甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是(单位:环):
甲:8,6,7,8,6,5,9,10,4,7;
乙:6,7,7,8,6,7,8,7,9,5.
(1)分别计算以上两组数据的平均数;
(2)分别求出两组数据的方差;
(3)根据计算结果,估计一下两名战士的射击情况.
统计图表是数据展示的一种方式,而统计量是要用到数据的准确值,从而可知统计量很可能与折线统计图、茎叶图相结合命题考查
甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示.
统计量与统计图表的综合运用
例3
(1)请填写下表:
平均数 方差 中位数 命中9环及9环以上次数


(2)请从下列四个不同的角度对这次测试结果进行分析:
①从平均数和方差相结合看,分析谁的成绩稳定;
②从平均数和中位数相结合看,分析谁的成绩好些;
③从平均数和命中9环及9环以上的次数相结合看,分析谁的成绩好些;
④从折线图上两人射击命中环数的走势看,分析谁更有潜力.
【思路点拨】 根据折线统计图得到甲、乙两人各射靶10次的有关数据,按照题意对数据进行适当处理,并选择恰当的平均数及方差公式计算出相应的结果,最后根据结果对问题作出回答.
【解】 (1)观察折线图可得甲射击10次中靶环数分别为:
9,5,7,8,7,6,8,6,7,7.
将它们由小到大重排为:
5,6,6,7,7,7,7,8,8,9.
乙射击10次中靶环数分别为:
2,4,6,8,7,7,8,9,9,10.
将它们由小到大重排为:
2,4,6,7,7,8,8,9,9,10.
根据以上的分析与计算填表如下:
平均数 方差 中位数 命中9环及9环以上次数
甲 7 1.2 7 1
乙 7 5.4 7.5 3
【名师点评】 统计图与统计量是从两个方面去分析样本,从而估计总体,是统计学的基础内容,要结合使用.
自我挑战2 某市对上、下班时的交通情况做抽样调查,在上、下班时间各抽取了12辆机动车,行驶时速如下(单位:km/h):
上班
时间 30 33 18 27 32 40 26 28 21 28 35 20
下班
时间 27 19 32 29 36 29 30 22 25 16 17 30
用茎叶图表示上面的样本数据,并求出样本数据的中位数、平均数及众数.
解:根据题意绘出该市上、下班交通情况的茎叶图,如图所示:
方法感悟
知能优化训练
本部分内容讲解结束
点此进入课件目录
按ESC键退出全屏播放
谢谢使用(共32张PPT)
本章优化总结
本章优化总结
专题探究精讲
知识体系网络
知识体系网络
专题探究精讲
抽样方法
考点突破
根据简单随机抽样、系统抽样、分层抽样这三种方法的共同点、适用范围和各自特点,恰当地选取抽样方法从总体中抽取样本,掌握这三种抽样方法抽取样本的步骤.
学习抽样方法应注意以下几点.
1.用随机数法抽样时,对个体所编的号码位数要相等.当题目中所给编号位数不等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.
3.应用三种抽样方法时需搞清楚它们的使用原则.
(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法.
(2)当总体容量较大,样本容量较小时可用随机数法.
(3)当总体容量较大,样本容量也较大时可用系统抽样法.
(4)当总体由明显差异的几部分构成时,采用分层抽样法.
某班共有60名学生,领到10张电影票,请你采用适当方式把这10张电影票分下去.
【思路点拨】 因人数较少,可采用简单随机抽样,用抽签法和随机数表法均可.
【解】 法一:抽签法
第一步 先将60名学生编号.编号为1,2,3,…,60;
第二步 准备抽签工具.把号码写在形状、大小相同的号签上,将这些号签放在同一个箱子里;
例1
第三步 实施抽签.抽签前先将放在箱子里的号签搅拌均匀,抽签时每次从中抽出一个号签,连续抽10次,根据抽到的10个号码对应10名学生,10张电影票就分给10名被抽到的学生.
法二:随机数表法
第一步 先将60名学生编号,分别为00,01,02,03,…,59;
第二步 由于总体的编号为两位数,在随机数表中选取两列组成两位数.从随机数表中的任意一个位置,按一定顺序开始读数.
如果读到的数小于59,则将它取出;若读到的数大于59,则舍去;重复的数字只取一个,直到取满10个不超过59的数为止.将10张电影票分给抽到的10名相应编号的学生.
【名师点评】 注意三种抽样方法的使用条件.
统计的基本思想
统计学的基本思想是用样本的特征去估计总体,它采取的方式有两种:一是用样本的频率分布去估计总体的频率分布;二是用样本的数字特征去估计总体的数字特征.
1.用样本的频率分布估计总体分布
利用样本的频率表和频率分布直方图对总体情况作出估计,有时也利用频率折线图和茎叶图对总体作出估计.
直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式,这样根据样本的频率分布,我们可以大致估计出总体的分布.但是,当总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增加,频率折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体密度曲线,它能给我们提供更加精细的信息.在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留原始信息,而且可以随时记录,这给数据的记录和表示都能带来方便.
(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与画频率分布直方图时要注意其方法步骤.
(2)用茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到;二是便于记录和表示,但数据位数较多时不方便.
从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)
40~50,2;50~60,3;60~70,10;70~80,15;
80~90,12;90~100,8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在60~90分的学生比例;
(4)估计成绩在85分以下的学生比例.
例2
【解】 (1)频率分布表如下:
成绩分组(Δxi) 频数(ni) 频率(fi)
40~50 2 0.04 0.004
50~60 3 0.06 0.006
60~70 10 0.2 0.02
70~80 15 0.3 0.03
80~90 12 0.24 0.024
90~100 8 0.16 0.016
(2)频率分布直方图如图所示.
【名师点评】 (1)掌握画频率分布直方图的步骤,频率分布直方图的处理与坐标系的单位长度有关,为了图形的直观性,要注意单位长度.
(2)要掌握频率分布直方图的特点,尤其是面积表示频率.
(3)由频率分布直方图得到的频率是不准确的,只能估计出可能性,它把原始数据特征丢失了,只能分析出哪部分数据出现的较多或较少,分析不出具体的数据.
2.用样本的数字特征估计总体的数字特征
为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计.众数是样本数据中出现次数最多的那个值;中位数把样本数据分成相同数目的两部分,其中一部分比这个数小或等于这个数,另一部分比这个数大或等于这个数;
甲、乙两人同时生产内径为25.40的一种零件,为了对两个人生产的机器零件的质量进行评比,现在从他们生产的零件中各抽取一个容量为20的样本,量得零件的内径尺寸如下(单位:mm):
甲:25.46 25.32 25.45 25.39 25.36 25.34
25.42 25.45 25.38 25.42
25.39 25.43 25.39 25.40 25.44 25.40
25.42 25.35 25.41 25.39
乙:25.40 25.43 25.44 25.48 25.48 25.47
例3
25.49 25.49 25.36 25.34
25.33 25.43 25.43 25.32 25.47 25.31
25.32 25.32 25.32 25.48
从生产的零件的内径来看,甲乙两人谁生产的零件的质量较高?
【思路点拨】 零件质量的高低问题,转化为对所抽取的样本的零件内径尺寸的平均数和方差的大小比较;根据公式计算出平均数和标准差,再比较大小即可得出结论.
从样本平均数看,甲生产的零件内径比乙生产的零件内径更接近内径标准,但是差异很小;从样本标准差看,由于s甲【名师点评】 像这类“选拔或区分”问题,通常利用平均数和方差等样本数据的数字特征来解决,只需比较他们的平均数和方差的大小即可.
除了函数关系这种确定性的关系之外,还大量存在因变量的取值带有一定随机性的两个变量,它们之间的关系是相关关系.
在本章中,我们学习了一元线性相关关系,通过建立线性回归方程就可以根据其部分观测值获得对这两个变量之间的整体关系的了解,主要是作出散点图和写出线性回归方程.(说明:在处理数据时,计算量大,因此要学会应用科学计算器)
线性回归分析
某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据.
例4
广告支出x(单位:万元) 1 2 3 4
销售收入y(单位:万元) 12 28 42 56
(1)画出表中数据的散点图;
(2)求出y对x的线性回归方程;
(3)若广告费为9万元,则销售收入约为多少万元?
【思路点拨】 由散点图判断y与x的相关关系,利用公式求出回归直线方程.
【解】 (1)散点图如图:
(2)观察散点图可知各点大致分布在一条直线附近,列出下列表格,以备计算a、b.
i xi yi x xiyi
1 1 12 1 12
2 2 28 4 56
3 3 42 9 126
4 4 56 16 224
【名师点评】 计算要细心、准确,注意中间结果的保留.
本部分内容讲解结束
点此进入课件目录
按ESC键退出全屏播放
谢谢使用(共52张PPT)
§5 用样本估计总体
5.1 估计总体的分布
5.2 估计总体的数字特征
5.2 
估计总体的数字特征
课堂互动讲练
知能优化训练
课前自主学案
学习目标
1.理解频率分布直方图、频率折线图的概念.
2.会用样本频率分布去估计总体分布.
3.会用样本的基本数字特征估计总体的基本数字特征.
4.体会统计问题的基本思想.
课前自主学案
1.初中学过的众数、中位数、平均数,其定义分别是
(1)在一组数据中________________的数据叫作这组数据的众数.
(2)将一组数据按大小顺序依次排列,把处在______________的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.
温故夯基
出现次数最多
最中间位置
2.反映数据的离散程度的量有_________、__________等.
方差
标准差
方差:s2=
_______________________________________
标准差s=______=
_______________________________________
知新益能
1.频率分布直方图和频率折线图
频率分布直方图 频率折线图
定义 频率分布直方图由一些小矩形来表示,每个小矩形的宽度为Δxi(分组的宽度),高为_________,小矩形的面积恰为相应的__________,图中所有小矩形的面积之和为______. 在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的________开始,用线段依次连接各个矩形的
_____________,直至右边所加区间的________,就可以得到一条折线,我们称之为频率折线图.
fi/Δxi
频率fi
1
中点
顶端中点
中点
频率分布直方图 频率折线图
当样
本容
量很大时 样本中落在每个区间内的_________________会稳定于总体在相应区间内取值的_________,因此我们就可以用样本的
______________________来估计总体在任意区间内取值的__________. 所划分的区间数也可以随之增多,而每个区间的长度则会相应___________,相应的频率折线图就会越来越接近于
_____________________
作用 用样本分布去______________________情况
样本数的频率
概率
频率分布直方图
概率
随之减小
一条光滑曲线.
估计总体分布
3.估计总体的数字特征
样本平均数和样本标准差可分别用来估计________________和__________,如果抽样的方法比较合理,那么样本可以反映总体的信息,从样本中所得到的有关总体的估计可能互不相同,这一现象是由抽样的___________引起的,当
_____________很大时,样本数据确实反映了总体的信息.
总体的平均数
标准差
随机性
样本容量
1.如何绘制频率分布直方图?
提示:
问题探究
2.如何把握样本的平均数、标准差二者在估计总体中的作用?
提示:(1)样本的标准差描述了总体数据围绕平均数波动的大小程度,样本的标准差越大,总体数据估计越分散;样本的标准差越小,总体估计越集中.特别地,当样本的标准差为0时,则标明总体数据估计没有波动,估计数据全相等.
(2)样本的平均数和标准差是两个重要的数字特征,在应用平均数和标准差解决问题时,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由标准差研究其与平均数的偏离程度.
课堂互动讲练
频率直方图和频率折线图的绘制
考点突破
频率分布表是反映总体频率分布的表格,一般内容有数据的分组、频率的统计、频数和频率等内容.根据这个表格,就可以在坐标系中画频率分布直方图.
例1
为了了解某所中学男生身高情况,对该中学同龄的50名男生的身高进行了测量,结果如下(单位:cm):
175 168 170 176 167 181 162 173 171 177
171 171 174 173 174 175 177 166 163 160
166 166 163 169 174 165 175 165 170 158
167 174 172 166 172 167 172 175 161 173
184 170 178 165 157 172 173 166 177 169
(1)列出样本的频率分布表,画出频率分布直方图和频率折线图;
(2)估算该中学男生身高在[164.5,176.5)的频率.
【思路点拨】 依据绘制频率分布表、频率分布直方图、频率折线图的步骤,首先合理分组,确定组距,然后列频率分布表,绘频率分布直方图、频率折线图.
【解】 (1)步骤:
①求极差,在这个样本中,最大值是184,最小值是157,
所以极差等于184-157=27.
②决定组距与组数:可以取组距为4,分成7组.
③将数据分组:[156.5,160.5),[160.5,164.5),[164.5,168.5),[168.5,172.5),[172.5,176.5),[176.5,180.5),[180.5,184.5).
④列频率分布表:
分组 频数 频率
[156.5,160.5) 3 0.06
[160.5,164.5) 4 0.08
[164.5,168.5) 12 0.24
[168.5,172.5) 12 0.24
[172.5,176.5) 13 0.26
[176.5,180.5) 4 0.08
[180.5,184.5) 2 0.04
合计 50 1.00
⑤画频率分布直方图,如图.
连接频率分布直方图中各小长方形上端的中点,得频率折线图,如图.
(2)根据频率分布表和频率分布直方图可得,样本中男生身高落在[164.5,176.5)的频率为0.24+0.24+0.26=0.74.
所以该中学男生身高在[164.5,176.5)的频率是0.74.
【名师点评】 将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,左、右两端点分别向外延伸半个组距,并取此组距上在x轴上的点与折线的首、尾分别连接,可得到频率折线图,也可以直接用频率表作出频率折线图,其方法为:用每组中点的数作横坐标,相应频率除以
组距所得的数作纵坐标描点,然后用折线依次连接起来即可.其中,频率折线图与横轴相连,是为了看图方便,横轴上的左右两端点没有实际的意义.
自我挑战1 (2011年锦州质检)有一个容量为100的某校毕业生起始月薪的样本数据的分组及各组的频数如下:
起始
月薪
(百元) 13~14 14~15 15~16 16~17 17~18 18~19 19~20 20~21
频数 7 11 26 23 15 8 4 6
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率折线图;
(3)根据频率分布估计该校毕业生起始月薪低于2000元的频率.
解:(1)样本频率分布表
起始月薪分组(Δxi) 频数(ni) 频率(fi)
13~14 7 0.07 0.07
14~15 11 0.11 0.11
15~16 26 0.26 0.26
16~17 23 0.23 0.23
17~18 15 0.15 0.15
18~19 8 0.08 0.08
19~20 4 0.04 0.04
20~21 6 0.06 0.06
(2)频率分布直方图和频率
折线图如图:
(3)起始月薪低于2000元
的频率为0.07+0.11+…
+0.04=0.94,
故起始月薪低于2000元的频率估计为0.94.
利用图形信息,解决实际问题
列频率分布表和画出频率分布直方图的最终目的是通过样本分布估计总体分布.在估计时,只需要求出相应的样本分布中的
有关数据即可推知总体分布的情况.
为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”.共有900名学生参加了这次竞赛.
为了解本次竞赛成绩情况,从中
抽取了部分学生的成绩(得分均为
整数,满分为100分)进行统计.
请你根据尚未完成并有局部污损
的频率分布表和频率分布直方图,
解答下列问题:
例2
宽度分组(Δxi) 频数(ni) 频率(fi)
50.5~60.5 4 0.08 0.008
60.5~70.5 0.16
70.5~80.5 10
80.5~90.5 16 0.32
90.5~100.5
合计 50
(1)填充频率分布表的空格;
(2)补全频率分布直方图;
(3)若成绩在75.5分~85.5分的学生为二等奖,问该校获得二等奖的学生约为多少人?
【解】 (1)频率分布表如下:
宽度分组(Δxi) 频数(ni) 频率(fi)
50.5~60.5 4 0.08 0.008
60.5~70.5 8 0.16 0.016
70.5~80.5 10 0.20 0.020
80.5~90.5 16 0.32 0.032
90.5~100.5 12 0.24 0.024
合计 50 1.00 0.100
(2)频率分布直方图如图所示:
因为成绩在80.5分~90.5分的学生频率为0.32,
所以成绩在80.5分~85.5分的学生频率为0.16,所以成绩在75.5分~85.5分的学生频率为0.26,由于有900名学生参加了这次竞赛,所以该校获得二等奖的学生约为0.26×900=234(人).
【名师点评】 (1)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到题意中看不清楚的信息和数据模式.
(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性,利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.
自我挑战2 为了解某校初中毕业男生的体能状况,从该校初中毕业班学生中抽取若干名男生进行铅球测试,把所得数据(精确到0.01米)进行整理后,分成6组画出频率分布直方图的一部分(如图),已知从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30.第6小组的频数是7.
(1)请将频率分布直方图补充完整;
(2)该校参加这次铅球测试的男生有多少人?
(3)若成绩在8.0米以上(含8.0米)的为合格,试求这次铅球测试的成绩的合格率.
解:(1)由频率分布直方图的意义可知,各小组频率之和为1,故第6小组的频率为:
1-(0.04+0.10+0.14+0.28+0.30)=0.14,易知第6小组与第3小组的频率相等,故两个小长方形等高,图略.
(2)由(1)知,第6小组的频率是0.14.
(3)由图可知,第4、5、6小组成绩在8.0米以上(含8.0米),其频率之和为:0.28+0.30+0.14=0.72,故合格率为72%.
从高三抽出50名学生参加数学竞赛,由成绩得到如图的频率分布直方图.
由于一些数据丢失,试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生的平均成绩.
根据频率分布直方图求统计量
例3
【解】 (1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形框的中间值的横坐标即为所求,所以众数应为75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.
因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.
∵0.004×10+0.006×10+0.02×10
=0.04+0.06+0.2=0.3,
∴前三个小矩形面积的和为0.3.
而第四个小矩形面积为0.03×10=0.3,
0.3+0.3>0.5,
∴中位数应位于第四个小矩形内.
设其底边为x,高为0.03,
令0.03x=0.2得x≈6.7,
故中位数应为70+6.7=76.7.
(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.
∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈74.
综上,(1)众数是75,中位数约为76.7;
(2)平均成绩约为74.
【名师点评】 (1)利用频率分布直方图求数字特征:
①众数是最高的矩形的底边的中点;
②中位数左右两侧直方图的面积相等;
③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标.
(2)利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致.但它们能粗略估计其众数、中位数和平均数.
平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
用样本数字特征估计总体数字特征
甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
例4
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
【名师点评】 当总体容量较大时,用样本的数字特征去估计总体的数字特征,方差和标准差都是刻画数据的离散程度的,但在实际问题中多采用标准差,如生产中当样本的平均数或标准差超过了规定界限时,说明这批产品质量距生产要求有了较大偏离,应及时进行检查解决.
方法感悟
1.分析数据的一种基本方法是用图将它们画出来,图形不仅可以帮助我们从数据中获取有用的信息,还可以帮助我们直观、准确地理解相应的结果.
2.现实生活中我们经常需要用三数两差来比较两组数据所反映的总体的稳定性,判断谁更优秀.但是一定要慎重应用这三数两差,灵活分析,避免出错.
3.分析数据的一种基本方法是用图画出来,或用表格改变数据的排列方式,常见的有列频率分布表,绘频率分布直方图、频率折线图等.
知能优化训练
本部分内容讲解结束
点此进入课件目录
按ESC键退出全屏播放
谢谢使用(共27张PPT)
§3 统计图表
§3 
统计图表
课堂互动讲练
知能优化训练
课前自主学案
学习目标
1.进一步理解统计图表的作用与意义.
2.掌握茎叶图的概念与应用.
3.会利用合适的统计图表研究生活中的例子.
课前自主学案
1.抽样的方法有_______________、
_____________和_____________
2.为估计总体所抽的样本必须有很好的代表性.
3.在抽样过程中必须保证每个个体被抽到的概率_________
温故夯基
简单随机抽样
系统抽样
分层抽样.
相等.
知新益能
1.如何制作茎叶图?
提示:茎叶图的制作过程主要分两步
(1)将所有两位数的十位数字作为“茎”,茎按从小到大同列排出,茎相同者共用一个茎,再画上竖线作为分界线.
(2)在分界线的另一侧在对应“茎”处,记录下“叶”—个位数字,一般共茎的叶按从小到大的顺序同行列出.
问题探究
2.如何选择统计图表统计所收集到的数据?
提示:在统计过程中收集到的数据量较多时,在用统计图表示之前,一般需要先将数据按一定的方式进行整理.在此基础上,再根据不同的需要选择适当的统计图进行表示.
如果只需大致判断一些数据的分布规律,了解数据中各元素所占比例的大小情况可以使用扇形统计图.例如统计一个农村种植的各种作物的比例.
如果需要根据图表了解各个数据所占的频率可以使用条形统计图.例如统计一批产品中优等品所占频率.
如果要了解数据的增减情况可以采用折线图.例如统计一个人成绩变化情况.
如果要了解数据的全部信息可以使用茎叶图.例如篮球比赛的计分.
因此要选择恰当的统计图表直观表达统计的数据,必须把各种统计图表的特点和问题中的需要结合起来,确定选择何种统计图表.
课堂互动讲练
条形统计图与扇形统计图的制作与应用
考点突破
条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来,条形统计图的特点是便于看出和比较各种数量的多少;一般分析比例变化问题用扇形统计图.
英才学校的四个年级学生分布的扇形统计图如图(1)所示,通过对全体学生暑假期间所读课外书情况的调查,制成各年级读书情况的条形统计图如图(2),已知英才学校被调查的四个年级共有学生1500人.
(1)高一年级学生暑假期间共读课外书多少本?
(2)暑假期间读课外书总量最少的是几年级的学生?共读课外书多少本?
(3)该校暑假期间四个年级人均读课外书多少本?
例1
【思路点拨】
【解】 (1)由两图知:初二年级学生暑假期间读课外书的人数是1500×28%=420(人),共读课外书420×5.6=2352(本).初三年级学生暑假期间读课外书的人数是1500×24%=360(人),共读课外书360×6.6=2376(本).高二年级学生暑假期间读课外书的人数是1500×22%=330(人),共读课外书330×7.3=2409(本).
所以高一年级学生暑假期间读课外书的人数是1500-420-360-330=390(人),共读课外书390×6.2=2418(本).
(2)由(1)知暑假期间读课外书总量最少的是初二年级的学生,共读课外书2352本.
(3)该校暑假期间四个年级人均读课外书(2352+2376+2418+2409)÷1500=6.37(本/人).
【名师点评】 解有关条形图问题,首先要清楚坐标系中横、纵坐标表示的意义,然后根据题意进行有关计算.
自我挑战 初中生的视力状况受到全社会的广泛关注.某市有关部门对全市
3万名初中生视力状况进行了一
次抽样调查,下图是利用所得
数据绘制的条形图,根据图
中所提供的信息回答下列问题:
(1)本次调查共抽测了多少名学生?
(2)在这个问题中的样本是什么?
(3)如果视力在4.9~5.1(含4.9,5.1)均属正常,那么全市有多少名初中生的视力正常?
折线图的制作及应用
把条形统计图中矩形上底边的中点顺次连接起来,再把各矩形擦掉,就得到一条折线,这条折线就称为数据的折线统计图,它直观地体现了数据的变化规律,不能绝对精确地反映数据,更多地反映一种趋势.
某摩托车厂2010年第三、四季度各月的月产量如下表:
根据统计表绘制折线统计图,哪个月的月产量增长幅度最大?
【思路点拨】 在绘制折线统计图时,可以先整理和观察数据统计表,建立直角坐标系,用两坐标轴上的点分别表示数据,再描出数据的相应点,顺次连接相邻的点,得到一条折线.
例2
月份 7 8 9 10 11 12
月产量(辆) 300 350 450 540 700 600
【解】 建立直角坐标系,用横
坐标上的点表示月份,用纵坐标
上的点表示月产量,描出每个月
份的对应点,然后用直线段顺次
连接相邻点,得到折线统计图如
图所示,由图可知,11月份的月
产量增长幅度最大.
【名师点评】 画折线统计图和条形统计图的步骤很相近,条形统计图和折线统计图的作用也较相近,本题如果画条形统计图也可以得出11月份的月产量增长幅度最大.
茎叶图是一种既能保留原始数据又能展示数据分布情况的表与图的结合.
某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
茎叶图的制作与应用
例3
品种A:
357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454
品种B:
363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430
(1)作出数据的茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
【思路点拨】 (1)按照茎叶图的作法,对照数据解决;
(2)根据茎叶图的特点作结论.
【解】 (1)茎叶图如图所示:
(2)此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.
【误区警示】 作茎叶图时要对数据作一一处理,在数据较多时容易遗漏或重复,导致错误.解答该类试题要保证茎叶图的准确性.
1.解答统计图表问题时,要对所给的图表进行仔细观察,明确图表中基本量及其表示的情况后再开始解题.
2.解答统计中的图表问题,既要有一定的识图、读图能力,又要熟练掌握与图表有关的一些知识点.图表题的考查其实是对综合能力的考查,在考查知识点的同时,也考查了运用知识的能力.
方法感悟
3.近年来,高考非常重视考查学生对图形的正确理解能力以及善于从图形中捕捉信息的能力.这是对综合素质考查的一个重要体现,也是在激烈竞争的信息社会中必备的一种技能.因此,研究此类问题,不但是应考的需要,而且有实际价值.
知能优化训练
本部分内容讲解结束
点此进入课件目录
按ESC键退出全屏播放
谢谢使用(共31张PPT)
§2 抽样方法
2.1 简单随机抽样
2.1 
简单随机抽样
课堂互动讲练
知能优化训练
课前自主学案
学习目标
1.结合具体的实际问题情景,理解随机抽样的必要性和重要性.
2.在参与解决统计问题的过程中,学会用简单随机抽样方法从总体中抽取样本.
课前自主学案
1.总体:我们所要考察对象的全体叫作_________,其中每一个考察对象叫作________
2.样本:从总体中抽出的若干个个体组成的集合叫作总体的一个 ________,样本中个体的数量叫作_____________
温故夯基
总体
个体.
样本
样本容量.
1.简单随机抽样的定义
设一个总体含有N个个体,随机抽取n个个体作为________ (n知新益能
样本
概率
2.抽签法
3.随机数法
(1)可以利用转盘、摸球、计算机、科学计算器直接产生随机数,也可以利用___________来产生随机数.利用产生的随机数来抽取对应编号的个体,直至抽到预先规定的样本数的方法.
(2)利用随机数表产生随机数的实施步骤:
①将总体中个体_________
②在随机数表中_________一个数作为开始.
③规定从选定的数读取数字的_________
随机数表
编号.
任选
方向.
④开始读取数字,若不在编号中,________,若在编号中则________,依次取下去,直到取满为止,________的号只取一次.
⑤根据选定的_________抽取样本.
跳过
取出
相同
号码
1.在简单随机抽样的定义中,每个个体被抽到的可能性是多少?
问题探究
2.简单随机抽样为什么是公平的?
提示:简单随机抽样是在特定的总体中抽取样本.总体中每一个个体被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机会是独立的.当总体容量和样本容量不大时,采用抽签法.抽签时,样本数据来自“搅拌均匀”的总体,抽取时不带有主观或客观的影响因素,所以每个个体有相同的机会被抽中;
当总体容量和样本容量较大时,采用随机数法.利用随机数表、随机数骰子或计算机产生随机数时,出现任何一个数字都是随机的、等可能的,且从总体中抽取任何一个个体的号码也是随机的、等可能的.故简单随机抽样是公平的.
课堂互动讲练
简单随机抽样的概念
考点突破
简单随机抽样主要有四个特点:(1)总体个数有限;(2)逐个抽取;(3)不放回;(4)公平性:每个个体被抽到的可能性相同.
下面的抽样方法是简单随机抽样吗,为什么?
(1)火箭队共有15名球员,指定个子最高的2名球员参加球迷见面;
(2)从20个零件中一次性抽出3个进行质量检验;
(3)一儿童从玩具箱中的20件玩具中随意拿出一件来玩,玩后放回再拿出一件,连续玩了5件.
例1
【思路点拨】 抓住本题中的几个关键词“指定”“一次性”“放回”等与简单随机抽样特点对照.
【解】 (1)不是简单随机抽样.因为这不是等可能抽样.
(2)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.
(3)不是简单随机抽样.因为这是有放回抽样.
【名师点评】 判断一个抽样是否是简单随机抽样,关键看它是否满足四个特点:①总体的个体数目有限;②从总体中逐个进行抽取;③是不放回抽样;④是等可能抽样.同时还要注意以下两点:一是总体中的个体性质相似,无明显层次;二是用简单随机抽样法抽出的样本带有随机性,个体间无固定间距.
自我挑战1 下列抽取样本的方式是简单随机抽样吗?为什么?
(1)从无限多个个体中抽取50个个体作为样本;
(2)箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检验后再把它放回箱子里;
(3)从50个个体里一次性抽取5个个体作为样本.
解:(1)不是,因为个体的数目无限.
(2)不是,因为是放回抽样.
(3)不是,因为它是一次性抽取.
抽签法的应用
一般地,抽签法就是把总体的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
要从某汽车厂生产的30辆同一型号的汽车中抽取3辆进行刹车系统测试,试选择合适的抽样方法,并写出具体的操作步骤.
例2
【思路点拨】 由于本题总体容量与样本容量都较小,故宜用抽签法.
【解】 使用抽签法,操作步骤如下:
(1)将30辆汽车编号为1~30;
(2)将号码写在形状、大小完全相同的30个号签上;
(3)将号签放入一个盒子中进行均匀搅拌;
(4)从盒子中逐个抽取3个号签,并记录上面的号码;
(5)找出和所得号码相对应的3辆汽车,组成样本.
【名师点评】 一个抽样试验能否用抽签法,关键看两点:一是制签是否方便,二是号签是否容易被搅匀.一般地,当总体容量和样本容量都较小时可用抽签法,若总体容量非常大,那就费时、费力又不方便,搅拌不均匀有失公平性,从而产生坏样本(代表性差的样本)的可能性增加.
对于总体容量不大,即易编号时,可采用这种方法.
即:编号—选起始数—读数—取数.
有一批机器,编号为1,2,3,…,112,为调查机器的质量问题,打算抽取10台入样,问此样本若采用随机数表产生随机数的方法将如何获得?(读数从第9行第9列开始从左向右读,随机数表见教材P9)
随机数法的应用
例3
【思路点拨】 解答本题可先把编号调整为三位数,再利用随机数表读取数字.
【解】 第一步 将原来的编号调整为001,002,003,…,112.
第二步 从随机数表第9行第9个数“1”,向右读.
第三步 从“1”开始,向右读,每次读取三位,凡不在001~112中的数跳过去不读,依次可得到024,042,019,058,005,002,054,062,004,094.
第四步 对应编号为
024,042,019,058,005,002,054,062,004,094的机器便是要抽取的对象.
【名师点评】 在用随机数法抽取样本时,注意以下几个问题:(1)如总体中个体已有号,可直接用,而无需编号.(2)本题编号时,编为001,002,…,112,以使每个号码都是三位数,一是为了方便在数表中找到,另外也要保证被抽取的概率相等,不然,有的是两位数,有的是三位数,每个个体入样的概率就不相等了.
(3)抽样时所需的随机数表可临时产生,也可以沿用已有的随机数表,本题用了教材上的一个随机数表,虽然每个个体的号码为三位数,最好是用三位数的随机数表,但也可用随便多少位的随机数表,尽管抽出的样本号码可能不同,但这些都不影响所抽取样本的代表性.
自我挑战2 某单位有老年职工30人,中年职工50人,青年职工40人.若分别从老年职工、中年职工、青年职工中随机抽取3人、5人、4人举行会议.试用随机数法进行抽样.
解:第一步:将职工编号,老年职工的编号为001,002,…,030;中年职工的编号为031,032,…,080;青年职工的编号为081,…,120;
第二步:从随机数表中任意一个位置,例如从教材表1-2中第15行的第6列,第7列和第8列开始选数,向右读;
第三步:从选定的位置开始读数,凡不在001~120中的数跳过去不读,前面已经读过的也跳过去不读,从001~030中选3个号码.从031~080中选5个号码,从081~120中选4个号码,依次可得到071,114,058,094,003,047,013,060,024,093,034,082;
第四步:对应003,013,024找出老年职工代表;对应071,058,047,060,034找出中年职工代表;对应114,094,093,082找出青年职工代表.
1.简单随机抽样是最简单、最基本的抽样方法,通常用抽签法与随机数法来实现.当总体的个数较少或抽取的样本个数较少时,常采用简单随机抽样的方法.
2.判断一个抽样能否用简单随机抽样法,关键要看它是否满足四个特点:(1)总体的个体数目有限;(2)从总体中逐个进行抽取;(3)是不放回抽样;(4)是等可能抽样.
方法感悟
3.抽签法与随机数法的相同点与不同点.
相同点:(1)它要求被抽取样本的总体的个数有限,以便对每个个体被抽到的机会进行分析.
(2)从总体中逐个进行抽取,具有可操作性.
(3)这是一种等机会的抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的机会相等,而且在整个抽样过程中,各个个体被抽取的机会都相等,从而保证了抽样的公平性.
不同点:(1)抽签法相对于随机数法简单,随机数法较抽签法稍麻烦一点.
(2)随机数法更适用于总体中的个体数较多的时候,而抽签法适用于总体中的个体数相对较少的情况,所以当总体中的个体数较多时,应当选用随机数法,这样可以节约大量的人力和制作号签的成本与精力.
知能优化训练
本部分内容讲解结束
点此进入课件目录
按ESC键退出全屏播放
谢谢使用(共45张PPT)
§6 统计活动:结婚年龄的变化
§7 相关性
§8 最小二乘估计
§8 
最小二乘估计
课堂互动讲练
知能优化训练
课前自主学案
学习目标

1.通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.
2.学会用不同估算方法描述两个变量线性相关的过程,知道最小二乘法的思想,能够根据给出的线性回归方程系数公式建立线性回归方程.
课前自主学案
1.抽样方法有_______________、
____________、____________
2.用样本估计总体主要有:用样本的
______________估计总体的频率分布;用样本的____________估计总体的数字特征.
3.样本的数字特征主要有_________、
________、________、________及
___________
温故夯基
简单随机抽样
系统抽样
分层抽样.
频率分布
数字特征
平均数
众数
中位数
方差
标准差.
4.在现实生活中两个变量之间的函数关系是一种_________的关系.
确定
知新益能
1.变量间关系
(1)函数关系:两变量之间的 ___________关系;
(2)相关关系:两变量之间的____________关系.
2.散点图
在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将______________的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.
确定性
不确定性
变量所对应
3.曲线拟合
从散点图上可以看出,如果变量之间
___________________,这些点会有一个
_______的大致趋势,这种趋势通常可以用一条______________来近似,这样近似的过程称为曲线拟合.
4.相关关系的分类
(1)线性相关:若两个变量x和y的散点图中,所有点看上去都在______________附近波动,则称变量间是线性相关的.
存在着某种关系
集中
光滑的曲线
一条直线
[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2
(2)非线性相关:若散点图上所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关的.此时,可以用
_____________来拟合.
5.最小二乘法
(1)定义:如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:
__________________________________________________.使得上式达到____________的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.
一条曲线
最小值
(2)应用:利用最小二乘法估计时,要先作出数据的______________如果__________呈现出线性关系,可以用最小二乘法估计出线性回归方程;如果___________呈现出其他的曲线关系,我们就要利用其他的工具进行拟合.
散点图.
散点图
散点图
6.线性回归方程
b=______________________________
a= ________________, 这样得到的直线方程y=a+bx称为线性回归方程,a,b是线性回归方程的_________
系数.
1.函数关系与相关关系有何异同点?
问题探究
提示:
 关系
异同点   函数关系 相关关系
相同点 两者均是指两个变量之间的关系
 关系
异同点   函数关系 相关关系
不同点 是一种确定性的关系 是一种非确定性的关系
是两个变量之间的关系 ①一个为变量,另一个为随机变量;②两个都是随机变量
是一种因果关系 不一定是因果关系,也可能是伴随关系
是一种理想关系模型 是更为一般的情况
2.如何利用散点图来研究两个变量之间是否存在某种关系?
提示:在研究两个变量之间是否存在某种关系时,结合所画的散点图来判断.
(1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.
(2)如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.
3.回归直线方程的应用有哪些?
提示:(1)描述两变量之间的依存关系;利用线性回归方程即可定量描述两个变量间依存的数量关系.
(2)利用回归方程进行预测或规定y值的变化,通过控制x的范围来实现目标.如已经得到了空气中NO的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中的NO的浓度.
(3)注意作回归分析要有实际意义,回归分析前,最好先作出散点图,确定合适的拟合模型.
4.“回归直线”方程能否按解析几何中求直线方程的方法来求?
提示:不能.求回归直线方程的方法用最小二乘法.因为所有数据点都分布在一条直线附近时,这样的直线可画出许多条,而“回归直线”是这些直线中“最贴近”已知数据点的,但不一定过数据中的某个点,故一般不按解析几何中求直线方程的方法来求.
课堂互动讲练
画散点图并判断相关关系
考点突破
在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.由于变量间的相关关系带有不确定性,这就需要通过收集大量的数据,对数据进行统计分析,发现规律,从而作出科学的判断.
下面是水稻产量与施化肥量的一组观测数据:
例1
施化肥量 15 20 25 30 35 40 45
水稻产量 320 330 360 410 460 470 480
(1)将上表中的数据制成散点图;
(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?
(3)若近似成线性关系,请画出一条直线来近似表示这种线性关系.
【思路点拨】 以横轴表示施化肥量,纵轴表示水稻产量,作出散点图,若所有点分布在一条直线(或曲线)附近,则水稻产量和施化肥量之间具有相关关系.
【解】 (1)散点图如图所示:
(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系.
但水稻产量只是在一定范围内随着化肥施用量的增加而增长.
(3)如上图所示.
【名师点评】 判断两个变量之间是否具有相关关系有两种方法:一种方法是直观感觉判断,这时要用到已有的知识和生活经验等;另一种方法是根据散点图判断.常采用的是第二种方法.一般来说判断两个变量之间是否具有相关关系时,若两个变量具有相关关系,需要进一步判断是线性相关,还是非线性相关.
自我挑战1 某灯泡生产厂家为了提高灯泡的使用寿命,研究灯丝的精细x(mm)与灯泡的使用寿命y(小时)之间的关系,得到如下检测数据:
编号i 1 2 3 4 5 6 7 8 9 10
xi(mm) 0.100 0.105 0.110 0.115 0.120 0.125 0.130 0.135 0.140 0.145
yi(h) 3170 3210 3350 3400 3300 3450 3370 3500 3510 3620
编号i 11 12 13 14 15 16 17 18 19 20
xi(mm) 0.150 0.155 0.160 0.165 0.170 0.175 0.180 0.185 0.190 0.195
yi(h) 3490 3590 3680 3700 3575 3870 3620 3530 3680 3570
以横轴表示灯丝的精细x(mm),纵轴表示灯泡的使用寿命y(小时),根据这些数据作出散点图,并研究它们是否具有一定的相关关系.
解:这组检测数据的散点图,如图所示:
显然,这些点分布在某条直线附近.因此,这两个变量具有一定的相关性.
求回归直线方程
据最小二乘法思想的公式,用待定系数法求出a,b,从而确定回归直线方程.
某化工厂的原料中,有A和B两种有效成分,现随机抽取了10份原料样品进行抽样检测,测得A和B的含量如下表所示:
例2
i 1 2 3 4 5 6 7 8 9 10
x 67 54 72 64 39 22 58 43 46 34
y 24 15 23 19 16 11 20 16 17 13
其中x表示成分A的百分含量x%,y表示成分B的百分含量y%.
(1)作出两个变量y与x的散点图;
(2)两个变量y与x是否线性相关?若是线性相关,求出线性回归方程.
【解】 (1)按照y从小到大的顺序调整表中数据(这样有利于描点,如用画图软件则不需要调整表格数据),
如下表所示:
x 22 34 54 43 39 46 64 58 72 67
y 11 13 15 16 16 17 19 20 23 24
散点图如图所示:
(2)观察散点图可知,y与x是线性相关关系;
下面求线性回归方程:
i 1 2 3 4 5 6 7 8 9 10 合计
xi 22 34 54 43 39 46 64 58 72 67 499
yi 11 13 15 16 16 17 19 20 23 24 174
xi·yi 242 442 810 688 624 782 1216 1160 1656 1608 9228
x 484 1156 2916 1849 1521 2116 4096 3364 5184 4489 27175
【名师点评】 用线性回归方程进行数据拟合的一般步骤是:(1)把数据列成表格;(2)作散点图;(3)判断是否线性相关;(4)若线性相关,求出系数b,a的值(一般也列成表格的形式,用计算器或计算机计算);(5)写出回归直线方程y=a+bx.
利用回归直线,我们可以进行预测.若回归直线方程为y=a+bx,则x=x0处的估计值为y=a+bx0.
下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
利用回归方程对总体进行估计
例3
x 3 4 5 6
y 2.5 3 4 4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=a+bx;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
【解】 (1)由题设所给数据,可得散点图如图.
因此,所求的线性回归方程为y=0.35+0.7x.
(3)由(2)的线性回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗约为:
90-(0.35+0.7×100)=19.65(吨标准煤).
【名师点评】 (1)求线性回归方程时,应注意只有在散点图大致呈线性相关时,求出的线性回归方程才有实际意义,因此,对数据作线性回归分析时,应先看其散点图是否呈线性相关关系.
(2)求线性回归方程,关键在于正确地求出系数a、b,由于求a、b的计算量较大,计算时应仔细谨慎、分步进行,避免因计算产生失误.
(3)得到的实验数据不同,则a、b的结果也不尽相同.
自我挑战2 要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽取10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表:
学生编号 1 2 3 4 5 6 7 8 9 10
入学成绩x 63 67 45 88 81 71 52 99 58 76
高一期末成绩y 65 78 52 82 92 89 73 98 56 75
(1)计算入学成绩x与高一期末考试成绩y的相关关系;
(2)若某学生入学数学成绩为80分,试估计他高一期末数学考试成绩;
(3)若事实上该学生期末考试数学为94分,如何解释?
解:(1)从入学成绩x与高一期末考试成绩y两组变量的散点图可以看出,这两组变量具有线性相关关系,
(2)若某学生入学数学成绩为80分,代入上式y=0.76556x+22.41067可得:y≈84,即这个学生高一期末数学考试成绩预测值为84分.
(3)用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差.
方法感悟
1.判断两个变量之间的关系是否是相关关系,一方面可根据日常生活的知识和经验进行判断;另一方面是画出散点图,根据散点图观察它们的分布是否存在一定的规律,直观地进行判断.
2.画散点图时,平面直角坐标系中两坐标轴的长度单位可以不同.
3.作出散点图后,要观察分析散点图中各点的位置关系,若在一条直线附近波动,则这两个变量具有线性相关关系,否则没有.
4.求线性回归方程的前提是先判定线性相关,这就用到散点图,在确认其具有线性相关关系后,再求其线性回归方程,进而由线性回归方程估计总体的性质.
5.在求线性回归系数时,公式不要求记忆,但要明确公式各部分的含义,才能求出a,b.
知能优化训练
本部分内容讲解结束
点此进入课件目录
按ESC键退出全屏播放
谢谢使用