2017_2018版高中数学第一章统计课件(打包9套)北师大版必修3

文档属性

名称 2017_2018版高中数学第一章统计课件(打包9套)北师大版必修3
格式 zip
文件大小 5.7MB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2018-03-02 15:24:16

文档简介

课件27张PPT。第一章 统计§1 从普查到抽样学习目标
1.了解普查与抽样调查的概念.
2.理解随机抽样的必要性和重要性.
3.明确两种调查的优缺点.题型探究问题导学内容索引当堂训练问题导学我们每天都接触大量的数据:各地房价的涨幅,各种指数的变化、天气的各种数据等,这些数据是怎么来的?思考 知识点一 统计答案由专业人员收集、整理、分析出来的.梳理 
统计是研究如何合理收集、 、 数据的学科.整理分析知识点二 普查思考 你对“武汉一人口普查员劳累过度以身殉职”的报道有何看法?人口普查是一个规模宏大的政府工程.普查是一项非常艰苦的工作,工作量很大,要耗费大量的人力、物力与财力,并且组织工作繁重、时间长.更值得注意的是,在很多情况下,普查工作难以实现.答案梳理 一般地,普查是指一个 或一个 专门组织的 大规模的全面调查,目的是为了详细地了解 重要的国情、国力.
普查的主要特点:①所取得的资料更加全面、 ;
②主要调查在特定时段的社会经济现象总体的 .
普查的对象 时,普查无疑是一项非常好的调查方式.国家地区一次性某项系统数量很少知识点三 抽样调查思考 要了解一批牛奶的质量是否达标,能用普查吗?检验具有破坏性,故不能普查.答案梳理 当不宜普查时,有:
(1)抽样调查:从调查对象中按照一定的方法抽取一部分,进行调查或观察,获取数据,并以此对调查对象的某项指标作出推断,这就是抽样调查.
(2)总体:调查对象的全体称为总体.
(3)个体:组成总体的每一个考察对象叫作个体;
(4)样本及样本的容量:从总体中所抽取的一部分个体叫作总体的一个样本,样本中的个体数目叫作样本的容量.
(5)抽样调查的优点:抽样调查与普查相比,有很多优点,最突出的有两点:①迅速、及时;②节约人力、物力和财力.题型探究例1 医生是如何检验人的血液中血脂的含量是否偏高的?类型一 普查与抽样调查解答大家都知道,医生在检验时是不可能将一个人的血液都抽出来进行普查的,因此,医生在检验人的血液中血脂含量是否偏高时,通常是抽取少量的血样进行检验,然后由此作出推断,认为这个人的血液状况基本如此.设计合理的调查方案是调查的基础,是统计活动中非常重要的环节.若对大批量且有破坏性的检验问题,只能进行抽样调查,这样检验是科学、合理的.在抽样调查中应注意:抽取的样本要具有全面性、代表性、随机性.跟踪训练1 下列调查中哪些是用普查方式,哪些是用抽样方法来收集数据的?
(1)为了了解我们班级的每个学生穿几号鞋,向全班同学做调查;解答因为调查的是班级的每个学生,所以用的是普查.(2)为了了解我们学校高一年级学生穿几号鞋,向我们所在班的全体同学做调查;解答通过我们班的全体同学穿几号鞋来了解学校高一年级学生穿几号鞋,这是抽样调查,样本是我们班的全体同学所穿的鞋号,总体是学校高一年级学生所穿的鞋号.(3)为了了解我们班的同学每天的睡眠时间,在每个小组中各选取2名学生做调查;
(4)为了了解我们班的同学每天的睡眠时间,选取班级中学号为双数的所有学生做调查.解答(3)、(4)也都是抽样调查,样本分别是每小组中选取的2名学生的睡眠时间,学号为双数的所有学生的睡眠时间;总体都是我们班的同学每天的睡眠时间.类型二 如何进行抽样调查例2 为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样?解答一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机地抽样调查,不要只关注到拥有私家车的市民.在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法与策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得出统计推断.跟踪训练2 中央电视台希望在春节联欢晚会播出后一周内获得当年春节联欢晚会的收视率.下面是三名同学为电视台设计的调查方案.
甲同学:我把这张《春节联欢晚会收视率调查表》放在互联网上,只要上网登录该网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快统计收视率了.
乙同学:我给我们居民小区的每一户住户发一份是否在除夕那天晚上看过中央电视台春节联欢晚会的调查表,只要一两天就可以统计出收视率.
丙同学:我在电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们是否收看了中央电视台春节联欢晚会,我不出家门就可以统计出中央电视台春节联欢晚会的收视率.请问:上述三名同学设计的调查方案能够获得比较准确的收视率吗?为什么?解答综上所述,这三种调查方案都有一定的片面性,不能得到比较准确的收视率.因为并不是每个人都有互联网可上;某一地方的居民小区代表性不强;并不是每家都拥有电话.当堂训练1.下列调查方式中,可用“普查”方式的是
A.调查某品牌电视机的市场占有率
B.调查某电视连续剧在全国的收视率
C.调查某校七年级一班的男女同学的比例
D.调查某型号炮弹的射程答案解析√选项C中调查对象的数目较少,适合采用普查方式.234512.下列说法不正确的是
A.普查是要对所有的对象进行调查
B.样本不一定是从总体中抽取的,没抽取的个体也是样本
C.当调查的对象很少时,普查是很好的调查方式,但当调查的对象很
多时,则要耗费大量的人力、物力和财力
D.普查不是在任何情况下都能实现的答案解析√样本必须是从总体中抽取的,没抽取的个体不是样本,故B说法不正确,而其他的都正确.234513.为了了解高一年级学生的视力情况,特别是近视率问题,抽测了其中100名同学的视力情况.在这个过程中,100名同学的视力情况(数据)是
A.总体 B.个体
C.总体的一个样本 D.样本容量23451答案解析√100名同学的视力情况(数据)是从总体中抽取的一部分个体所组成的集合,所以是总体的一个样本.4.下列调查中属于抽样调查的是
①每隔5年进行一次人口普查;②某商品的质量优劣;
③某报社对某个事情进行舆论调查;④高考考生的查体.
A.②③ B.①④
C.③④ D.①②答案解析人口普查和高考考生的查体都属于普查,调查某商品的质量优劣和对某个事情进行舆论调查只能是抽样,没必要进行普查.故答案为A.23451√234515.“非典”期间,我国每日公布非典疫情,其中有关数据的收集所采用的调查方式是_____.答案解析为了全面、准确掌握非典疫情,所以有关数据的收集采用的是普查的调查方式.普查普查是一项非常艰巨的工作,它要对所有的对象进行调查.当普查的对象很少时,普查无疑是一项非常好的调查方式.普查主要有两个特点:
(1)所取得的资料更加全面、系统;
(2)主要调查在特定时段的社会经济现象总体的数量.本课结束课件33张PPT。第一章 §2 抽样方法2.1 简单随机抽样学习目标
1.体会随机抽样的必要性和重要性.
2.理解随机抽样的目的和基本要求.
3.掌握简单随机抽样中的抽签法、随机数法的一般步骤.题型探究问题导学内容索引当堂训练问题导学从含有甲、乙的9件产品中随机抽取一件,总体内的各个个体被抽到的机会相同吗?为什么?甲被抽到的机会是多少?思考1 知识点一 简单随机抽样答案总体内的各个个体被抽到的机会是相同的.因为是从9件产品中随机抽取一件,这9件产品每件产品被抽到的机会都是1/9,甲也是1/9.被抽取的样本总体的个数有限定条件吗?思考2 答案被抽取的样本总体的个数必须有限,便于分析.简单随机抽样是不放回抽样,对于放回的抽样可以是简单随机抽样吗?思考3 答案不可以.简单随机抽样是从总体中逐个抽取的是一种不放回抽样,也就是每次从总体中取出元素后不放回总体,若放回,则一定不是简单随机抽样.梳理 
1.一般地,从一个总体中, 地抽取一些个体,然后对抽取的对象进行调查,在抽取过程中,要保证每个对象被抽到的 .这样的抽样方法叫作简单随机抽样.
2.简单随机抽样的四个特点
(1)它要求被抽取样本的总体的个数有限,这样便于通过随机抽取的样本对总体进行分析.随机概率相同(2)它是从总体中逐个抽取,这样便于在抽样实践中进行操作.
(3)它是一种不放回抽样,由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.
(4)它是一种等机会抽样,不仅每次从总体中抽取一个个体时,各个个体被抽到的机会相等,而且在整个抽样的过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性.知识点二 抽签法和随机数法思考1 采用抽签法抽取样本时,为什么将编号写在形状、大小相同的号签上,并且将号签放在同一个箱子里搅拌均匀?为了使每个号签被抽取的可能性相等,保证抽样的公平性.答案思考2 在什么条件下使用随机数法?在总体容量不大的情况下使用.答案梳理 1.一般地,抽签法是简单随机抽样的一种,其操作步骤是
(1)给调查对象群体中的每个对象 ;
(2)准备“抽签”的工具,实施“ ”;
(3)对样本中每一个个体进行 .
2.一般地,随机数法也是简单随机抽样的一种,把总体中的N个个体依次编上0,1,…,N-1的号码,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生0,1,…,N-1中的随机数,产生的随机数是几,就选几号个体,直至抽到预先规定的样本数.编号抽签测量或调查题型探究例1 下面的抽样是简单随机抽样吗?为什么?
(1)小乐从玩具箱中的10件玩具中随意拿出一件玩,玩后放回,再拿出一件,连续拿出四件;类型一 简单随机抽样的判断解答不是简单随机抽样,因为玩具被放回了,不符合“不放回抽样”这一特点.(2)某学校从300名学生中一次性抽取20名学生调查睡眠情况.解答不是简单随机抽样,因为一次性抽取不符合“逐个抽取”这一特点.当抽样具有:(1)总体中个体数是有限的,(2)逐个抽取,(3)不放回抽取,(4)每个个体被抽到的机会等可能时,为简单随机抽样,否则不是简单随机抽样. 跟踪训练1 下面的抽样方法是简单随机抽样的是
A.盒子中有80个零件,从中选出5个零件进行质量检验,在抽样操作时,
从中任意拿出一个零件进行质量检验后再把它放回盒子里
B.某车间包装一种产品,在自动包装传送带上,每隔5分钟抽一包产品,
称其重量是否合格
C.某校分别从行政人员、教师、后勤人员中抽取2人,14人,4人了解对
他们学校机构改革的意见
D.从8台电脑中不放回地随机抽取2台进行质量检验(假设8台电脑已编好
号,对编号随机抽取) 答案解析依据简单随机抽样的特点知,只有D符合.类型二 简单随机抽样等可能性应用例2 一个布袋中有10个同样质地的小球,从中不放回地依次抽取3个小球,则某一特定小球被抽到的可能性是_____,第三次抽取时,剩余每个小球被抽到的可能性是____.答案解析简单随机抽样,每次抽取时,总体中各个个体被抽到的概率相同,在整个抽样过程中各个个体被抽到的机会也都相等. 跟踪训练2 从总体容量为N的一批零件中,抽取一个容量为30的样本,若每个零件被抽到的可能性为0.25,则N的值为
A.120 B.200 C.150 D.100答案解析类型三 抽签法与随机数法命题角度1 抽签法
例3 某卫生单位为了支援抗震救灾,要在18名志愿者中选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.解答方案如下:
第一步,将18名志愿者编号,号码为01,02,03,…,18.
第二步,将号码分别写在相同的纸条上,揉成团,制成号签.
第三步,将得到的号签放到一个不透明的盒子中,充分搅匀.
第四步,从盒子中依次取出6个号签,并记录上面的编号.
第五步,与所得号码对应的志愿者就是医疗小组成员.一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.跟踪训练3 从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴.解答第一步,将20架钢琴编号,号码是01,02,…,20.
第二步,将号码分别写在相同的纸条上,揉成团,制成号签.
第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀.
第四步,从袋子中逐个不放回地抽取5个号签,并记录上面的编号.
第五步,与所得号码对应的5架钢琴就是要进行质量检查的对象.命题角度2 随机数法
例4 假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,应如何操作?解答第一步,将800袋牛奶编号为000,001,…,799.
第二步,在随机数表中任选一个数作为起始数(例如选出第8行第2列的数7).
第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.抽签法和随机数法对个体的编号是不同的,抽签法可以利用个体已有的编号,如学生的学籍号、产品的记数编号等,也可以重新编号,例如总体个数为100,编号可以为1,2,3,…,100.随机数法对个体的编号要看总体的个数,总体数为100,通常为00,01,…,99.总体数大于100小于1 000,从000开始编起,然后是001,002,….跟踪训练4 某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?解答方法一 (抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,搅拌均匀,接着连续不放回地抽取10个号签,然后测量这10个号签对应的轴的直径.
方法二 (随机数法)将100件轴编号为00,01,…,99,在随机数表中选定一个起始位置,如取第21行第1个数开始,向右选取10个为93,12,47,79,57,37,89,18,45,50,这10件即为所要抽取的样本.当堂训练1.在简单随机抽样中,某一个个体被抽中的可能性
A.与第几次抽样有关,第1次的可能性要大些
B.与第几次抽样无关,每次的可能性都相等
C.与第几次抽样有关,最后1次的可能性要大些
D.以上都不正确答案解析√在简单随机抽样中,每个个体被抽到的可能性都相等,与第几次抽样无关,故选B.234512.下面抽样方法是简单随机抽样的是
A.从平面直角坐标系中抽取5个点作为样本
B.可口可乐公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查
C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动
D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机
已编好号,对编号随机抽取)答案解析√选项A中,平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;B中,一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;C中,50名战士是最优秀的,不符合简单随机抽样的等可能性,故错误.234513.一个总体中含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的可能性为____.23451答案解析4.某地有2 000人参加自学考试,为了了解他们的成绩,从中抽取一个样本,若每个考生被抽到的概率都是0.04,则这个样本的容量是____.答案解析2345180234515.齐鲁风采“七乐彩”的中奖号码是从分别标有1,2,…,30的三十个小球中逐个不放回地摇出7个小球来按规则确定中奖情况,这种从30个号码中选7个号码的抽样方法是________.答案解析三十个小球相当于号签,搅拌均匀后逐个不放回地抽取,是典型的抽签法.抽签法1.简单随机抽样是一种简单、基本、不放回的抽样方法,常用的简单随机抽样方法有抽签法和随机数法.
2.抽签法的优点是简单易行,缺点是当总体的容量大时,费时、费力,并且标号的签不易搅拌均匀,这样会导致抽样不公平;随机数法的优点也是简单易行,缺点是当总体容量大时,编号不方便.两种方法只适合总体容量较少的抽样类型.本课结束课件35张PPT。第一章 §2 抽样方法2.2 分层抽样与系统抽样学习目标
1.理解并掌握系统抽样、分层抽样.
2.会用系统抽样、分层抽样从总体中抽取样本.
3.理解三种抽样的区别与联系.题型探究问题导学内容索引当堂训练问题导学分层抽样的总体具有什么特性?思考 知识点一 分层抽样答案分层抽样的总体由差异明显的几部分构成,也就是说当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样.梳理 
1.分层抽样的概念
将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照 随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为 .
2.分层抽样的适用条件
分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由 _________的几个部分组成时,往往选用分层抽样的方法.所占比例类型抽样差异明显各层总的个体数×抽样比简单随机抽样知识点二 系统抽样思考1 当总体中的个体数较多时,为什么不宜用简单随机抽样?因为个体较多,采用简单随机抽样如制作号签等工作会耗费大量的人力、物力和时间,而且不容易做到“搅拌均匀”,从而使样本的代表性不强.答案思考2 用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?用简单随机抽样抽取第1段的个体编号.在抽取第1段的号码之前,自定义规则确定以后各段的个体编号,通常是将第1段抽取的号码依次累加间隔k.答案梳理 1.系统抽样的概念
将总体中的个体进行编号,等距分组,在第一组中按照___________抽取第一个样本,然后按 (称为 )抽取其他样本.这种抽样方法有时也叫 或 .
2.系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本,步骤为:
(1)先将总体的N个个体 .有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;简单随机抽样分组的间隔抽样距等距抽样机械抽样编号(3)在第1段用 确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l 得到第2个个体编号 ,再加 得到第3个个体编号 ,依次进行下去,直到获取整个样本.分段随机重新编号简单随机抽样加上间隔kl+kkl+2k知识点三 三种抽样方法的比较思考 系统抽样时,将总体分成均等的几部分,每部分抽取一个,符合分层抽样,故系统抽样就是一种特殊的分层抽样,这种说法对吗?不对,因为分层抽样是从各层独立地抽取个体,而系统抽样各段上抽取是按事先确定好的规则进行的,各层编号有联系,不是独立的,故系统抽样不同于分层抽样.答案从总体中逐个不
放回抽取简单随机抽样是
基础样本容量较小抽样过
程中每
个个体
被抽取
的概率
相等将总体分成均衡
的几部分,按规
则关联抽取用简单随机抽样
抽取起始号码总体中的个体
数较多,样本
容量较大将总体分成几层,
按比例分层抽取用简单随机抽样
或系统抽样对各
层抽样总体由差异明显
的几部分组成题型探究命题角度1 分层抽样适用情形判定
例1 某地区有高中生2 400人,初中生10 900人,小学生11 000人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?类型一 分层抽样及应用解答(1)从总体来看,因为不同年龄阶段的学生的近视情况可能存在明显差异,为了使样本具有较好的代表性,应该分高中、初中、小学三个层次分别抽样.
(2)从三类学生的数量来看,人数较多,所以在各层抽样时可以采用系统抽样.
(3)采用系统抽样分好组之后,确定第一组人选时,可以采用简单随机抽样.分层抽样实质是利用已知信息尽量使样本结构与总体结构相似.在实际操作时,并不排斥与其他抽样方法联合使用.跟踪训练1 某单位有员工500人,其中35岁以下的有125人,35岁~49岁的有280人,50岁以上的有95人.为了调查员工的身体状况,要从中抽取一个容量为100的样本,如何进行抽取?解答因为员工按年龄分为三个层,各层的身体状况有明显的差异,所以为了使样本具有代表性,需要采用分层抽样.抽样比为1∶5,即每5人中抽取一人.
命题角度2 分层抽样具体实施步骤
例2 某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层抽样的方法抽取,写出抽样过程.解答
第三步,采用简单随机抽样的方法,抽取行政人员2人,教师14人,后勤人员4人.
第四步,把抽取的个体组合在一起构成所需样本.在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体容量之比.?解答
解得b=50%,c=10%,
故a=1-50%-10%=40%.
所以游泳组中,青年人、中年人、老年人各占的比例分别为40%、50%、10%.(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.解答
类型二 系统抽样及应用例3 为了了解参加某种知识竞赛的1 000名学生的成绩,从中抽取一个容量为50的样本,那么采用什么抽样方法比较恰当?简述抽样过程.解答适宜选用系统抽样,抽样过程如下:
(1)随机地将这1 000名学生编号为1,2,3,…,1000.
(2)将总体按编号顺序均分成50个部分,每部分包括20个个体.
(3)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码l.
(4)以l为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:l,l+20,l+40,…,l+980.引申探究
在本例中,如果总体是1 002,其余条件不变,又该怎么抽样?解答(1)将每个学生编一个号,由1至1002.
(2)利用随机数法剔除2个号.
(3)将剩余的1 000名学生重新编号1至1000.
(4)按编号顺序均分成50个部分,每部分包括20个个体.
(5)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码l.
(6)以l为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:l,l+20,l+40,…,l+980.当总体中的个体数不能被样本容量整除时,需要在总体中剔除一些个体.由于剔除方法采用简单随机抽样,所以即使是被剔除的个体,在整个抽样过程中被抽到的机会和其他个体是一样的.跟踪训练3 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施.解答(1)将每个工人编一个号,由0001至1003.
(2)利用随机数法找到3个号将这3名工人剔除.
(3)将剩余的1 000名工人重新编号0001至1000.
(4)分段,取间隔k= =100,将总体均分为10组,每组100个工人.
(5)从第一段即0001号到0100号中随机抽取一个号l.
(6)按编号将l,100+l,200+l,…,900+l,共10个号选出.
这10个号所对应的工人组成样本.当堂训练1.检测员每10分钟从匀速传递的新产品生产流水线上抽取一件新产品进行某项指标检测,这样的抽样方法是
A.系统抽样法
B.抽签法
C.随机数法
D.其他抽样方法答案解析√根据系统抽样的定义和性质进行判断即可.234512.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为
A.101 B.808
C.1 212 D.2 012答案解析√234513.为了调查某省各城市PM2.5的值,按地域把36个城市分成甲、乙、丙三组,对应的城市数分别为6,12,18.若用分层抽样的方法抽取12个城市,则乙组中应抽取的城市数为____.23451答案解析44.某班级有50名学生,现要采用系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号为1~50号,并均匀分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为_____的学生.答案解析因为12=5×2+2,所以第n组中抽得号码为5(n-1)+2的学生.所以第八组中抽得号码为5×7+2=37的学生. 2345137234515.一批产品中有一级品100个,二级品60个,三级品40个,分别用系统抽样法和分层抽样法从这批产品中抽取一个容量为20的样本.解答系统抽样法:将200个产品编号为1~200,然后将编号分成20个部分,在第1部分中用简单随机抽样法抽取1个编号.如抽到5号,那么得到编号为5,15,25,…,195的个体,即可得到所需样本.
因此在一级品、二级品和三级品中分别抽取10个、6个和4个,即可得到所需样本.1.系统抽样有以下特点:
(1)适用于总体容量较大的情况;
(2)剔除多余个体及第一段抽样都要用简单随机抽样,因而与简单随机抽样有密切联系;
(3)是等可能抽样,每个个体被抽到的可能性都是 ;
(4)是不放回抽样.
在抽样时,只要第一段抽取的个体确定了,后面各段中要抽取的个体依照事先确定好的规律就自动地被抽出,因此简单易行.
2.总体容量小,简单随机抽样;总体容量大,系统抽样;总体差异明显,分层抽样.在实际抽样中,为了使样本具有代表性,通常要同时使用几种抽样方法.本课结束课件32张PPT。第一章 统计§3 统计图表学习目标
1.理解统计图表的作用与意义.
2.掌握茎叶图的概念与应用.
3.通过实例体会条形统计图、折线统计图、扇形统计图和茎
叶图的各自特征,从而恰当地选择上述方法分析样本的分
布,准确地做出总体估计.题型探究问题导学内容索引当堂训练问题导学通过抽样获得的原始数据有什么缺点?思考 知识点一 统计图表的作用与意义答案因为通过抽样获得的原始数据多而且杂乱,无法直接从中理解它们的含义,并提取信息,也不便于我们用它来传递信息.梳理 
数据分析的基本方法:
(1)借助于图形
分析数据的一种基本方法是用图将它们画出来,此方法可以达到两个目的,一是从数据中 信息,二是利用图形 信息.
(2)借助于表格
分析数据的另一种方法是用紧凑的 改变数据的排列方式,此方法是通过改变数据的 ,为我们提供解释数据的新方式.提取传递构成形式表格知识点二 常见统计图的特征直观准确具体数目折线统计图扇形统计图原始数据题型探究例1 某人统计了一本书中的100个句子的字数,得出下列结果:1~5个字的15句,6~10个字的27句,11~15个字的32句,16~20个字的15句,21~25个字的8句,26~30个字的3句.
(1)试作出条形统计图;类型一 条形图的制作及读图解答条形统计图如图(1)所示.
(2)统计出1~15个字及16~30个字的句子个数所占百分比,作出条形统计图;解答1~15个字的句子个数为1~5个字,6~10个字,11~15个字的句子个数之和:15+27+32=74,所占百分比为74%;16~30个字的句子个数为16~20个字,21~25个字,26~30个字的句子个数之
和:15+8+3=26,所占百分比为26%.条形统计
图如图(2)所示.
(3)统计出1~10个字,11~20个字,21~30个字的句子个数所占百分比,作出条形统计图.解答1~10个字的句子个数为15+27=42,所占百分比为42%;11~20个字的句子个数为32+15=47,所占百分比为47%;21~30个字的句子个数为8+3=11,所占百分比为11%.条形统计图如图(3)所示.
条形图的制作一般可分为以下几步:
(1)根据统计资料整理数据,一般整理成表格形式;
(2)画出横轴、纵轴,确定它们表示的项目;
(3)画直条,条形的高与数据的大小成比例.跟踪训练1 有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.
(1)列出学生参加运动队的频率分布表;解答参加足球队记为1,参加篮球队记为2,参加排球队记为3,参加乒乓球队记为4,得频率分布表如下:
(2)画出频率分布条形图.解答由上表可知频率分布条形图如下.
类型二 折线统计图与扇形统计图例2 某市是我国西部的一个多民族城市,总人口数为370万(2000年普查统计).如图1和图2所示的是2000年该市各民族人口的统计图,请你根据统计图提供的信息回答下列问题.
(1)2000年该市少数民族的总人口数是多少? 解答15%×370=55.5(万人),
即2000年该市少数民族的总人口数是55.5万人.(2)2000年该市总人口中的苗族所占的百分比是多少?解答40%×15%=6%,
∴2000年该市总人口中的苗族所占的百分比是6%.(3)若2000年该市参加中考的学生有40 000人,则参加中考的少数民族的学生人数约为多少?解答40 000×15%=6 000(人),
即2000年该市参加中考的少数民族的学生约有6 000人.用统计图来表示百分比时,我们可以用条形统计图、折线统计图和扇形统计图,但最适宜用扇形统计图来表示.在解题过程中要看清楚题目的要求,根据不同的要求选择不同的统计图.统计图的功能就是将数据信息通过图表的形式恰当地表示出来.?解析91答案类型三 茎叶图例3 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:
甲的得分 12,15,24,25,31,31,36,36,37,39,44,49,50;
乙的得分 8,13,14,16,23,26,28,33,38,39,51.
(1)画出甲、乙两名运动员得分数据的茎叶图;解答作出茎叶图如图.
(2)根据茎叶图分析甲、乙两名运动员的水平.解答由上面的茎叶图可以看出,甲运动员的得分情况是大致对称的;乙运动员的得分情况除一个特殊得分外,也大致对称.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.当数据较少时,用茎叶图分析问题的突出优点是
(1)保留原始信息;
(2)随时记录.用茎叶图分析数据可以运用数据分布的对称情况、集中分散情况来分析总体情况.跟踪训练3 在某电脑杂志的一篇文章中,每个句子所含的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17;
在某报纸的一篇文章中,每个句子所含的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.
(1)将这两组数据用茎叶图表示;解答茎叶图如图所示:
(2)将这两组数据进行比较分析,得到什么结论?解答电脑杂志上每个句子的字数集中在10~30之间,报纸上每个句子的字数集中在20~40之间,说明电脑杂志上每个句子的平均字数要比报纸上每个句子的平均字数少.说明电脑杂志作为科普读物需要通俗易懂、简明.当堂训练1.当收集到的数据量很大或有多组数据时,用哪种统计图表示较合适
A.茎叶图
B.条形统计图
C.折线统计图
D.扇形统计图答案解析√当收集到的数据量很大或有多组数据时条形统计图较为合适.23412.如图所示是从一批产品中抽样得到的数据的条形统计图,由图可看出数据出现机会最大的范围是
A.(8.1,8.3) B.(8.2,8.4)
C.(8.4,8.5) D.(8.6,8.7) 答案√23413.如图所示是某校高一年级学生到校方式的条形统计图,根据图形可得出骑自行车人数占高一年级学生总人数的
A.20%
B.30%
C.50%
D.60% 2341答案解析√4.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:
从折线图上两人射击命中环数的走势看,最有潜力的是____. 答案2341乙1.条形统计图及折线统计图特别适用于数据量很大的情况,但却损失了数据的部分信息.扇形统计图适合表示总体的各个部分所占比例的问题,但不适用于总体分成部分较多的问题.
2.茎叶图表示数据有两个突出优点:(1)统计图上没有原始信息的损失.
(2)茎叶图可以随时记录,方便表示与比较.
缺点:当数据量很大或有多组数据时,茎叶图就不那么直观、清晰了.本课结束课件33张PPT。第一章 统计§4 数据的数字特征学习目标
1.能合理地选取样本,并从中提取基本的数字特征.
2.了解众数、中位数、平均数的概念,会计算方差和标准差.
3.进一步体会用样本估计总体的思想,会用样本的数字特征
估计总体的数字特征.题型探究问题导学内容索引当堂训练问题导学平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点?思考1 知识点一 众数、中位数、平均数答案平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分?思考2 答案为了避免平均值受数据中个别极端值的影响,增大它在估计总体时的可靠性,故计算评委打分时要去掉一个最高分和一个最低分.梳理 
众数、中位数、平均数定义
(1)众数:一组数据中出现次数 的数.
(2)中位数:把一组数据按 的顺序排列,处在 位置的数(或中间两个数的 )叫作这组数据的中位数.最多从小到大(或从大到小)中间平均数知识点二 方差、标准差当样本数据的标准差为0时,该组数据有何特点?思考1 答案当样本数据的标准差为0时,该组数据都相等.标准差、方差的意义是什么?思考2 答案标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.梳理 标准差、方差的概念及计算公式
(1)标准差是样本数据到平均数的一种 ,一般用s表示.
s=__________________________________.
(2)标准差的平方s2叫作方差.
s2= ( xn是样本数据,n是样本容量,是样本平均数). (3)标准差(或方差)越小,数据越稳定在平均数附近.s=0时,每一组样本数据均为 .平均距离知识点三 用样本的基本数字特征估计总体的基本数字特征1.样本的基本数字特征包括 、 、 、 .
2.平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,还需要用标准差来反映数据的
程度.
3.现实中的总体所包含的个体数往往是很多的,虽然总体的平均数与标准差客观存在,但是我们无从知道.所以通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.虽然样本具有 性,不同的样本测得的数据不一样,与总体的数字特征也可能不同,但只要样本的
好,这样做就是合理的,也是可以接受的.众数中位数平均数标准差随机代表性分散题型探究例1 某公司的各层人员及工资数构成如下:
人员:经理1人,周工资2 200元;高层管理人员6人,周工资均为250元;高级技工5人,周工资均为220元;工人10人,周工资均为200元;学徒1人,周工资为100元.
(1)计算该公司员工周工资的众数、中位数、平均数;类型一 众数、中位数和平均数的理解与应用解答众数为200,中位数为220,平均数为
(2)这个问题中,平均数能客观地反映这个公司的工资水平吗?解答虽然平均数为300,但由给出的数据可见,只有经理的周工资在平均数以上,其余的都在平均数以下,故用平均数不能客观地反映该公司的工资水平.(1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中部分数据多次重复出现时,众数往往更能反映问题.
(3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.(4)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动.
(5)因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息.但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低. 跟踪训练1 对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:
①这组数据的众数是3;
②这组数据的众数与中位数的数值不相等;
③这组数据的中位数与平均数的数值相等;
④这组数据的平均数与众数的数值相等.
其中正确结论的个数为
A.1 B.2
C.3 D.4答案解析
类型二 标准差、方差的应用例2 计算数据89,93,88,91,94,90,88,87的方差和标准差(标准差结果精确到0.1).解答(1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.
(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.
(3)若样本数据都相等,则s=0.
(4)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度是由标准差来衡量的.跟踪训练2 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差; 解答由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
(2)根据图和(1)中算得的结果,对两人的训练成绩作出评价.解答当堂训练1.某市2016年各月的平均气温(℃)数据的茎叶图如图:
则这组数据的中位数是
A.19
B.20
C.21.5
D.23 答案解析√由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B.234152.设样本数据x1,x2,…,x10的平均数和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的平均数和方差分别为
A.1+a,4 B.1+a,4+a C.1,4 D.1,4+a答案√2341解析53.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为____.2341答案解析564.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,
…,2x10-1的标准差为_____.答案234116解析设样本数据x1,x2,…,x10的标准差为s,则s=8,可知数据2x1-1,
2x2-1,…,2x10-1的标准差为2s=16.55.某校医务室抽查了高一10位同学的体重(单位:kg)如下:
74,71,72,68,76,73,67,70,65,74.
求这10个学生体重数据的平均数、中位数、方差、标准差.2341解答5?234151.平均数、中位数和众数刻画了一组数据的集中趋势,极差、方差刻画了一组数据的离散程度.它们作为一组数据的代表各有优缺点,也各有各的用处,从不同的角度出发,不同的人会选取不同的统计量来表达同一组数据的信息.
2.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.本课结束课件41张PPT。第一章 统计§5 用样本估计总体学习目标
1.学会列频率分布表,会画频率分布直方图.
2.会用频率分布表或分布直方图估计总体分布,并作出合理解释.
3.在解决问题过程中,进一步体会用样本估计总体的思想,认识
统计的实际作用,初步经历收集数据到统计数据的全过程.题型探究问题导学内容索引当堂训练问题导学如果把我国初生婴儿的性别作为总体,那么它的分布是指什么?思考 知识点一 总体的分布答案是指男女性别的比例.梳理 
一般地,总体分布是指总体中个体所占的比例.知识点二 用频率分布表或频率分布直方图估计总体分布要做频率分布表,需要对原始数据做哪些工作?思考1 答案分组,频数累计,计算频数和频率.如何决定组数与组距?思考2 答案同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?思考3 答案不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.梳理 面积12.频率折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的 开始,用线段依次连接各个矩形的 ,直至右边所加区间的 ,就可以得到一条折线,我们称之为频率折线图.
3.随着样本容量不断增大,样本中落在每个区间内的样本数的 会越来越稳定于总体在相应区间内取值的 .随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小.相应的频率折线图就会越来越接近于一条光滑曲线.中点顶端中点中点频率概率如果想知道某一历史时期黄河流域男性平均身高,有可能获得总体数据吗?怎么办?思考 知识点三 总体的数字特征答案时代变迁,已经不可能获得所有数据,但可以根据出土的同时期样本数据计算平均身高来估计.梳理 一般地,
1.现实中的总体所包含的个体数往往很难获得,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.
2.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.题型探究例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm).
(1)列出样本频率分布表; 类型一 用频率分布表及频率分布直方图估计总体分布解答样本频率分布表如下:
(2)画出频率分布直方图;解答频率分布直方图如下:
(3)估计身高小于134 cm的人数占总人数的百分比.解答由样本频率分布表可知身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.跟踪训练1 为了了解中学生身体发育情况,对某中学17岁的60名女生的身高(单位:cm)进行了测量,结果如下:
154 159 166 169 159 156 166 162 158 159
156 166 160 164 160 157 151 157 161 162
158 153 158 164 158 163 158 153 157 168
162 159 154 165 166 157 155 146 151 158
160 165 158 163 163 162 161 154 165 161
162 159 157 159 149 164 168 159 153 160
列出样本的频率分布表;绘出频率分布直方图和频率折线图.解答第一步,求极差:上述60个数据中最大为169,最小为146.故极差为169-146=23(cm).
第二步,确定组距和组数,可取组距为3 cm,
第三步,确定区间界限:[145.5,148.5),[148.5,151.5),[151.5,154.5),[154.5,157.5),[157.5,160.5),[160.5,163.5),[163.5,166.5),[166.5,169.5).第四步,列频率分布表:
第五步,根据上述数据绘制频率分布直方图:
第六步,在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线即为频率折线图. 类型二 估计总体数字特征例2 为了解A,B两种轮胎的性能,某汽车制造厂分别从这两种轮胎中随机抽取了8个进行测试,下面列出了每种轮胎行驶的最远里程数(单位:1 000 km)
轮胎A 96,112,97,108,100,103,86,98
轮胎B 108,101,94,105,96,93,97,106
(1)分别计算A,B两种轮胎行驶的最远里程的平均数、中位数;解答(2)分别计算A,B两种轮胎行驶的最远里程的极差、标准差;解答A轮胎行驶的最远里程的极差为112-86=26,
标准差为
B轮胎行驶的最远里程的极差为108-93=15,
标准差为 (3)根据以上数据你认为哪种型号的轮胎性能更加稳定?解答由于A和B的最远行驶里程的平均数相同,而B轮胎行驶的最远里程的极差和标准差较小,所以B轮胎性能更加稳定.平均数、中位数、众数、极差、方差等统计量是将多个数据“加工”成一个数据,能更清楚地反映这组数据的某些重要特征,要理解这些统计量表达的信息.跟踪训练2 为迎接5月31日世界无烟日的到来,小华对10名戒烟成功者戒烟前和戒烟5个星期后的体重(单位:kg)作了认真统计,并记录如下表所示:
(1)求这10人在戒烟前和戒烟后的体重的平均数; 解答将数据按从小到大的顺序重新排列;
戒烟前:52,52,55,55,60,60,64,67,69,80;
戒烟后:52,54,55,57,58,62,67,68,70,81.
(2)求这10人在戒烟前和戒烟后的体重的方差;解答(3)通过上述数据,你能得到什么结论?解答从戒烟前后两组数据的统计量知:从平均数看,戒烟后这10人的平均体重增加了1 kg;从方差看,戒烟后数据的波动比戒烟前数据的波动大,说明戒烟对不同的人所发生的变化程度是不同的,通过对这两组数据的统计分析,得出结论:吸烟有害健康,戒烟对身体健康是有益的.当堂训练1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确答案解析√由用样本估计总体的性质可得.23415由于频率分布直方图中小矩形的面积为频率,故A错.2.下列说法不正确的是
A.频率分布直方图中每个小矩形的高就是该组的频率
B.频率分布直方图中各个小矩形的面积之和等于1
C.频率分布直方图中各个小矩形的宽一样大
D.频率分布折线图是从所加的左边区间的中点开始,用线段依次连接频率分布直方图的每个小矩形上端中点,直至右边所加区间的中点得到的答案√2341解析53.某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg的人数是
A.10
B.2
C.5
D.15 2341答案解析5√4.一个容量为20的样本数据,分组后组距与频数如下表:
则样本在[10,50)上的频率为
A.0.5 B.0.24 C.0.6 D.0.7 答案2341解析5√5.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.
(1)直方图中x的值为_________; 23415(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,
∴x=0.004 4.0.004 4答案解析(0.003 6+0.004 4+0.006 0)×50×100=70.23415(2)在这些用户中,用电量落在区间[100,250)内的户数为____.70答案解析1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.用同样的方法先后从总体中抽取两个大小相同的样本,但两次得到的样本频率分布表、样本频率分布直方图、样本的平均数和标准差仍然可能互不相同,是样本的随机性造成的,是不可避免的.只要抽样的方法比较合理,就能反映总体的信息,当样本量很大时,就比较接近总体的真实情况.本课结束课件34张PPT。§6 统计活动:结婚年龄的变化
§7 相关性学习目标
1.了解一个统计活动的全过程,提高收集、处理数据的能力.
2.能通过实例体会变量间的相关性.
3.掌握相关关系的判断.能根据散点图对线性相关关系进行判断
和直线拟合,从而对整体进行估计.题型探究问题导学内容索引当堂训练问题导学这一章到目前为止,我们已经学了很多统计知识,你能简要概括一下统计都是做哪些工作吗?思考 知识点一 统计活动的步骤答案收集数据;整理数据;分析数据;估计总体.梳理 
统计活动的步骤:一般地,有
(1)确定 ;(2) ;(3)整理数据;(4) ;(5)作出推断.调查对象收集数据分析数据知识点二 散点图与曲线拟合假定我们已经有了两个量的一些对应取值,怎样处理这些数据才能便于我们观察猜想这两个量的关系?思考 答案以一个量为横坐标,一个量为纵坐标画出图.梳理
一般地,在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将 的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.从散点图上可以看出,如果变量之间 ,这些点会有一个
的大致趋势,这种趋势通常可以用一条 来近似,这样近似的过程称为_________. 变量所对应存在着某种关系集中光滑的曲线曲线拟合数学成绩y与学习数学所用时间t之间的关系,能否用函数关系刻画?思考 知识点三 相关关系答案一般来说,学数学的时间越长,成绩越好.但用时10小时,数学成绩却不是一个确定的数字.故不能用函数关系刻画.梳理 一般地,函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.函数关系是一种因果关系而相关关系不一定是因果关系,也可能是伴随关系.
相关关系的分类
(1)线性相关:若 x和y的散点图中,所有点看上去都在________附近波动,则称变量间是线性相关的.
(2)非线性相关:若散点图上所有点看上去都在 (不是一条直线)附近波动,则称此相关为非线性相关的,此时,可以用 来拟合.
(3)不相关:如果所有的点在散点图中 ,则称变量间是不相关的.两个变量一条直线一条曲线某条曲线没有显示任何关系题型探究例1 如何设计随着年代推移初次结婚年龄如何发生变化的统计活动.类型一 统计活动的方案设计解答我们可以按照如下的步骤来进行这个统计活动.
(1)确定调查的对象:全班同学的父母辈和祖父母辈.调查目的:随着年代推移结婚年龄如何变化.
(2)收集数据:每位同学收集自己父母辈和祖父母辈的初次结婚年龄,按照以下方式记录下来(如下表).
(3)整理数据,把所收集到的数据汇总成一个表格.
整理数据处理方法:利用计算机处理数据.
(4)分析数据:①将上面的数据用折线图、频率分布直方图分别表示出来.同学们之间可进行交流、讨论,确定出比较合适的统计图.
②分别估计父辈、母辈、祖父辈、祖母辈的初次结婚年龄的平均数与标准差,并进行比较.
(5)作出推断,通过分析数据作出推断.统计活动作出的推断结论的准确性,决定于抽取的样本是否具有代表性,以及样本容量的大小,一般来说,用科学的抽样方法抽取样本,并且样本容量足够大,这样的统计活动得到的结论准确性高,可信度大,可以作为决策依据.跟踪训练1 请设计一个测量全班同学身高的试验.解答试验的操作步骤设计如下:
(1)准备身高测量仪(为了避免仪器的误差,准备3架身高测量仪);
(2)安排负责仪器的人,一般每架仪器两人,一人测量一人记录;
(3)组织学生排队依次测量.用每架测量仪各测量一次,将所得数据填入下表;(4)整理数据,用求平均值的方法算出每位同学的身高.
类型二 变量之间的相关关系判断例2 在下列两个变量的关系中,哪些是相关关系?
(1)正方形边长与面积之间的关系;解答两变量之间的关系有:函数关系与带有随机性的相关关系.正方形的边长与面积之间的关系是函数关系.(2)作文水平与课外阅读量之间的关系;解答作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.(3)人的身高与年龄之间的关系;解答人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具备相关关系.(4)降雪量与交通事故发生率之间的关系.解答降雪量与交通事故发生率之间具有相关关系.如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.跟踪训练2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?有人认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?解答从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.画出散点图,分析年龄与人体脂肪含量的关系.类型三 散点图及曲线拟合例3 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:解答散点图如下;
在散点图中,点散布在从左下角到右上角的区域,故人的年龄与人体脂肪含量是线性相关关系.画散点图时应注意合理选择单位长度,避免图形过大或过小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.跟踪训练3 如表所示为我国在1000年到2000年间的人口数量.
(1)试画出散点图;解答散点图如下:
(2)年份与人口是相关关系吗?你觉得用什么函数模型模拟效果比较好?解答由图可知,我国在1000年到2000年间的人口数量与年份是相关关系.因为增长速度越来越快, 用指数模型模拟效果比较合适.当堂训练1.对于给定的两个变量的统计数据,下列说法正确的是
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系答案√23412.观察下列散点图,具有相关关系的是答案√2341A.①② B.①③
C.②④ D.②③ 3.下列两个变量之间的关系,哪个不是函数关系
A.匀速行驶的车辆的行驶距离与时间
B.角度和它的正弦值
C.等腰直角三角形的腰长与面积
D.在一定年龄段内,人的年龄与身高2341答案解析在一定年龄段内,人的年龄与身高具有相关关系.√4.下列变量之间的关系是函数关系的是
A.圆的周长与半径
B.施肥量和小麦亩产量
C.降雨量和交通事故发生率
D.学习时间和学习成绩答案2341√1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关.
2.函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.函数关系是一种因果关系而相关关系不一定是因果关系,也可能是伴随关系,函数关系与相关关系之间有着密切联系,在一定条件下可以互相转化.
3.设计统计方案可以帮助我们更好地理解统计的全过程,其中收集数据过程实质是抽样,要强调样本的代表性;把数据整理成图表形式并计算特征数如平均数,标准差,可以估计总体分布,且便于交流.本课结束课件31张PPT。第一章 统计§8 最小二乘估计学习目标
1.了解用最小二乘法建立线性回归方程的思想,会用给出的公式
建立线性回归方程.
2.理解回归直线与观测数据的关系,能用线性回归方程进行估计
和预测.题型探究问题导学内容索引当堂训练问题导学具有线性相关关系的散点大致分布在一条直线附近.如何确定这条直线比较合理?思考 知识点一 最小二乘法答案应该使散点整体上最接近这条直线.最小二乘法是一种求回归直线的方法,用这种方法求得的回归直线能使样本数据的点到回归直线的距离
[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2最小.数学上的“回归”是什么意思?思考 知识点二 线性回归方程答案“回归”一词最早由英国统计学家(Francils Galton)提出的,本意是子女的身高会向一般人的均值靠拢.现在这个概念引伸到随机变量有向回归线集中的趋势.梳理 
用最小二乘法得到的直线方程称为 ,a,b是线性回归方程的系数.线性回归方程题型探究例1 下表为某地近几年机动车辆数与交通事故数的统计资料.
(1)请判断机动车辆数与交通事故数之间是否具有线性相关关系,如果不具有线性相关关系,请说明理由; 类型一 线性回归方程的求法解答在平面直角坐标系中画出数据的散点图,如图.
直观判断散点在一条直线附近,故具有线性相关关系.(2)如果具有线性相关关系,求出线性回归方程.解答
将它们代入公式计算得b≈0.077 4,a≈-1.024 9,
所以,所求线性回归方程为y=0.077 4x-1.024 9. 即使散点图呈饼状,也可利用公式求出线性回归方程,但这种方程显然没什么价值.故应先画出散点图,看是否呈直线形,再求方程.跟踪训练1 以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
(1)画出数据对应的散点图; 解答数据对应的散点图如图所示:
(2)求线性回归方程,并在散点图中加上回归直线.解答
故所求线性回归方程为y=0.196 2x+1.814 2.
回归直线如(1)中图所示.类型二 线性回归方程的应用例2 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:
(1)画出散点图; 解答散点图如图所示:
(2)从散点图中发现气温与热饮销售杯数之间有什么关系;解答从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.(3)求线性回归方程;解答从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出线性回归方程的系数.利用计算器容易求得线性回归方程为y=-2.352x+147.767.(4)如果某天的气温是2℃,预测这天卖出的热饮杯数;解答当x=2时,y=143.063.因此,某天的气温为2℃时,这天大约可以卖出143杯热饮.(5) 气温为2℃时,小卖部一定能够卖出143杯左右热饮吗?为什么?解答小卖部不一定能够卖出143杯左右热饮,原因如下:①线性回归方程中的截距和斜率都是通过样本估计出来的,存在误差,这种误差可以导致预测结果的偏差.
②即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,能够与实际值y很接近.我们不能保证点(x,y)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近.线性回归方程主要用于预测,但这种预测类似于天气预报,不一定与实际数据完全吻合.跟踪训练2 有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童数,如下表:
(1)画出散点图,并判定这两个变量是否具有线性相关关系; 解答散点图如下:
根据散点图可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系. (2)通过计算可知这两个变量的线性回归方程为y=23.25x+102.15,假如一个城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?解答断言是错误的,将x=12代入y=23.25x+102.15得y=23.25×12+102.15=381.15>380,但381.15是对该城市人均GDP为12万元的情况下所作的一个估计,该城市患白血病的儿童可能超过380人,也可能低于380人.当堂训练1.下列有关线性回归的说法,不正确的是
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的
关系叫做相关关系
B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量
的一组数据的图形叫作散点图
C.线性回归方程最能代表观测值x、y之间的线性关系
D.任何一组观测值都能得到具有代表意义的线性回归方程答案√2341回归直线必过样本点的中心.2.已知回归直线的斜率的估计值是1.23,样本点中心 为(4,5),
A.y=1.23x+4
B.y=1.23x+5
C.y=1.23x+0.08
D.y=0.08x+1.23答案√2341解析3.某产品的广告费用x与销售额y的统计数据如下表:
根据上表可得线性回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为
A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元 2341答案解析√4.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的线性回归方程为y=0.85x-85.71,则下列结论中不正确的是
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可判定其体重必为58.79 kg答案2341解析当x=170时,y=0.85×170-85.71=58.79,体重的估计值为58.79 kg.√1.求线性回归方程时应注意的问题
(1)知道x与y成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.
(2)用公式计算a、b的值时,要先计算b,然后才能算出a.
2.利用线性回归方程,我们可以进行估计和预测.若线性回归方程为y=bx+a,则x=x0处的估计值为y0=bx0+a.本课结束课件42张PPT。第一章 统计章末复习课学习目标
1.会根据不同的特点选择适当的抽样方法获得样本数据.
2.能利用图、表对样本数据进行整理分析,用样本和样本的数字
特征估计总体.
3.能利用散点图对两个变量是否相关进行初步判断,能用线性回
归方程进行预测.题型探究知识梳理内容索引当堂训练知识梳理1.抽样方法
(1)当总体容量较小,样本容量也较小时,可采用 .
(2)当总体容量较大,样本容量较小时,可用 .
(3)当总体容量较大,样本容量也较大时,可用 .
(4)当总体由差异明显的几部分组成时,可用 .
2.用样本估计总体
用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率 与频率 .当样本只有两组数据且样本容量比较小时,用 刻画数据比较方便.抽签法随机数法系统抽样法分层抽样法分布表分布直方图茎叶图3.样本的数字特征
样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括 、 和 ;另一类是反映样本波动大小的,包括
及 .
4.变量间的相关关系
(1) 两个变量之间的相关关系的研究,通常先作变量的 ,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系).众数中位数平均数方差标准差散点图(2)求线性回归方程的步骤:③写出线性回归方程y=bx+a.题型探究例1 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,干事20人,上级机关为了了解机关人员对政府机构的改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取?类型一 抽样方法的应用解答
即从副处级以上干部中抽取2人,一般干部中抽取14人,干事中抽取4人.
∵副处级以上干部与干事人数都较少,他们分别按1~10编号和1~20编号,然后采用抽签法分别抽取2人和4人,对一般干部采用00,01,…,69编号,然后用随机数法抽取14人.三种抽样方法并非截然分开,它们都能保证个体被抽到的机会相等. 跟踪训练1 某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为
A.6 B.8 C.10 D.12答案解析类型二 用样本的频率分布估计总体分布例2 有1个容量为100的样本,数据(均为整数)的分组及各组的频数如下:
[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;
[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;
[30.5,33.5),8.
(1)列出样本的频率分布表;解答样本的频率分布表如下:
(2)画出频率分布直方图;解答频率分布直方图如图:
(3)估计数据小于30的数据约占多大百分比.解答小于30的数据占0.06+0.16+0.18+0.22+0.20+0.10=0.92=92%.借助图表,可以把抽样获得的庞杂数据变得直观,凸显其中的规律,便于信息的提取和交流. 跟踪训练2 为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为
A.64 B.54
C.48 D.27 [4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为1-0.62-0.05-0.11=1-0.78=0.22.
∴a=(0.22+0.32)×100=54.答案解析类型三 用样本的数字特征估计总体的数字特征例3 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;解答
(2)根据计算结果判断哪台机床加工零件的质量更稳定.解答两台机床所加工零件的直径的平均数相同,
所以乙机床加工零件的质量更稳定. 样本的数字特征就像盲人摸到的象的某一局部特征,只有把它们结合起来才能看到全貌.跟踪训练3 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:
问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡? 解答类型四 线性回归方程的应用例4 下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
(1)请画出上表数据的散点图; 解答散点图如图所示:
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;解答
∴所求的线性回归方程为y=0.7x+0.35.(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?解答现在生产100吨甲产品用煤
y=0.7×100+0.35=70.35,∴90-70.35=19.65.
∴预测生产100吨甲产品的生产能耗比技改前降低约19.65吨标准煤.散点图经最小二乘法量化为线性回归方程后,更便于操作(估计、预测),但得到的值仍是估计值.跟踪训练4 2017年元旦前夕,某市统计局统计了该市2016年10户家庭的年收入和年饮食支出的统计资料如表:
(1)如果已知y与x成线性相关关系,求线性回归方程; 解答
∴y=0.17x+0.81.
∴所求的线性回归方程为y=0.17x+0.81.(2)若某家庭年收入为9万元,预测其年饮食支出.解答当x=9时,y=0.17×9+0.81=2.34(万元).
可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.当堂训练1.10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,则数0.4是指1号球占总体分布的
A.频数 B.概率
C.频率 D.累积频率答案√23415个体是每一个学生的身高;样本是220名学生的身高;总体是全校1 320名高一学生的身高.2.为了了解全校1 320名高一学生的身高情况,从中抽取220名学生进行测量,下列说法正确的是
A.样本容量是220
B.个体是每一个学生
C.样本是220名学生
D.总体是1 320答案√解析23415?答案解析√234154.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如图,则所给结论中错误的是
A.甲的极差是29
B.乙的众数是21
C.甲罚球命中率比乙高
D.甲的中位数是24 答案解析甲的极差是37-8=29;乙的众数显然是21;甲的平均数显然高于乙,即C成立;甲的中位数应该是23.√234155.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15,则该班的学生人数是
A.45 B.50
C.55 D.60 答案2341解析?√51.应用抽样方法抽取样本时,应注意根据总体特征和已知信息设计和选择合适的抽样方法,确保样本的代表性.
2.用样本的频率分布估计总体分布
利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体情况作出估计.直方图能够很容易地表示大量数据,非常直观地表明分布的形状.在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留原始信息,而且可以随时记录,这给数据的记录和表示都带来方便.3.用样本的数字特征估计总体的数字特征
为了从整体上更好地把握总体的规律, 我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计.虽然随着样本不同,样本数字特征也不同,但只要样本代表性好,样本数字特征还是能估计总体数字特征的.
4.线性回归方程的应用
分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出线性回归方程,并利用线性回归方程进行估计和预测.本课结束