2017_2018学年高中数学第一章统计案例课件(打包12套)北师大版必修3

文档属性

名称 2017_2018学年高中数学第一章统计案例课件(打包12套)北师大版必修3
格式 zip
文件大小 52.9MB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2017-11-08 18:51:26

文档简介

课件17张PPT。§1 从普查到抽样 1.了解普查的意义.
2.结合具体的问题情境,理解抽样的必要性和重要性.1.普查
普查是指一个国家或一个地区专门组织的一次性大规模的 全面调查,目的是详细地了解某项重要的国情、国力.当普查的对象很少时,普查无疑是一项非常好的调查方式.当普查的对象很多时,普查的工作量就很大,要耗费大量的人力、物力与财力,并且组织工作繁重、时间长.更值得注意的是,在很多情况下,普查工作难以实现.
【做一做1】 下列调查中,必须采用普查的是(  )
A.调查某品牌电视机的市场占有率
B.调查某电视连续剧在全国的收视率
C.调查高一(1)班的男女同学的比例
D.调查某型号炮弹的射程
答案:C2.抽样调查
从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推断,这就是抽样调查.其中,调查对象的全体称为总体,被抽取的一部分称为样本.
抽样调查最突出的两个优点:(1)迅速、及时;
(2)节约人力、物力和财力.【做一做2-1】 下列调查所抽取的样本具有代表性的是 (  )
A.利用当地七月份的日平均最高气温值估计当地全年的日平均最高气温
B.在农村调查全市人民的平均寿命
C.利用一块实验水稻田的亩产量估计水稻的实际亩产量
D.为了了解一批洗衣粉的质量情况,从仓库中任意抽取100袋进行检验
答案:D
【做一做2-2】 为了了解某种花的发芽天数,种植某种花的球根200个,进行调查发芽天数的试验,样本是(  )
A.200个表示球根发芽天数的数值
B.200个球根
C.无数个球根发芽天数的数值集合
D.无法确定
答案:A题型一题型二题型三题型四普查与抽样调查的选择
【例1】 试指出以下问题适合用普查还是抽样调查:
(1)去菜市场买鸡蛋,想知道鸡蛋是否有破损;
(2)去菜市场买韭菜,想知道韭菜是否新鲜;
(3)银行在收进储户现金的时候想知道有没有假钞;
(4)学期临近结束时,英语老师想在课堂上花10 min的时间了解全班54人记忆单词和短语的情况.
分析:普查与抽样调查的区别在于是不是对所有对象进行调查.题型一题型二题型三题型四解:(1)适合用普查,对于一般家庭而言每次买的鸡蛋不会很多,逐个检查所需时间不多,且一个鸡蛋破损与否并不能说明其他鸡蛋的破损情况.
(2)适合用抽样调查,因为韭菜较细,每根都查不太可能.
(3)适合用普查,因为每张钞票是否为假钞与其他钞票没有关系.
(4)适合用抽样调查,因为每个学期会新学许多单词和短语,且学生较多,要在10 min内检查完,实在太困难,所以老师只能挑选其中的一部分学生来检查.
反思选择普查和抽样调查的大体标准是:当总体容量很大时,通常是通过科学的抽样方法抽取具有代表性的样本进行抽查;当总体容量较小时,如果所进行的调查没有破坏性,那么可以选择普查,但是,若所进行的调查具有破坏性,无论总体容量是多少,只能选择抽样调查.题型一题型二题型三题型四【变式训练1】 在下列问题中为了得到数据应采用普查还是抽样调查?若采用抽样调查,指出原因.
(1)为了买校服,了解每名学生衣服的尺寸;
(2)某养鱼专业户要了解鱼塘中鱼的平均质量;
(3)商检人员在某超市检查出售的饮料的合格率;
(4)某班拟组织一次春游活动,为了确定春游的地点,向全班同学进行调查.
解:(1)普查;
(2)抽样调查,调查时总体容量较大;
(3)抽样调查,调查饮料是否合格会对产品产生一定的破坏;
(4)普查.题型一题型二题型三题型四理解统计的有关概念
【例2】 为了了解全校240名学生的身高情况,从中抽取40名学生测量其身高,下列说法正确的是(  )
A.总体是240
B.个体是每一名学生
C.样本是40名学生
D.总体是全校240名学生的身高
解析:总体是240名学生的身高,所以A项不正确,D项正确;个体是每一名学生的身高,所以B项不正确;样本是40名学生的身高,所以C项不正确.
答案:D题型一题型二题型三题型四【变式训练2】 为了了解高一年级学生的视力情况,特别是近视率问题,抽测了其中100名学生的视力.在这个过程中,100名学生的视力情况(数据)是(  )
A.总体 B.个体
C.总体的一个样本 D.样本容量
解析:100名学生的视力情况(数据)是从总体中抽取的一部分个体所组成的集合,所以是总体的一个样本.
答案:C题型一题型二题型三题型四设计调查方案
【例3】 你的班主任想全面了解你班学生的学习情况和思想状况,请你帮助班主任设计一个调查方案.
分析:在总体中的对象不是很多的情况下,普查是全面获取信息最可靠的方法.
解:因为一个班的学生人数不是很多,为了帮助班主任全面了解班里学生的学习情况和思想状况,可以采取普查的方法进行调查.先设计一个问卷,包括同学们对学习的各种看法,同学们的爱好、心理和思想状况等,然后发放给每一名学生填写,并全部收回,最后进行统计.这样就可以全面了解每名学生的学习情况和思想状况了.
反思在进行普查时,一定要注意普查的两个特点:(1)所取得的资料全面、系统;(2)主要调查在特定时段、特定情形下总体的数量.题型一题型二题型三题型四【变式训练3】 如果要进行一项调查,调查你自己学校学生的近视情况,那么你会怎样做?将你的想法写成调查方案,并与同学们交流你的调查方案与想法.
解:方案一:普查.因为各个学校每学期均有体检,所以可利用全校的体检,组织一次普查,将每位学生的体检表收集起来进行统计,最后将数据进行汇总.
方案二:抽样调查.普查不一定能实现,因为有个别学校由于各种原因不能完成体检,而全校班级很多,情况也不相同,要得到较准确的数据,可以到学校找出学生的学籍号,每隔一定的人数抽出一名进行调查,这样抽出的样本才会有代表性.(答案不唯一)题型一题型二题型三题型四易错辨析
易错点:因对总体、个体、样本的理解不透而致错
【例4】 为了调查参加运动会的1 000名运动员的平均年龄,从中抽取了100名运动员进行调查,下面说法正确的是(  )
A.1 000名运动员是总体
B.每名运动员是个体
C.抽取的100名运动员是样本
D.样本容量是100
错解:A 根据定义,1 000名运动员是总体,所以答案为A.
错因分析:本题中调查的是运动员的年龄,不是运动员.
正解:D 根据调查目的可知,总体是这1 000名运动员的年龄,个体是每名运动员的年龄,样本是抽取的100名运动员的年龄,样本容量是100.故答案为D.12341.若对某校1 200名学生的耐力做调查,抽取其中120名学生,测试他们1 500 m跑的成绩,得出相应的数值,在这项调查中,样本是指(  )
A.120名学生
B.1 200名学生
C.120名学生1 500 m跑的成绩
D.1 200名学生1 500 m跑的成绩
答案:C12342.下列调查工作,必须采用抽样调查的是(  )
A.调查某城市今年7月份的温度变化情况
B.调查某一品牌5万包袋装鲜奶是否符合卫生标准
C.调查我国所有城市中哪些是第一批沿海开放城市
D.了解全班50名学生100 m短跑的成绩
答案:B12343.为了了解某地参加计算机水平测试的5 000名学生的成绩,从中抽取了200名学生的成绩进行统计分析,在这个问题中,总体是 .?
答案:参加计算机水平测试的5 000名学生的成绩12344.为了创建“和谐平安”校园,某校决定在开学前对学校的电灯电路使用情况进行检查,以便排除安全隐患,此检查能否进行普查?为什么?
分析:利用普查的特点进行判断.
解:能.因为一个学校的电灯电路数目不算大,且对创建“和谐平安”校园来说,必须排除任一潜在或已存在的安全隐患,故必须用普查的方式.课件25张PPT。§2 抽样方法2.1 简单随机抽样1.了解简单随机抽样的定义,理解随机抽样的必要性和重要性.
2.在参与解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本.1.简单随机抽样
(1)基本概念
在抽样调查时,若抽取过程中每个个体被抽到的概率相同,这种抽样方法就叫作简单随机抽样.
简单随机抽样是抽样中一个最基本的方法.
(2)概率问题
用简单随机抽样从含有N个个体的总体中抽取容量为n(n≤N)的样本,在整个抽样过程中各个个体被抽到的概率为 .(3)特点
①总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便于通过样本对总体进行分析.
②逐个抽取:简单随机抽样是从总体中逐个进行抽取,这样便于实际操作.
③无放回抽样:简单随机抽样是一种无放回抽样,这样便于样本的获取和一些相关的计算.
④等可能抽样:不仅每次从总体中抽取一个个体时各个个体被抽取的可能性相等,而且在整个抽样过程当中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.
(4)常用方法:抽签法和随机数法.【做一做1】 下列抽样方法是简单随机抽样的是(  )
A.从50个零件中一次性抽取5个做质量检验
B.从50个零件中拿出指定的5个做质量检验
C.从实数集中逐个抽取10个数分析奇偶性
D.运动员从8个跑道中随机地抽取1个跑道
解析:选项A错在“一次性”抽取;选项B错在“指定的”抽取;选项C错在总体的容量无限.
答案:D2.抽签法
(1)先把总体中的N个个体编号,并把编号写在形状、大小相同的签上(签可以是纸条、卡片或小球等),然后将这些号签放在同一个箱子里均匀搅拌.每次随机地从中抽取一个,然后将号签均匀搅拌,再进行下一次抽取.如此下去,直至抽到预先设定的样本数.
(2)实施步骤:
①给调查对象群体中的每个对象编号;
②准备“抽签”的工具,实施“抽签”;
③对样本中每一个个体进行测量或调查.
名师点拨只有把号签充分搅匀,才能保证抽签的公平性.【做一做2-1】 下列抽样试验中,适合用抽签法的是(  )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
答案:B
【做一做2-2】 一个班级中有30名学生,若用抽签法抽取15人,则每个个体被抽到的可能性是     .?
答案:3.随机数法
(1)定义:把总体中的N个个体依次编上0,1,…,N-1的号码,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生0,1,…,N-1中的随机数;产生的随机数是几,就选几号个体,直至抽到预先规定的样本数.
(2)实施步骤:
①将总体中的每个个体进行编号;
②在随机数表中任选一个数作为开始;
③规定读取数字的方向;
④开始读取数字,若不在编号中,则跳过,前面已经读过的也跳过,若在编号中,则取出,依次取下去,直到取满为止;
⑤根据选定的号码抽取样本.温馨提示1.随机地选定开始读取的数字后,读数的方向可以向右,也可以向左、向上、向下等.
2.在位数少的数前添加“0”,
凑齐位数,如1,2,…,10可调整为01,02,…,10.
为减少位数也可用减1添0,如1,2,…,10可调整为0,1,2,…,9.【做一做3-1】 某工厂的质检人员对生产的100件产品,采用随机数法抽取10件检查,对100件产品采用下面的编号方法.
①1,2,3,…,100;   ②001,002,…,100;
③00,01,02,…,99; ④01,02,03,…,100.
其中正确的序号是(  )
A.②③④ B.③④
C.②③ D.①②
答案:C【做一做3-2】 某班有51名学生,学号从00到50,数学老师在上统计课时,运用随机数法选取5名学生提问,老师首先选定随机数表中的第21行第29个数5开始,然后向右读,如果不在50以内或与前面所取数字相同则跳过去,那么被提问的5名学生的学号是   .?
附:随机数表的第21行第21个数到第22行的第10个数
…46 16 28 35 54 94 75 08 99 23
37 08 92 00 48 80 33 69 45 98…
答案:08,23,37,00,48题型一题型二题型三简单随机抽样的判断
【例1】 下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)仓库中有1万支铅笔,从中一次性抽取100支铅笔进行质量检查;
(3)某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴某地参加抗震救灾工作;
(4)某彩民选号,从装有36个大小、形状都相同的号签的盒子中不放回地抽出6个号签.
分析:先逐个判断抽样的特点,再与简单随机抽样的定义比较得出结论.题型一题型二题型三解:(1)不是简单随机抽样.因为简单随机抽样要求被抽取样本的总体的个体数是有限的.
(2)不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.
(3)不是简单随机抽样.虽然这50名官兵是从中挑选出来的,但是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.
(4)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.
反思要判断所给的抽样方法是不是简单随机抽样,关键是看它们是不是符合简单随机抽样的定义以及简单随机抽样的几个特点.题型一题型二题型三【变式训练1】 四人打牌时,将洗好的扑克牌随机确定一张为起始牌,再按次序发牌,对任何一家来说,都是从52张牌(除去大、小王)中抽取13张牌,问这种抽样方法是不是简单随机抽样?为什么?
解:不是.因为简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始牌,其他各张牌虽然是逐张发牌,但是各张在谁手里已经被确定,所以不是简单随机抽样.题型一题型二题型三抽样方法的选择
【例2】 选择合适的抽样方法抽样,并写出抽样过程.
(1)从甲厂生产的30个篮球(其中一箱20个,另一箱10个)中抽取3个入样;
(2)从甲厂生产的300个篮球中,抽取10个入样.
解:(1)总体容量较小,用抽签法.
第一步:将30个篮球随机编号,编号为00,01,…,29.
第二步:将以上30个编号分别写在大小、形状、质地完全相同的小纸条上,揉成小球,制成号签.
第三步:把号签放到一个不透明的盒子中,充分搅拌.
第四步:从盒子中逐个抽取三个号签,并记录上面的号码.
第五步:找出与号码对应的篮球,即可得到样本.题型一题型二题型三(2)总体容量较大,样本容量较小,宜用随机数法.
第一步:将300个篮球随机编号,编号为000,001,…,299.
第二步:利用教材P164提供的随机数表随机地确定一个数作为开始数字.如选第10行,第11列的数0为开始数字,任选一个方向作为读数方向.
第三步:从选定的数0开始向右读,凡不在000~299(包括000和299)中都跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到035,296,093,177,221,094,055,034,050,073这10个号码,这就是所要抽取的10个样本个体的号码.题型一题型二题型三反思1.一个抽样试验能不能用抽签法,关键看两点:一是制签是不是方便;二是号签是不是容易被搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
2.利用随机数法抽取样本时,关键是事先确定以表中的哪个数(哪行哪列)作为起点以及读数的方向.同时,读数时结合编号特点进行读取,若编号为两位数,则两位两位地读取;若编号为三位数,则三位三位地读取,若出现重号则跳过,接着读取.题型一题型二题型三【变式训练2】 选择合适的抽样方法抽样,并写出抽样过程.
(1)某单位支援西部开发,现从报名的18名志愿者中选取6人组成志愿小组到西藏工作3年;
(2)现有一批零件,共600个,要从中抽取10个进行质量检查.
解:(1)利用抽签法.
第一步:将18名志愿者编号,编号分别为1,2,…,18;
第二步:将号码分别写在18张大小、形状、质地相同的纸条上,揉成团,制成号签;
第三步:将所有号签放入一个箱子中,充分搅匀;
第四步:依次取出6个号签,并记录其编号;
第五步:将对应编号的志愿者选出.题型一题型二题型三(2)利用随机数法.
第一步:将这批零件编号,编号分别为001,002,…,600;
第二步:在随机数表中任选一数作为开始,任选一方向作为读数方向,比如,选教材表1-2中第5行第2个数“5”,向右读;
第三步:从“5”开始向右读,每次读三位,凡不在001~600中的数跳过,前面已读过的也跳过去不读,依次选取可以得到:556,231,243,554,444,526,357,337,091,388;
第四步:将与这10个号码相对应的零件抽出就组成了我们所要抽取的样本.题型一题型二题型三易错辨析
易错点:对简单随机抽样的概念不理解致错
【例3】 下列抽取样本的方式是否属于简单随机抽样?如果不是,请说明理由.
(1)从无限多个个体中抽取100个个体作样本;
(2)盒子里共有80个零件,从中选出5个零件进行质量检验,在进行抽样操作时,从中任意抽出一个零件进行质量检验后再把它放回盒子里.
错解:(1)(2)全为简单随机抽样.
错因分析:(1)是从无限多个个体中抽取;(2)是有放回地抽取,故(1)(2)皆不是简单随机抽样.
正解:(1)不是简单随机抽样.因为被抽取样本的总体的个体数是无限的而不是有限的.
(2)不是简单随机抽样.因为它是有放回地抽取.12341.关于简单随机抽样的方法,下列说法错误的是(  )
A.要求总体的个数有限
B.从总体中逐个抽取
C.每个个体被抽到的可能性不一样,与先后顺序有关
D.它是一种不放回抽样
答案:C12342.用随机数法从100名学生(男生25人)中抽取20人进行某项活动,某男生被抽到的可能性是(  )答案:C 12343.从10个篮球中任取2个,检验其质量,较适宜采用的抽样方法为     .(填“抽签法”或“随机数法”)?
答案:抽签法12344.一个布袋中有6个大小、形状、质地相同的小球,从中不放回地抽取3个小球.求:
(1)某一特定小球入样的可能性;
(2)第三次抽取时,每个小球入样的可能性.课件19张PPT。2.2 分层抽样与系统抽样第1课时 分层抽样1.理解分层抽样的概念,会用分层抽样从总体中抽取样本.
2.能运用分层抽样的特点,进行简单的计算.分层抽样
(1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.
(2)特点:
①适用于总体由明显差异的几部分组成的情况;
②利用事先掌握的信息,抽取的样本有较好的代表性;
③等可能抽样,每个个体被抽到的概率都相同.
(3)实施步骤:
①分层:按某种属性特征将总体分成若干部分(层);
②按所占比例确定每层抽取个体的个数;
③各层分别按简单随机抽样或其他的抽样方法抽取样本;
④综合每层抽样,组成样本.【做一做1】 某社区有500户家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本,应采用的抽样方法是(  )
A.简单随机抽样
B.分层抽样
C.分类抽样
D.使用何种抽样方法都可以
答案:B【做一做2】 已知某市甲、乙、丙三个社区现分别有低收入家庭360户、270户、180户,若一批经济适用房中有90套住房用于解决这三个社区中90户低收入家庭的住房问题,则应从甲社区中抽取低收入家庭的户数为(  )
A.40 B.30 C.20 D.36答案:A 题型一题型二题型三分层抽样中的有关计算
【例1】 某校有老师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从所有师生中抽取一个容量为n的样本,已知从女学生中抽取80人,则n=     .?
分析:按分层抽样的特点计算.
解析:此题已经说明是分层抽样,需要计算其中对应的比例,再按比例来进一步计算.答案:192 题型一题型二题型三?题型一题型二题型三【变式训练1】 某大学数学系共有本科生1 000人,其中一、二、三、四年级的人数比为4∶3∶2∶1,若用分层抽样的方法从所有本科生中抽取一个容量为200的样本,则应抽取三年级的学生人数为(  )
A.80 B.40
C.60 D.20
解析:由分层抽样的特征可设从一、二、三、四年级中抽取的人数分别为4x,3x,2x,x,则依据抽取的样本容量为200,
得4x+3x+2x+x=200,即x=20.
所以应抽取三年级的学生人数为2x=20×2=40.
答案:B题型一题型二题型三分层抽样的应用
【例2】 某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000,其中持各种态度的人数如下表所示:电视台为了进一步了解观众的具体想法和意见,打算从中再抽取60人进行更为详细的调查,应怎样进行抽样?
分析:人数多,差异大→分层抽样→确定每层抽取比例→在各层中分别抽取→合在一起得样本题型一题型二题型三反思在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比.题型一题型二题型三【变式训练2】 设有120件产品,其中一级品有24件,二级品有36件,三级品有60件,用分层抽样的方法从中抽取一个容量为20的样本,试说明这种抽样方法是公平的.题型一题型二题型三易错辨析
易错点:忽略抽样的公平性而致错
【例3】 某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则合适的抽样方法是(  )
A.简单随机抽样
B.分层抽样或简单随机抽样
C.直接运用分层抽样
D.先从老年人中剔除1人,然后再用分层抽样题型一题型二题型三123451.已知某单位有职工120人,男职工有90人,现采用分层抽样(按男、女分层)抽取一个样本,若已知样本中有27名男职工,则样本容量为(  )
A.30 B.36
C.40 D.无法确定答案:B 12345答案:A 123453.一个单位有职工120人,其中业务人员60人,管理人员40人,后勤人员20人,为了了解职工健康状况,要从中抽取一个容量为24的样本,若用分层抽样,则管理人员应抽到的人数为(  )
A.4 B.12
C.5 D.8答案:D 123454.某学院A,B,C三个专业共有1 200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取     名学生.?
解析:C专业的学生人数为1 200-380-420=400(名),则C专业应抽取的学生数为 .
答案:40123455.某学校有在编人员200人,其中行政人员20人,教师140人,后勤人员40人,教育部门为了解学校机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽样,并写出抽样过程.
分析:因为不同部门的人对机构改革有不同意见,因此可选用分层抽样,按分层抽样的方法步骤进行即可.
解:(1)将200人分成行政人员、教师、后勤人员三层.(3)在各层中用简单随机抽样的方法抽取样本.
(4)将抽取的20人综合到一起,即得到一个容量为20的样本.课件22张PPT。第2课时 系统抽样1.理解系统抽样的概念,会用系统抽样从总体中抽取样本.
2.理解系统抽样抽取样本的编号特点.
3.能进行抽样数量的直接计算.系统抽样
(1)定义:将总体中的个体进行编号,等距分组,在第一组中按照 简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本.这种抽样方法称为系统抽样,有时也叫等距抽样或机械抽样.
(2)注意:编号时要随机编号,否则抽取的样本代表性差.
(3)实施步骤:
①确定分段间隔k(k∈N+)及抽样距,若需剔除部分个体,应采用简单随机抽样先剔除;
②给总体中的个体(除被剔除以外的个体)进行编号;
③在第一段用简单随机抽样确定起始个体的编号l(l∈N,0≤l≤k-1);
④按照一定的规则抽取样本,通常是将起始编号l加上间隔k得到第2个个体编号l+k,再加上k得到第3个个体编号l+2k,这样继续下去,直到获取整个样本. (4)特点:
①当总体中个体无差异且个体数目较大时,采用系统抽样;
②将总体分成均衡的若干部分指的是,将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,间隔一般为
③预先制定的规则指的是,在第一段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.归纳总结三种抽样方法的比较 【做一做1】 要从已编号(1~60)的60枚最新研制的某型号导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是(  )
A.5,10,15,20,25,30 B.3,13,23,33,43,53
C.1,2,3,4,5,6 D.2,4,8,16,32,48
答案:B
【做一做2】 若总体中含有1 600个个体,现在要采用系统抽样从中抽取一个容量为50的样本,总体应均分为     段,每段有     个个体.?
答案: 50 32题型一题型二题型三题型四系统抽样特点的应用
【例1】 为了了解1 500名学生对学校某项教改试验的意见,打算从中抽取一个容量为50的样本,考虑采用系统抽样,则分段的间隔k为(  )
A.50 B.40
C.30 D.20
解析:抽样距等于总体容量N除以样本容量n.
∵N=1 500,n=50,
?
答案:C题型一题型二题型三题型四【变式训练1】 为了调查某班级学生的作业完成情况,将该班级的52名学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知5号、31号、44号同学在样本中,则样本中还有一位同学的编号应该是(  )
A.13 B.17
C.18 D.21
解析:抽样距为44-31=13,故样本中另一位同学的编号为5+13=18.
答案:C题型一题型二题型三题型四系统抽样中的相关计算 A.39 B.40
C.37 D.38解析:根据系统抽样的特点可知,所抽到的样本编号为7+16(m-1)(1≤m≤50,m∈N+).
由题意得33≤7+16(m-1)≤48, 即m=3.
所以在33~48这16个数中应取的数为7+2×16=39.故选A.
答案:A题型一题型二题型三题型四【变式训练2】 将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300号在第Ⅰ营区,从301到495号在第Ⅱ营区,从496到600号在第Ⅲ营区,三个营区被抽中的人数依次为(  )
A.26,16,8 B.25,17,8 C.25,16,9 D.24,17,9
解析:依题意及系统抽样可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N+)组抽中的号码是3+12(k-1).所以第Ⅲ营区被抽中的人数是50-25-17=8.故选B.
答案:B题型一题型二题型三题型四【例3】 为了了解某地区今年高一学生期末考试的数学成绩,打算从参加考试的15 000名学生的数学成绩中用系统抽样的方法抽取容量为150的样本,请写出抽取过程.
分析:按照系统抽样的步骤进行.
解:第一步:因为样本容量与总体容量的比是1∶100,所以我们将总体平均分为150个部分,其中每一部分包括100个个体.
第二步:对全体学生的数学成绩进行编号:1,2,3,…,15000.
第三步:在第一部分即1号到100号用简单随机抽样抽取一个号码,比如是56号.
第四步:以56号作为起始号,再顺次抽取编号为156,256,356,…,14956的数学成绩,这样就得到一个容量为150的样本.题型一题型二题型三题型四反思根据起始号抽取其他号码时,是给起始号加上了间隔的整数倍,而不是加上了样本容量的整数倍.题型一题型二题型三题型四【变式训练3】 某校高中三年级的295名学生已经编号为1,2,3,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本.请你设计一个抽样方案.
解:按1∶5的比例抽样.
295÷5=59.
第一步:把295名同学分成59组,每组5人.第一组是编号为1~5的5名学生;第二组是编号为6~10的5名学生,依此类推,第59组是编号为291~295的5名学生.
第二步:采用简单随机抽样从第一组5名学生中随机抽取1名,不妨设其编号为k(1≤k≤5).
第三步:从以后各段中依次抽取编号为k+5i(i=1,2,3,…,58)的学生,再加上从第一段中抽取的编号为k的学生,得到一个容量为59的样本.题型一题型二题型三题型四【例4】 从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.
分析:总体特点,采用系统抽样 剔除2个个体→系统抽样→样本题型一题型二题型三题型四解:由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:
第一步:把这些车分成80组, ,余数是2,因此每个组有10辆车,还剩2辆车.这时,抽样距就是10.
第二步:先从802辆轿车中剔除2辆轿车(剔除方法可用随机数法).
第三步:将余下的800辆轿车编号为1,2,…,800.
第四步:从第1组即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个号(如5)作为起始号.
第五步:从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量为80的样本.题型一题型二题型三题型四反思当总体容量不能被样本容量整除时,可以先从总体中随机剔除几个个体,但要注意的是剔除过程必须是随机的,也就是总体中的每个个体被剔除的机会均等,剔除几个个体后使总体中剩余的个体能被样本容量整除,然后再按系统抽样的方法抽取样本.题型一题型二题型三题型四【变式训练4】 某校九年级有学生323名,为了了解学生的某种情况,按1∶8的比例抽取一个样本,用系统抽样进行抽样,并写出抽样过程.
解:第一步:把总体分为40个部分,每一部分有8名学生,还剩3名学生.这时,抽样距就是8.
第二步:先利用简单随机抽样的方法从323名学生中剔除3名学生,再对剩余的学生编号为1,2,…,320.
第三步:在第一段的1~8中用简单随机抽样抽取一个起始数(假设抽到的编号为4).
第四步:从4开始,依次加上间隔8,即得编号12,20,…,316,由编号4,12,20,…,316找出对应的学生,这样就得到一个容量为40的样本.123451.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为(  )
A.15 B.10 C.9 D.7
解析:按照系统抽样方法共分32组,抽取的号码为9,39,69,99,…,编号落入区间[1,450]的共有15人,编号落入区间[451,750]的共有10人,所以做问卷C的有32-15-10=7(人),故选D.
答案:D123452.某工厂为了检查某产品质量,在其生产流水线上每隔5分钟就取一件产品,这种抽样方法是(  )
A.抽签法 B.简单随机抽样
C.系统抽样 D.随机数法
解析:因为生产流水线均匀生产出产品,所取产品中每相邻两件的抽取“间隔”是相同的,所以是系统抽样.故选C.
答案:C123453.为了解1 200名学生对学校某项制度改革的意见,打算从中抽取一个容量为30的样本,则分段的间隔k为(  )
A.40 B.30 C.20 D.12
答案:A123454.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个销售点调查其销售收入和售后服务情况,记这项调查为②.完成①②这两项调查宜采用的抽样方法依次是(  )
A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法
解析:当总体中个体数较多且无明显差异时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体数较少时,宜采用简单随机抽样.依据题意,第①项调查应采用分层抽样法,第②项调查应采用简单随机抽样法.
答案:B123455.若总体中含有1 645个个体,采用系统抽样的方法从中抽取容量为35的样本,则应分为     段,分段间隔k=     ,每段有     个个体.?
解析:因为N=1 645,n=35,所以应分为35段,
?
每段有47个个体.
答案:35 47 47课件32张PPT。§3 统计图表第1课时 条形统计图、扇形统计图、折线统计图1.通过实例初步体会分布的意义和作用.
2.明确条形统计图、扇形统计图、折线统计图的特点和作用.
3.能选择合适的统计图表解决问题.统计图表
统计图表是表达和分析数据的重要工具,它不仅可以帮助我们从数据中获取有用的信息,还可以帮助我们直观、准确地理解相应的结果.统计图表有:条形统计图、扇形统计图、折线统计图、茎叶图.1.条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来.其特点是便于看出和比较各种数量的多少,即条形统计图能清楚地表示出每个项目的具体数目.
名师点拨1.用横轴上的数字表示样本值时,如果样本值较少,那么可以选择将每个样本值在横轴上列出的方式.如果样本值较多,那么可以选择将样本值的范围分组,用横轴上的点表示每组的两个端点(分点),两个端点间的线段表示每一组中的样本值.
2.纵轴上的一个单位长度可以表示一个样本值的出现个数或某个范围内的样本值的出现个数,也可以是出现的百分比、频率,只要能够清楚地反映出样本值的出现情况就行.在条形统计图中,每个条形的高度表示相应样本值出现的次数或百分比.【做一做1-1】 如图是某校高一学生到校方式的条形统计图,根据图形可得出骑自行车人数占高一学生总人数的(  )
?
       
         
A.20% B.30% C.50% D.60%
答案:B【做一做1-2】 某研究性学习小组为了了解本校七年级学生一天中做家庭作业所用的大致时间(时间以整数记,单位:min),对本校的七年级学生做了抽样调查,并把调查得到的所有数据(时间)进行整理,分成五个时间段,绘制成统计图.请结合统计图中提供的信息,回答下列问题:
?
(1)这个研究性学习小组所抽取的样本容量是多少?
(2)在被调查的学生中,一天做家庭作业所用的大致时间超过120 min(不包括120 min)的人数占被调查学生总人数的百分之几?分析:(1)样本容量即各个小组人数之和;(2)用后三个小组的人数之和除以总人数即可解答.
解:(1)第一段内的人数为3,第二段内的人数为6,第三段内的人数为9,第四段内的人数为8,第五段内的人数为4,故3+6+9+8+4=30(人),所以样本容量为30.
(2)一天中做家庭作业超过120 min(不包括120 min)的人数为9+8+4=21,占调查总人数的百分比为2.扇形统计图中,用圆面积代表总体,圆面中的各个扇形分别代表总体中的不同部分,扇形面积的大小反映部分占总体的百分比的大小.扇形统计图可以很清楚地表示各部分数量同总数之间的关系,即扇形统计图能清楚地表示出各部分在总体中所占的百分比.
名师点拨1.扇形统计图一般用于表示总体所分成的部分不多时的数据.如果所分的部分太多,用扇形统计图表示时,作图比较麻烦,图形表示效果也不够好.
2.在用圆面表示总体后,将圆面分成若干个扇形时,要根据各部分所占总体的多少来决定每个扇形的大小,理论上可以根据每部分占总体的比例,计算出相应扇形的圆心角,从而准确地画出每个扇形.
3.画扇形统计图时,既要标明每部分表示总体的哪一部分,又要标明该部分所占的比例.【做一做2】 如图为某校高三(1)班的男女人数比例图表,已知该班共有学生55人,则该班男生比女生约多(  )
A.13人 B.21人
C.24人 D.34人
答案:A3.折线统计图是用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段顺次连接起来.折线统计图不但可以表示出数量的多少,而且能够清楚地表示数量增减变化的情况,即折线统计图能够清晰地反映数据的变化情况.
名师点拨1.用折线统计图表示样本数据时,一般用横轴上的点表示单个孤立的样本值,而不是表示样本值的范围,这样才能描出一些对应的点.
2.在纵轴上标明数据时,要出现统计表中数据的最大值和最小值,并注意间隔.
3.折线统计图与条形统计图很类似,只是将条形换成点,并且连成了直线段,其作法与条形统计图基本一致.【做一做3】 如图是某市5月1日至5月7日每天最高、最低气温的折线统计图,在这7天中,日温差最大的一天是 (  )
?
A.5月1日 B.5月2日
C.5月3日 D.5月5日
答案:D题型一题型二题型三题型四条形统计图的应用
【例1】 如图是根据对某校高一80名男生的身高进行调查后得到的数据画出的统计图,由图可知下列说法不能肯定的是(  )
?
A.这80名男生中有32人的身高在160~170 cm之间
B.有70%的男生身高在160~180 cm之间
C.身高在180 cm以上的不足10人
D.平均身高为165 cm题型一题型二题型三题型四解析:身高在160~170 cm之间的人数为80×40%=32,A正确;易知B正确;180 cm以上的人数为80×10%=8<10,即C正确.故选D.
答案:D
反思该例题中条形统计图的横轴是身高的分组,纵轴是各组所占的百分数.题型一题型二题型三题型四【变式训练1】 2016年年度大学学科能力测验有12万名学生参加,各学科成绩采用15级分,数学学科能力测验成绩分布图如图所示.与数学成绩高于11级分的考生人数最接近的是(  )
?
   
             
A.4 000 B.10 000 C.15 000 D.20 000
解析:12,13,14,15级分所占百分比的和高于4%,低于10%,因此12,13,14,15级分的考生人数之和多于4 800,少于12 000,故选B.
答案:B题型一题型二题型三题型四折线统计图的应用
【例2】 红叶服装店2016年6月的某个星期销售T恤的情况如下表:
?
?
根据上表中的数据,先制成折线统计图,再观察折线统计图,说明T恤销售量的总趋势如何?题型一题型二题型三题型四解:折线统计图如图所示.
?
从统计图可以看出,前四天的销售量不是很稳定,从第四天开始,销售量呈上升趋势.
反思与条形统计图比较,折线统计图不但可以表示数量的多少,而且还可以反映同一事件在不同时间段的发展变化情况.题型一题型二题型三题型四【变式训练2】 小明同学因发热而住院,如图是根据护士为他测量的体温所绘制的体温折线图.
?
根据图中的信息,回答以下问题:
(1)护士每隔几小时给小明测量一次体温?
(2)近三天来,小明的最高体温、最低体温分别是多少?
(3)从体温看,小明的病情是在恶化还是在好转?
(4)如果连续36小时体温不超过37.2 ℃的话,可认为基本康复,那么小明最快什么时候出院?题型一题型二题型三题型四解:(1)根据横轴单位长表示的意义,可知护士每隔6小时给小明测量一次体温.
(2)从折线统计图中的最高点和最低点对应的纵轴意义,可知最高体温是39.5 ℃,最低体温是36.8 ℃.
(3)从题图可知小明的体温已经下降,并趋于稳定,因此病情在好转.
(4)9月8日18时小明的体温是37 ℃.其后的体温未超过37.2 ℃,自9月8日18时起计算,连续36小时后对应的时间为9月10日凌晨6时.因此小明最快可以在9月10日凌晨6时出院.题型一题型二题型三题型四扇形统计图的应用
【例3】 如图是甲、乙、丙、丁四组人数的扇形统计图的部分结果,根据扇形统计图可以知道丙、丁两组人数之和为(  )
A.250 B.150
C.400 D.300
解析:甲组人数是120,占30%,则总人数是
所以乙组人数是400×7.5%=30,即丙、丁两组人数之和为
400-120-30=250.
答案:A题型一题型二题型三题型四反思扇形统计图中的百分比是各组个体数与总体数之比,所有组的个体数之和等于总体数,所有组的百分比之和等于1.题型一题型二题型三题型四解:由题意设丁县人口占总人口的百分比为x,
则甲县人口占总人口的百分比为4x,
所以x+4x+15%+20%=1,所以x=13%.
故丁县有300 000×13%=39 000(人).题型一题型二题型三题型四易错辨析
易错点:选错统计图表而致错
【例4】 某班中有42%的人喜欢体育课,有31%的人喜欢音乐课,有70%的人喜欢微机课,还有25%的人喜欢美术课,请你选用合适的统计图来表示这些数据.
错解:用扇形统计图,如图所示.题型一题型二题型三题型四错因分析:在选择统计图时,应当特别注意当各对象所占的百分比之和大于1或小于1时,不能用扇形统计图来表示.
正解:应选择条形统计图,如图所示.123451.某学生某月有零花钱a元,其支出情况如图所示,下列说法不正确的是(  )
A.该学生捐赠款为0.6a元
B.捐赠款所对应的圆心角为240°
C.捐赠款是购书款的2倍
D.其他支出占10%
解析:关键是要把握住统计图中各扇形圆心角的度数,该学生捐赠款对应的圆心角应为360°×60%=216°.
答案:B123452.已知小波一星期的总开支分布如图①所示,一星期的食品开支如图②所示,则小波一星期的鸡蛋开支占总开支的百分比为(  )A.30% B.10%
C.3% D.不能确定图① 图② 12345解析:由题图②知,小波一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%,故选C.
答案:C123453.已知某班学生在课外活动中参加文娱、美术、体育小组的人数之比为4∶1∶5,则在扇形统计图中表示参加体育小组人数的扇形圆心角是     .?答案:180° 123454.对某市高三年级数学考试成绩的抽样调查中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示.若130~140分数段的人数为90,则90~100分数段的人数为     .?答案:810 123455.某农民年收入如下(单位:元): 请用不同的统计图来表示上面的数据.
分析:题目要求是将此四个数据用统计图表示出来,可利用条形统计图、折线统计图、扇形统计图来表示.12345解:用条形统计图表示,如图所示. 用折线统计图表示,如图所示. 12345用扇形统计图表示,如图所示. 课件16张PPT。第2课时 茎叶图1.掌握茎叶图,明确它的优点.
2.能根据已知茎叶图,读出有关数据.
3.能根据实际问题的特点,选择合适的图表.茎叶图
所有数据均为两位数的茎叶图的制作方法:将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎.一般地,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).
拓展提升各种统计图的优缺点:
(1)条形统计图:条形统计图是在直角坐标系中用直条表示数据,它便于直观地比较各种数量的多少,能直观地反映数据分布的大致情况,它既能看出某个情况下的数量多少,也能看出某个区间内的数量多少,特别适合于数据量大的数据表示,但最大的缺点是会丢失部分数据的信息.(2)折线统计图:折线统计图是在直角坐标系中用点表示各种情况的数据后,通过用直线段连接相邻点形成的一条折线,用折线表示数据的一种统计图.折线统计图不仅可以表示数量的多少,还直观地反映了数量的增减情况,变化趋势.由于画折线统计图时要描点,因此总体所分的情况不宜太多,否则比较麻烦.一般来说,折线统计图与条形统计图的作用比较相近,优缺点也相近.
(3)扇形统计图:扇形统计图是用圆面和扇形表示数据的一种统计图,它能很直观地看出总体所分成的各部分的情况,如所占总体的百分比,部分数量与总体数量之间的关系等,但这种方法不适合总体所分成的部分较多的情况,同时也会丢失一些数据的信息.
(4)茎叶图:茎叶图是用“茎”“叶”形成表示一组或两组数据的统计图,它能保留原始数据,可随时记录,且记录和表示比较方便,但不便于表示数据量较大和三组及三组以上的数据.【做一做】 如图是表示8位销售员一个月销售商品数量的茎叶图,则销售数据分别为          .(单位:百件)?
解析:由题中茎叶图可知销售数据都是两位数,
分别为45,45,52,56,57,58,60,63.
答案:45,45,52,56,57,58,60,63题型一题型二茎叶图的绘制
【例1】 在每年的植树节某市政府都会组织公务员参加植树活动,为了保证树苗的质量,林业部门将在植树前对树苗进行检测,现从同一种树的甲、乙两批树苗中各抽测了10株树苗,量出它们的高度如下(单位:cm):
甲:37,21,31,20,29,19,32,23,25,33;
乙:10,30,47,27,46,14,26,10,44,46.
(1)根据上面的数据画出茎叶图.
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,你认为甲、乙两批树苗的高度哪个更整齐.
分析:(1)茎是十位数字,叶是个位数字;(2)依据茎叶图的优点写出即可;(3)数据分散说明高度不整齐,数据集中说明高度比较整齐.题型一题型二解:(1)作出茎叶图如图所示,其中中间的数字表示每株树苗高度的十位数,两边的数字分别表示个位数.
?
(2)用茎叶图处理现有的数据不仅可以看出数据的分布状况,而且可以看出每组中的具体数据.
(3)通过观察茎叶图,可以发现甲批树苗比乙批树苗的高度整齐.题型一题型二反思茎叶图在样本数据较少、数值相对集中,且数据有两位有效数字时比较适用.画茎叶图时,叶只有一位数,一般左侧的叶按照从大到小的顺序写,右侧的叶按照从小到大的顺序写,相同的数据要重复记录,不能遗漏.题型一题型二【变式训练】 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下(单位:分):
甲的得分:12,24,25,31,36,36,37,39,44,49,50;
乙的得分:8,13,14,16,23,26,28,33,38,39,51.
(1)画出甲、乙两名运动员得分数据的茎叶图;
(2)根据茎叶图分析甲、乙两名运动员的水平.题型一题型二解:(1)作出茎叶图如图所示.
?
(2)由上面的茎叶图可以看出,甲运动员的得分情况是大致对称的,中位数是36分;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26分.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.题型一题型二易错辨析
易错点:利用茎叶图表示数据时,因忽视重复数据的表示而致错
【例2】 有甲、乙两种小麦,分别从中抽取10株苗,测得苗高如下(单位:分):
?
?
试用茎叶图表示以上数据.
错解:茎叶图如图所示.题型一题型二错因分析:一般地,茎应按从小到大的顺序从上往下写,仅有个位数的,十位数字写0.重复出现的数字要重复写.
正解:茎叶图如图所示.12341.当收集到的数据量很大或有多组数据时,需要比较各种数量的多少,适宜采用的统计图是(  )
A.茎叶图 B.条形统计图
C.折线统计图 D.扇形统计图
解析:由于需要比较各种数量的多少,并且收集到的数据量很大或有多组数据,符合条形统计图的特点.
答案:B12342如图的茎叶图表示的是某城市一台自动售货机的销售额情况(单位:元),图中的数字7表示的意义是这台自动售货机的销售额为(  )
A.7元 B.37元 C.27元 D.2 337元
答案:C12343.下面哪种统计图没有数据信息的损失,所有的原始数据都可以从该图中得到(  )
A.条形统计图 B.茎叶图
C.扇形统计图 D.折线统计图
答案:B12344.数据8,51,33,39,38,23,26,28,13,16,14的茎叶图是 (  )
?
答案:A课件29张PPT。§4 数据的数字特征1.能结合具体情境理解不同数字特征的意义,并能根据问题的需要选择适当的数字特征来表达数据的信息.
2.通过实例理解数据标准差的意义和作用,学会计算数据的标准差.1.众数
(1)定义:一组数据中出现次数最多的数称为这组数据的众数.
(2)特征:一组数据的众数可能不止一个,也可能没有,它反映了该组数据的集中趋势.
名师点拨若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.2.中位数
(1)定义:一组数据按小大顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.
(2)特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.
名师点拨求中位数时,必须先将这组数据按从小到大(或从大到小)的顺序排列,如果数据的个数为奇数,那么最中间的一个数据是这组数据的中位数;如果数据的个数为偶数,那么最中间两个数据的平均数是这组数据的中位数.【做一做1】 已知某班50名学生右眼视力的检查结果如下表所示:则该班学生右眼视力的众数为    ,中位数为    .?
答案:1.2 0.83.平均数
(1)定义:一组数据的和与这组数据的个数的商叫作这组数据的平均数,数据x1,x2,…,xn的平均数为
(2)特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.名师点拨众数、中位数与平均数的关系
(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会相应引起平均数的变动.
(3)众数大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.
(4)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响.中位数可能在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.
(5)实际问题中求得的平均数、众数和中位数应带上单位.【做一做2】 已知一组数据从小到大排列为-1,0,4,x,6,15,且这组数据的中位数为5,则这组数据的平均数是     .?答案:5 4.标准差
(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算:可以用计算器或计算机计算标准差.
(2)特征:标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.【做一做3】 从某项综合能力测试中抽取100个人的成绩如下表,这100个人成绩的标准差为(  )答案:B 5.方差
(1)定义:标准差的平方,即
?
(2)特征:与标准差的作用相同,描述一组数据围绕平均数波动的大小.
(3)取值范围:[0,+∞).【做一做4-1】 从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为
?
A.甲班10名学生的成绩比乙班10名学生的成绩整齐
B.乙班10名学生的成绩比甲班10名学生的成绩整齐
C.甲、乙两班10名学生的成绩一样整齐
D.不能比较甲、乙两班10名学生成绩的整齐程度
答案:A【做一做4-2】 若样本x1+2,x2+2,…,xn+2的平均数为10,方差为3,则样本2x1+3,2x2+3,…,2xn+3的平均数为     ,方差为     ,标准差为     .?
解析:因为x1+2,x2+2,…,xn+2的平均数为10,方差为3,所以x1,x2,…,xn的平均数为8,方差为3,所以2x1+3,2x2+3,…,2xn+3的平均数为2×8+3=19,方差为22×3=12,标准差为
答案:19 12 题型一题型二题型三平均数、中位数、众数的应用
【例1】 某公司30名职工的月工资(单位:元)如下:(1)求该公司职工的月工资的平均数、中位数、众数.(精确到元)
(2)如果副董事长的工资从10 000元提升到20 000元,董事长的工资从15 000元提升到30 000元,那么该公司职工的月工资的平均数、中位数、众数又是多少?
(3)你认为哪个统计量更能反映这个公司职工的月工资水平?结合此问题谈一谈你的看法.
分析:根据平均数、中位数、众数的概念求解.题型一题型二题型三解:(1)平均数是
?
中位数是2 500元,众数是2 500元.
(2)平均数是
?
中位数是2 500元,众数是2 500元.
(3)在这个问题中,中位数和众数均能反映该公司职工的月工资水平.因为公司中少数人的月工资与大多数人的月工资差别较大,这样导致平均数与职工整体月工资的偏差较大,所以平均数不能反映这个公司职工的月工资水平.题型一题型二题型三反思平均数是将所有的数据都考虑进去得到的量,它是反映数据集中趋势最常用的量.中位数可靠性较差,因为它只利用了部分数据,但当一组数据中个别数据变动较大时,常用中位数表示该组数据的集中趋势.而众数求法较简便,也经常被用到.考察一组数据的特征时,这三个数字特征要结合在一起考虑.
大多情况下人们会把眼光仅停留在工资表中的最大值与最小值处,把最高工资作为一个单位工资的评价标准,这是一种错误的评价方式.题型一题型二题型三【变式训练1】 在一次歌手大赛中,6位评委现场给每位歌手打分,然后去掉一个最高分和一个最低分,其余分数的平均数作为该歌手的成绩.已知6位评委给某位歌手的打分是9.2,9.5,9.4,9.6,9.8,9.5.求这位歌手的得分及6位评委评分的众数和中位数.
解:该歌手的得分为 .
9.5在这组数据中出现两次,出现次数最多,故评分的众数是9.5分.
将这组数据按从小到大的顺序排列后最中间的两个数都是9.5,故中位数是9.5分.题型一题型二题型三极差、标准差、方差的计算
【例2】 随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.
?
(1)根据茎叶图判断哪个班的平均身高较高;
(2)计算甲班身高数据的极差、方差和标准差(标准差保留一位小数).题型一题型二题型三解:(1)由题中茎叶图可知,甲班的身高集中于160~180 cm之间,而乙班的身高集中于170~180 cm之间,因此乙班的平均身高高于甲班.题型一题型二题型三【变式训练2】 有一组数据为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则这组数据的极差为(  )
A.1 B.2
C.3 D.4化简得x+y=20,(x-10)2+(y-10)2=8,
解得x=12,y=8或x=8,y=12,
从而极差为|x-y|=4,故选D.
答案:D题型一题型二题型三易错辨析
易错点:因忽视字母的取值范围而致错
【例3】 某班4个小组的人数分别为10,10,x,8,已知这组数据的中位数与平均数相等,求这组数据的中位数.所以这组数据的中位数为9.
错因分析:当在数据中有未知数x,求其中位数时,因x的取值不同,数据由大到小(或由小到大)的排列顺序不同,中位数也不同,故本题需进行分类讨论.题型一题型二题型三题型一题型二题型三123451.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有(  )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
解析:由题意知a=14.7,b=15,c=17,所以a答案:D12345答案:A 2.如图是一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的中位数为(  )
A.10 B.11
C.12 D.13123453.在一次歌手大奖赛上,七位评委为某歌手打出的分数(单位:分)如下:
9.4 8.4 9.4 9.9 9.6 9.4 9.7
去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为(  )
A.9.4分,0.484分2 B.9.4分,0.016分2
C.9.5分,0.04分2 D.9.5分,0.016分2答案:D 123454.某学员在一次射击测试中射靶10次,命中环数如下:
7,8,7,9,5,4,9,10,7,4,
则(1)平均命中环数为     ;?
(2)命中环数的标准差为     .?答案:(1)7 (2)2 123455.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:问:甲、乙谁的平均成绩较好?谁的各门功课发展较均衡?12345课件33张PPT。§5 用样本估计总体5.1 估计总体的分布1.通过实例进一步体会用样本估计总体的意义和作用,在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图,并体会它们各自的特点.
2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,初步体会样本频率分布的随机性.在频率分布直方图中,每个小矩形的面积表示相应组的频率,所有小矩形的面积的总和等于1.
2.通常,在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图,有时也用它来估计总体的分布情况.名师点拨几种表示频率分布方法的优点与不足【做一做1】 若将容量为100的样本数据,按从小到大的顺序分成8个组,如下表:
?
?
则第6组的频率为(  )
A.0.14 B.14 C.0.15 D.15
解析:由题意可求得第6组的频数为100-9-14-14-13-12-13-10=15,所以第6组的频率
答案:C【做一做2】 在某市2016年“创建文明城市”知识竞赛中,考评组从中抽取200份试卷进行分析,其分数的频率分布直方图如图所示,则分数在区间[60,70)上的大约有     人.?
答案:80题型一题型二题型三题型四画频率分布直方图
【例1】 某中学同年级40名男生的体重数据如下(单位:kg):
61 60 59 59 59 58 58 57 57 57
57 56 56 56 56 56 56 56 55 55
55 55 54 54 54 54 53 53 52 52
52 52 52 51 51 51 50 50 49 48
列出样本的频率分布表,画出频率分布直方图.
分析:画频率分布直方图的一般步骤:算极差,找组距,定分点,列频率分布表,画频率分布直方图.题型一题型二题型三题型四解:(1)计算最大值与最小值的差:61-48=13.
(2)决定组距与组数,取组距为2,
?
所以,共分成7组.
(3)决定分点,使分点比数据多一位小数,并把第1组的分点减小0.5,即分成如下7组:
47.5~49.5,49.5~51.5,51.5~53.5,53.5~55.5,55.5~57.5,57.5~59.5,59.5~61.5.题型一题型二题型三题型四(4)列出频率分布表如下: 题型一题型二题型三题型四(5)画出频率分布直方图(如图所示). 反思1.组数的决定方法是:设数据总数目为n,一般地,当n≤50时,分为5~8组;当502.分点的决定方法是:若数据为整数,则分点数据减去0.5;若数据的小数点后有一位数,则分点减去0.05,以此类推.题型一题型二题型三题型四【变式训练1】 有一个容量为200的样本,数据的分组以及各组的频数如下:
[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;
[10,15),20;[15,20],17.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)求样本数据不足0的频率.题型一题型二题型三题型四解:(1)频率分布表如下: 题型一题型二题型三题型四(2)频率分布直方图如图所示. 题型一题型二题型三题型四频率分布直方图的应用
【例2】 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
?
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少.题型一题型二题型三题型四分析:小矩形面积比已知,而各小矩形面积之和为1,故可求得各小矩形的面积,即频率;由第二小组的频数为12,可求得样本容量.可通过面积之比求得达标率.题型一题型二题型三题型四题型一题型二题型三题型四【变式训练2】 某工厂对一批产品进行了抽样检测,如图是根据抽样检测后的产品净重(单位:g)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),
[100,102),[102,104),[104,106].已知样本中产品净重小于100 g的个数是36,则样本中净重大于或等于98 g并且小于104 g的产品的个数是(  )A.90 B.75 C.60 D.45 题型一题型二题型三题型四解析:产品净重小于100 g的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100 g的个数是36,设样本容量为n,
?
产品净重大于或等于98 g并且小于104 g的频率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98 g并且小于104 g的产品的个数是120×0.75=90.故选A.
答案:A题型一题型二题型三题型四频率折线图
【例3】 已知50个样本数据的分组以及各组的频数如下:
153.5~155.5,2   161.5~163.5,10
155.5~157.5,7 163.5~165.5,6
157.5~159.5,9 165.5~167.5,4
159.5~161.5,11 167.5~169.5,1
(1)列出频率分布表;
(2)画出频率分布直方图和频率折线图.
分析:此题按照频率分布直方图、频率折线图的绘制步骤解决即可.题型一题型二题型三题型四解:(1)频率分布表如下: 题型一题型二题型三题型四(2)频率分布直方图和频率折线图如图所示.题型一题型二题型三题型四【变式训练3】 为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:
[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2.
(1)列出频率分布表;
(2)画出频率分布直方图以及频率折线图;
(3)据上述图表,估计数据落在[10.95,11.35)范围内的可能性是百分之几.题型一题型二题型三题型四解:(1)频率分布表如下: 题型一题型二题型三题型四(2)频率分布直方图及频率折线图如图所示.(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为1-(0.03+0.09)-(0.07+0.04+0.02)=0.75=75%,即数据落在[10.95,11.35)范围内的可能性是75%.题型一题型二题型三题型四易错辨析
易错点:将矩形的高看作频率致错
【例4】 观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在[2 700,3 000)(单位:g)的频率为     .?题型一题型二题型三题型四123451.关于频率分布直方图中小矩形的高的说法,正确的是 (  )
A.表示该组上的个体在样本中出现的频率
B.表示取某数的频率
C.表示该组上的个体数与组距的比值
D.表示该组上的个体在样本中出现的频率与组距的比值
解析:频率分布直方图中小矩形的 .
答案:D123452.已知样本数据:
10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,12,
则频率为0.3的数据范围是(  )
A.5.5~7.5 B.7.5~9.5
C.9.5~11.5 D.11.5~13.5
解析:由题意知,样本容量为20,频率若为0.3,则在此组的频数应为20×0.3=6,由数据可知选B.
答案:B123453.某幼儿园对本园“大班”的100名儿童的体重做了测量,并根据所测量的数据画出了频率分布直方图,如图所示,则体重在[18,20) kg的儿童人数为(  )A.15 B.25 C.30 D.75
解析:这100名儿童中,体重在[18,20) kg的频率是0.075×2=0.15,所以体重在[18,20) kg的儿童人数为100×0.15=15.
答案:A123454.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),
[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为     .?12345解析:由于组距为1,则样本中平均气温低于22.5 ℃的城市的频率为0.10+0.12=0.22.
平均气温低于22.5 ℃的城市个数为11,
?
而平均气温不低于25.5 ℃的城市的频率为0.18,
所以样本中平均气温不低于25.5 ℃的城市个数为50×0.18=9.
答案:9123455.如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:
?
观察图形,回答下列问题:
(1)79.5~89.5这一组的频数、频率分别是多少?
(2)估计这次环保知识竞赛的及格率(60分及以上为及格).
解:(1)该组频率为0.025×10=0.25,频数为60×0.25=15.
(2)所求及格率为
0.015×10+0.03×10+0.025×10+0.005×10=0.75=75%.课件22张PPT。5.2 估计总体的数字特征1.能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.
2.会用样本的基本数字特征估计总体的基本数字特征;初步体会数字特征的随机性.1.样本平均数和样本标准差
假设通过随机抽样得到的样本为x1,x2,…,xn,则2.估计总体的数字特征
利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息.答案:D 题型一题型二题型三利用方差分析数据
【例1】 甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2):根据这组数据判断应该选择哪一种小麦进行推广?
分析:从平均数和方差两个角度去考虑.题型一题型二题型三题型一题型二题型三反思平均数和方差是样本的两个重要的数字特征,方差越大,表明数据越分散,相反地,方差越小,表明数据越集中稳定;平均数越大,表明数据的平均水平越高;平均数越小,表明数据的平均水平越低.题型一题型二题型三【变式训练1】 已知母鸡产蛋的最佳温度在10 ℃左右,下面是在甲、乙两地六个时间测得的温度,你认为甲、乙两地哪个更适合母鸡产蛋?题型一题型二题型三题型一题型二题型三用样本的数字特征估计总体的数字特征
【例2】 甲、乙两台机床同时加工直径为100 mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):
甲:99,100,98,100,100,103;
乙:99,100,102,99,100,100.
(1)分别计算上述两组数据的平均数和方差;
(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.
分析:利用平均数与方差公式分别进行计算,并作出判断.题型一题型二题型三题型一题型二题型三反思平均数描述了数据的平均水平,定量地反映了数据的集中趋势所处的水平.方差描述了一组数据围绕平均数波动的大小.题型一题型二题型三【变式训练2】 为了选拔一名同学参加全市中学生射击竞赛,某校对甲、乙两名同学的射击水平进行了测试,两人在相同条件下各射靶10次,统计结果如下:(2)比较甲、乙两名同学的射击水平,谁的成绩更稳定一些?你认为学校派谁参加竞赛更合适?题型一题型二题型三题型一题型二题型三易错辨析
易错点:忽视实际问题中的单位致错
【例3】 下面是某商品在一段时期内的价格(单位:元):10,9,10,10,11,11,9,11,10,10,则该商品在这段时间内的平均价格为     ,方差为     .?
错解:10.1 0.49
错因分析:漏掉单位致错.
正解:10.1元 0.49元2123451.用分层抽样抽取了容量为10的样本,已知其平均数为5.1,方差为0.2,则总体的平均数与方差分别估计是(  )
A.5.1,0.2 B.0.2,0.2
C.5.1,2 D.都不能估计
答案:A123452.设矩形的长为a,宽为b,其比满足 ,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是(  )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定12345解析:计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近,故选A.
答案:A123453.甲、乙两人在相同的条件下练习射击,每人打5发子弹,命中的环数如下:
甲:6,8,9,9,8; 乙:10,7,7,7,9.
则两人的射击成绩较稳定的是     .?答案:甲 123454.甲电池厂从某日生产的电池中抽取10个进行寿命测试,得到数据如下(单位:h):
30,35,25,25,30,34,26,25,29,21,
则该电池的平均寿命估计为     ,方差估计为     .?答案:28 h 17.4 h2 123455.甲、乙两人学习成绩的茎叶图如图所示.
(1)分别求出这两名同学学习成绩的平均数和标准差(平均数精确到整数,标准差精确到0.1);
(2)比较这两名同学的成绩,谈谈你的看法.
分析:首先由茎叶图读出数据,计算平均数,注意用简便方法,然后求出标准差,最后依据结果比较,可以借助于计算器.12345课件29张PPT。§6 统计活动:结婚年龄的变化  §7 相关性1.经历“确定调查对象——收集数据——整理数据——分析数据——作出推断”的统计活动,体验统计活动的全过程.
2.通过收集现实问题中两个变量的数据作出散点图,利用散点图直观认识变量间的相关关系.
3.经历用不同的估算方法来描述两个变量相关的过程.1.统计活动的步骤
(1)明确调查的目的,确定调查的对象.
(2)利用随机抽样抽取样本,收集数据.
(3)整理数据,用表格来表示数据.
(4)分析数据.其方法有两种:一是用统计图表来分析,二是计算数据的数字特征.
(5)作出推断.通过分析数据作出推断.
【做一做1】 为了调查某市高中学生中喜欢数学的学生所占的比例,收集数据后,整理、分析数据的方式是(  )
A.画频率分布直方图
B.画茎叶图
C.计算平均数和标准差
D.画扇形统计图
答案:D2.散点图
在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.
名师点拨散点图形象地反映了各对数据的密切程度,通过对图中点的趋势的分析可以得到两个变量之间是否存在一定的关系.如果两个变量的取值数有限,那么可以作出所有的点;如果两个变量的取值数有无数多个,那么可以取一部分值作出一部分点组成的散点图.当然作出的点越多,越能反映变量之间的关系.由此也可以看出,两个变量之间的散点图可能因作图时取值情况的不同而略有不同,但变量关系的趋势是一样的.3.变量之间的相关关系
从散点图上看,如果两个变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的.若所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关的.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.【做一做2-1】 下列两个变量之间的关系是相关关系的是(  )
A.正方体的棱长与体积
B.单位圆中圆心角的度数与所对的弧长
C.单位面积的产量为常数时,土地面积与总产量
D.日照时间与水稻的亩产量
解析:选项A,B,C为函数关系,日照时间与水稻的亩产量有一定的关系,日照时间长,水稻的亩产量就高,但这种情况也不是绝对的,二者是相关关系.
答案:D【做一做2-2】 下列说法正确的是(  )
A.相关关系是函数关系
B.函数关系是相关关系
C.线性相关关系是一次函数关系
D.相关关系有两种,分别是线性相关关系和非线性相关关系
解析:函数关系和相关关系互不包含,所以A,B,C三个选项不正确;根据定义,相关关系有两种,分别是线性相关关系和非线性相关关系,故选D.
答案:D题型一题型二题型三题型四统计活动案例
【例1】 某风景区对5个旅游景点的门票价格进行了调整,据统计,调价前后各景点的游客人数基本不变,有关数据如下表所示:(1)该风景区称调整前后这5个景点门票的平均收费不变,问风景区是怎样计算的?
(2)另一方面,游客认为调整收费后风景区的日平均总收入相对于调价前,实际上增加了约9.4%,问游客是怎样计算的?
(3)你认为风景区和游客哪一个的说法较能反映整体实际?题型一题型二题型三题型四题型一题型二题型三题型四反思1.统计活动中的数据分析,可以分析数据中的平均值、方差、标准差、中位数、众数等数字特征,从而全面把握总体情况.
2.统计活动中的数据分析,可以采取图表来分析,如条形统计图、扇形统计图、折线统计图、频率分布直方图等.这样得到的结果更直观,更能体现出各部分所占的份额.题型一题型二题型三题型四【变式训练1】 如图,公园里有两条石级路,哪条石级路走起来更舒适?(图中数字表示每一级的高度,单位:cm)题型一题型二题型三题型四解:由于15+14+14+16+16+15=90(cm),
19+10+17+18+15+11=90(cm).
所以两条石级路总高度一样,都是90 cm;由于都是6个台阶,所以台阶的平均高度也一样,都是15 cm;上台阶是否舒适,就看台阶的高低起伏情况如何,因此,需要计算两条石级路台阶高度的极差、方差和标准差.题型一题型二题型三题型四由以上可知:题图①中石级路台阶的高度的极差、方差和标准差都比题图②中的小,所以题图①中石级路起伏小,走起来更舒适.题型一题型二题型三题型四相关关系的判断
【例2】 有下列关系:
①炼钢时钢水的含碳量与冶炼时间的关系;
②曲线上的点与该点的坐标之间的关系;
③柑橘的产量与气温之间的关系;
④森林中的同一种树木,其横断面直径与高度之间的关系.
其中具有相关关系的是      .(只填序号)?题型一题型二题型三题型四解析:①炼钢的过程就是一个降低含碳量进行氧化还原的过程,除了与冶炼时间有关外,还受冶炼温度等其他因素的影响,所以两个变量间具有相关关系.
②曲线上的点与该点的坐标之间的关系是一一对应的,即是一种确定性关系,所以两个变量间不具有相关关系.
③柑橘的产量除了受气温影响以外,还受施肥量以及水分等因素的影响,所以两个变量间具有相关关系.
④森林中的同一种树木,其横断面直径随高度的增加而增加,但是还受光照等因素的影响,所以两个变量间具有相关关系.
答案:①③④题型一题型二题型三题型四反思相关关系与函数关系的区别在于是否具有确定性.在区分二者时,如果一个变量每取一个值,另一个变量总有唯一确定的值与之对应,那么这两个变量就是函数关系,不是相关关系;如果一个变量每取一个值,另一个变量的取值带有一定的随机性,并且从总体上来看有关系,但不是确定性关系,那么这两个变量之间就是相关关系,不是函数关系.确定相关关系时有时要依靠生活经验大致确定.题型一题型二题型三题型四【变式训练2】 下列变量之间的关系是相关关系的是     .(只填序号)?
①球的体积与半径的关系;
②动物大脑容量的百分比与智力水平的关系;
③降水量与农作物产量之间的关系.
答案:③题型一题型二题型三题型四散点图的画法及应用
【例3】 下面是随机抽取的9名15岁男生的身高、体重表:判断所给的两个变量是否存在相关关系.
分析:方法一:根据经验判断是否具有相关关系
方法二:画出散点图→观察各点的分布→判断是否具 有相关关系题型一题型二题型三题型四解:方法一:根据经验可知,人的身高和体重之间存在相关关系.
方法二:以横轴表示身高,以纵轴表示体重,得到相应的散点图如图所示.
?
我们会发现,在一定年龄范围内随着身高的增长,体重基本上呈增加的趋势.所以体重与身高之间存在相关关系.题型一题型二题型三题型四反思两个随机变量x和y相关关系的确定方法:
(1)散点图法:通过画散点图,观察它们的分布是否存在一定的规律,直观地判断;
(2)表格、关系式法:结合表格或关系式进行判断;
(3)经验法:借助积累的经验进行分析判断.题型一题型二题型三题型四【变式训练3】 两对变量A和B,C和D的取值分别对应表1和表2,画出散点图,判断它们是否有相关关系,若具有相关关系,说出它们相关关系的区别.题型一题型二题型三题型四解:散点图分别如图①和图②. 从图中可以看出两图中的点都分布在一条直线附近,因此两图中的变量都分别具有相关关系.
图①中A的值由小变大时,B的值却是由大变小.
图②中C的值由小变大时,D的值也是由小变大.题型一题型二题型三题型四易错辨析
易错点:混淆相关关系与函数关系致错
【例4】 从下面的四个散点图中点的分布状态,可以初步判断两个变量之间具有线性相关关系的是(  )错解:B,C 两个变量之间具有线性相关关系的是B,C.题型一题型二题型三题型四错因分析:根据各选项中点的分布规律并结合相关的概念加以分析判断.在选项A中点的分布毫无规则,横轴、纵轴表示的两个量之间可能不相关(或相关程度很小).在选项B中所有的点严格地分布在一条直线上,横轴、纵轴表示的两个量之间有确定的关系——函数关系.在选项C中,点的分布基本上集中在一个带状区域内,横轴、纵轴表示的两个量具有相关关系——当一个变量变化时,另一个变量的值虽然不能完全确定,但大体上总是落在带状区域内,这时我们可以探求一条合适的直线来近似表示两个变量之间的关系(如选项C中的直线),即两个变量之间的关系可以近似地表示成线性关系,也就是这两个变量线性相关.选项D与选项C类似,点的分布基本上也集中在由某条曲线两侧组成的带状区域内,因此横轴、纵轴表示的两个量也具有相关性,只是非线性相关.
正解:C 从直观上判断两个变量之间具有线性相关关系的是C.123451.统计活动中,分析数据时(  )
A.用统计图表
B.计算数据的数字特征
C.随便看看就行
D.用统计图表或计算数据的数字特征
答案:D123452.下列两个变量间的关系,是相关关系的是(  )
A.任意实数和它的平方
B.圆的半径和圆的面积
C.正多边形的边数和内角度数之和
D.天空中的云量和下雨
解析:很明显A,B,C三项都是函数关系;根据生活经验,天空中的云量和下雨之间不是确定性关系,虽然有云彩不一定下雨,但是如果没有云彩一定不下雨,这说明它们之间是相关关系,故选D.
答案:D123453.下图中的两个变量具有相关关系的是(  )
?
          
      
A.①② B.①③ C.②④ D.②③
答案:D123454.下列关系中,属于相关关系的是     .(只填序号)?
①正方形的边长与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
解析:在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.
答案:②④123455.某医院用光电比色计检验尿汞时,得尿汞含量x(单位:mg/L)与消光系数y的部分数据如下表:用散点图判断尿汞含量x与消光系数y是否相关.
解:画出散点图如图所示.
?
观察散点图,可以发现5个样本点都落在一条直线附近,所以变量x,y具有线性相关关系.课件30张PPT。§8 最小二乘估计1.了解最小二乘法的思想.
2.能根据给出的线性回归方程系数公式建立线性回归方程.1.最小二乘法
如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:
[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2.使得上式达到 最小值的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.其中a,b的值由以下公式给出:a,b是线性回归方程的系数. 【做一做1】 在最小二乘法中,用来刻画各样本点到直线y=a+bx“距离”的量是(  )
C.|yi-(a+bxi)| D.[yi-(a+bxi)]2
解析:最小二乘法的定义明确给出,用[yi-(a+bxi)]2来刻画各个样本点与这条直线之间的“距离”(即二者之间的接近程度),用它们的和表示这些点与这条直线的接近程度.
答案:D2.线性回归方程
(1)线性回归方程的概念注意:①线性回归直线是与n个样本点距离最近的直线;
②线性回归方程的系数是用最小二乘法思想求出来的,虽然求的过程中主要用二次函数最值的求法,但运算较繁,教材上不作要求;
③a,b的值被n个样本点唯一确定,n个样本点坐标给定后,应用公式即可计算出a,b,得到线性回归方程;
④在写线性回归方程时,切勿写成y=ax+b,应写成y=a+bx.(2)求线性回归方程的步骤 ②分别计算b,a;
③代入y=a+bx即得线性回归方程.【做一做2-1】 由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到线性回归方程y=bx+a,下面说法不正确的是 (  )答案:B 【做一做2-2】 已知某工厂在某年里每月生产产品的总成本y(单位:万元)与该月产量x(单位:万件)之间的线性回归方程为y=0.974+1.215x,计算当x=2时,总成本y的估计值为     .?
解析:由线性回归直线方程y=0.974+1.215x,得当x=2时,总成本y的估计值为y=0.974+1.215×2=3.404.
答案:3.404题型一题型二题型三题型四线性回归方程的意义
【例1】 已知一个线性回归方程y=2+1.2x,则变量x增加一个单位长度时(  )
A.y平均增加1.2个单位长度
B.y平均减少1.2个单位长度
C.y平均增加2个单位长度
D.y平均减少2个单位长度
解析:在线性回归方程y=bx+a中,b是线性回归方程的斜率,a是截距.b代表x每增加一个单位长度,y平均增加的单位长度数.当b>0时,若x每增加一个单位长度,y就增加b个单位长度;当b<0时,若x每增加一个单位长度,y就减少|b|个单位长度.
答案: A题型一题型二题型三题型四【变式训练1】 为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归法,求得线性回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,则下列说法正确的是(  )
A.l1和l2有交点(s,t)
B.l1与l2有交点,但交点不一定是(s,t)
C.l1与l2必定平行
D.l1与l2必定重合题型一题型二题型三题型四答案:A 题型一题型二题型三题型四求线性回归方程 A.y=11.47+2.62x B.y=-11.47+2.62x
C.y=2.62+11.47x D.y=11.47-2.62x题型一题型二题型三题型四答案:A 反思与以往的直线方程y=ax+b不同,在线性回归方程中,参数a,b的位置正好相反.题型一题型二题型三题型四【变式训练2】 已知x,y之间的一组数据如下表:答案:③ 题型一题型二题型三题型四线性回归方程及其简单应用
【例3】 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:t)与相应的生产能耗y(单位:吨标准煤)的几组对照数据:(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(3)已知该厂技术改造前100 t甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100 t甲产品的生产能耗比技术改造前降低多少吨标准煤.题型一题型二题型三题型四分析:(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标在平面直角坐标系内画散点图;(2)应用计算公式求得线性相关系数b,a的值;(3)实际上就是求出当x=100时,对应的y的值.
解:(1)散点图如图所示.题型一题型二题型三题型四(3)根据回归方程可预测,现在生产100 t甲产品的生产能耗为
0.7×100+0.35=70.35(吨标准煤),
故预测生产100 t甲产品的生产能耗比技术改造前减少了
90-70.35=19.65(吨标准煤).题型一题型二题型三题型四【变式训练3】 某种产品的广告费支出额x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:(1)画出散点图,判断变量x与y是否具有线性相关关系;
(2)如果x与y具有线性相关关系,求线性回归方程;
(3)预测当广告费用为7百万元时的销售额.题型一题型二题型三题型四解:(1)散点图如图所示.
?
由图可以看出,各点都在一条直线附近,所以广告费支出额x与销售额y之间具有线性相关关系.题型一题型二题型三题型四 (2)设线性回归方程为y=a+bx.
列出下表,并用科学计算器进行有关计算.所以所求的线性回归方程是y=17.5+6.5x.
(3)当x=7时,y=6.5×7+17.5=63,
所以当广告费为7百万元时,销售额约为63百万元.题型一题型二题型三题型四易错辨析
易错点:不判断相关性就求线性回归方程而致错
【例4】 假设关于某设备的使用年限和所支出的维修费用如下表中统计资料所示:求y对x的线性回归方程,并检验能否用线性回归模型描述两个变量间的关系.
错解:求出相关的数据直接代入公式求b,a,得出线性回归方程为y=0.16x+2.94.
错因分析:没有先判断两个变量是否具有相关关系.题型一题型二题型三题型四正解:画出散点图,如图所示,从散点图上看,这些点的分布几乎没有什么规则,虽然也可求出线性回归方程,但这时不能用线性回归模型描述两个变量之间的关系.123451.若有一个回归方程为y=2-1.5x,则变量x每增加1个单位长度时,变量y(  )              
A.平均增加1.5个单位长度
B.平均增加2个单位长度
C.平均减少1.5个单位长度
D.平均减少2个单位长度
答案:C123452.已知下表是x与y之间的一组数据,则y关于x的回归直线必经过点(  )?123453.已知x,y的取值如下表所示: 答案:B 12345?123455.某个服装店经营某种服装,在某周内获纯利润y(单位:元)与该周每天销售这种服装件数x之间的一组数据关系见下表:(2)画出散点图;
(3)求纯利润y与每天销售件数x之间的线性回归方程.1234512345课件28张PPT。本章整合统计统计 专题一专题二专题三专题四专题一 三种抽样方法的比较
简单随机抽样、系统抽样、分层抽样的比较如下表:专题一专题二专题三专题四研究统计问题的基本思想方法就是从总体中抽取样本,用样本估计总体,因此选择适当的抽样方法抽取具有代表性的样本,对整个统计问题起着至关重要的作用.高考中主要考查三种抽样方法的比较和辨析以及应用.专题一专题二专题三专题四应用 某学校为调查高三年级的240名学生完成课后作业所需时间,采取了两种抽样调查的方式:
第一种由学生会的同学随机抽取24名同学进行调查;
第二种由教务处对高三年级的学生进行编号,从001到240,抽取学号最后一位为3的同学进行调查.
上述两种抽样方法依次为(  )
A.分层抽样,简单随机抽样
B.简单随机抽样,分层抽样
C.分层抽样,系统抽样
D.简单随机抽样,系统抽样专题一专题二专题三专题四提示:选择抽样方法的标准是:先判断总体中个体有无差异.当总体中个体有差异时,无论总体中个体数目的多少,都应选择分层抽样;当总体中的个体无差异时,再判断总体中的个体数目的多少,如果个体数目较少,那么用简单随机抽样,如果个体数目较多,那么用系统抽样.
解析:结合三种抽样方法的定义可知第一种抽样方法是简单随机抽样,第二种抽样方法是系统抽样.
答案:D专题二 对频率分布直方图的理解问题 专题一专题二专题三专题四专题一专题二专题三专题四应用 统计某校1 000名学生的数学会考成绩,得到样本频率分布直方图如图所示,规定不低于60分为及格,不低于80分为优秀,则及格人数是     .?提示:及格人数=不低于60分的频率×该校总人数.专题一专题二专题三专题四解析:不低于60分的小矩形的面积和为
1-(10×0.005+10×0.015)=0.8,
即不低于60分的频率为0.8,所以及格人数是1 000×0.8=800.
答案:800专题一专题二专题三专题四专题三 估计总体的数字特征
通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),呈现样本数据的集中趋势及波动大小,从而实现对总体的估计.
(1)一般情况下,需要将平均数和标准差结合,得到更多样本数据的信息,从而对总体作出较好的估计.因为平均数容易掩盖一些极端情况,使我们对总体作出片面的判断,而标准差较好地避免了极端情况.
(2)若两组数据的平均数差别很大,也可以仅比较平均数,估计总体的平均水平,从而作出判断.
需要注意的是:通过样本数据的统计图表和数字特征,我们能够估计总体的信息,而且样本容量越大,这种估计也就越精确.当样本数据发生变化时,总体的这些信息不会变化.专题一专题二专题三专题四应用 某盐场有甲、乙两套设备包装食盐,在自动包装传送带上,每隔3 min抽一包称其质量(单位:g)是否合格,分别记录数据如下:
甲套设备:504,510,505,490,485,485,515,510,496,500;
乙套设备:496,502,501,499,505,498,499,498,497,505.
(1)试确定这是何种抽样方法?
(2)比较甲、乙两套设备包装的食盐质量的平均值与方差,说明哪套包装设备误差较少.
提示:根据三种抽样方法的概念与特征判断是何种抽样,根据选出的样本数据的特征来估计总体的数字特征.
解:(1)根据系统抽样的定义,可知这种抽样方法是系统抽样.专题一专题二专题三专题四专题一专题二专题三专题四专题四 两个变量的相关性
1.分析两个变量的相关关系时,我们可根据样本数据的散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出线性回归方程.把样本数据表示的点在平面直角坐标系中作出,由此构成的图叫散点图.从散点图上,我们可以分析出两个变量是否存在相关关系:如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫作回归直线,直线方程叫作线性回归方程.专题一专题二专题三专题四2.求线性回归方程的方法及步骤.
(1)“表格”法的步骤:③写出线性回归方程y=a+bx.
(2)利用工作表软件求法的步骤:
调状态→输入数据→按键得结果→写出所得方程.专题一专题二专题三专题四应用 以下资料是一位销售经理收集来的每年销售额和销售经验年数的关系:(1)作出散点图;
(2)试判断两组数据之间存在什么关系.
提示:建立平面直角坐标系,准确作出散点图.由散点图可判断两个变量之间的关系.专题一专题二专题三专题四解:(1)散点图如图所示.
?
(2)由散点图可知两组数据存在线性相关关系.1234561.(2016全国丙高考)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是(  )
?
A.各月的平均最低气温都在0 ℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20 ℃的月份有5个
解析:由题图可知,0 ℃在虚线圈内,所以各月的平均最低气温都在0 ℃以上,A正确;易知B,C正确;平均最高气温高于20 ℃的月份有3个,分别为六月、七月、八月,D错误.故选D.
答案:D1234562.(2016山东高考)某高校调查了200名学生每周的自习时间(单位:时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5时的人数是(  )
?
        
        
A.56 B.60
C.120 D.140
解析:自习时间不少于22.5小时为后三组,其频率和为(0.16+0.08+0.04)×2.5=0.7,故人数为200×0.7=140,选D.
答案:D1234563.(2015课标全国Ⅱ高考)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是(  )
?
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
解析:由柱形图知,2006年以来我国二氧化硫年排放量呈减少趋势,故其排放量与年份负相关.
答案:D1234564.(2016全国丙高考)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2008-2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:123456123456解:(1)由折线图中数据和附注中参考数据得 因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.123456所以,y关于t的回归方程为y=0.92+0.10t.
将2016年对应的t=9代入回归方程得y=0.92+0.10×9=1.82.
所以预测2016年我国生活垃圾无害化处理量为1.82亿吨.1234565.(2016四川高考)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),
…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
?
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)估计居民月均用水量的中位数.123456解:(1)由频率分布直方图,可知月均用水量在[0,0.5)的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.
(2)由(1),100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.123456(3)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,
所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.1234566.(2016北京高考)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
?
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.123456解:(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.
所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.
依题意,w至少定为3.
(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:根据题意,该市居民该月的人均水费估计为
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).