课件27张PPT。第二章 统计本章概览
一、地位作用
本章在高中数学中具有较强的独立性,与其他章节知识联系不大.统计是研究如何合理地收集、整理、分析数据的学科,可以为人们制定决策提供依据.本章通过对数据的收集、整理和分析,提高学生的社会实践能力,培养学生解决问题的能力,增强学生学习数学的兴趣.
二、内容要求
1.理解随机抽样的必要性,会用简单随机抽样、分层抽样等方法从总体中抽取样本.
2.理解分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图,体会它们各自的特点.3.理解样本数字特征(平均数、方差、标准差、频率分布)的意义和作用,学会用样本的数字特征估计总体的数字特征.
4.能够通过收集现实问题中两个有关联变量的数据作出散点图,并能利用散点图直观认识变量间的相关关系,了解最小二乘法的思想,并能根据给出的线性回归方程系数公式建立线性回归方程.
5.本章重点是抽样方法和用样本估计总体,难点是对方差意义的理解及统计知识在实际问题中的应用.
三、核心素养
统计观念是当代公民应当具有的基本素养,通过解决具体有实际背景的问题,让学生较为系统地经历数据收集与处理全过程,领会统计思想,体会统计思维与确定性思维的差异,培养用数学眼光观察世界,学会用数学思维分析世界.学会用数学语言表达世界,发展数学建模和数据分析素养.认识数学的科学价值,应用价值,促进学生全面可持续性发展.2.1 随机抽样
2.1.1 简单随机抽样目标导航新知探求课堂探究新知探求·素养养成【情境导学】导入 假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本.那么,应当怎样获取样本呢?解:要对这批小包装饼干进行卫生达标检查,只能从中抽取一定数量的饼干作为检验的样本,用样本的卫生情况来估计这批饼干的卫生情况.如果对这批饼干全部检验,那么费时费力,等检查完了,这批饼干可能就超过保质期了,再就是会破坏这批饼干的质量,导致无法出售.
获取样本的方法是:将这批小包装饼干放入一个不透明的袋子中,搅拌均匀,然后不放回地摸取(这样可以保证每一袋饼干被抽到的可能性相等),这样就可以得到一个样本.通过检验样本来估计这批饼干的卫生情况.知识探究1.简单随机抽样逐个不放回相等抽签法随机数法2.抽签法编号号签均匀一个n3.随机数法编号任选一个 方向跳过取出探究1:随机数表法如何体现其公平性?
提示:随机数表法的公平性体现在:(1)随机数表中每个位置出现任何一个数字都是随机的、等可能的;(2)从总体中抽取任何一个个体的号码也是随机的、等可能的.基于以上两点,利用随机数表法抽取样本保证了各个个体被抽到的可能性相同,也就是说是公平的.
探究2:利用随机数表抽样时,开始位置和读数方向可以任意选择吗?
提示:可以,但是通常要在抽样前确定好.读数方向一般按从左往右,从上到下的顺序,以免造成混乱.【拓展延伸】
简单随机抽样的特征
(1)总体中个体无明显差异且个体数不多;(2)逐个不放回抽取;(3)是一种不放回抽样;(4)是一种等可能抽取,即在每次抽取或整个抽样过程中,各个个体被抽到的机会相同;(5)操作时简便易行.自我检测1.关于简单随机抽样的特点,有以下几种说法,其中不正确的是( )
(A)要求总体中的个体数有限
(B)从总体中逐个抽取
(C)这是一种不放回抽样
(D)每个个体被抽到的机会不一样,与先后顺序有关D2.用抽签法进行抽样有以下几个步骤:①制签;②抽签;③将签摇匀;④编号;⑤将抽取的号码对应的个体取出,组成样本.这些步骤的正确顺序为( )
(A)④①③②⑤ (B)①②③④⑤
(C)③②④①⑤ (D)④③①②⑤A3.已知总体容量为108,若用随机数法抽取一个容量为10的样本,下面对总体的编号正确的是( )
(A)1,2,…,108
(B)01,02,…,108
(C)00,01,…,107
(D)001,002,…,108D4.从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N为 .?答案:120题型一 简单随机抽样的判断【例1】 下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取20个个体作为样本;
(2)从50台冰箱中一次性抽取5台冰箱进行质量检查;
(3)某班有40名同学,指定个子最高的5名同学参加学校组织的篮球赛;
(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.课堂探究·素养提升解:(1)不是简单随机抽样.因为总体的个数是无限的,而不是有限的.
(2)不是简单随机抽样.简单随机抽样的定义要求的是“逐个抽取”.
(3)不是简单随机抽样.因为是指定5名同学参加比赛,每个个体被抽到的可能性是不同的,不是等可能抽样.
(4)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能地进行抽样.方法技巧 要判断所给的抽样方法是否是简单随机抽样,关键是看它是否符合简单随机抽样的定义,即简单随机抽样的特点:(1)总体的个体数有限;(2)逐个抽取;(3)是不放回地抽取;(4)保证每个个体被抽到的可能性是相同的.即时训练1-1:下列问题中,最适合用简单随机抽样法抽样的是( )
(A)从某厂生产的2 000只灯泡中随机地抽取20只进行寿命测试
(B)从10台冰箱中抽取3台进行质量检验
(C)某学校有在编人员160人,其中行政人员16人,专职教师112人,后勤人员32人.教育部门为了了解学校机构改革的意见,要从中抽取一个容量为20的样本
(D)某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩,现抽取农田480亩估计全乡农田平均产量解析:A中总体容量较大,B中总体容量较小,C,D中总体容量差别较大,故B适合.故选B.题型二 抽签法的应用【例2】 某单位积极支援西部开发,现从报名的20名志愿者中随机选取5名组成志愿小组到新疆工作,请用抽签法设计抽样方案.规范解答:①将20名志愿者编号,号码是01,02,…,20;
②将号码分别写在一张纸条上,揉成团,制成号签;
③将得到的号签放入一个不透明的袋子中,并搅拌均匀;
④从袋子中依次抽取5个号签,并记录上面的编号;
⑤所得号码对应的5名志愿者就是志愿小组的成员.方法技巧 抽签法的优点:简单易行.当总体的个体数不多时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性.
缺点:仅适用于个体数较少的总体.当总体容量非常大时,费时费力又不方便.况且,如果号签搅拌的不均匀,可能导致抽样不公平.即时训练2-1:下列抽样试验中,用抽签法方便的是( )
(A)从某厂生产的3 000件产品中随机抽取600件产品进行质量检验
(B)从某厂生产的两箱(每箱15件)产品中随机抽取6件产品进行质量检验
(C)从某厂生产的3 000件产品中随机抽取10件产品进行质量检验
(D)从某厂生产的100箱(每箱15件)产品中随机抽取6件产品进行质量检验解析:A,C,D中总体容量都较大,不适合用抽签法.故选B.题型三 随机数法的应用【例3】要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子进行试验,利用随机数表法抽取种子,先将850颗种子按001,002,…,850进行编号,如果从随机数表第3行第6列的数开始向右读,请依次写出最先检验的4颗种子的编号 .?
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62
33 26 16 80 45 60 11 14 10 95 97 74 24 67 62
42 81 14 57 20 42 53 32 37 32 27 07 36 07 51
24 51 79 89 73 16 76 62 27 66 56 50 26 71 07
32 90 79 78 53 13 55 38 58 59 88 97 54 14 10解析:从随机数表第3行第6列的数4开始向右读第一个小于850的数字是457,第二个数字是204,第三个数字是253,第四个数字是323,符合题意.
答案:457,204,253,323误区警示 在随机数表法抽样的过程中要注意:(1)编号要求位数相同,读数时应结合编号特点进行读取,如:编号为两位,则两位两位地读取;编号为三位,则三位三位地读取.(2)第一个数字的抽取是随机的.(3)读数的方向是任意的,且事先定好的.即时训练3-1:一个总体的60个个体编号为00,01,…,59,现需从中抽取一容量为8的样本,请从随机数表的第2行第11列开始,向右读取,直到取足样本,则抽取样本的号码是 .?
95 33 95 22 00 18 74 72 00 18 38 79 58 69 32
81 76 80 26 92 82 80 84 25 39 90 84 60 79 80
24 36 59 87 38 82 07 53 89 35 96 35 23 79 18
05 98 90 07 35 46 40 62 98 80 54 97 20 56 95
15 74 80 08 32 16 46 70 50 80 67 72 16 42 79解析:所取的号码要在00~59之间且重复出现的号码仅取一次.依次为: 25,39,24,36,59,38,07,53.
答案:25,39,24,36,59,38,07,53即时训练3-2:为了了解某班学生的身高情况,决定从50名同学中选取10名进行检测(已编号为00~49),利用随机数法进行抽取,得到如下3组编号,你认为正确的是 .(填序号)?
①26,94,29,27,43,99,55,19,81,06;
②20,26,31,40,24,36,19,34,03,48;
③04,00,45,32,44,22,04,11,08,49.解析:获取的样本号码应跳过不在样本编号内的号码,并应去掉重复号码.
答案:②谢谢观赏!课件21张PPT。2.1.3 分层抽样目标导航新知探求课堂探究新知探求·素养养成【情境导学】【实例】 某市为调查中小学生的近视情况,在全市范围内分别对小学生、初中生、高中生三个群体抽样,进而了解中小学生近视的总体情况和三个群体近视情况的差异大小.想一想 实例中样本总体有什么特点?
(此总体中,小学生、初中生、高中生三个群体在年龄、体质等方面存在着明显的差异)知识探究1.分层抽样的概念
一般地,在抽样时,将总体分成 的层,然后按照一定的 ,从 独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
2.分层抽样的步骤
①根据已经掌握的信息,将总体分成互不相交的层;互不交叉比例各层②根据总体中的个数N和样本容量n计算抽样比k= ;
③确定第i层应该抽取的个体数为ni=Ni·k(Ni为第i层所包含的个体数),使得各ni之和为n;④按步骤③中确定的个体数在各层中随机地抽取个体,合在一起便得到容量为n的样本.
3.分层抽样的特点
(1)不放回抽样;
(2)每个个体被抽到的可能性相等.
(3)总体由差异明显的几部分组成、分层按比例抽取.【拓展延伸】自我检测1.某地区为了了解居民家庭生活状况,先把居民按所在行业分为几类,然后每个行业抽 的居民家庭进行抽查,这样抽样是( )
(A)抽签法 (B)随机数法
(C)分层抽样 (D)分类抽样C2.(2017·辽宁辽源期末)已知某单位有职工120人,其中男职工90人,现采用分层抽样(按男、女分层)抽取一个样本,若样本中有27名男职工,则样本容量为( )
(A)30 (B)36
(C)40 (D)无法确定B3.有一批产品,其中一等品10件,二等品25件,次品5件.用分层抽样从这批产品中抽出8件进行质量分析,则抽取的一等品有 件.?答案:2题型一 分层抽样的应用【例1】 某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解学校机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,并写出抽样过程.课堂探究·素养提升名师导引:因题中涉及三个差异明显的机构,故应采用分层抽样,其操作步骤是分层→计算抽样比→确定各层样本容量→每层抽样→层中样本汇总.方法技巧 (1)当已知总体是由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常采用分层抽样的方法;
(2)分层抽样是将总体分成几层,然后分层进行抽取样本,各层抽取时可采用简单随机抽样;即时训练1-1:(1)(2017·湖北武汉期末)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( )
(A)6 (B)8
(C)10 (D)12(2)(2017·辽宁六校协作体联考)某防疫站对学生进行身体健康调查,欲采用分层抽样的办法抽取样本.某中学共有学生2 000名,抽取了一个容量为200的样本,样本中男生103人,则该中学共有女生( )
(A)1 030 (B)97
(C)950 (D)970即时训练1-2:已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
(A)200,20 (B)100,20
(C)200,10 (D)100,10题型二 抽样方法的选择【例2】 某中学举行了为期3天的新世纪体育运动会,同时进行全校精神文明擂台赛.为了了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3 000名初中生、4 000名高中生中做问卷调查,如果要在所有答卷中抽出120份用于评估.
(1)应如何抽取才能得到比较客观的评价结论?(2)要从3 000份初中生的答卷中抽取一个容量为48的样本,如果采用简单随机抽样,宜采用哪种方式?规范解答:(2)由于简单随机抽样有两种方法:抽签法和随机数法.如果用抽签法,要作3 000个号签,费时费力,因此采用随机数法抽取样本.方法技巧 选择抽样方法的规律
(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法.
(2)当总体容量较大,样本容量较小时,可采用随机数法.
(3)当总体是由差异明显的几部分组成时,可采用分层抽样.即时训练2-1:现要完成下列两项抽样调查:
①从10盒黑色水笔芯中抽取2盒进行质量检查.
②抚州市某中学共有160名教职工,其中教师120名,行政人员16名,后勤人员24员.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
请问较为合理的抽样方法是( )
(A)①和②都是简单随机抽样
(B)①和②都是分层抽样
(C)①简单随机抽样,②分层抽样
(D)①分层抽样,②简单随机抽样解析:①从10盒黑色水笔芯中抽取2盒进行质量检查,应选简单随机抽样.
②总体中的个体有明显的差异,所以选用分层抽样.故选C.谢谢观赏!课件29张PPT。2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布目标导航新知探求课堂探究新知探求·素养养成【情境导学】导入 体育彩票市场曾创造了无数的神话,相当一部分中奖者在谈及自己的中奖经历时都表示他们能够中奖,是经过长期研究体育彩票的走势及中奖号码分布特点后(即作出频率分布表),精心选号的结果.所以说彩民之所以能中大奖是因为他们“推测”的方法是科学的,“推测”的结果是比较可靠的.那么他们是如何“推测”的呢?解:他们是把中奖号码绘制成图、表等进行观察、分析中奖号码的分布、走势,以此去推测、去估计下次的中奖号码.想一想 1:导入中“推测”彩票是估计哪些方面?
(其主要是利用中奖号码的分布情况去估计下期中奖号码的分布)
想一想 2:导入中,他们是如何处理中奖数据的?
(绘成图、表进行分析)知识探究1.用样本估计总体
一般分为用样本的 估计总体的分布和用样本的 (如平均数、标准差等)估计总体的数字特征.
2.数据分析的基本方法
(1)借助于图形
分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中 ,二是利用图形 .
(2)借助于表格
分析数据的另一方法是用紧凑的表格改变数据的排列方式,此法是通过改变数据的 ,为我们提供解释数据的新方式.频率分布数字特征提取信息传递信息构成形式3.作频率分布直方图的步骤
(1)求极差:即一组数据中 和 的差;
(2)决定组距与组数:将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.这时应注意:①一般样本容量越大,所分组数 ;②为方便起见,组距的选择应力求“取整”;③当样本容量不超过100时,按照数据的多少,通常分成5~12组.
(3)将数据分组:按组距将数据 ,分组时,各组均为左闭右开区间,最后一组是闭区间.最大值最小值越多分组列频率分布表探究:将数据的样本进行分组的目的是什么?
提示:从样本中的一个个数字中很难直接看出样本所包含的信息,通过分组,并计算其频率,目的是通过描述样本数据分布的特征估计总体的分布情况.4.频率分布折线图和总体密度曲线
(1)频率分布折线图
连接频率分布直方图中各小长方形 ,就得到频率分布折线图.
(2)随着样本容量的增加,作图时所分的 增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线,它反映了总体在各个范围内取值的百分比.
5.茎叶图
(1)茎叶图的适用范围
在样本数据较 时,用茎叶图表示数据的效果较好.
(2)茎叶图的优点
它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.
(3)茎叶图的缺点
当样本数据较 时,枝叶就会很长,茎叶图就显得不太方便.上端的中点组数少多【拓展延伸】四种图表的区别与联系自我检测1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )
(A)总体容量越大,估计越精确
(B)总体容量越小,估计越精确
(C)样本容量越大,估计越精确
(D)样本容量越小,估计越精确C2.频率分布直方图中,小长方形的面积等于( )
(A)组距 (B)频率 (C)组数 (D)频数B3.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8,其累计频率为0.4,则这个样本的容量是( )
(A)20 (B)40
(C)70 (D)80A4.如图是某公司10个销售点某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为 .?答案:0.45.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)的汽车大约有 辆.?答案:60 题型一 频率分布直方图的绘制【例1】有一个容量为100的某校毕业生起始月薪的样本,数据的分组及各组的频数如下:课堂探究·素养提升(1)列出样本的频率分布表;解:(1)样本的频率分布表为(2)画出频率分布直方图和频率分布折线图;
(3)根据频率分布估计该校毕业生起始月薪低于2 000元的频率.解:(2)频率分布直方图和频率分布折线图如图.
(3)起始月薪低于2 000元的频率为0.07+0.11+…+0.04=0.94,故起始月薪低于2 000元的频率的估计值是0.94.即时训练1-1:(2017·湖北黄冈期末)某制造厂商生产了一批乒乓球,从中随机抽取n个进行检查,测得每个球的直径(单位:mm),将数据进行分组,得到如下频率分布表:(1)求a,b,n及p1,p2的值,并画出频率分布直方图(结果保留两位小数);解:(1)由频率分布表可知n=12÷0.20=60,
a=60×0.50=30,b=60-6-12-30=12,
p1=6÷60=0.10,p2=12÷60=0.20.
频率分布直方图如图:(2)已知标准乒乓球的直径为40.00 mm,且称直径在[39.99,40.01)内的乒乓球为五星乒乓球,若这批乒乓球共有10 000个,试估计其中五星乒乓球的数目.解:(2)因为五星乒乓球的直径在[39.99,40.01)内,所以由频率分布表,可得五星乒乓球的频率为0.50,
故10 000个乒乓球中,“五星乒乓球”大约有10 000×0.50=5 000(个).题型二 频率分布直方图的应用【例2】 (2018·河南濮阳期末)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为 ;?
(2)在这些用户中,用电量落在区间[100,250)内的户数为 .?解析:(1)根据频率和为1,得(0.002 4+0.003 6+0.006 0+x+0.002 4+ 0.001 2)×50=1,
解得x=0.004 4.
(2)(0.003 6+0.006 0+0.004 4)×50×100=70.
答案:(1)0.004 4 (2)70方法技巧 (1)频率分布直方图中,所有小长方形面积之和为1.
(2)根据频率分布直方图求样本落在某一区间的频数时,需先求该区间的频率.
(3)本题中,求85%的居民用水量时,利用了比例法,这也是求解频率分布直方图中非端点值时常用的方法.题型三 茎叶图的画法及应用【例3】 某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:
甲:95,81,75,91,86,89,71,65,76,88,94,110,107.
乙:83,86,93,99,88,103,98,114,98,79,78,106,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.解:甲、乙两人数学成绩的茎叶图如图所示,
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.误区警示 绘制茎叶图的注意事项
(1)绘制茎叶图关键是分清茎和叶.一般地说,当数据是两位数时,十位上的数字为“茎”,个位上的数字为“叶”;如果是小数,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据的特点合理地选择茎和叶.
(2)茎叶图只适用于样本数据较少的情况.即时训练3-1:(2018·贵州安顺高一检测)某超市连锁店统计了城市甲、乙的各16台自动售货机在中午12:00至13:00间的销售金额,并用茎叶图表示如图.则有( )
(A)甲城销售额多,乙城销售不够稳定
(B)甲城销售额多,乙城销售稳定
(C)乙城销售额多,甲城销售稳定
(D)乙城销售额多,甲城销售不够稳定解析:十位数字是2,3,4时乙明显多于甲,估计乙销售额多,甲的数字过于分散,不够稳定,故选D.即时训练3-2:(2017·江西上饶二中月考)为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:00间各自的车流量(单位:百辆),得如图所示的统计图,试求:(1)甲、乙两个交通站的车流量的极差分别是多少?
(2)甲交通站的车流量在[10,60]间的频率是多少?解:(1)甲交通站的车流量的极差为73-8=65(百辆),
乙交通站的车流量的极差为71-5=66(百辆).谢谢观赏!课件33张PPT。2.2.2 用样本的数字特征估计总体的数字特征目标导航新知探求课堂探究新知探求·素养养成【情境导学】【实例】 (1)现从甲、乙、丙三个厂家生产的同一种产品中,各抽取8件产品,对其使用寿命进行跟踪调查,其结果如下(单位:年)
甲:3,4,5,6,8,8,8,10
乙:4,6,6,6,8,9,12,13
丙:3,3,4,7,9,10,11,12
(2)甲、乙两位同学分别记录了他们10次的数学测验成绩,甲对乙说:“我的最高分是100分,而你的最高分是95分,所以我的数学比你好.”而乙对甲说:“我的平均分是86分,你的平均分是80分,这说明我的数学比你好.”想一想 1:若实例(1)中的三家广告中都称其产品的使用寿命是8年,利用初中所学的知识,你能说明为什么吗?
(三个厂家是从不同角度进行了说明,以宣传自己的产品.
甲:众数为8年,乙:平均数为8年,丙:中位数为8年)
想一想 2:实例(2)中甲、乙两位同学谁的分析正确?哪个较好?
(他们的分析均具有片面性,甲侧重两人最高分的比较,即比较了两组数据的最大值;乙侧重于两人平均分的比较,即比较了两组数据的平均值.要判断哪位成绩较好,不但要计算平均值,还应比较他们成绩的稳定性)知识探究1.众数、中位数、平均数最多底边中点集中趋势相等底边中点的横坐标2.标准差与方差的概念
(1)标准差
①定义:标准差是样本数据到平均数的一种 ,一般用s表示.
②计算公式:
s= .?平均距离探究:标准差的大小对数据的离散程度有何影响?
提示:标准差越大,表明各数据的离散程度就越大;反之,标准差越小,表明各数据的离散程度就越小,它用来描述样本数据的离散程度.在实际应用中,标准差常被理解为稳定性.
(2)方差
①定义:标准差的平方.②计算公式:
s2= .【拓展延伸】众数、中位数、平均数与频率分布直方图的联系
(1)众数:众数在样本数据的频率分布直方图中,就是最高矩形的底边中点的横坐标.
(2)中位数:在样本中,有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)平均数:用频率分布直方图估计平均数时,平均数等于频率分布直方图中每个小矩形的面积乘以每个小矩形底边中点的横坐标之和.自我检测1.下列说法正确的个数是( )
①中位数一定是样本数据中的某个数;②在一组样本数据中,众数一定是唯一的;③标准差越大,数据的稳定性越强;④如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变;⑤一组数据的方差可以为0.
(A)0 (B)1 (C)2 (D)3C2.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是( )
(A)85分、85分、85分 (B)87分、100分、85分
(C)87分、85分、85分 (D)87分、85分、90分C3.一组样本数据按从小到大的顺序排列为12,15,20,x,23,28,30,50,其中,中位数为22,则x等于( )
(A)21 (B)15
(C)22 (D)35A4.某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是 分.?答案:85 5.样本数据3,5,7,4,6的方差为 .?答案:2 题型一 求众数、中位数、平均数【例1】(1)(2017·山东枣庄二模)传承传统文化再掀热潮,央视科教频道以诗词知识竞赛为主的《中国诗词大会》火爆荧屏,如图茎叶图是两位选手在个人追逐赛中的比赛得分,则下列说法正确的是( )
(A)甲的平均数大于乙的平均数
(B)甲的中位数大于乙的中位数
(C)甲的方差大于乙的方差
(D)甲的平均数等于乙的中位数课堂探究·素养提升(2)(2017·广西南宁期末)有两位射击运动员在一次射击测试中各射靶7次,每次命中的环数如下:
甲 7 8 10 9 8 8 6
乙 9 10 7 8 7 7 8
则下列判断正确的是( )
(A)甲射击的平均成绩比乙好
(B)乙射击的平均成绩比甲好
(C)甲射击的成绩的众数小于乙射击的成绩的众数
(D)甲射击的成绩的极差大于乙射击的成绩的极差方法技巧 (1)平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.②数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等;
③若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.即时训练1-1:10名工人某天生产同一种零件,生产的件数分别是15,17,14, 10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( )
(A)a>b>c (B)b>c>a
(C)c>a>b (D)c>b>a题型二 方差、标准差的应用【例2】 (2017·四川成都龙泉二中月考)如茎叶图记录了某NBA篮球队内两大中锋在六次训练中抢得篮板球数记录,由于教练一时疏忽,忘了记录乙球员其中一次的数据,在图中以X表示.
(1)如果乙球员抢得篮板球的平均数为10时,求X的值和乙球员抢得篮板球数的方差;(2)如果您是该球队的教练在正式比赛中您会派谁上场呢?并说明理由(用数据说明).方法技巧 标准差(方差)的两个作用
(1)标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小.
(2)在实际应用中,常常把平均数与标准差结合起来进行决策.在平均值相等的情况下,比较方差或标准差以确定稳定性.即时训练2-1:已知母鸡产蛋的最佳温度在10 ℃左右,下面是在甲、乙两地六个时刻测得的温度,你认为甲、乙两地哪个地方更适合母鸡产蛋?②极差:甲地温度极差为15-(-5)=20;
乙地温度极差为10-0=10.题型三 频率分布直方图中的样本数字特征【例3】 (2017·宁夏石嘴山月考)某学校1 800名学生在一次百米测试中,成绩全部介于13秒与18秒之间,抽取其中50个作为样本,将测试结果按如下方式分成五组:第一组[13,14),第二组[14,15),…,第五组[17,18],如图是按分组方法得到的频率分布直方图.解:(1)样本在这次百米测试中成绩良好的人数为0.22×50=11(人).
(2)学校1 800名学生中,成绩属于第四组的人数为0.32×1 800=576(人).(1)若成绩小于15秒认为良好,求该样本在这次百米测试中成绩良好的人数;
(2)请估计学校1 800名学生中,成绩属于第四组的人数;(3)请根据频率分布直方图,求样本数据的众数、中位数、平均数和方差.方法技巧 (1)频率分布直方图中的众数是最高小长方形底边中点的横坐标,中位数是平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标,即累积频率为0.5的样本数据值.
(2)根据频率分布直方图中求平均数的方法:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.即时训练3-1:(2017·四川省资阳期末)某校收集该校学生从家到学校的时间后,制作成如图的频率分布直方图:(1)求a的值及该校学生从家到学校的平均时间;
(2)若该校因学生寝室不足,只能容纳全校50%的学生住校,出于安全角度考虑,从家到学校时间较长的学生才住校,请问从家到学校时间多少分钟以上开始住校.谢谢观赏!课件35张PPT。2.3 变量间的相关关系
2.3.1 变量之间的相关关系
2.3.2 两个变量的线性相关目标导航新知探求课堂探究新知探求·素养养成【情境导学】导入一 “名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?即学生成绩与教师水平之间存在着某种联系,但又不是必然联系,对于学生成绩与教师水平之间的这种非函数的不确定关系,我们称之为相关关系.这就是我们这节课要共同探讨的内容.
导入二
【实例】 (1)吸烟可导致肺癌.
(2)y=x2+5(x∈R).
(3)如表是某小卖部6天卖出热茶的杯数与当天气温的对比表.想一想 1:吸烟一定可导致肺癌吗?吸烟与患肺癌有关吗?实例(2)中x,y间又是什么关系?
(吸烟不一定患肺癌,但它们有一定的关系.y=x2+5(x∈R)中x,y是一种函数关系,是确定的)
想一想 2:实例(3)中小卖部卖出的热茶杯数与当天气温有关吗?两者之间是如何变化的?
(两者间有关系;随着气温的降低卖出的热茶杯数增加)知识探究1.相关关系与函数关系不同
函数关系中的两个变量间是一种确定性关系,相关关系是一种不确定性关系.
2.正相关和负相关
(1)正相关
在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们就称它为正相关.
(2)负相关
在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关关系,我们就称它为负相关.3.回归直线方程
(1)回归直线
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有 关系,这条直线叫做回归直线;
(2)回归方程
与回归直线对应的方程叫回归直线的方程,简称回归方程;
(3)最小二乘法
求回归直线时使得样本数据的点到回归直线的 的方法叫做最小二乘法;线性相关距离的平方和最小探究:根据线性回归直线方程的求解方法,则线性回归直线方程必过哪个定点?【拓展延伸】求线性回归方程的注意事项
(1)利用散点图判定两个变量是否具有线性相关关系,注意不要受个别点的位置的影响.自我检测1.(2017·辽宁葫芦岛期中)观察下列散点图,则①正相关,②负相关,③不相关,这三句话与散点图的位置相对应的是( )
(A)①②③ (B)②③①
(C)②①③ (D)①③②DAC答案:①④ 题型一 判断相关关系【例1】 若变量x,y有如下观察的数据:课堂探究·素养提升(1)画出散点图;解:(1)画出散点图.(2)判断变量x,y是否具有相关关系?如果具有相关关系,那么是正相关还是负相关?解:(2)具有相关关系.根据散点图,左下角到右上角的区域,变量x的值由小变大时,另一个变量y的值也由小变大,所以它们具有正相关关系.方法技巧 两个随机变量x和y是否具有相关关系的确定方法:
(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断(如本题);
(2)表格、关系式法:结合表格或关系式进行判断;
(3)经验法:借助积累的经验进行分析判断.即时训练1-1:(2017·四川泸州期末)对于变量x,y有以下四个散点图,由这四个散点图可以判断变量x与y成负相关的是( )解析:对于A,散点图呈片状分布,不具相关性;对于B,散点图呈带状分布,且y随x的增大而减小,是负相关,对于C,散点图中y随x的增大先增大再减小,不是负相关;对于D,散点图呈带状分布,且y随x的增大而增大,是正相关.故选B.题型二 求回归直线方程【例2】某连锁经营公司所属5个零售店某月的销售额和利润额资料如表.(1)画出销售额和利润额的散点图;(2)若销售额和利润额具有相关关系,计算利润额y对销售额x的回归直线方程.方法技巧 用公式求回归方程的一般步骤(4)写出回归方程.即时训练2-1:(2018·青岛高一检测)已知变量x,y有如下对应数据.(1)作出散点图;(2)用最小二乘法求关于x,y的回归直线方程.题型三 利用回归方程对总体进行估计【例3】 (2017·杭州月考)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如表:(1)在给定的坐标系中画出表中数据的散点图:(3)试预测加工10个零件需要多少时间?方法技巧即时训练3-1:(2017·甘肃省高台期末)某地随着经济的发展,居民收入逐年增长,下表是该地一银行连续五年的储蓄存款(年底余额),如表1:为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5得到表2:(1)求z关于t的线性回归方程;(2)通过(1)中的方程,求出y关于x的回归方程;
(3)用所求的回归方程预测到2022年年底,该地储蓄存款可达多少?解:(2)t=x-2 012,z=y-5,代入z=1.2t-1.4得到:
y-5=1.2(x-2 012)-1.4,即y=1.2x-2 410.8.
(3)所以y=1.2×2 022-2 410.8=15.6,
所以预测到2022年年底,该地储蓄存款额可达15.6千亿元.题型四 易错辨析错解:A正解:B谢谢观赏!课件42张PPT。章末总结网络建构知识辨析判断下列说法是否正确.(请在括号中填“√”或“×”)
1.抽签法和随机数法都是不放回抽样.( )
2.抽签法抽签时,先抽签的人占便宜.( )
3.利用随机数表抽样时,开始位置和读数方向可以任意选择.( )
4.分层抽样中,为确保公平性,在每层都应用同一抽样方法.( )
5.频率分布直方图中每个小长方形的面积等于相应组的频率,各个小长方形面积之和小于1.( )
6.从总体中抽取一个样本,用样本的分布估计总体的分布,样本容量越小估计越准确.( )
7.在样本数据中,频率分布最大值所对应的样本数据是众数.( )√× √× × × √√题型探究真题体验题型探究·素养提升一、抽样方法的应用
【典例1】 如图是某市高中男生体重的样本频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2个小组的频数为100,若按照分层抽样的方法再从各个小组抽取一个容量为16的样本,则各个小组依次抽取的人数为 .?答案:2,4,6,3,1规律方法 简单随机抽样与分层抽样中每个个体被抽中的机会均等.分层抽样在各层中抽取的数目取决于抽样比,即各层抽取数目=抽样比×各层个体总数.【变式训练】 (1)(2018·广西桂林高一检测)某校共有学生2 000名,各年级男、女生人数如表.已知在全校学生中随机抽取1名,抽到二年级女生的可能性是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( )(A)24 (B)18
(C)16 (D)12(2)(2018·泰安高一检测)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号是( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6931 7481
(A)08 (B)07 (C)02 (D)01解析:(2)从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字中小于20的编号依次为08,02,14,07,02,01….其中第2个和第5个都是02,重复.则第5个个体的编号为01.故选D.二、用样本的频率分布估计总体分布
【典例2】 (2018·长春高一检测)某市统计局就某地居民的月收入调查了 10 000人,并根据所得数据画出样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).(1)求居民收入在[3 000,3 500)的频率;
(2)根据频率分布直方图算出样本数据的中位数;解:(1)0.000 3×500=0.15.
(2)0.000 2×500=0.1,0.000 4×500=0.2,
0.000 5×500=0.25.
设中位数为x,则0.1+0.2+(x-2 000)×0.000 5=0.5,
解得x=2 400,中位数为2 400元.(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中按分层抽样方法抽出100人作进一步分析,则月收入在[2 500, 3 000)的这段应抽取多少人?规律方法 频率分布直方图中,各个矩形的面积为对应数据组的频率且所有矩形的面积和为1.【变式训练】 我校高三年级进行了一次水平测试.用简单随机抽样的方法抽取了50名学生的数学成绩,准备进行分析和研究.经统计成绩的分组及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)绘制样本的频率分布表,画出频率分布直方图;解:(1)频率分布表频率分布直方图(2)估计成绩在85分以下的学生比例;
(3)请你根据以上信息去估计样本的众数、中位数、平均数.(精确到0.01)(3)众数为75.00,中位数在[70,80)范围内,然后由
0.004×10+0.006×10+0.02×10+(x中-70)×0.03=0.5,
解得x中≈76.67.
平均数为
45×0.04+55×0.06+65×0.2+75×0.3+85×0.24+95×0.16=76.20.三、用样本的数字特征估计总体
【典例3】 (2018·山东枣庄二模)随着高校自主招生活动的持续开展,我市高中生掀起了参与数学兴趣小组的热潮.为调查我市高中生对数学学习的喜好程度,从甲、乙两所高中各随机抽取了40名学生,记录他们在一周内平均每天学习数学的时间,并将其分成了6个区间:(0,10],(10,20],(20,30],(30, 40],(40,50],(50,60],整理得到如下频率分布直方图.根据一周内平均每天学习数学的时间t,将学生对于数学的喜好程度分为三个等级:(1)试估计甲高中学生一周内平均每天学习数学的时间的中位数m甲(精确到0.01);规律方法 样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差.我们常通过样本的数字特征估计总体的数字特征.【变式训练】 某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上每隔一小时抽一包产品,称其重量(单位:克)是否合格,分别记录抽查数据,获得重量数据茎叶图.
(1)写出甲的众数和乙的中位数;解:(1)甲的众数是111,乙的中位数是111.(2)根据样本数据,计算甲、乙两个车间产品重量的均值与方差,并说明哪个车间的产品的重量相对稳定.四、线性回归分析
【典例4】 (2017·广东肇庆期末)某研究机构对中学生记忆能力x和识图能力y进行统计分析,得到如下数据:由于某些原因,识图能力的一个数据丢失,但已知识图能力样本平均值是5.5.
(1)求丢失的数据;(3)若某一学生记忆能力值为12,请你预测他的识图能力值.规律方法 两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量是否具有相关关系.若两变量具有线性相关关系代入公式求回归直线方程由直线方程预测变量,估计和预测分析实际问题.【变式训练】 (2018·辽宁大连高一检测)某地植被面积x(公顷)与当地气温下降的度数y(℃)之间有如下的对应数据:真题体验·素养升级1.(2015·福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:B2.(2016·全国Ⅲ卷)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.3.(2017·全国Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:谢谢观赏!