2018高中数学苏教版选修1-2课件:第1章统计案例(6份)

文档属性

名称 2018高中数学苏教版选修1-2课件:第1章统计案例(6份)
格式 zip
文件大小 9.6MB
资源类型 教案
版本资源 苏教版
科目 数学
更新时间 2018-11-01 16:08:26

文档简介

课件43张PPT。第1章——统计案例1.1 独立性检验[学习目标]
1.理解列联表的意义,会根据列联表中数据大致判断两个变量是否独立.
2.理解统计量χ2的意义和独立性检验的基本思想.1预习导学 挑战自我,点点落实2课堂讲义 重点难点,个个击破3当堂检测 当堂训练,体验成功[知识链接]
1.什么是列联表?怎样从列联表判断两个分类变量有无关系?
答 一般地,假设两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},列出两个变量的频数表,称为列联表(如下图):|ad-bc|越小,说明两个分类变量x、y之间的关系越弱;
|ad-bc|越大,说明两个分类变量x、y之间的关系越强.2.统计量χ2有什么作用?[预习导引]
1.2×2列联表:
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值类A和类B,Ⅱ也有两类取值类1和类2,得到如下列联表所示的抽样数据:上述表格称为2×2列联表.2.统计量χ2
χ2= .
3.独立性检验
要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:
(1)提出假设H0: ;
(2)根据2×2列联表计算_____的值;
(3)查对临界值,作出判断.Ⅰ与Ⅱ没有关系χ2要点一 2×2列联表和χ2统计量
例1 根据下表计算:χ2≈________.(结果保留3位小数)解析 χ2= ≈4.514.
答案 4.514规律方法 利用χ2= ,准确代数与
计算,求出χ2的值.
跟踪演练1 已知列联表:药物效果与动物试验列联表则χ2≈________.(结果保留3位小数)解析 χ2= ≈6.109.
答案 6.109要点二 独立性检验
例2 为了研究人的性别与患色盲是否有关系,某研究所进行了随机调查,发现在调查的480名男性中有39名患有色盲,520名女性中有6名患有色盲,能在犯错误的概率不超过0.001的前提下认为人的性别与患色盲有关系吗?解 由题意列出2×2列联表:由公式得χ2的观测值
x0= ≈28.225.
因为P(χ2≥10.828)≈0.001,且28.225>10.828,
所以在犯错误的概率不超过0.001的前提下认为患色盲与人的性别有关系,男性患色盲的概率要比女性大得多. 规律方法 独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.跟踪演练2 调查在2~3级风的海上航行中男女乘客的晕船情况,结果如下表所示:根据此资料,你是否认为在2~3级风的海上航行中男人比女人更容易晕船?
解 假设H0:海上航行和性别没有关系,χ2=
≈0.08.
因为χ2<2.706,所以我们没有理由认为男人比女人更容易晕船.
要点三 独立性检验的应用
例3 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出500件,量其内径尺寸,结果如下表:
甲厂乙厂(1)试分别估计两个分厂生产的零件的优质品率;
解 甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为 =72%;
乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为 =64%.(2)由以上统计数据填下面2×2列联表,并计算是否有99%的把握认为“两个分厂生产的零件的质量有差异”.解 
χ2= ≈7.353>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.规律方法 (1)解答此类题目的关键在于正确利用χ2=
计算χ2的值,再用它与临界值的大小作比较来判断假设检验是否成立,从而使问题得到解决.
(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.跟踪演练3 下表是某地区的一种传染病与饮用水的调查表:(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;
解 (1)假设H0:传染病与饮用水无关.把表中数据代入公式得:χ2= ≈54.21,
∵54.21>10.828,所以假设H0不成立.
因此我们有99.9%的把握认为该地区这种传染病与饮用水的卫生程度有关.
(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.依题意得2×2列联表:此时,χ2= ≈5.785.
由于5.785>5.024所以我们有97.5%的把握认为该种疾病与饮用水的卫生程度有关.
两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握肯定结论的正确性.1.下面是一个2×2列联表:1234则表中a=________.b=________.解析 ∵a+21=73,
∴a=52,b=a+8=52+8=60.
答案 52 60123412342.为了考查长头发与女性头晕是否有关系,随机抽查301名女性,得到如表所示的列联表,试根据表格中已有数据填空.1234则空格中的数据分别为:①________;②________;
③________;④________.
解析 最右侧的合计是对应行上的两个数据的和,由此可求出①和②;而最下面的合计是相应列上的两个数据的和,由刚才的结果可求得③④.
答案 86 180 229 3013.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是________.(填序号)
①若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
②从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;1234③若从χ2统计量中得出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.
解析 对于①,99%的把握是通过大量的试验得出的结论,这100个吸烟的人中可能全患肺病也可能都不患,是随机的,所以①错;1234对于②,某人吸烟只能说其患病的可能性较大,并不一定患病;
③的解释是正确的.
答案 ③12344.为研究学生的数学成绩与学生学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:12341234学生的数学成绩好坏与对学习数学的兴趣是否有关?
解 由公式得:χ2= ≈38.459.
∵38.459>10.828,
∴有99.9%的把握认为,学生学习数学的兴趣与数学成绩是有关的.课堂小结
1.独立性检验的思想:先假设两个事件无关,计算统计量χ2的值.若χ2值较大,则假设不成立,认为两个事件有关.
2.独立性检验的步骤:(1)作出假设H0:Ⅰ与Ⅱ没有关系;(2)计算χ2的值;(3)查对临界值,作出判断.课件50张PPT。课件58张PPT。第1章——统计案例1.2 回归分析[学习目标]
1.会建立线性回归模型分析两个变量间的相关关系.
2.能通过相关系数判断两个变量间的线性相关程度.
3.了解回归分析的基本思想和初步应用.1预习导学 挑战自我,点点落实2课堂讲义 重点难点,个个击破3当堂检测 当堂训练,体验成功[知识链接]
1.什么叫回归分析?
答 回归分析是对具有相关关系的两个变量进行统计分析的一种方法.2.回归分析中,利用线性回归方程求出的函数值一定是真实值吗?
答 不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等.[预习导引]
1.线性回归方程(2)将y=a+bx+ε称为线性回归模型,其中a+bx是确定性函数,ε称为 .随机误差2.相关系数r的性质
(1)|r|≤ ;
(2)|r|越接近于1,x,y的线性相关程度越 ;
(3)|r|越接近于0,x,y的线性相关程度越 .强弱13.显著性检验
(1)提出统计假设H0:变量x,y ;
(2)如果以95%的把握作出判断,可以根据1-0.95=0.05与 n-2在附录2中查出一个r的 (其中1-0.95=0.05称为 );不具有线性相关关系临界值r0.05检验水平相关系数(4)作出统计推断:若 ,则否定H0,表明有 的把握认为x与y之间具有 ;若 ,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为x与y之间有 .|r|>r0.0595%|r|≤r0.05线性相关关系线性相关关系要点一 线性相关的判断
例1 某校高三(1)班的学生每周用于数学学习的时间x(单位:h)与数学平均成绩y(单位:分)之间有表格所示的数据.(1)画出散点图;
(2)作相关性检验;而n=10时,r0.05=0.632,
所以|r|>r0.05,
所以有95%的把握认为数学成绩与学习时间之间具有线性相关关系.(3)若某同学每周用于数学学习的时间为18 h,试预测其数学成绩.规律方法 判断变量的相关性通常有两种方式:一是散点图;二是相关系数r.前者只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关性的强弱.跟踪演练1 暑期社会实践中,小闲所在的小组调查了某地家庭人口数x与每天对生活必需品的消费y的情况,得到的数据如下表:(1)利用相关系数r判断y与x是否线性相关;
解 由表中数据,利用科学计算器计算得:因为r>r0.05=0.878,
所以y与x之间具有线性相关关系.(2)根据上表提供的数据,求出y关于x的线性回归方程.
解 根据以上数据可得,要点二 求线性回归方程
例2 某班5名学生的数学和物理成绩如下表:(1)画出散点图;
解 散点图如图.(2)求物理成绩y对数学成绩x的线性回归方程;
(3)一名学生的数学成绩是96,试预测他的物理成绩.即可以预测他的物理成绩是82.规律方法 (1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.
(2)求线性回归方程,首先应注意到,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.跟踪演练2 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:①请画出上表数据的散点图(要求:点要描粗);
解 如图:③试根据求出的线性回归方程,预测记忆力为9的同学的判断力.要点三 非线性回归分析
例3 某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:检验每册书的成本费y与印刷册数的倒数 之间是否具有线性相关关系;如有,求出y对x的回归方程.解 令u= ,原题中所给数据变成如下表示的数据:查表得r0.05=0.632,因为r>r0.05,从而认为u与y之间具有线性相关关系.规律方法 对非线性回归问题,若给出经验公式,采用变量代换把问题转化为线性回归问题.若没有经验公式,需结合散点图挑选拟合得最好的函数.跟踪演练3 在试验中得到变量y与x的数据如下表:
试求y与x之间的回归方程,并预测x=40时,y的值.解 作散点图如图所示,
从散点图可以看出,两个变量x,y不
呈线性相关关系,根据学过的函数知
识,样本点分布的曲线符合指数型函数 ,通过对数变化把指数关系变为线性关系,
令z=ln y,
则z=bx+a(a=ln c1,b=c2).列表:作散点图如图所示,从散点图可以看出,两个变量x,z呈很强的线性相关关系.
由表中的数据得到线性回归方程为 =0.277x-3.998.
所以y关于x的指数回归方程为: =e0.277x-3.998.
所以,当x=40时,y=e0.277×40-3.998≈1 190.347.1.在下列各量之间,存在相关关系的是________.
①正方体的体积与棱长之间的关系;②一块农田的水稻产量与施肥量之间的关系;③人的身高与年龄之间的关系;④家庭的支出与收入之间的关系;⑤某户家庭用电量与电价之间的关系.
 1234②③④2.如图是x和y的一组样本数据的散点
图,去掉一组数据________后,剩下
的4组数据的相关指数最大.
解析 经计算,去掉D(3,10)这一组数据
后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.
 1234D(3,10)3.对具有线性相关关系的变量x和y,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.1234答案 =-10+6.5x12344.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:1234(1)求年推销金额 y关于工作年限x的线性回归方程;1234所以年推销金额y关于工作年限x的线性回归方程为
=0.5x+0.4.1234(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.
解 当x=11时,=0.5x+0.4=0.5×11+0.4=5.9(万元).
所以可以估计第6名推销员的年推销金额为5.9万元.1234课堂小结
1.相关系数r
r的大小与两个变量之间线性相关程度的强弱关系:
(1)当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.当r=1时,两个变量完全正相关;当r=-1时,两个变量完全负相关.(2)|r|≤1,并且|r|越接近1,表明两个变量的线性相关程度越强,它们的散点图越接近于一条直线,这时用线性回归模型拟合这组数据的效果就越好;|r|越接近0,表明两个变量的线性相关程度越弱,通常当|r|>r0.05时,认为两个变量有很强的线性相关程度.此时建立的回归模型是有意义的.2.回归分析
用回归分析可以预测具有相关关系的两个随机变量的取值.但要注意:
①回归方程只适用于我们所研究的样本的总体.
②我们建立的回归方程一般都有时间性.③样本取值的范围影响了回归方程的适用范围.
④回归方程得到预报值不是变量的精确值,是变量可能取值的平均值.课件46张PPT。课件42张PPT。第1章——统计案例1知识网络 系统盘点,提炼主干2要点归纳 整合要点,诠释疑点3题型研修 突破重点,提升能力章末复习提升1.独立性检验
(其中n=a+b+c+d)来确定在多大程度上认为“两个变量有相关关系”.应记熟χ2的几个临界值的概率.2.回归分析
(1)分析两个变量相关关系常用:散点图或相关系数r进行判断.在确认具有线性相关关系后,再求线性回归方程,进行预测.
(2)对某些特殊的非线性关系,可以通过变量转化,把非线性回归转化为线性回归,再进行研究.题型一 独立性检验思想的应用
独立性检验的基本思想是统计中的假设检验思想,类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的观测值很大,则在一定程度上说明假设不合理.例1 为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表表2:注射药物B后皮肤疱疹面积的频数分布表完成下面2×2列联表,能否在犯错误概率不超过0.001的前提下,认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:解 列出2×2列联表由于χ2>10.828,所以在犯错误概率不超过0.001的前提下,认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.跟踪演练1 某企业为了更好地了解设备改造与生产合格品的关系,随机抽取了180件产品进行分析.其中设备改造前生产的合格品有36件,不合格品有49件;设备改造后生产的合格品有65件,不合格品有30件,根据上面的数据,你能得出什么结论?解 根据已知条件列出2×2列联表:提出假设H0:设备改造与生产合格品无关.∵χ2>10.828,
∴我们有99.9%的把握认为设备改造与生产合格品有关系.题型二 线性回归分析
进行线性回归分析的前提是两个变量具有线性相关关系,否则求出的线性回归方程就没有实际意义,所以必须先判断两个变量是否线性相关.分析判断两个变量是否线性相关的常用方法是利用散点图进行判断,若各数据点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系.此方法直观、形象,但缺乏精确性.例2 在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为 (1)画出散点图;
解 散点图如下图所示:(2)求出y对x的线性回归方程;
(3)如果价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t).故价格定为1.9万元,预测需求量大约为6.25 t.跟踪演练2 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了4次试验,得到数据如下:(1)在给定的坐标系中画出表中数据的散点图;
解 散点图如图所示:(3)试预测加工10个零件需要的时间.题型三 非线性回归分析
非线性回归问题有时并不给出经验公式.这时我们可以画出已经数据的散点图,把它与已经学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.例3 下表是某年美国旧轿车价格的调查资料,今以x表示轿车的使用年数,y是表示相应的年均价格,求y关于x的回归方程.解 数据对应的散点图如图1,
图1
可以发现,各点并不是基本处于一条直线附近,
因此,y与x之间是非线性回归关系.题中数据变成如下表所示:相应的散点图如图2,
从图2可以看出,变换的样本点分布在一条直线附近,
因此可以用线性回归方程拟合.

图2由表中数据可得r≈-0.996.
即|r|>r0.05=0.632,
所以有95%的把握认为x与z之间具有线性相关关系,跟踪演练3 下表所示是一组试验数据:(1)作出x与y的散点图,并判断是否线性相关;
解 散点图如图:
由散点图可知y与x不具有线性相关关系,且样本点分布在反比例函数y= +a的周围.(2)若变量y与 成线性相关关系,求出y对x的回归方程,
并观测x=10时y的值.解 令x′= ,y′=y由已知数据制成下表由于|r|>r0.05=0.878,
说明y′与x′具有很强的线性关系,所以y′=-11.3+36.95x′.课堂小结
1.独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法,而利用假设的思想方法,计算出某一个随机变量χ2的值来判断更精确些.
2.建立回归模型的基本步骤:(1)确定研究对象.(2)画出散点图,观察它们之间的关系.(3)由经验确定回归方程的类型.(4)按照一定的规则估计回归方程中的参数. 课件44张PPT。