2018_2019学年高中数学第3章统计案例课件(打包3套)新人教B版选修2_3

文档属性

名称 2018_2019学年高中数学第3章统计案例课件(打包3套)新人教B版选修2_3
格式 zip
文件大小 2.0MB
资源类型 教案
版本资源 人教新课标B版
科目 数学
更新时间 2019-01-07 20:46:04

文档简介

课件35张PPT。第三章——统计案例3.1 独立性检验[学习目标]
1.理解列联表的意义,会根据列联表中数据大致判断两个变量是否独立.
2.理解统计量χ2的意义和独立性检验的基本思想.1预习导学 挑战自我,点点落实2课堂讲义 重点难点,个个击破3当堂检测 当堂训练,体验成功[知识链接]
1.什么是列联表,它有什么作用?
答 一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值类A和类B,Ⅱ也有两类取值类1和类2,得如下列联表中的抽样数据:以上表格称为2×2列联表.2.统计量χ2有什么作用?[预习导引]
1.2×2列联表:
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值类A和类B,Ⅱ也有两类取值类1和类2,得到如下列联表所示的抽样数据:上述表格称为2×2列联表.3.独立性检验
要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:
(1)提出假设H0: ;(2)根据2×2列联表计算__的值;(3)查对临界值,作出判断.Ⅰ与Ⅱ没有关系χ2要点一 2×2列联表和χ2统计量
例1 根据下表计算:
χ2≈________.(结果保留3位小数)答案 4.514规律方法 利用χ2= ,准确代数与计算,求出χ2的值.跟踪演练1 已知列联表:药物效果与动物试验列联表则χ2≈________.(结果保留3位小数)答案 6.109要点二 有关“相关的检验”
例2 某校对学生课外活动进行调查,结果整理成下表:
用你所学过的知识进行分析,能否在犯错误的概率不超过0.01的前提下,认为“喜欢体育还是文娱与性别有关系”?解 判断方法如下:
假设H0“喜欢体育还是喜欢文娱与性别没有关系”,若H0成立,则χ2应该很小.
∵n11=21,n12=23,n21=6,n22=29,n=79,∵χ2≥6.635,
∴我们有99%的把握认为“喜欢体育还是文娱与性别有关系”,
即在犯错误的概率不超过0.01的前提下认为“喜欢体育还是喜欢文娱与性别有关”.规律方法 (1)利用χ2= 求出χ2的值.再利用临界值的大小来判断假设是否成立.
(2)解题时应注意准确代数与计算,不可错用公式,准确进行比较与判断.跟踪演练2 为了研究人的性别与患色盲是否有关系,某研究所进行了随机调查,发现在调查的480名男性中有39名患有色盲,520名女性中有6名患有色盲,能在犯错误的概率不超过0.01的前提下认为人的性别与患色盲有关系吗?
解 由题意列出2×2列联表:因为χ2≥6.635,所以有99%的把握认为人的性别与患色盲有关系,即在犯错误的概率不超过0.01的前提下认为患色盲与人的性别有关系,男性患色盲的概率要比女性大得多要点三 有关“无关的检验”
例3 为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.试分析学生选报文、理科与对外语的兴趣是否有关?解 列出2×2列联表∵1.871×10-4≤3.841,可以认为学生选报文、理科与对外语的兴趣无关.规律方法 运用独立性检验的方法:
1.列出2×2列联表,根据公式计算χ2.
2.根据临界值作出判断.跟踪演练3 调查在2~3级风的海上航行中男女乘客的晕船情况,结果如下表所示:根据此资料,你是否认为在2~3级风的海上航行中男人比女人更容易晕船?解 假设H0:海上航行和性别没有关系,因为χ2<3.841,所以我们没有理由认为男人比女人更容易晕船.12341.当χ2>3.841时,认为事件A与事件B(  )
A.有95%的把握有关
B.有99%的把握有关
C.没有理由说它们有关
D.不确定A12342.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300名学生,得到如下列联表:1234你认为性别与是否喜欢数学课程之间有关系的把握有(  )
A.0 B.95%
C.99% D.100%B3.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据?
_________________________________________________________.1234女正教授人数、男正教授人数、女副教授人数、男副教授人数4.为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:1234学生的数学成绩好坏与对学习数学的兴趣是否有关?1234∵38.459>6.635,
∴有99%的把握说,学生学习数学的兴趣与数学成绩是有关的.课堂小结
1.独立性检验的思想:先假设两个事件无关,计算统计量χ2的值.若χ2值较大,则拒绝假设,认为两个事件有关,若χ2值较小,则假设成立,认为两个事件无关.
2.独立性检验的步骤:(1)作出假设H0:Ⅰ与Ⅱ没有关系;
(2)计算χ2的值;(3)和临界值比较作出判断.课件59张PPT。第三章——统计案例3.2 回归分析[学习目标]
1.会建立线性回归模型分析两个变量间的相关关系.
2.能通过相关系数判断两个变量间的线性相关程度.1预习导学 挑战自我,点点落实2课堂讲义 重点难点,个个击破3当堂检测 当堂训练,体验成功[知识链接]
1.什么叫回归分析?
答 回归分析是对具有相关关系的两个变量进行统计分析的一种方法.2.回归分析中,利用线性回归方程求出的函数值一定是真实值吗?
答 不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.[预习导引]2.相关系数
对于变量x与y随机抽到的n对数据(x1,y1),(x2,y2),…,(xn,yn),检测统计量是样本相关系数相关系数r的取值范围是 ,|r|越接近1,变量之间的线性相关程度越高,|r|越接近0,线性相关程度越弱,当|r|>
时,有95%的把握认为两个变量之间有线性相关关系.[-1,1]r0.053.非线性回归分析
回归曲线方程也可以线性化
(1)将幂函数型函数y=axn(a为常数,a,x,y均取正值)化为线性函数:
将y=axn两边取常用对数,则有lg y=nlg x+lg a,令μ=lg y,v=lg x,b=lg a,代入上式得μ=nv+b(其中n、b是常数),其图象是一条直线.(2)将指数型函数y=cax(a>0,c>0,a,c为常数)化为线性函数;
将y=cax两边取常用对数,则有lg y=xlg a+lg c,令μ=lg y,b=lg c,d=lg a,代入上式得μ=dx+b(d,b是常数),它的图象是一条直线.要点一 求线性回归方程
例1 某班5名学生的数学和物理成绩如下表:(1)画出散点图;
解 散点图如图.(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩.
即可以预测他的物理成绩是82.规律方法 (1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.
(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.跟踪演练1 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:(1)请画出上表数据的散点图(要求:点要描粗);
解 如图:(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.要点二 相关性检验
例2 下面的数据是从年龄在40到60岁的男子中随机抽出的6个样本,分别测定了心脏的功能水平y(满分100)以及每天花在看电视上的平均时间x(小时).(1)求心脏的功能水平y与每天花在看电视上的平均时间x之间的样本相关系数r;心脏的功能水平y与每天花在看电视上的平均时间x之间的相关系数(2)求心脏的功能水平y与每天花在看电视上的平均时间x的线性回归方程,并讨论方程是否有意义;查表n-2=4,r0.05=0.811,因为|r|≈0.902 5>0.811,
所以有95%以上的把握认为y与x之间有线性关系,这个方程是有意义的.(3)估计平均每天看电视3小时的男子的心脏的功能水平.因此估计平均每天看电视3小时的男子的心脏的功能水平为69分.规律方法 解决这一类问题时,首先应对问题进行必要的相关性检验,如果不作相关性检验,我们仍然可以求出x与y的线性回归方程,但不知道这时的线性回归方程是否有意义,也就不知道能否反映变量x与y之间的变化规律,只有在x与y之间具有相关关系时,求得的线性回归方程才有意义.跟踪演练2 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.(1)画散点图;
解 (2)求线性回归方程;
解 列表:=0.264 3,(3)求相关系数r,并进行相关性检验.=0.96.
计算得r=0.96>r0.05=0.754.说明甲醛浓度与缩醛化度两个变量之间有较强的线性相关关系.要点三 非线性回归模型
例3 某地区不同身高的未成年男性的体重平均值如下表:试建立y与x之间的回归方程.解 根据上表中数据画出散点图如图所示.由图看出,样本点分布在某条指数型函数曲线y=c1e 的周围,于是令z=ln y.由计算器计算可得下表,c2x画出散点图如图所示.由表中数据可得z与x之间的回归直线方程:规律方法 根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y=c1e 的周围,其中c1和c2是待定参数;可以通过对x进行对数变换,转化为线性相关关系.c2x跟踪演练3 某种书每册的成本费Y(元)与印刷册数x(千册)有关,经统计得到数据如下:检验每册书的成本费Y与印刷册数的倒数 之间是否具有线性相关关系?若有,求出Y对x的回归方程;若无,说明理由.解 设μ=,则Y与μ的数据关系如下表所示:经过计算r=0.999 8>r0.05=0.632.
从而有95%的把握认为这两个变量具有线性相关关系,从而求Y与μ的回归直线方程有意义.1.下列各组变量之间具有线性相关关系的是(  )
A.出租车费与行驶的里程
B.学习成绩与学生身高
C.身高与体重
D.铁的体积与质量1234C12342.若劳动生产率x(千元)与月工资y(元)之间的线性回归方程为
=50+80x,则下列判断正确的是(  )
A.劳动生产率为1 000元时,月工资为130元
B.劳动生产率提高1 000元时,月工资平均提高80元
C.劳动生产率提高1 000元时,月工资平均提高130元
D.月工资为210元时,劳动生产率为2 000元B12341234解析 由于销售量y与销售价格x成负相关,故排除B、D.
又当x=10时,A中y=100,而C中y=-300,C不符合实际情况,故选A.
答案 A4.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:12341234(1)求年推销金额y关于工作年限x的线性回归方程;12341234(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.所以可以估计第6名推销员的年推销金额为5.9万元.课堂小结
回归分析的基本思路:
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);课件42张PPT。第三章——统计案例1知识网络 系统盘点,提炼主干2要点归纳 整合要点,诠释疑点3题型研修 突破重点,提升能力章末复习提升1.独立性检验
(1)它依据的原理是“小概率原理”.
(2)采用的方法是“反证”的推理方法,即为了检验命题成立与否,先假设两分类变量不具有线性相关系,然后采用统计分析方法进行推理:如果导致小概率事件居然在一次抽检中发现,则认为这是“不合理”的现象,表明原假设很可能不正确,从而拒绝接受假设;反之,则没有理由拒绝假设.要注意的是,假设检验中的“反证法”与通常我们在纯数学中使用的反证法是不同的,因为这里所谓“不合理”现象,并不是形式逻辑推理中出现的矛盾,而是根据小概率事件的原理来判断的.2.回归直线方程
(1)相关关系:当自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系.
(2)回归分析:与函数关系不同,相关关系是一种非确定性关系,对具有相关关系的两个变量进行统计分析的方法叫做回归分析.(5)线性相关系数
当r>0时表示两个变量正相关.
当r<0时表示两个变量负相关.
通常,当|r|大于r0.05时,我们认为两个变量存在着很强的线性相关关系.题型一 独立性检验思想
独立性检验的基本思想是统计中的假设检验思想,类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的值很大,则在一定程度上说明假设不合理,即两分类变量有关系.例1 为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表表2:注射药物B后皮肤疱疹面积的频数分布表完成下面2×2列联表,试问能否在犯错误概率不超过0.01的前提下,认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3解 列出2×2列联表由于χ2>6.635,所以有99%的把握认为两者有关系,或者说在犯错误概率不超过0.01的前提下,认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.跟踪演练1 为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:(1)请将上面的列联表补充完整;
解 列联表补充如下:(2)是否有99%的把握认为喜爱打篮球与性别有关?说明你的理由;∴有99%的把握认为喜爱打篮球与性别有关.(3)已知喜爱打篮球的10位女生中,A1,A2,A3,A4,A5还喜欢打羽毛球,B1,B2,B3还喜欢打乒乓球,C1,C2还喜欢踢足球,现再从喜欢打羽毛球、喜欢打乒乓球、喜欢踢足球的女生中各选出1名进行其他方面的调查,求B1和C1不全被选中的概率.
解 从10位女生中选出喜欢打羽毛球、喜欢打乒乓球、喜欢踢足球的各1名,其一切可能的结果组成的基本事件如下:(A1,B1,C1),(A1,B1,C2),(A1,B2,C1),(A1,B2,C2),(A1,B3,C1),(A1,B3,C2),(A2,B1,C1),(A2,B1,C2),(A2,B2,C1),(A2,B2,C2),(A2,B3,C1),(A2,B3,C2),(A3,B1,C1),(A3,B1,C2),(A3,B2,C1),(A3,B2,C2),(A3,B3,C1),(A3,B3,C2),(A4,B1,C1),(A4,B1,C2),(A4,B2,C1),(A4,B2,C2),(A4,B3,C1),(A4,B3,C2),(A5,B1,C1),(A5,B1,C2),(A5,B2,C1),(A5,B2,C2),(A5,B3,C1),(A5,B3,C2),基本事件的总数为30.题型二 回归分析思想
在回归分析中,我们可以使用散点图观察两个变量间的相关关系,也可以大致分析回归方程是否有实际意义,这就体现出我们数学中常用的数形结合思想.例2 某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关系,随机抽取10户进行调查,其结果如下:(1)作出散点图;解 作出散点图如图所示,由图可知月人均生活费与月人均收入之间具有较强的线性相关关系.(2)求出回归直线方程;(3)试预测月人均收入为1 100元和月人均收入为1 200元的两个家庭的月人均生活费.将x=1 100代入,得y≈784.61,
将x=1 200代入,得y≈850.60.故预测月人均收入分别为1 100元和1 200元的两个家庭的月人均生活费分别为784.61元和850.60元.跟踪演练2 对变量x,y有观测数据(xi,yi) (i=1,2,…,10),得散点图1;对变量u,v有观测数据(ui,vi) (i=1,2,…,10),得散点图2.其相关系数分别为r1,r2,由这两个散点图可以判断(  )A.r1>0,r2>0 B.r1>0,r2<0
C.r1<0,r2>0 D.r1<0,r2<0
答案 C题型三 转化与化归思想在回归分析中的应用
回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题.例3 在试验中得到变量y与x的数据如下表:
试求y与x之间的回归方程,并预测x=40时,y的值.解 作散点图如图所示,从散点图可以看出,两个变量x,y不呈线性相关关系,根据学过的函数知识,样本点分布的曲线符合指数型函数y=c1e ,通过对数变化把指数关系变为线性关系,令z=ln y,则z=bx+a(a=ln c1,b=c2).c2x列表:作散点图如图所示,从散点图可以看出,两个变量x,z呈很强的线性相关关系.由表中的数据得到线性回归方程为: =0.277x-3.998.所以,当x=40时,y=e0.277×40-3.998≈1 190.347.跟踪演练3 在某化学实验中,测得如下表所示的6对数据,其中x(单位:min)表示化学反应进行的时间,y(单位:mg)表示未转化物质的质量.(1)设y与x之间具有关系y=cdx,试根据测量数据估计c和d的值(精确到0.001);
解 (1)在y=cdx两边取自然对数,令ln y=z,ln c=a,ln d=b,则z=a+bx.由已知数据,而ln c=3.905 5,
ln d=-0.221 9,故c≈49.675,d≈0.801,
所以c、d的估计值分别为49.675,0.801.(2)估计化学反应进行到10 min时未转化物质的质量(精确到0.1).
解 当x=10时,由(1)所得公式可得y≈5.4(mg).
故化学反应进行到10 min时未转化物质的质量为5.4 mg.课堂小结
1.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出散点图,观察它们之间的关系.(3)由经验确定回归方程的类型.(4)按照一定的规则估计回归方程中的参数.
2.独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法.而利用假设的思想方法,计算出某一个随机变量χ2的值来判断更精确些.