课件35张PPT。章末复习第一章 统计案例学习目标
1.会求线性回归方程,并用回归直线进行预报.
2.理解独立性检验的基本思想及实施步骤.知识梳理达标检测题型探究内容索引知识梳理1.最小二乘法
对于一组数据(xi,yi),i=1,2,…,n,如果它们线性相关,则线性回归
方程为 =_________________= ,=
_______ .2.2×2列联表a+bc+da+cb+d其中n= 为样本容量.a+b+c+d3.独立性检验
常用随机变量
K2= 来检验两个变量是否有关系.1.选用的模型不当是产生随机误差的原因之一.( )
2.相关系数r=-0.85,说明两个变量相关性较弱.( )
3.在散点图大致呈线性时,求得回归方程才有意义.( )
4.等高条形图能展示列联表数据的占比.( )
5.利用随机变量K2进行独立性检验时,其值越小,犯错误的概率越小.
( )
6.独立性检验若得出结论有99%的可信度,则意味着这个结论一定是正确的.
( )[思考辨析 判断正误]√×√√××题型探究例1 为了估计山上积雪融化后对下游灌溉的影响,在山下建立了一个观测站,测量了最大积雪深度x(尺)与当年灌溉面积y(千亩),得到连续10年的数据如下表:类型一 线性回归分析试求线性回归方程.解答解 为了研究这些数据中所蕴含的规律,我们把各年最大积雪深度作为横坐标,相应的灌溉面积作为纵坐标,作散点图如图所示.从图中看到,数据点大致落在一条直线附近,这告诉我们变量x与y之间的关系大致可看作是线性关系;
从图中还看到,这些点又不都在一条直线上,这表明x与y的关系并没有确切到给定x就可以唯一确定y的程度.事实上,还有许多其他因素对y产生影响,如当年的平均气温、当年的降雨量等,这些都是影响y取值的随机因素.
如果我们研究x与y的关系,利用公式,得:反思与感悟 解决回归分析问题的一般步骤
(1)画散点图.根据已知数据画出散点图.
(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程.
(3)回归分析.画残差图或计算R2,进行残差分析.
(4)实际应用.依据求得的回归方程解决实际问题.跟踪训练1 菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水x(单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y(单位:微克)的统计表:(1)在坐标系中描出散点图,并判断变量x与y的相关性;解答解 作图(略),负相关.解答解答∴为了放心食用该蔬菜,估计需要用4.5千克的清水清洗一千克蔬菜.例2 某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)类型二 独立性检验(1)根据以上数据完成下面的2×2列联表:解答解 2×2列联表如下:(2)能否在犯错误的概率不超过0.010的前提下可以认为“其亲属的饮食习惯与年龄有关”?并写出简要分析.解答所以在犯错误的概率不超过0.010的前提下认为“其亲属的饮食习惯与年龄有关”.反思与感悟 解决一般的独立性检验问题的步骤
(1)通过列联表确定a,b,c,d,n的值,根据实际问题需要的可信程度确定临界值k0.(3)如果k≥k0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α.解答跟踪训练2 为了响应“文化强国建设”号召,某市把社区图书阅览室建设增列为重要的民生工程.为了解市民阅读需求,随机抽取市民200人做调查,统计显示,男士喜欢阅读古典文学的有64人,不喜欢的有56人;女士喜欢阅读古典文学的有36人,不喜欢的有44人.能否在犯错误的概率不超过0.25的前提下认为喜欢阅读古典文学与性别有关系?参考数据:解 根据所给条件,制作列联表如下:由所给临界值表可知,在犯错误的概率不超过0.25的前提下可以认为喜欢阅读古典文学与性别有关.达标检测12341.已知线性回归方程 =2+2.5x,若变量x每增加1个单位,则
A.y平均增加2.5个单位 B.y平均增加1个单位
C.y平均减少2.5个单位 D.y平均减少2个单位答案√解析2.在对两个变量x,y进行回归分析时有以下操作:
①求回归方程;
②收集数据(xi,yi),i=1,2,…,n;
③对所求出的回归方程作出解释;
④根据所收集的数据绘制散点图.
则下列操作顺序正确的是
A.③②④① B.①②④③ C.②①③④ D.②④①③答案√1234解析解析 根据回归分析的思想,可知对两个变量x,y进行回归分析时,应先收集数据(xi,yi),然后绘制散点图,再求回归方程,最后对所求的回归方程作出解释,正确操作的顺序为②④①③,故选D.3.某机构调查中学生的近视情况,了解到某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力
A.平均数 B.方差
C.回归分析 D.独立性检验答案√1234解析1234答案24解析 首先把两组值代入线性回归方程,得令x+14=38,可得x=24,即当x=24时,y的估计值是38.1.建立回归模型的基本步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
(2)画出散点图,观察它们之间的关系;
(3)由经验确定回归方程的类型;
(4)按照一定的规则估计回归方程中的参数;
(5)得出结果后分析残差图是否有异常.
2.独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法.常用的直观方法为等高条形图,等高条形图由于是等高的,因此它能直观地反映两个分类变量之间的差异的大小,而利用假设的思想方法,计算出某一个随机变量K2的值来判断更精确些.本课结束