选修1-2第一章统计案例的课件(浙江省台州市椒江区)

文档属性

名称 选修1-2第一章统计案例的课件(浙江省台州市椒江区)
格式 rar
文件大小 3.8MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2007-11-06 22:34:00

文档简介

课件18张PPT。1.1 回归分析的基本思想及其初步应用(1)1.求回归直线方程例:某单位对口支援西部开发,现从报名的18名
志愿者中选取6人组成志愿小组到西藏工作3年,
请用抽签法设计抽样方案。第一步:将18名志愿者编号,号码是01,02,…,18; 第二步:将号码分别写在一张纸上,制成号签;第三步:将得到的号签放入一个容器中,并充分搅匀;第四步:从容器中逐个不放回地依次抽取6个号签,并记录上面的编号;第五步:所得的号码对应的志愿者就是支援小组的成员。2.随机数法例:从800袋牛奶中抽取60袋进行质量检查,利用
随机数法设计抽样方案。第一步:将800袋牛奶编号,号码是000,001,…,799; 第二步:在随机数表中任选一个数作为开始,例如选出第8行第7列的数“7”;第三步:从数“7”开始,向右读,得到一个三位数785,由于785<799,说明号码785在总体编号内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507, …,依次下去,直到样本的60个号码全部取出;第四步:以上号码对应的60袋牛奶就是要抽取的对象。用随机数法抽取样本的步骤:①将总体中的所有个体编号(每个号码位数一致);②在随机数表中选定开始的数字(确定行数列数);③从选定的数开始按一定方向读数,若得到的号码大于总体编号或与前面所取出的号码重复的去掉,如此进行下去,直到取满为止;④根据选定的号码抽取样本。练习:要从某厂生产的300台机器中用随机数表法
抽出10台作为样本,试设计抽样方案。第一步:将300台机器编号,号码是000,001,…,299; 第二步:在随机数表中任选一个数作为开始,例如选出第3行第2列的数“6”;第三步:从数“6”开始,向右读,每次读取3位,凡不在000~299中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到:026,141,012,269,050,101,243,099,006,184;第四步:以上号码对应的10台机器就是要抽取的对象。思考:当N=100时,分别以0,1,3,6为起点对
总体编号,再利用随机数表抽取10个号码,
你能说出从0开始对总体编号的好处吗? 当总数为100时,从0开始编号,那么用两位
数字即可,因此可以节省从随机数表中抽取随机数
的时间。2.1 随机抽样2.1.2 系统(等距)抽样探究:某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查。方法:系统抽样的步骤:(1)先将总体的N个个体编号;(2)确定分段间隔k,对编号进行分段。
当N/n是整数时,取k= N/n;(3)在第一段用简单随机抽样确定第一个个体编号l(l≤k);(4)以l为起始号码,每间隔k个号码抽取,直到获取整个样本。练习:从含有100个个体的总体中抽取20个样本,
请用系统抽样法给出抽样过程。第一步:将100个个体编号,号码是001,002,…,100; 第二步:由于100÷20=5,则将编号按顺序每5个一段,分成20段;第三步:在第一段001,002, …, 005这五个编号中用简单随机抽样法抽出一个(如004)作为起始号码;第四步:将编号为004,014,024,034,044,054,064,074,084,094的个体抽出,组成样本。例:从某厂生产的802辆轿车中随机抽取80辆测试
某项功能,请合理选择抽样方法,并写出过程。第一步:将802辆轿车编号,号码是001,002,…,802; 第二步:用随机数表法随机抽取2个号码,如016,378,将编号为016,378的2辆轿车剔除;第三步:将剩下的800辆轿车重新编号,号码为1,2, …, 800,并分成80段,间隔为10;第四步:在第一段1,2, …, 10这十个编号中用抽签法抽出一个(如数5)作为起始号码;第五步:由第5号开始,把5,15, 25,…, 795共80个号码取出,这80个号码所对应的轿车组成样本。练习:一批电视机中,有TCL厂生产的56台,长虹
厂生产的42台,用分层抽样的方法从中抽出
一个容量为14的样本。试确定各厂被抽取电
视机的台数。练习:某大学数学系本科生有1200名学生,其中
大一、大二、大三、大四学生的比例为
4:3:2:1,现从所有学生中用分层抽样的
方法抽取一个容量为400人的样本, 应分别
抽取多少人?大一应抽取40人,
大二应抽取30人,
大三应抽取20人,
大四应抽取10人。(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法(也可采用随机数表法); (2)当总体容量较大,样本容量较小时可用随机数表法;(3)当总体容量较大,样本容量也较大时,可用系统抽样法;(4)当总体由差异明显的几部分组成时,可用分层抽样法。共同特点:均为不放回抽样,在抽样过程中每一个个体被抽取的机会是相等的。探究(2):解:由于总体由差异明显的几个部分组成,所以应采用分层抽样法进行抽样,根据题意应分为9层,样本容量与总体容量之比为1:1000,则各层抽取的学生人数依次为第一步:确定抽样比,即样本容量与总体容量之比为1:1000; 第二步:确定各层个数,利用抽样比确定各地区学生数为357、222、258、226、134、113、112、43、6;第五步:利用系统抽样法分别在城市小学、县镇小学、农村小学、城市初中、县镇初中、农村初中、城市高中、县镇高中、农村高中的学生中抽取357、222、258、226、134、113、112、43、6人,然后合在一起,就是要抽取的样本。即357、222、258、226、134、113、112、43、6。练习:1. 在下列问题中,各采用什么抽样方法抽取样本较为合适?(1)从20台彩电中抽取4台进行质量检验;(2)科学会堂有32排座位,每排有40各座位(座位号为01~40),一次报告会坐满了听众,会后为了听取意见,留下了座位号为18的所有的32名听众进行座谈;(3)实验中学有180名教工,其中有专职教师144名,管理人员12名,后勤服务人员24人,今从中抽取一个容量15的样本。简单随机抽样法系统抽样法分层抽样法2. 下列抽样试验中不是系统抽样的是( )。A. 从标有1~15号的15个球中,任选3个作为样本,按从小号到大号排序,随机选起点i16227794394954435482173793237887352096438456349164
84421753315724550688770474476721763350258392120676
63106378591695556719981050717512867358074439523879
33211234297864560782524207443815510013429966027954
57608662440947279654491746096290528477270802734328 课件14张PPT。统计案例之回归方程表示解释变量(x)和 随机误差(e)的 总效应。 :表示随机误差的效应.(列表法)练:某种产品的广告费支出x与销售额y之间有如表所示数据:(1)求x,y之间的相关系数;
(2)求线性回归方程;
(3)求总偏差平方和及残差平方和;
(4)求R2,说明模型的拟合效果,残差变量对销售额的影响百分比.残差分析54.37354.37347.58158.61862.86354.37345.88358.618-6.3732.6272.419-4.6181.1376.627-2.8830.382-6.3732.6272.419-4.6181.1376.627-2.8830.382我们利用图形来分析残差特性,作图时纵坐标为残差,横坐
标可以选为样本编号、身高等,这样作出的图形叫做残差图可以看出第1个样本点和第6样本点的残差比较大,对下表给出的数据,使用最小二乘法求水稻产量y对化
肥用量x的回归直线,(1)求x与y的相关系数r,并判断它们的相关性强弱;(3)求残差平方和,总偏差平方和;(2)求回归方程;(4)求相关指数,说明拟合效果,残差变量对水稻产量影响的百分比. (5) 对回归模型进行残差分析,求出有可疑的数. 一只红铃虫的产卵数y和温度x有关,现收集了7组数据,试建立y与x的回归方程(1)收集数据,作散点图。 求y,关键求a,b 两边取自然对数,得 回归方程1.9462.3983.0453.1784.1904.7455.784方法:把非线性的回归问题化为线性问题来考虑,
通过变换来实现。(1)根据数据,作散点图 ;(2)由经验确定回归方程的类型(如观察到数据呈
线性关系,则选用线性回归方程y=bx+a) ;练习:下表时1957年美国旧轿车价格的调查资料,今以x表示使用年限,y表示年均价格(1)画散点图,观察图形呈什么函数模型?
(2)求该变量间的是否有显著相关关系?
(3)求该模型回归方程.
(4)预测使用10年时,年均价格为多少?由散点图看出y与x呈指数关系7.8837.5727.3096.9916.6406.2886.1825.6705.420课件17张PPT。
独立性检验 某医疗机构为了了解患肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个成年人,其中吸烟者2148人,不吸烟者7817 人,调查结果是:吸烟的2148 人中49人患肺癌, 2099人不患肺癌;不吸烟的7817人中42人患肺癌, 7775人不患肺癌。
●根据这些数据能否断定:患肺癌与
吸烟有关?问题:问题:为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)列联表0.54%2.28%1)通过图形直观判断三维柱状图2) 通过图形直观判断
二维条形图3)通过图形直观判断患肺癌
比例不患肺癌
比例问题1:判断的标准是什么?吸烟与不吸烟,患病的可能性的大小是否有差异?说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大问题2:差异大到什么程度才能作出“吸烟与患病有关”的判断?问题3:能否用数量刻画出“有关”的程度? 独立性检验H0: 吸烟和患肺癌之间没有关系
通过数据和图表分析,得到结论是:吸烟与患肺癌有关结论的可靠程度如何? 吸烟的人中患肺癌的比例:不吸烟的人中患肺癌的比例:若H0成立 独立性检验引入一个随机变量:卡方统计量作为检验在多大程度上可以认为“两个变量有关系”的标准 。 独立性检验通过公式计算 独立性检验故有99.9%的把握认为H0不成立,即有99.9%的把握认为“患肺癌与吸烟有关系”。2×2列联表一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类
取值,即类A和B(如吸烟与不吸烟);Ⅱ也有两类
取值,即类1和2(如患病与不患病)。于是得到
下列联表所示的抽样数据:要推断“Ⅰ和Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0 :Ⅰ和Ⅱ没有关系;(3)查对临界值,作出判断。反证法原理与假设检验原理反证法原理: 在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。例1.在500人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能否起到预防感冒的作用?