(共24张PPT)
§1 从普查到抽样
1.普查
(1)概念
普查是指一个国家或一个地区专门组织的一次性大规模的全面调查.目的是为了详细地了解某项重要的国情、国力.
(2)普查主要有两个特点:
①所取得的资料更加全面、系统;
②主要调查在特定时段的社会经济现象总体的数量.
(3)普查的种类
目前,我国所进行的普查主要有:人口普查、农业普查、工业普查、第三产业普查、基本单位普查等.
【做一做1】 下列调查工作需要采用普查方式的是 ( )
A.医院对某人的血液检查
B.电视台对某节目收视率的调查
C.某企业给工人定做工作服前的尺寸大小的调查
D.质检部门对各个厂家生产的奶粉合格率的调查
答案:C
2.抽样调查
(1)相关概念
从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推断,这就是抽样调查.其中,调查对象的全体称为总体,被抽取的一部分称为样本.
(2)与普查相比,抽样调查最突出的优点有两点:
①迅速、及时;
②节约人力、物力和财力.
(3)随机抽样
在抽样中,如果每个样本被抽到的概率相同,这种抽样称为随机抽样.
【做一做2】 抽样调查在抽取调查对象时( )
A.按一定的方法抽取
B.随便抽取
C.全部抽取
D.根据个人的喜好抽取
答案:A
归纳总结普查与抽样调查的对照表
思考辨析
判断下列说法是否正确,正确的在后面的括号里画“√”,错误的画“×”.
(1)有些调查具有破坏性,不适宜用普查. ( )
(2)要了解中央电视台的某个法制栏目的收看情况,应采取普查方式. ( )
(3)要保证某载人飞船发射成功,对重要零件适宜采取抽样调查方式. ( )
(4)要了解外国人对“博鳌亚洲论坛”的关注度,可采用抽样调查方式. ( )
答案:(1)√ (2)× (3)× (4)√
探究一
探究二
探究三
思维辨析
当堂检测
普查与抽样调查的选用
【例1】 (1)在某传染病严重流行期间,学校、车站、机场等公共场所设有体温监测仪,检查这些公共场所的所有人员的体温,这是对这些公共场所人员的普查还是抽样调查 为什么要采取这种调查方式
(2)国家质检局对某品牌某一批号的婴幼儿奶粉进行质量检查,应采用哪种调查方法 并说明其合理性.
解:(1)普查.这种调查方式虽然耗费大量的人力、物力、财力,但对于防止传染病的蔓延非常有效,可以准确查出并隔离疑似传染病人.
(2)应采用抽样调查的方法.因为这是破坏性的检查,不可能进行普查,而且是从同一批产品中随机抽取,所以对抽取的部分产品进行检查所得到的结果基本能代表全体产品的情况.故选用该方法是合理的.
探究一
探究二
探究三
思维辨析
当堂检测
反思感悟对生活中实际问题的调查,往往需要选用合适的调查方式,这要根据调查对象的特点、普查的特点、抽样调查的特点来确定.一般地,(1)若需要调查所有对象,则选用普查的方式;(2)若调查具有破坏性或无法实现,则选用抽样调查的方法.
探究一
探究二
探究三
思维辨析
当堂检测
变式训练1指出下列问题适合用普查还是抽样调查.
(1)某学校为了掌握全体教师的身体健康状况,请一家医院对全体教师进行体检;
(2)某渔民想知道他的鱼塘所养的鱼的成长状况;
(3)银行在收进储户现金时检验有没有假钞;
(4)英语老师在课堂上用10分钟的时间了解班里同学记单词和短语的情况.
解:(1)普查.
(2)抽样调查.
(3)普查.
(4)抽样调查.
探究一
探究二
探究三
思维辨析
当堂检测
普查方案的设计
【例2】 高一新生入校后,某班主任想全面了解班内48名同学的家庭状况,以便于班级的管理工作,请你帮助班主任设计一个调查方案.
解:由于该班有48名同学,人数不是太多,而且为了班级工作的需要,班主任应全面地了解班内每名同学的家庭状况,因此应采取普查的方式进行调查.可采用表格的形式,表格中包括家庭居住地、家庭成员、父母工作状况、父母联系方式、户籍所在地等,将表格发放给每一名学生,学生填写后,全部收回,然后班主任进行统计,这样就可以了解每一名学生的家庭状况了.(答案不唯一,合理即可)
探究一
探究二
探究三
思维辨析
当堂检测
反思感悟1.若想要调查在特定时段、特定情形下总体的相关情况,且总体数量不是很大的时候,一般采用普查的方法.
2.对总体进行普查时,可通过设计表格、调查问卷等形式,获得总体中每个对象的相关信息,然后进行整体分析,了解情况.
探究一
探究二
探究三
思维辨析
当堂检测
抽样调查中的公平性与代表性
【例3】 为了缓解城市的交通拥堵情况,某城市准备出台限制私家车的政策,为此要进行民意调查,某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样
解:由于要出台限制私家车的政策,抽样调查的市民又是拥有私家车的市民,因此调查结果倾向于反对出台限制私家车的政策.
如果要调查出市民对政策的真实意见,需要对市民的各个群体进行抽样调查,还需要对一些社会团体(比如公交公司、消防、医院等)的运营状况进行调查,这样才能比较真实地反映出社会的实际情况,了解市民的心声.
探究一
探究二
探究三
思维辨析
当堂检测
反思感悟(1)在抽样时必须做到抽样的随机性,即为了使抽取的样本能够很好地反映总体,必须排除人为主观因素的影响,使收集到的样本数据与总体的情况基本吻合.
(2)抽样的过程必须科学、合理,使所有个体被抽到的可能性相等,即按随机原则抽取样本,同时可以按照一定的可能性来保证将抽样误差控制在规定的范围内.
探究一
探究二
探究三
思维辨析
当堂检测
变式训练2为调查某小区平均每户居民的月用水量,下面是2名同学设计的方案:
学生甲:我把这个小区用水量调查表放在互联网上,只要登录网站的人就可以看到这张表,他们填的表可以很快地反馈到我的电脑中,这样就可以很快估算出小区平均每户居民的月用水量;
学生乙:我给我们居民小区的每一个住户发一张用水量调查表,大概需要一周左右的时间就可以统计出小区平均每户居民的月用水量.
请你分析上述2名学生设计的调查方案,他们能够获得平均每户居民的月用水量吗 为什么
探究一
探究二
探究三
思维辨析
当堂检测
解:学生甲的方案得到的样本不能够反映不上网的居民的用水情况,它是一种方便样本,所得到的样本代表性差,不能准确地获得平均每户居民的月用水量.
学生乙的方案实际上是普查,花费的人力、物力更多一些,但是只要统计过程不出错,就可以准确地得到平均每户居民的月用水量.
探究一
探究二
探究三
思维辨析
当堂检测
对总体、个体、样本的概念理解不清而致误
【典例】为了了解参加市运动会的268名运动员的身高情况,从中抽取30名运动员进行测量,下列说法正确的是( )
A.总体是268名运动员
B.个体是每一个运动员
C.30名运动员的身高是一个个体
D.样本容量是30
错解A
解析:因为该问题是要了解参加市运动会的268名运动员,所以总体应为268名运动员.
探究一
探究二
探究三
思维辨析
当堂检测
正解D
解析:根据统计的相关概念并结合题意可得,此题的总体、个体、样本这三个概念的考察对象都是运动员的身高,而不是运动员,并且一个个体是指一名运动员的身高.在这个问题中,总体是268名运动员的身高,个体是每个运动员的身高,样本是30名运动员的身高,样本容量是30.
纠错心得1.本题产生错误的根本原因是对总体、个体、样本的概念理解不清而造成的,误将考察的对象当作运动员本身.
2.要纠正此类问题,一定要看清考查对象的研究范围,不要仅靠表面字意而妄下结论.
探究一
探究二
探究三
思维辨析
当堂检测
变式训练为了了解高一(2)班56名同学的期中考试总分成绩情况,现从中抽取了15名学生进行分析,则该试验的样本是 ;样本容量是 .
答案:15名学生的期中考试总分成绩 15
探究一
探究二
探究三
思维辨析
当堂检测
1.下列调查必须采用普查的是( )
A.调查某品牌电视机的市场占有率
B.调查某电视连续剧在全国的收视率
C.调查高一(1)班的男、女同学的比例
D.调查某型号炮弹的射程
答案:C
2.对于下列调查:①海拔高度对生物的影响;②全国人口普查;③高考体检;④对中学生视力进行调查.其中适宜用抽样调查的是( )
A.①② B.①④ C.②③ D.③④
答案:B
探究一
探究二
探究三
思维辨析
当堂检测
3.一名交警在高速路上随机观测了6辆车的行驶速度,然后作出了一份报告,调查结果如下表:
(1)交警采取的调查方式是 .
(2)这次调查的样本是 ,个体是 .
答案:(1)抽样调查 (2)6辆车的行驶速度 每一辆车的行驶速度
探究一
探究二
探究三
思维辨析
当堂检测
4.下列调查属于抽样调查的是 .(只填序号)
①为了了解高一(4)班每个学生的视力情况,对全班同学进行调查;
②为了了解人们对2017年春节联欢晚会(央视)的收视情况,对部分电视观众进行调查;
③某乳业公司对其当天生产的液态奶制品进行质量检验;
④医生检验某病人血液中血糖的含量.
答案:②③④
探究一
探究二
探究三
思维辨析
当堂检测
5.某校有高中学生900人,校医务室想对全体高中学生的身高情况做一次调查,为了不影响正常教学活动,准备抽取50名学生作为调查对象.校医务室从高一年级中抽取50名学生的身高来估计全校高中学生的身高,你认为这样的调查结果是否可信
解:不可信.因为学生的身高会随着年龄的增长而增高,校医务室想了解全校高中学生的身高情况,在抽样时应当关注高中各年级学生的身高,并且还要分性别进行抽查.如果只抽取高一年级的学生,结果一定是片面的,所以调查结果不可信.(共28张PPT)
2.1 简单随机抽样
1.简单随机抽样
(1)定义
如果在抽样过程中,随机地抽取一部分个体,然后对抽取的对象进行调查,在抽取的过程中,要保证每个个体被抽到的概率相同,这样的抽样方法就叫作简单随机抽样.
(2)简单随机抽样的具体实施方法
在总体的N个个体中机会均等地抽取第一个,然后在剩下的(N-1)个个体中机会均等地抽取第二个……最后在剩余的[N-(n-1)]个个体中机会均等地抽取第n个.
用这种抽样方法,每一个被抽到的概率是相同的.
【做一做1】 全国高中数学联合竞赛是中国高中数学学科的较高等级的数学竞赛,在每年9月第二个星期日举行,在这项竞赛中取得优异成绩的全国约200名学生有资格参加由中国数学会主办的中国数学奥林匹克(CMO).某校从初赛成绩优秀的52名学生中选取5名学生参加省赛,若采用简单随机抽样抽取,则每人入选的可能性( )
答案:C
2.抽签法
(1)定义
先把总体中的N个个体编号,并把编号写在形状、大小相同的签上(签可以是纸条、卡片或小球等),然后将这些号签放在同一个箱子里均匀搅拌.每次随机地从中抽取一个,然后将号签均匀搅拌,再进行下一次抽取.如此下去,直至抽到预先设定的样本数.
(2)实施步骤
①给调查对象群体中的每个对象编号;
②准备“抽签”的工具,实施“抽签”;
③对样本中每一个个体进行测量或调查.
【做一做2】 一个班级中有30名学生,若用抽签法抽取15人,则每个个体被抽到的可能性是 .
3.随机数法
(1)定义
把总体中的N个个体依次编上0,1,…,N-1的号码,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生0,1,…,N-1中的随机数,产生的随机数是几,就选几号个体,直至抽到预先规定的样本数.利用产生的随机数来抽取样本,这种方法称为随机数法.
(2)利用随机数表抽取样本的实施步骤
①将总体中的个体编号;
②在随机数表中任选一个数作为开始;
③规定读取数字的方向;
④开始读取数字,若不在编号中,则跳过,前面已经读过的也跳过,若在编号中,则取出,依次取下去,直到取满为止,相同的号只取一次;
⑤根据选定的号码抽取样本.
【做一做3】 总体由编号为001,002,003,…,299,300的300个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第3,4,5列数字开始由左到右依次选取三个数字,则选出来的第5个个体的编号为 ( )
7816 6572 0802 6314 0702 4369 9728
0198 3204 9234 4935 8200 3623 4869
6938 7481
A.080 B.263 C.140 D.280
答案:D
思考辨析
判断下列说法是否正确,正确的在后面的括号里画“√”,错误的画“×”.
(1)当总体容量较小,样本容量较小时,宜采用抽签法抽取样本. ( )
(2)当总体容量较大,样本容量较小时,宜采用随机数法抽取样本. ( )
答案:(1)√ (2)√
探究一
探究二
探究三
思维辨析
当堂检测
简单随机抽样的判断
【例1】 判断下列抽样是不是简单随机抽样 为什么
①从无数个个体中抽取20个个体作为样本;
②从某种型号的30部手机中一次性取出5部手机进行质量检测;
③箱子里共有100个零件,从中选取10个零件进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检测后再把它放回箱子里;
④一彩民选号,从装有36个大小、形状、质地都相同的号签的盒子中无放回地抽出6个号签;
⑤某班有54名同学,指定数学成绩较好的6名同学参加数学竞赛.
探究一
探究二
探究三
思维辨析
当堂检测
解:①不是简单随机抽样.因为简单随机抽样要求被抽取样本的总体的个体数是有限的.
②不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.
③不是简单随机抽样.因为简单随机抽样要求是不放回抽样.
④是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.
⑤不是简单随机抽样.因为指定了数学成绩较好的6名同学参加竞赛,不存在随机性,不是等可能抽样.
探究一
探究二
探究三
思维辨析
当堂检测
反思感悟1.判断一个抽样是不是简单随机抽样的关键点,一是看总体的个数是否有限,二是看抽取过程是不是逐个、不放回、等可能抽样.
2.在简单随机抽样过程中,每一个个体被抽到的可能性都是 ,其中,n是样本容量,N是总体容量.
探究一
探究二
探究三
思维辨析
当堂检测
变式训练1下面抽样方法是简单随机抽样的是 ( )
A.从平面直角坐标系中抽取5个点作为样本
B.可口可乐公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查
C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动
D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编好号,对编号随机抽取)
解析:A中平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;B中一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;C中挑选50名最优秀的战士,不符合简单随机抽样的等可能性,故错误.
答案:D
探究一
探究二
探究三
思维辨析
当堂检测
抽签法的应用
【例2】 学校要组织学生参加植树活动,要求每班选派男生10名,女生6名,现高一(1)班有男生32名,女生28名准备被随机选派.试用抽签法确定该班参加植树的同学.
分析:按照抽签法的步骤进行:编号→制签→搅拌均匀→抽签→确定样本.
探究一
探究二
探究三
思维辨析
当堂检测
解:按照以下步骤进行抽样:
第一步 将32名男生从0到31编号;
第二步 用大小、形状、质地都相同的纸条做成32个号签,在每个号签上写上这些编号;
第三步 将写好的号签放在一个箱子中摇匀,不放回地逐个从中抽取10个号签;
第四步 抽取到的编号对应的男生参加植树活动.
重复上述的方法步骤,从28名女生中随机抽取6名女生参加植树活动.
探究一
探究二
探究三
思维辨析
当堂检测
反思感悟1.利用抽签法抽取样本时,对个体的编号问题可视情况灵活处理,若个体没有编号,应首先编号;若个体已有编号,如考号、学号、序号等,可不必重新编号.
2.号签一定要大小、形状、质地完全相同.
3.号签制好后一定要将其搅拌均匀,这样才能保证抽签的随机性、公平性.
探究一
探究二
探究三
思维辨析
当堂检测
变式训练2(2018安徽仙桃高一同步检测)2022年第24届冬季奥林匹克运动会将在北京市和张家口市联合举行,这是中国历史上第一次举办冬季奥运会.组委会计划从某高校报名的20名志愿者中选取5人组成奥运志愿小组,请用抽签法设计抽样方案.
分析:总体的容量为20,抽取的样本容量为5,容量都较小,所以可用抽签法抽取样本.
解:(1)将20名志愿者编号,号码分别是01,02,…,20;
(2)将号码分别写在20张大小、形状都相同的纸条上,揉成团,制成号签;
(3)将所得号签放在一个不透明的袋子中,并搅拌均匀;
(4)从袋子中依次不放回地抽取5个号签,并记录下上面的编号;
(5)所得号码对应的志愿者就是志愿小组的成员.
探究一
探究二
探究三
思维辨析
当堂检测
随机数法的应用
【例3】 (1)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为( )
A.08 B.07 C.02 D.01
(2)现有一批编号为10,11,12,…,99,100,…,600的零件,打算从中抽取一个容量为6的样本进行质量检验,如何用随机数法设计抽样方案
探究一
探究二
探究三
思维辨析
当堂检测
(1)解析:由题意知选定的第一个数为65(第1行的第5列和第6列),按由左到右选取两位数(大于20的跳过、重复的不选取),前5个个体编号为08,02,14,07,01.故选出来的第5个个体的编号为01.
答案:D
(2)分析:为了便于编号,将每个零件的编号加100.
解:第一步 将每个零件的编号加100,重新编号为110,111,…,700.
第二步 在随机数表中任选一数作为开始,比如在教材表1-2中的第2列、第3列和第4列的第二行开始,从上到下读数,依次为:204,303,556,635,211,477.
探究一
探究二
探究三
思维辨析
当堂检测
反思感悟1.随机数法适合于个体数较多的总体,抽样的过程要借助于随机数表.
2.利用随机数法抽取样本时,所有个体的号码位数要一致,若不一致,需先调整到一致再进行抽样.
3.用随机数法抽取样本,读数时要结合编号特点进行读取,编号为两位数,则两位、两位地读取,编号为三位数,则三位、三位地读取,若出现重号则跳过,接着读取.
探究一
探究二
探究三
思维辨析
当堂检测
变式训练3(1)用随机数法进行抽样有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定开始的数字;④确定读数的方向.这些步骤的先后顺序应为 ( )
A.③④①② B.①③④②
C.①④③② D.④③①②
(2)有300台机器,编号分别为1,2,3,…,300,为调查机器的质量问题,打算从中抽取10台入样,问此样本若采用随机数法将如何获得
探究一
探究二
探究三
思维辨析
当堂检测
(1)答案:B
(2)解:第一步 将原来的编号调整为001,002,…,300;
第二步 使用教材中的随机数表1-2,随机地确定一个数作为开始,如第8行第10列的数“1”开始,任选一个方向作为读数方向,比如向右读;
第三步 从数“1”开始向右读,每次读三位,凡不在001~300中的数跳过去不读,遇到与前面已经取出的数重复的数也跳过去,便可依次得到164,207,011,116,297,076,269,274,068,072这10个号码,这就是所要抽取的10个样本个体的号码.
探究一
探究二
探究三
思维辨析
当堂检测
因对个体编号设计不合理而致误
【典例】要检验某公司生产的袋装牛奶的质量是否达标,需从1 000袋袋装牛奶中抽取20袋进行检验.利用随机数法抽取样本,写出抽样过程.
错解第一步 将1 000袋牛奶编号1,2,3,…,1 000;
第二步 从随机数表任一位置开始读数,每次读3位,其中超出1~1 000的数不取,重复的数不取,一直取到20个为止;
第三步 将所选出的20个号码所对应的20袋牛奶取出得到样本.
探究一
探究二
探究三
思维辨析
当堂检测
正解第一步 将1 000袋袋装牛奶编号为000,001,…,999;
第二步 从随机数表中任意一个位置,例如从教材表1-2中第1行的第8列、第9列和第10列开始选数,向右读,抽得第1个样本号码208,再依次得到样本号码:026,314,070,243,…,其中超出000~999范围的数和前面已出现的数舍去,一直到选出20个样本号码为止;
第三步 所选出的20个号码对应的20袋袋装牛奶即为所要抽取的样本.
纠错心得本题错误的原因是对个体编号的位数不一致,而实际上,若个体编号位数不一致,每次读取3位数,则编号为1,2,3,…,99,1 000的个体没有被抽到的机会,从而每个个体被抽到的概率就不相等了,这样就造成个体入样可能性不符合抽样要求了.
探究一
探究二
探究三
思维辨析
当堂检测
变式训练用随机数表法进行抽样有以下几个步骤:
①将总体中的个体编号;②获取样本号码;③选定开始的数字.
这些步骤的先后顺序应为( )
A.①②③ B.①③② C.③②① D.③①②
解析:根据随机数表法的定义和操作步骤可以做出排序.
答案:B
探究一
探究二
探究三
思维辨析
当堂检测
1.某学校为了解高一800名新入学同学的数学学,从中随机抽取100名同学的中考数学成绩进行分析,在这个问题中,下列说法正确的是( )
A.800名同学是总体 B.100名同学是样本
C.每名同学是个体 D.样本容量是100
解析:据题意,总体是指800名新入学同学的中考数学成绩,样本是指抽取的100名同学的中考数学成绩,个体是指每名同学的中考数学成绩,样本容量是100,故只有D正确.
答案:D
探究一
探究二
探究三
思维辨析
当堂检测
2.下列抽样方法是简单随机抽样的是( )
A.妈妈从小贩的菜筐里挑了5根黄瓜
B.电视上一人从庙里一次性求了3支签
C.从湖里捞出20尾鱼苗研究生长情况
D.博尔特从8个跑道中随机抽取一个跑道试跑
答案:D
探究一
探究二
探究三
思维辨析
当堂检测
3.假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验.利用随机数法抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第8行第7列的数开始向右读,请你依次写出最先检测的5袋牛奶的编号 . (下面摘取了随机数表第7行至第9行)
答案:785,567,199,507,175
探究一
探究二
探究三
思维辨析
当堂检测
4.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,并写出抽样过程.
解:由于总体容量和样本容量都较小,因此可采用抽签法抽取样本.抽样过程如下:
第一步 将30辆汽车进行编号,号码是1,2,3,…,30;
第二步 将号码分别写在大小、形状、质地都相同的纸条上,揉成团,制成号签;
第三步 将全部号签放入一个不透明的袋子中,并搅拌均匀;
第四步 从袋子中依次抽取3个号签,并记录上面的编号;
第五步 所得号码对应的3辆汽车就是要抽取的对象.(共26张PPT)
2.2 分层抽样与系统抽样
1.分层抽样
(1)定义
将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.
(2)抽象概括
如果知道某一类个体在总体中所占有的百分比,那么按照这个比例抽取这类个体.这样的抽样会提高对总体推断的精度.
【做一做1】 在1 000个球中有红球50个,从中抽取100个进行分析,如果用分层抽样的方法对球进行抽样,则抽取红球的个数应为( )
A.33 B.20 C.5 D.10
解析:由分层抽样知应抽取的红球个数为
答案:C
2.系统抽样
系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.
【做一做2】 若总体中含有210个个体,现在要采用系统抽样,从中抽取一个容量为30的样本,编号后应均分为 段,每段有 个个体.
答案:30 7
规律总结三种抽样方法的比较
思考辨析
判断下列说法是否正确,正确的在后面的括号里画“√”,错误的画“×”.
(1)在分层抽样和系统抽样中某一个个体被抽到的可能性不同,最后一次被抽中的可能性较大. ( )
(2)当总体容量较大,样本容量较大时,宜采用系统抽样法. ( )
(3)当总体中由差异明显的几部分组成时,宜用分层抽样法. ( )
(4)在系统抽样中,为确定分段间隔K,要对编号进行分段,若 不是整数,需要从总体剔除一些个体,以使N'能被n整除,其中剔除个体时“随便”剔除即可. ( )
答案:(1)× (2)√ (3)√ (4)×
探究一
探究二
思维辨析
当堂检测
分层抽样的概念及应用
【例1】 (1)下列问题中,最适合用分层抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.某社区有300户家庭,其中高收入的家庭75户,中等收入的家庭180户,低收入的家庭45户,为了了解生活购买力的某项指标,要从中抽取一个容量为50的样本
C.从1 000名工人中,抽取100人调查上班途中所用的时间
D.从生产流水线上,抽取样本检查产品质量
(2)一支田径运动队有男运动员56人,女运动员42人,现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有 人.
(3)一个单位有职工500人,其中不到35岁的有125人,35岁至50岁的有280人,50岁以上的有95人,为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取
探究一
探究二
思维辨析
当堂检测
(1)解析:生活购买力的某项指标与家庭的收入情况密切相关,因此可认为总体中这300户家庭生活购买力的某项指标存在明显差异,故适合采用分层抽样的方法抽取样本,故选B.
答案:B
(2)解析:利用男女抽取比例相等解题.
设抽取的女运动员有x人,则 ,解得x=6.
答案:6
探究一
探究二
思维辨析
当堂检测
(3)解:应该用分层抽样来抽取样本,步骤如下.
①分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至50岁的职工;50岁以上的职工.
③在各层分别按抽签法或随机数法抽取样本.
④综合每层抽样,组成样本.
探究一
探究二
思维辨析
当堂检测
反思感悟分层抽样的步骤与特点
1.分层抽样的步骤
(1)将总体按照不同的类型来分层;
(2)计算各层的个体数与总体中的个体数的比;
(3)按照每层的个体数占总体个体数的比确定各层应抽取的个体数;
(4)对每一层进行随机抽样;
(5)综合每层抽取的个体,得到样本.
探究一
探究二
思维辨析
当堂检测
探究一
探究二
思维辨析
当堂检测
变式训练1(1)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行 ( )
A.每层等可能抽样
B.每层不等可能抽样
C.所有层按同一抽样比等可能抽样
D.所有层抽同样多样本,等可能抽样
(2)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取 名学生.
(3)某单位有职工900人,其中青年职工450人,中年职工270人,老年职工180人.该单位为了了解职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为10人,则样本容量为 .
探究一
探究二
思维辨析
当堂检测
解析:(1)保证每个个体等可能入样是简单随机抽样、系统抽样、分层抽样的共同特征.为了保证这一点,分层时用同一抽样比是必不可少的.
答案:(1)C (2)15 (3)20
探究一
探究二
思维辨析
当堂检测
系统抽样的概念及应用
【例2】 (1)下列抽样中是系统抽样的有 .(填序号)
①从标有1~15的15个球中,任取3个作为样本,按从小号到大号排序,随机选起点i0,以后i0+5,i0+10(超过15则从1再数起)号入样.
②在用传送带将工厂生产的产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品进行检验.
③做某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止.
④电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈.
(2)从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.
探究一
探究二
思维辨析
当堂检测
(1)解析:①选取的样本的编号间隔是相同的,是系统抽样.②选取的样本间的时间间隔是相同的,是系统抽样.③事先不知道总体,并且随机抽取不能保证样本间的间隔相同,所以不是系统抽样.④相邻两排座位号的间隔是相同的,所以是系统抽样.
答案:①②④
探究一
探究二
思维辨析
当堂检测
(2)解:由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:
第一步 先从802辆轿车中剔除2辆轿车(剔除方法可用随机数法);
第二步 将余下的800辆轿车编号为1,2,…,800,并均匀分成80段,每段含 个个体;
第三步 从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个号(如5)作为起始号;
第四步 把起始号依次加上10,即可获得抽取的样本编号(例如5,15,25,…,795);
取出以上编号所对应的个体即可组成样本.
探究一
探究二
思维辨析
当堂检测
反思感悟系统抽样的步骤与特点
1.系统抽样的步骤
一般地,从容量为N的总体中抽取容量为n的样本,可以按照下列步骤进行系统抽样.
探究一
探究二
思维辨析
当堂检测
(3)在第一段编号内用简单随机抽样确定一个个体编号m(m≤k).
(4)按照一定的规则抽取其他个体,通常是将编号m加上间隔k得到第二个个体编号,以此类推,分别加上2k,3k,4k,…,直到获取整个样本.
探究一
探究二
思维辨析
当堂检测
探究一
探究二
思维辨析
当堂检测
变式训练2(1)为了了解1 200名学生对学校某项教学实验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样的方法,则抽样距k为( )
A.40 B.30 C.20 D.12
(2)要从160名学生中抽取容量为20的样本,用系统抽样法将160名学生从1~160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为125,则第一组中按抽签方法确定的号码是( )
A.7 B.5 C.4 D.3
(3)某工厂有1 008名工人,从中抽取50人参加体检,试用系统抽样进行具体实施.
探究一
探究二
思维辨析
当堂检测
(1)解析:由已知得总体容量N=1 200,样本容量n=30,因此应将总体分为30组,每组中含有个体数为 ,即抽样距k=40.
答案:A
(2)解析:由系统抽样知第一组确定的号码是125-15×8=5.
答案:B
(3)解:按下面的步骤实施:
第一步 将这些工人分成50组,因为 的商是20,余数是8,所以每个组有20名工人.这时,抽样距就是20;
第二步 先用简单随机抽样的方法从这些工人中抽取8名工人,不参加体检;
第三步 将剩余的1 000名工人编号1到1 000;
第四步 从第一组即1号到20号中随机抽取一个号l;
第五步 按编号将l,20+l,40+l,…,980+l共50个号选出.这50个号所对应的工人组成样本.
探究一
探究二
思维辨析
当堂检测
未弄清分层抽样中每一层应抽取的样本特征而致误
【典例】一支田径队有男女运动员98人,其中男运动员有56人,按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,则应抽取女运动员人数是 .
错解设应抽取的女运动员为x人,依题意得 ,解得x=16.
正解利用分层抽样的特点,按比例抽样去分析.
依题意,女运动员有98-56=42(人).设应抽取女运动员x人,根据分层抽样特点,得 ,解得x=12.
纠错心得本题中产生错误的原因是对男、女运动员分层时混淆对应数据,在处理分层抽样的问题时,关键是确定好对应各层的抽样比,再根据样本与总体之间的比例关系列出相应等式.
探究一
探究二
思维辨析
当堂检测
变式训练某校老年、中年和青年教师的人数如下表所示,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为( )
A.90 B.100
C.180 D.300
解析:由表格知,老年教师人数为900,青年教师人数为1 600,设样本中老年教师人数为x,则由题意知 ,解得x=180.
答案:C
探究一
探究二
思维辨析
当堂检测
1.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )
A.50 B.40 C.25 D.20
解析:根据系统抽样的特点可知分段间隔为 =25,故选C.
答案:C
2.某地的迪士尼乐园开始建设,针对“喜羊羊如何抗衡米老鼠”这一问题,某网站设置了一个投票项目,现准备从参加投票的青年300人、少年2 000人、儿童1 200人中抽取容量为350的样本,最适合抽取样本的方法是 ( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.随机数法
答案:C
探究一
探究二
思维辨析
当堂检测
3.已知某单位有职工120人,其中男职工90人,现采用分层抽样的方法(按男、女分层)抽取一个样本.若样本中有27名男职工,则样本容量为( )
A.30 B.36
C.40 D.无法确定
解析:分层抽样中抽样比一定相同,设样本容量为n,
由题意得, ,解得n=36.
答案:B
探究一
探究二
思维辨析
当堂检测
4.为了了解某地区今年高一学生期末考试的数学成绩,打算从参加考试的15 000名学生的数学成绩中用系统抽样的方法抽取容量为150的样本,请写出抽取过程.
解:抽取过程按如下步骤进行.
第一步 分段:因为样本容量与总体容量的比是1∶100,所以我们将总体平均分为150个部分,其中每一部分包括100个个体.
第二步 对全体学生的数学成绩进行编号:1,2,3,…,15 000.
第三步 在第一部分即1号到100号用简单随机抽样抽取一个号码,比如是56.
第四步 以56作为起始数,再顺次抽取156,256,356,…,14 956,这样就得到一个容量为150的样本.(共43张PPT)
§3 统计图表
统计图表
统计图表是表达和分析数据的重要工具,它不仅可以帮助我们从数据中获取有用的信息,还可以帮助我们直观、准确地理解相应的 结果.统计图表有:条形统计图、折线统计图、扇形统计图、茎叶图.
1.条形统计图
(1)条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的矩形条,然后把这些矩形条按照一定的顺序排列起来的图形.
(2)条形统计图的特点:既能看出总体中各类对象的具体数量,又能直观地比较各类对象数量的多少.
(3)条形统计图的制作步骤:①整理数据;②画坐标轴;③画矩形条.
【做一做1】 如图所示是某校八年级学生到校方式的条形统计图,根据图形可得出骑自行车人数占八年级学生总人数的( )
A.20% B.30% C.50% D.60%
解析:骑自行车到校的人数是90,占总人数的百分比为
答案:B
2.折线统计图
(1)折线统计图是用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段顺次连接起来的图形.
(2)折线统计图的特点:既能看出总体中各类对象的具体数量,又能直观地看出各类对象数量的多少及数量的变化情况.
(3)折线统计图的制作步骤:①整理数据;②画坐标轴;③描点;④连线.
【做一做2】 如图是某市5月1日至5月7日每天最高、最低气温的折线统计图,在这7天中,日温差最大的一天是( )
A.5月3日 B.5月4日
C.5月5日 D.5月6日
答案:C
3.扇形统计图
(1)扇形统计图是指用圆面代表总体,圆面中的各个扇形分别代表总体中的不同部分,扇形面积的大小反映各部分占总体的百分比的大小的图形.
(2)扇形统计图的特点:扇形统计图可以清楚地表达各部分在总体中所占的百分比.
(3)扇形统计图的制作步骤:
①先计算总数及各部分在总数中所占的百分比;
②将各部分所占比例转化为所占圆周的比例,并计算出圆弧所对应的圆心角的度数;
③用圆规按照纸的大小画一个合适的圆表示总数;
④根据各部分的圆心角的度数,用量角器在圆中顺次画出各个扇形;
⑤在各个扇形内写上相应各部分的名称和百分数;
⑥把各个扇形用不同的条纹或颜色区别开来,这样就可以得到一个扇形统计图.
【做一做3】 如图为某商场一天营业额的扇形统计图,根据统计图你能得到下列哪些信息 .
(1)该商场家用电器销售额为全商场营业额的40%
(2)服装鞋帽和百货日杂共售出29 000元
(3)副食的销售额为该商场营业额的10%
(4)家用电器部所得利润最高
答案:(1)(2)(3)
4.茎叶图
(1)制作茎叶图的一般步骤:
①把所有两位数据的十位数字按从小到大的顺序由上向
下写成一竖列作为茎(如果有一位数,那么其十位数字写作0);
②在十位数字的右边画一条竖线(如果有两组数据,那么在左右两边各画一条竖线)作为茎、叶的分界线;
③在分界线的另一侧记录茎所对的叶,即把相应数据的个位数字按顺序(一般是按大小顺序)同行列出作为叶,注意重复出现的数字要重复写.
(2)茎叶图的优缺点:
优点:茎叶图不但可以随时记录数据,还可以在记录的过程中随时观察到数据的一些特征,从而及时对数据进行分析.
缺点:当数据量很大或有多组数据时,茎叶图就不那么直观、清晰了.
名师点拨茎叶图是一种将样本数据有条理地列出来,以观察样本分布情况的图.它的思路是将数据中的数按位数进行比较,将数的大小基本不变或变化不大的位上的数作为“茎”,将变化大的位上的数作为“叶”,列在茎的左边或右边.这样就可以清楚地看到每个茎后面的几个数,每个数是多少.茎叶图主要用于两位数据的统计分析,但也可用茎叶图来表示三位数或一位小数等数据的统计分析,这时通常将前两位数字或小数的整数部分作为“茎”,个位数字或小数中的小数部分的数字作为“叶”,画出相应的茎叶图.
【做一做4】 从甲、乙两个班各随机选出15名同学进行测验,成绩的茎叶图如图所示,则甲、乙两班的最高成绩各是 , .从图中看, 班的平均成绩较高.
答案:96 92 乙
思考辨析
判断下列说法是否正确,正确的在后面的括号里画“√”,错误的画“×”.
(1)在扇形统计图中,各扇形部分圆心角的度数与所画圆的半径有关. ( )
(2)茎叶图适用于样本数据较少,且样本数据主要是两位数字的统计问题,但它不适合数据量很大的情况. ( )
(3)在扇形统计图中,若已知总体中各部分的百分比为Pi(i=1,2,3,…),则其相应的扇形圆心角的度数为Pi×360°(i=1,2,3,…). ( )
(4)条形统计图与折线统计图均适用于样本数据较多的情况. ( )
答案:(1)× (2)√ (3)√ (4)√
探究一
探究二
探究三
探究四
思想方法
当堂检测
条形统计图的绘制与应用
【例1】学校餐厅新推出A,B,C,D四款套餐,某一天四款套餐销售情况的条形统计图如图所示.为了了解同学们对新推出的四款套餐的评价,对就餐的每位同学都进行了问卷调查,统计结果如下表所示:
探究一
探究二
探究三
探究四
思想方法
当堂检测
(1)如果从所有的调查问卷中采用分层抽样的方法抽取20份进行进一步的调查,那么A,B,C,D四款套餐分别应抽多少份
(2)如果要对当天销售的所有套餐的评价情况进行统计分析,请你画出相应的条形统计图.
分析:(1)由所给条形统计图得到四种套餐的销售数量,然后根据分层抽样的特点进行各自应抽取的份数;
(2)根据所给评价情况计算出满意、一般、不满意的份数,据此制作条形统计图.
探究一
探究二
探究三
探究四
思想方法
当堂检测
解:(1)由条形统计图可知,选择A,B,C,D四款套餐的人数分别是40,50,60,50,共有40+50+60+50=200(人).
由分层抽样方法,抽取的问卷中选择A,B,C,D四款套餐的人数分别为4,5,6,5.
(2)当天销售的所有套餐中,评价为满意的人数为40×50%+ 50×80%+60×50%+50×40%=20+40+30+20=110;评价为一般的人数为40×25%+60×50%+50×20%=10+30+10=50;评价为不满意的人数为40×25%+50×20%+50×40%=10+10+20=40.故评价情况的条形统计图如图所示.
探究一
探究二
探究三
探究四
思想方法
当堂检测
反思感悟条形统计图的制作步骤与绘制的注意事项
1.条形统计图的制作步骤
探究一
探究二
探究三
探究四
思想方法
当堂检测
2.条形图绘制的注意事项
(1)坐标轴:横轴为观察项目,纵轴为数值,纵轴坐标一定要从0开始.
(2)直条的宽度:各直条应等宽,等间距,间距宽度和直条相等或为其一半.
(3)排列顺序:可以根据数值从大到小,从小到大,或按时间顺序排列.
探究一
探究二
探究三
探究四
思想方法
当堂检测
变式训练1抛掷一枚硬币500次,获得正面向上和反面向上的频数和频率如下表:
画出频数条形统计图和频率条形统计图.
探究一
探究二
探究三
探究四
思想方法
当堂检测
解:频数条形统计图如图(1)所示,频率条形统计图如图(2)所示.
探究一
探究二
探究三
探究四
思想方法
当堂检测
折线统计图的应用
【例2】 以下是某网店2017年1~6月份,甲、乙两种数码产品销量情况的折线统计图:
根据图形回答:
(1)甲产品在哪个月的月销量与前一个月相比变化幅度最大 乙产品在哪个月的月销量与前一个月相比变化幅度最大
(2)对于甲、乙两种产品,哪种产品的月平均销量较大
探究一
探究二
探究三
探究四
思想方法
当堂检测
解:(1)由折线统计图可以看出,与前一个月相比,甲产品在2月份的月销量的变化幅度最大,乙产品在5月份的月销量的变化幅度最大.
(2)对于甲产品,其月平均销量
探究一
探究二
探究三
探究四
思想方法
当堂检测
反思感悟1.绘制折线统计图时首先用一个单位长度表示一定的数量,然后根据数量的多少描出各点,最后把各点用线段顺次连接起来.
2.在折线统计图中,折线上各点的横坐标表示所研究问题中的每类对象,纵坐标表示每类对象的数量.因此从折线统计图可以准确获得统计结果,同时,还能直观地显示出每类对象在数量上的增减变化情况.
探究一
探究二
探究三
探究四
思想方法
当堂检测
变式训练2某商场的进货量与销售额的折线统计图如图所示,下列叙述不正确的是( )
某商场销售额与进货量比较
A.该商场亏损(销售额低于进货量)最大的是5月
B.该商场从5月份以后,销售额一直处于增长之中
C.从6月份起,该商场进货量一直处于增长之中
D.该商场全年整体营业状况可能是盈利的
答案:C
探究一
探究二
探究三
探究四
思想方法
当堂检测
扇形统计图的制作与应用
【例3】 (1)某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用分层抽样法,将全体职工随机按1~200编号,则50岁以上年龄段应抽取 人.
答案:8
探究一
探究二
探究三
探究四
思想方法
当堂检测
(2)下图是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日至3月10日最低气温(单位:℃)的扇形统计图.
探究一
探究二
探究三
探究四
思想方法
当堂检测
(2)解:该城市3月1日至3月10日的最低气温(单位:℃)情况如下表:
其中最低气温为-3 ℃的有1天,占10%,最低气温为-2 ℃的有1天,占10%,最低气温为-1 ℃的有2天,占20%,最低气温为0 ℃的有2天,占20%,最低气温为1 ℃的有1天,占10%,最低气温为2 ℃的有3天,占30%.
扇形统计图如图所示.
探究一
探究二
探究三
探究四
思想方法
当堂检测
反思感悟1.制作扇形统计图的关键是计算出总体中每类对象占总体的百分比,从而确定每类对象对应的扇形的圆心角的大小,从而依次作出各个扇形,完成扇形统计图,要注意检验各个扇形所占的百分比之和是否等于1.
2.由于扇形统计图显示的只是百分比,而不是各类对象的具体数量,因此在不同的扇形统计图中不能简单地根据百分比的大小比较各类对象数量的多少.
探究一
探究二
探究三
探究四
思想方法
当堂检测
变式训练3(1)下图是某市甲、乙两所高级中学各年级人数分布的扇形统计图:
给出下列几种说法:①甲、乙两校高二学生人数相等;②甲校高三学生人数比乙校少;③乙校高二学生人数比高一学生人数多;④若甲校和乙校高一的学生人数相等,则甲校高二学生人数比乙校高二学生人数少.其中正确的说法为 .(只填序号)
探究一
探究二
探究三
探究四
思想方法
当堂检测
(2)在某地,某户农民的年收入情况如下表(单位:元):
请用扇形统计图来表示上面的数据.
探究一
探究二
探究三
探究四
思想方法
当堂检测
(1)解析:因为甲校、乙校学生总人数未知,所以甲、乙两校高二学生人数虽然所占的百分比相同,但具体人数无法比较;同理,甲、乙两校的高三学生人数也无法比较多少,故①②错;但对于乙校,其高二、高一学生占总人数的比例分别为30%和25%,故高二学生人数比高一学生人数多,故③正确;对于④,若设甲、乙两校的学生总人数分别为a和b,则a·30%=b·25%,于是a从而a·30%答案:③④
探究一
探究二
探究三
探究四
思想方法
当堂检测
因此对应土地收入、打工收入、养殖收入、
其他收入的扇形的圆心角的度数分别为:38.8%×360°≈140°,32.4%×360°≈117°, 21.2%×360°≈76°,7.6%×360°≈27°,由此可画出扇形统计图如图所示.
探究一
探究二
探究三
探究四
思想方法
当堂检测
茎叶图的制作与应用
【例4】 (1)在茎叶图中,茎为2的叶子数为( )
A.0 B.1 C.2 D.3
(2)某赛季甲、乙两名篮球运动员每场得分情况如下:
甲:12,15,24,25,31,31,36,37,39,44,45,50;
乙:8,13,14,16,23,26,28,38,39,51,9,17.
①用茎叶图表示上面的数据;
②根据你所画的茎叶图分析甲、乙两名运动员的得分情况.
探究一
探究二
探究三
探究四
思想方法
当堂检测
(1)解析:由茎为2组成的数据有21,21,25,故有3个叶子.
答案:D
(2)解:①在如图所示的茎叶图中,中间的数字表示两名运动员得分的十位数,两边的数字分别表示两个人各场比赛得分的个位数.
②从茎叶图可以看出:甲运动员的得分比较集中在茎为3的一行,且大致关于这一行对称,乙运动员的得分相对比较分散.所以,甲运动员发挥比较稳定,总体得分情况比乙运动员好.
探究一
探究二
探究三
探究四
思想方法
当堂检测
反思感悟1.绘制茎叶图的关键是分清茎和叶.
2.在制作茎叶图时,重复出现的数据要重复记录,不能遗漏.
3.表示茎的数字按大小顺序由上到下排成一列,叶上的各个数字,可以按大小顺序,也可以不按大小顺序,但应排在茎相应的一侧.
探究一
探究二
探究三
探究四
思想方法
当堂检测
变式训练4从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如右图所示(单位:cm),根据数据估计( )
A.甲种玉米比乙种玉米不仅长得高而且长得整齐
B.乙种玉米比甲种玉米不仅长得高而且长得整齐
C.甲种玉米比乙种玉米长得高但长势没有乙整齐
D.乙种玉米比甲种玉米长得高但长势没有甲整齐
答案:D
探究一
探究二
探究三
探究四
思想方法
当堂检测
关于茎叶图的制作
【典例】从甲、乙两台机器生产的零件中各随机抽取15个进行检验,相关指标的检验结果为:
甲:534,517,528,522,513,516,527,526,520,508,533,524,518,522,512
乙:512,520,523,516,530,510,518,521,528,532,507,516,524,526,514
作出上述数据的茎叶图.
分析:题中所有数据都是三位数,百位数字是5,十位数字是0,1,2,3,所以把茎确定为50,51,52,53,个位数字作为叶按大小顺序写在茎的两侧即可.
探究一
探究二
探究三
探究四
思想方法
当堂检测
解:确定茎:50,51,52,53,
确定茎对应的“叶子”
甲:508,
乙:507;
甲:512,513,516,517,518,
乙:510,512,514,516,516,518;
甲:520,522,522,524,526,527,528;
乙:520,521,523,524,526,528,
甲:533,534,
乙:530,532.
列表画图
探究一
探究二
探究三
探究四
思想方法
当堂检测
方法点睛通过对本题的解决需要从以下三个方面提高认识
(1)数据的分析
在解题时,先对已知数据作出分析,再确定数据的范围.
(2)茎的选取
作茎叶图,选取确定的茎是关键,最后剩下一位作为叶,对于三位数字,应该把前两位数字作为茎,最后一位数字作为叶.
(3)叶子的顺序
共茎的叶子一般按照从小到大(或从大到小)的顺序同时列出,以免数据丢失或混乱,不易作出正确统计.
探究一
探究二
探究三
探究四
思想方法
当堂检测
1.下面能直观、形象地反映数据的变化趋势的统计图是 ( )
A.条形统计图 B.茎叶图
C.扇形统计图 D.折线统计图
答案:D
2.在如图所示的茎叶图中,乙中没有的数据是( )
A.17 B.26
C.38 D.44
解析:由茎叶图知,乙中有17,38,44,没有26,故选B.
答案:B
探究一
探究二
探究三
探究四
思想方法
当堂检测
3.如图为某校高三(1)班的男、女学生比例图表,已知该班共有学生55人,则该班男生比女生约多( )
A.13人 B.21人
C.24人 D.34人
解析:55×(62%-38%)=13.2,故男生比女生约多13人.
答案:A
4.有两名学员小林和小明练习射击,
第一轮10枪打完后两人打靶的环数
如图所示,通常新手的成绩不太稳定,
那么根据图中的信息,估计小林和小
明两人中新手是 .
答案:小林
探究一
探究二
探究三
探究四
思想方法
当堂检测
5.下面是两户居民家庭全年各项支出的统计图.
给出下列说法:①甲、乙两户居民家庭在衣着方面的支出的百分比相同;②甲户居民家庭在教育方面的支出的百分比比乙户居民家庭低;③乙户居民家庭的食品支出比甲户居民家庭多.其中正确的是 .(只填序号)
探究一
探究二
探究三
探究四
思想方法
当堂检测
答案:①②
探究一
探究二
探究三
探究四
思想方法
当堂检测
6.甲、乙两个小组各10名学生的英语口语测试成绩(单位:分)如下:
甲组:76 90 84 86 81 87 86 82 85 83
乙组:82 84 85 89 79 80 91 89 79 74
用茎叶图表示两个小组的成绩,并判断哪个小组的成绩更整齐一些
解:茎叶图如图所示(中间的茎为十位上的数).(共29张PPT)
§4 数据的数字特征
1.众数、中位数、平均数
众数、中位数、平均数刻画了一组数据的集中趋势.
(1)众数
一组数据中,出现次数最多的数就是众数.若有两个或几个数据出现的次数相等且都最多,则这些数都是这组数据的众数;若一组数据中,每个数据出现的次数都一样,则这组数据没有众数.
(2)中位数
①把一组数据按从小到大(或从大到小)的顺序排成一排,处于中间位置的数称为这组数据的中位数.
②当数据有奇数个时,位于最中间位置的数就是中位数;当数据有偶数个时,位于最中间的两个数的平均数就是中位数.
(3)平均数
一组数据的和与这组数据的个数的商叫作这组数据的平均数,数据x1,x2,…,xn的平均数为
【做一做1】 已知一组数据10,30,50,50,60,70,80.其中平均数、中位数和众数的大小关系是( )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
解析:由所给数据可得平均数为50,中位数为50,众数为50,因此众数=中位数=平均数.
答案:D
名师点拨众数、中位数、平均数的比较
2.极差、方差、标准差
极差、方差、标准差刻画了一组数据的离散程度.
(1)极差:把一组数据中最大值与最小值的差叫作这组数据的极差.极差对极端值非常敏感,在一定程度上表明了该组数据的分散程度.
(2)方差
【做一做2】 从一堆苹果中任取5只,称得它们的质量如下(单位:克):
125 124 121 123 127
则该样本的标准差s= (克)(用数字作答).
答案:2
思考辨析
判断下列说法是否正确,正确的在后面的括号里画“√”,错误的画“×”.
(1)平均数能描述数据的平均水平,定量地反映数据的集中趋势. ( )
(2)用样本来估计总体时,一般来说,样本容量越大,这种估计越精确. ( )
(3)若x1,x2,…,xn的方差为s2,则ax1+b,ax2+b,…,axn+b的方差是as2. ( )
答案:(1)√ (2)√ (3)×
探究一
探究二
探究三
探究四
思维辨析
当堂检测
平均数、中位数、众数的计算
【例1】某班50名同学右眼视力的检测结果如图所示:
试求该班同学右眼视力的平均数、中位数、众数.
解:由题图可知,右眼视力的平均数为(0.2+0.3×2+0.4×3+0.5×5 +0.6×5+0.7×6+0.8×6+1.0×7+1.2×9+1.5×6)÷50=43.3÷50=0.866.
中位数应该是第25、第26这两个数据的平均数,由于右眼视力不超过0.8的同学共有1+2+3+5+5+6+6=28(人),因此第25、第26这两个数据均为0.8,故中位数是0.8.
由条形统计图知,视力为1.2的同学最多,有9人,因此众数是1.2.
探究一
探究二
探究三
探究四
思维辨析
当堂检测
反思感悟1.通常情况下,给出一组数据后,可根据平均数、中位数、众数的定义及其计算公式分别计算求值.
2.求中位数时,必须先将数据按从大到小或从小到大的顺序排列.
3.当数据是用统计图表的形式给出时,要先通过分析图表,获取数据,再进行计算.
探究一
探究二
探究三
探究四
思维辨析
当堂检测
变式训练1以下是某地在甲、乙两个重要道路交叉口设置的电子监控在连续一周时间里抓拍到的每一天的车辆违章次数情况:
甲:6,8,9,10,9,9,12;
乙:7,9,8,11,10,9,11.
试分别求甲、乙两路口车辆违章次数的平均数、中位数、众数.
探究一
探究二
探究三
探究四
思维辨析
当堂检测
方差与标准差的计算
【例2】 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图如图所示,后来有1个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为( )
解析:利用平均数为91,求出x的值,利用方差的定义,计算方差.
根据茎叶图,去掉1个最低分87,1个最高分99,
答案:B
探究一
探究二
探究三
探究四
思维辨析
当堂检测
反思感悟1.按照定义,求一组数据的方差、标准差的步骤是:
求平均数 →求方差s2→求标准差s
2.如果数据是用统计图表给出的,应先从图表中获取数据信息,再套用公式计算.
探究一
探究二
探究三
探究四
思维辨析
当堂检测
变式训练2(1)已知一组数据为-3,5,7,x,11,若这组数据的众数为5,则该组数据的方差为 ;
(2)已知一组数据的茎叶图如图所示,则该组数据的标准差等于 .(精确到0.01)
探究一
探究二
探究三
探究四
思维辨析
当堂检测
答案:(1)20.8 (2)9.60
探究一
探究二
探究三
探究四
思维辨析
当堂检测
方差与标准差的性质
答案:D
探究一
探究二
探究三
探究四
思维辨析
当堂检测
变式训练3若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )
A.8 B.15 C.16 D.32
答案:C
探究一
探究二
探究三
探究四
思维辨析
当堂检测
统计图表与数字特征的综合应用
【例4】甲、乙两位学生参加数学竞赛培训,现分别从他们培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲:82,91,79,78,95,88,83,84
乙:92,95,80,75,83,80,90,85
(1)画出甲、乙两位学生成绩的茎叶图.
(2)现要从中选派一人参加数学竞赛,从统计学角度看,你认为应派哪位学生参加数学竞赛,请说明理由.
探究一
探究二
探究三
探究四
思维辨析
当堂检测
解:(1)茎叶图如图所示:
探究一
探究二
探究三
探究四
思维辨析
当堂检测
反思感悟处理统计图表与数字特征问题应注意的方法技巧
1.由图形得到对应的样本数据,计算出平均数、方差(标准差).
2.从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用方差(标准差)的大小反映数据的波动性大小.此点可称为方差(标准差)的几何意义.
探究一
探究二
探究三
探究四
思维辨析
当堂检测
答案:B
探究一
探究二
探究三
探究四
思维辨析
当堂检测
对方差概念理解不透彻而致误
【典例】 为了试验杂交水稻和普通水稻在产量和稳定程度上的区别,随机在两块试验田里分别抽取5穗,其中杂交水稻每穗粒数分别为49,50,51,50,50,而普通水稻每穗粒数分别为48,52,43,57,50,试比较这两种水稻哪种更稳定.
探究一
探究二
探究三
探究四
思维辨析
当堂检测
纠错心得本题产生错解的原因是对方差的概念及特征理解不透彻,方差是衡量一组数据波动性大小的一个统计量,并且方差越小,表示波动越小,越稳定.
探究一
探究二
探究三
探究四
思维辨析
当堂检测
变式训练下列对一组数据的分析,说法不正确的是( )
A.数据的极差越小,样本数据分布越集中、稳定
B.数据的平均数越小,样本数据分布越集中、稳定
C.数据的标准差越小,样本数据分布越集中、稳定
D.数据的方差越小,样本数据分布越集中、稳定
解析:极差、方差、标准差都可以反映数据的离散程度,而平均数不可以,平均数反映的是数据的平均水平.
答案:B
探究一
探究二
探究三
探究四
思维辨析
当堂检测
1.已知一组数据从小到大的排列顺序为-1,0,4,x,6,15,若这组数据的中位数为5,则这组数据的众数为( )
A.5 B.6 C.4 D.5.5
解析:因为中位数为 ,所以x=6,故众数为6.
答案:B
答案:C
探究一
探究二
探究三
探究四
思维辨析
当堂检测
3.若甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和标准差如下表:
则参加奥运会的最佳人选应为( )
A.甲 B.乙 C.丙 D.丁
解析:从平均数来看,乙、丙的平均值最大,从标准差来看,丙的标准差最小,因此,应选择丙参加比赛.
答案:C
探究一
探究二
探究三
探究四
思维辨析
当堂检测
4.已知一组数据x1,x2,…,xn的方差是a,则另一组数据x1-2,x2-2,…,xn-2的方差是 .
解析:将一组数据同时加上或减去一个数,所得新数据的方差与原数据的方差相等.
答案:a
探究一
探究二
探究三
探究四
思维辨析
当堂检测
5.某车间20名工人年龄数据如下表:
(1)求这20名工人年龄的众数与极差;
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差.
探究一
探究二
探究三
探究四
思维辨析
当堂检测
解:(1)这20名工人年龄的众数为30;这20名工人年龄的极差为40-19=21.
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如图所示.
(3)这20名工人年龄的平均数为(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;
所以这20名工人年龄的方差为(共32张PPT)
5.1 估计总体的分布
1.估计总体分布的相关概念
(1)总体分布:一般地,总体分布是指总体中个体所占的比例.
(2)样本频率分布表:是把样本数据重新汇总而成的一个表格,表中栏目有样本宽度分组(Δxi);频数(ni);频率(fi).
(3)频率分布直方图:每个小矩形的宽度为Δxi(分组的宽度),高为 ,小矩形的面积恰为相应的频率fi.通常我们称这样的图形为频率分布直方图.
(4)频率折线图:在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
规律总结几种表示样本分布方法的比较
(1)频率分布表:频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体趋势不太方便.
(2)频率分布直方图:频率分布直方图能非常直观地表明数据分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但是从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
(3)频率折线图:频率折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的宽度不断缩小,那么折线图就趋向于一条光滑曲线.
【做一做1】 为了引导学生树立正确的消费观,调查了学生每天零花钱的数量(钱数取整数元),容量为1 000的样本的频率分布直方图如图所示,则样本数据落在[6,14)内的频数为( )
A.780 B.680
C.648 D.460
解析:依题意知(0.02+0.08+x+0.03×2)×4=1,故x=0.09.
数据落在[6,14)内的频率为(0.08+0.09)×4=0.68,
因此频数为0.68×1 000=680.故选B.
答案:B
2.频率分布表、频率分布直方图、频率折线图的画法
(1)频率分布表的画法步骤
①计算数据中最大值与最小值的差称为极差,算出极差就知道数据变动的范围;
③决定分点;
④列频率分布表,数据落在第i个小组内的个数为频数ni;每小组的频数与数据总数的比值叫作这一小组的频率fi,算出各小组的频率;为方便画图还需计算出 填入表中.
(2)频率分布直方图的画法步骤
①列频率分布表;
②画坐标系,以横轴表示样本的分组,以纵轴表示频率与分组的宽度的比 ;
③按照频率分布表中的数据作出各个小矩形,即得频率分布直方图.
(3)频率折线图的画法步骤
①绘制频率分布直方图;
②取点:取各个小矩形的顶端的中点,再在原分组的左、右两边各增加一个小区间,取其中点(这两个端点没有实际意义);
③连线:用直线段顺次连接这些中点,就得到频率折线图.
【做一做2】 已知一个样本:30,29,26,24,25,27,26,22,24,25,26, 28,25,21,23,25,27,29,25,28.
(1)列出样本的频率分布表.
(2)画出频率分布直方图和频率折线图.
解:(1)计算极差:30-21=9.
决定组距和组数:取组距为2.
所以共分5组.
决定分点,使分点比数据多一位小数.
并把第1小组的分点减小0.5,即分成如下5组:
20.5~22.5,22.5~24.5,24.5~26.5,26.5~28.5,28.5~30.5.
列出频率分布表如下:
(2)作出频率分布直方图如下:
取各小长方形上的中点并用线段连接就构成了频率折线图,如上图.
思考辨析
判断下列说法是否正确,正确的在后面的括号里画“√”,错误的画“×”.
(1)频率分布直方图中小长方形的高表示取某数的频率. ( )
(2)频率分布直方图中所有小长方形的面积之和为1. ( )
(3)频率分布直方图中小长方形的面积等于该组的频率×组距. ( )
(4)频率分布折线图能反映数据的增减趋势. ( )
答案:(1)× (2)√ (3)× (4)√
探究一
探究二
思维辨析
当堂检测
频率分布直方图与折线图的概念及画法
【例1】 (1)已知样本数据如下:25,21,23,25,27,29,25,28,30,29,26,22,24,25,26,28,26,24,25,27.在列频率分布表时,如果取组距为2,那么落在24.5~26.5这一组的频率是( )
A.0.6 B.0.5 C.0.4 D.0.3
(2)已知100个样本数据的分组及各组的频数如下:
153.5~155.5,4; 161.5~163.5,20;
155.5~157.5,14; 163.5~165.5,12;
157.5~159.5,18; 165.5~167.5,8;
159.5~161.5,22; 167.5~169.5,2.
①列出频率分布表;
②作出频率分布直方图及频率折线图.
探究一
探究二
思维辨析
当堂检测
(1)答案:C
(2)解:①频率分布表如下:
探究一
探究二
思维辨析
当堂检测
②频率分布直方图和频率折线图如图所示.
探究一
探究二
思维辨析
当堂检测
反思感悟1.可按照画频率分布直方图的一般步骤画出频率分布直方图,特别要注意的是纵坐标表示的是 ,而不是频率.
2.对数据进行分组时,确定好分点是关键,通常有两种方法:
(1)改变数据位数,若数据为整数,则分点数据减去0.5;若数据是小数点后有1位的数,则分点数据减去0.05,依此类推.
(2)不改变数据位数,但要注意分组后,每组的起点数据包含在该组内,终点数据不包含在该组内.
3.画频率折线图时,应先作出频率分布直方图,再在最左边和最右边各添加一个区间,依次取出矩形顶端的中点,然后即可画出频率折线图.
探究一
探究二
思维辨析
当堂检测
变式训练1有一个容量为50的样本,数据分组及各组的频数如下:12.5~15.5,3;15.5~18.5,8;18.5~21.5,9;21.5~24.5,11;24.5~27.5,10;27.5~30.5,5;30.5~33.5,4.
(1)列出样本频率分布图表;
(2)画出频率分布直方图和频率分布折线图.
探究一
探究二
思维辨析
当堂检测
解:(1)频率分布表如下:
探究一
探究二
思维辨析
当堂检测
(2)频率分布直方图和频率分布折线图如图所示.
探究一
探究二
思维辨析
当堂检测
频率分布直方图的应用
【例2】 (1)如图,有一频率分布直方图,图中x的值为( )
A.0.4 B.0.2
C.0.04 D.0.02
探究一
探究二
思维辨析
当堂检测
(2)某学校对高二年级一次考试成绩进行抽样分析.如图是根据抽样分析后的考试成绩绘制的频率分布直方图,其中抽样成绩的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104), [104,106].已知样本中成绩小于100分的人数是36,则样本中成绩大于或等于98分且小于104分的人数是( )
A.90 B.75 C.60 D.45
探究一
探究二
思维辨析
当堂检测
解析:(1)在频率分布直方图中,分组的宽度为1,于是有(0.1+0.15+2x+0.35)×1=1,解得x=0.2.
(2)样本中成绩小于100分的频率为(0.050+0.100)×2=0.3.
∴样本容量为
∴样本中成绩大于或等于98分且小于104分的人数为120×(0.100+0.150+0.125)×2=90.
答案:(1)B (2)A
探究一
探究二
思维辨析
当堂检测
探究一
探究二
思维辨析
当堂检测
变式训练2如图所示是总体的一个样本频率分布直方图,且在[15,18)内频数为8.
(1)求样本在[15,18)内的频率;
(2)求样本容量;
(3)若在[12,15)内的小矩形面积为0.06,求在[18,33)内的频数.
探究一
探究二
思维辨析
当堂检测
解:由样本频率分布直方图可知组距为3.
(3)在[12,15)内的小矩形面积为0.06,故样本在[12,15)内的频率为0.06,故样本在[15,33)内的频数为50×(1-0.06)=47.又因为在[15,18)内的频数为8,故在[18,33)内的频数为47-8=39.
探究一
探究二
思维辨析
当堂检测
未理解频率分布直方图中纵坐标的含义而致误
【典例】中小学生的视力状况受到全社会的广泛关注,某市有关部门从全市60 000名高一新生中随机抽取了400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示,从左到右五个小组的频率之比依次是5∶7∶12∶10∶6,则全市高一新生视力在[3.95,4.25]范围内的学生约有多少人
探究一
探究二
思维辨析
当堂检测
纠错心得1.在频率分布直方图中,纵坐标对应值的含义是 ,每个小长方形的面积才能代表对应各段内频率值.
2.该例题产生错误的根源就是把图中标注的0.5看成了第五组的频率,而实际上0.5×0.3=0.15才是对应的频率,因此正确认识频率分布直方图的意义是解决问题的关键.
探究一
探究二
思维辨析
当堂检测
变式训练有一容量为500的样本,把数据分成7组,它的频率分布直方图如图所示,根据其频率分布直方图,请你估计数据落在15.5~24.5内的数量.
解:由频率分布直方图可知,数据分成7组,其组距为3,所以数据落在15.5~18.5内的频率为0.054×3,落在18.5~21.5内的频率为0.06×3,落在21.5~24.5内的频率为0.075×3.所以数据落在15.5~24.5内的数量有500×(0.054×3+0.06×3+0.075×3)=283.5.所以估计数据落在15.5~24.5内的数量大约有284个.
探究一
探究二
思维辨析
当堂检测
1.在用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )
A.总体容量越大,估计越精确 B.总体容量越小,估计越精确
C.样本容量越大,估计越精确 D.样本容量越小,估计越精确
答案:C
2.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间10~12内的频数为( )
A.18 B.36
C.54 D.72
答案:B
探究一
探究二
思维辨析
当堂检测
3.一个容量为35的样本数据,分组后,各组与相应频数如下:[5,10),5;[10,15),12;[15,20),7;[20,25),5;[25,30),4;[30,35),2,则样本在区间[20,35)上的频率约为( )
A.20% B.69% C.31% D.27%
答案:C
4.一个容量为20的样本,数据的分组及各组的频数如下表:(其中x,y∈N+)
则样本在区间10~50上的频率为 .
答案:0.7
探究一
探究二
思维辨析
当堂检测
5.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下
(单位:分):40~50,2;50~60,3;60~70,10;70~80,15;80~90,12;90~100,8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图及频率折线图;
(3)估计成绩在60~90分的学生比例.
探究一
探究二
思维辨析
当堂检测
解:(1)样本的频率分布表如下:
探究一
探究二
思维辨析
当堂检测
(2)频率分布直方图及频率折线图如图所示:
(3)成绩在60~90的频率为0.2+0.3+0.24=0.74,所以可估计成绩在60~90分的学生比例为74%.(共30张PPT)
5.2 估计总体的数字特征
1.样本数据的数字特征
(1)样本平均数
n个样本数据x1,x2,…,xn的平均数
(2)样本的方差与标准差
①样本的方差
设样本数据为x1,x2,…,xn,样本的平均数为 ,
则样本的方差s2=__________________________.
②样本的标准差
样本方差的算术平方根即为样本的标准差,即
【做一做1】 在一组数据:7,8,2,9,13,6,11中抽去一个,新的一组数据的平均数与原数据的平均数相同,则被抽去的数是( )
A.7 B.2 C.8 D.11
解析:抽去一个数后平均数没有变,说明被抽去的数应与平均数相等.因为原数据的平均数为 (7+8+2+9+13+6+11)=8,所以被抽去的数是8.
答案:C
【做一做2】 已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 .
解析:这组数据的平均数为 ×(4.7+4.8+5.1+5.4+5.5)=5.1,方差为 ×[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.
答案:0.1
2.估计总体的数字特征
利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这个估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息.
思考辨析
判断下列说法是否正确,正确的在后面的括号里画“√”,错误的画“×”.
(1)标准差、方差的取值范围为(0,+∞). ( )
(2)标准差、方差的作用是用来描述一组数据围绕平均数波动的大小的. ( )
(3)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. ( )
(4)方差的公式可以写为 ( )
答案:(1)× (2)√ (3)√ (4)√
探究一
探究二
探究三
思想方法
当堂检测
用样本的数字特征估计总体的数字特征
【例1】 (1)在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
分别求这些运动员成绩的众数、中位数与平均数.
(2)甲、乙两台机床同时加工直径为100 mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
①分别计算上述两组数据的平均数和方差;
②根据①的计算结果,说明哪一台机床加工的这种零件更符合要求.
探究一
探究二
探究三
思想方法
当堂检测
(1)解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.题表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;这组数据的平均数是
答:17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
探究一
探究二
探究三
思想方法
当堂检测
(2)分析利用平均数与方差公式分别进行计算,并作出判断.
②因为,说明甲机床与乙机床加工的平均水平相同,但甲机床加工的这种零件波动比较大,所以乙机床加工的这种零件更符合要求.
探究一
探究二
探究三
思想方法
当堂检测
反思感悟1.计算样本的平均数、方差、标准差等数字特征时,应利用相应的公式,将数据代入计算即可.
2.样本的平均数和标准差是两个重要的数字特征.在应用平均数和标准差解决实际问题时,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由标准差研究其与平均数的偏离程度.
探究一
探究二
探究三
思想方法
当堂检测
变式训练1某校为了了解甲、乙两班的数学学习情况,从两班抽出10名学生进行数学水平测试,成绩如下(单位:分):
甲班:82 84 85 89 79 80 91 89 79 74
乙班:90 76 86 81 84 87 86 82 85 83
(1)求两个样本的平均数;
(2)求两个样本的方差和标准差;
(3)试分析比较两个班的学习情况.
探究一
探究二
探究三
思想方法
当堂检测
所以甲班比乙班平均水平低.
因为s甲>s乙,
所以甲班没有乙班稳定.
所以乙班的总体学习情况比甲班好.
探究一
探究二
探究三
思想方法
当堂检测
由频率分布直方图估计总体的数字特征
【例2】某学校为了调查了解高一新生上学所需时间的情况,从高一新生中随机抽取了部分同学,调查其上学所
需时间,获得相应数据,制成了频率分布直方图(如图所示).
(1)试计算该校高一新生上学所需时间的平均数、中位数、众数;
(2)如果上学所需时间不少于1时的学生可申请在学校住宿,请估计学校1 200名新生中有多少名学生可以申请住宿
分析:(1)按照频率分布直方图下各种数字特征的求法分别计算;
(2)先求上学所需时间不少于1时的频率,再求相应的人数.
探究一
探究二
探究三
思想方法
当堂检测
解:(1)上学所需时间在[0,20),[20,40),[40,60),[60,80),[80,100]内的频率分别为0.012 5×20=0.25,0.025×20=0.5,0.006 5×20=0.13,0.003×20=0.06,0.003×20=0.06,因此平均数为10×0.25+30×0.5+50×0.13+70×0.06+90×0.06=33.6(分);
众数为频率最大的一组的组中值,即为30分;
设中位数为x,则有0.25+(x-20)×0.025=0.5,解得x=30,
即中位数为30分.
(2)由频率分布直方图可知,新生上学所需时间不少于1时的频率为(0.003+0.003)×20=0.12.
因为1 200×0.12=144,所以1 200名新生中有144名学生可以申请住宿.
探究一
探究二
探究三
思想方法
当堂检测
反思感悟1.因为频率分布直方图中没有保留样本的原始数据,所以利用频率分布直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
2.利用频率分布直方图求众数、中位数、平均数的方法如下:
(1)在频率分布直方图中,众数是最高的矩形的底边的中点;
(2)在频率分布直方图中,中位数左边和右边的直方图的面积相等;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.
探究一
探究二
探究三
思想方法
当堂检测
变式训练2一个社会调查机构就某地居民的月收入调查了1 000人,并根据所得数据画出样本频率分布直方图.
试根据上图,求该地居民月收入的众数、中位数和平均数.
探究一
探究二
探究三
思想方法
当堂检测
(3)求平均数时,可用各组中值乘以频率来计算,故平均数为1 250×0.000 2×500+1 750×0.000 4×500+2 250×0.000 5×500+2 750×0.000 5×500+3 250×0.000 3×500+3 750×0.000 1×500=(0.25+0.7+1.125+1.375+0.975+0.375)×500=2 400(元).
探究一
探究二
探究三
思想方法
当堂检测
由茎叶图估计总体的数字特征
【例3】为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示(如图).
(1)求该样本数据的平均数、中位数、众数;
(2)试估计全校教师中,上学期使用多媒体教学次数在[15,25)内的人数.
探究一
探究二
探究三
思想方法
当堂检测
反思感悟1.由于茎叶图中保留了样本的原始数据,因此在计算样本数据的数字特征时,可套用公式,代入数据计算可得.
2.由茎叶图估计总体分布及数字特征时,可通过样本数据的分布情况及数字特征进行估计.
探究一
探究二
探究三
思想方法
当堂检测
变式训练3茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若甲、乙两人的平均成绩相同,则污损的数字是( )
A.4 B.5
C.6 D.7
解析:设污损的叶对应的成绩是x,由茎叶图可得甲的平均数是89,则89×5=82+82+87+x+98,解得x=96,故污损的数字是6.
答案:C
探究一
探究二
探究三
思想方法
当堂检测
数字特征在实际中的应用
【典例】 某农场为了从三种不同的西红柿品种中选出高产稳定的西红柿品种,分别在5块试验田上试种,每块试验田均为0.5公顷,产量情况如表:
问哪一种西红柿既高产又稳定
分析:若判断西红柿既高产又稳定,则先计算三组数据的平均数,平均数大的品种产量高;再计算三组数据的标准差(或方差),标准差(或方差)小的品种产量稳定.利用平均数和标准差(或方差)即可作出判断.
探究一
探究二
探究三
思想方法
当堂检测
探究一
探究二
探究三
思想方法
当堂检测
方法点睛1.在计算样本数据的方差或标准差时,若数据很大,很容易出现计算错误,因此必要时可借助函数型计算器辅助计算.
2.对于数字特征在实际问题中的应用,要先明确平均数、方差(标准差)各自的含义,再把得出的数字特征理论值回归到实际中作以解释或判断,这样就形成了数学知识一个完整的应用流程.
探究一
探究二
探究三
思想方法
当堂检测
变式训练2018年12月,在某大学举办的2019届大学毕业生人才招聘会上,有一家公司的招聘员告诉大学生王某:“我们公司的收入水平很高,去年,在50名员工中,最高年收入达到了100万,他们的年收入的平均数为5.5万元.”王某希望获得年薪4.5万元.
(1)根据以上信息,王某能否成为该公司的一名高收入者
(2)如果招聘员继续告诉王某:“员工收入的变化范围是从2.5万~100万”,这个信息能否足以使王某做出决定是否受聘 为什么
(3)如果招聘员继续给王某提供了如下信息:“员工收入的中间50%(即去掉最少的25%和最多的25%后所剩下的)的变化范围是3万到5万”,王某又该如何使用这条信息来做出是否受聘的决定
探究一
探究二
探究三
思想方法
当堂检测
解:(1)不能,因为平均收入和最高收入相差太多,说明高收入的职工只占极少数.现在已经知道至少有一个人的收入为100万元.那么其他员工的收入之和为5.5×50-100=175(万元).
每人平均收入约有175÷49≈3.57(万元),如果再有几个收入特别高的,那么初进公司的员工收入将会很低.
(2)不能,要看中位数是多少.
(3)王某可以受聘,因为可以确定有75%的员工工资在3万元以上,有25%的员工工资在5万元以上.(答案不唯一)
探究一
探究二
探究三
思想方法
当堂检测
1.甲、乙两台机床同时生产一种零件,现要检查它们的运行情况,统计10天中,两台机床每天出的次品数如表所示.
两台机床出次品较少的是( )
A.甲 B.乙 C.一样 D.以上都有可能
答案:B
2.一组样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x等于( )
A.21 B.22 C.20 D.23
答案:A
探究一
探究二
探究三
思想方法
当堂检测
3.某校从甲、乙两班各随机抽取了5名学生的某课程的学分,用茎叶图表示(如图).s1,s2分别表示甲、乙两班各5名学生学分的标准差,则s1 s2.(填“>”“<”或“=”)
答案:<
探究一
探究二
探究三
思想方法
当堂检测
4.样本容量为100的频率分布直方图如图所示,根据样本频率分布直方图估计:样本数据落在[11,15)内的频数为 ;众数为 ;中位数为 ;平均数为 .(每组数用该组中间的数代替)
答案:60 14 14 14.24
探究一
探究二
探究三
思想方法
当堂检测
5.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据折线图和上面算得的结果,对两人的训练成绩作出评价.
探究一
探究二
探究三
思想方法
当堂检测
解:(1)由题图可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.(共24张PPT)
§6 统计活动:结婚年龄的变化
统计活动的步骤
(1)明确调查的目的,确定调查的对象.
(2)利用随机抽样抽取样本,收集数据.
(3)整理数据,用表格来表示数据.
(4)分析数据,其方法有两种:一是用统计图表来分析,二是计算数据的数字特征.
(5)作出推断,通过分析数据作出推断.
【做一做】 给出统计活动的5个步骤,则它们之间正确的顺序是( )
①收集数据 ②整理数据 ③确定调查对象
④分析数据 ⑤作出推断
A.①②③④⑤ B.③①②④⑤
C.③①②⑤④ D.①③②⑤④
答案:B
思考辨析
判断下列说法是否正确,正确的在后面的括号里画“√”,错误的画“×”.
(1)统计活动中,调查的对象要按随机的原则选取,要保证总体中每一个被调查对象被选取的机会均等. ( )
(2)统计活动中,整理数据一般采用表格法整理. ( )
(3)确定调查对象时要保证使样本的选取具有代表性,不能出现倾向性误差. ( )
(4)为了调查我国山区老百姓的生活水平,应采用普查的方式. ( )
答案:(1)√ (2)√ (3)√ (4)×
探究一
探究二
思想方法
当堂检测
统计方案的制定和数据的收集
【例1】 (1)有以下调查项目:
①在中学生中,喜欢写作的学生所占的比例.
②“五一”期间,乘坐火车的人比平时多很多,铁路部门要了解旅客是否都是购票乘车的.
③开学前夕,电工检查学校的照明灯是否正常工作.
④全国观众对中央电视台“春节联欢晚会”的满意程度.适合用普查的是 ,适合用抽样调查的是 .
(2)国务院召开全国青少年校园足球工作电视电话会议,将足球纳入我国学校体育课程教学体系,作为体育课必修内容,为学生提供学习足球的机会.中国业余足球迎来了前所未有的最好发展时期.
请设计一个统计方案,估计你所在的县市的中学生中,喜欢足球的学生所占比例的大小,写出主要步骤.
探究一
探究二
思想方法
当堂检测
(1)解析:①④适宜抽样调查,②③适宜普查.
答案:②③ ①④
(2)解:可以按照如下的步骤来进行这个统计活动.
①确定调查的对象:该县市的全体中学生;
明确调查的目的:是否喜欢足球运动.
②利用随机抽样抽取样本,收集数据.由于中学生太多,只能进行抽样调查.由于学校之间存在差别,采用分层抽样在各个中学抽取样本.为了统计的方便,设计如下的调查表,记录下来.
最好和你的同学一起完成收集数据的任务.
探究一
探究二
思想方法
当堂检测
③整理数据,用表格来表示数据.
把所收集到的数据汇总成一个表格,如表:
④分析数据.
由于是调查喜欢足球的学生占多大的百分比,因此选用扇形统计图来表示.
⑤作出推断,通过分析数据作出推断.根据扇形统计图作出推断.
探究一
探究二
思想方法
当堂检测
反思感悟收集数据的方式
探究一
探究二
思想方法
当堂检测
变式训练1请你设计一个调查全校同学喜欢球类情况的试验.
解:试验的设计步骤如下:
(1)明确目的,准备人手.
(2)开始调查,收集数据,填写各班同学最喜爱的球类运动的人数统计表:
探究一
探究二
思想方法
当堂检测
(3)分析数据,让学生针对统计表得出的数据进行分析,为了更直观地看出表中的信息,还可以用条形统计图和扇形统计图来描述数据.
(4)作出推断,形成报告.
探究一
探究二
思想方法
当堂检测
统计活动中的数据分析
【例2】 某学校高一(1)班和高一(2)班各有49名学生,两班在一次数学测验中的成绩统计如下:
(1)请你对下面的一段话给予简要分析:
(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分79分,得70分的人最多,我得了85分,在班里算是上游了!”
(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.
探究一
探究二
思想方法
当堂检测
解:(1)由于(1)班49名学生数学测验成绩的中位数是87,则85分排在全班第25名之后,所以从位次上看,不能说85分是上游,成绩应该属于中游.但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握得较好,从掌握学习的内容上讲,也可以说属于上游.
(2)(1)班的成绩的中位数是87分,说明不低于87分(含87分)的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难的学生的帮助.
(2)班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学习优异的也很少,建议采取措施提高优秀率.
探究一
探究二
思想方法
当堂检测
反思感悟1.统计活动中的数据分析,可以分析数据中的数字特征,从而全面把握总体情况.
2.统计活动中的数据分析,可以采取图表来分析.这样得到的结果更直观,更能体现出各部分所占的份额.
3.根据统计活动作出的推断结论的准确性,取决于抽取的样本是否具有代表性以及样本容量的大小.一般来说,用科学的抽样方法抽取样本,并且样本容量足够大,由这样的统计活动得到的结论准确性高,可信度大,可以作为决策的依据.
探究一
探究二
思想方法
当堂检测
变式训练2某中学人数相等的甲、乙两班学生参加同一次数学测试,两班平均分和方差分别为
则成绩较为整齐的是( )
A.甲班 B.乙班
C.两班一样齐 D.无法确定
答案:B
探究一
探究二
思想方法
当堂检测
统计在实际问题中的应用
【典例】在美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
思路点拨:画出频率分布直方图的前提是先给出频率分布表.
探究一
探究二
思想方法
当堂检测
解:(1)以4为组距,列表如下:
探究一
探究二
思想方法
当堂检测
相应的频率分布直方图和频率分布折线图如图:
(2)从频率分布表中可以看出,将近65%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.
探究一
探究二
思想方法
当堂检测
方法点睛利用频率分布直方图与频率分布折线图解决实际问题时要注意:
(1)绘图时,应以横轴表示分组,纵轴表示各组频率与组距的比值,以各个组距为底,以各频率除以组距的商为高,分别画成矩形,便得到频率分布直方图;
(2)在频率分布直方图左右两边各添加一个区间,顺次连接频率分布直方图中各个矩形上边的中点及左右两边区间的中点,就得到频率分布折线图.
探究一
探究二
思想方法
当堂检测
变式训练某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )
探究一
探究二
思想方法
当堂检测
解析:根据题意,由频率与频数的关系,计算可得各组的频率,进而可以作出频率分布表,结合频率分布表,进而可以作出频率分布直方图.根据题意,可得频率分布表:
进而可以作频率分布直方图,分析可知选A.
答案:A
探究一
探究二
思想方法
当堂检测
1.下面是四位同学对他们学习小组将要共同进行的一次统计活动分别设计的活动程序,其中正确的是( )
答案:C
2.为了调查2017年上半年我国居民消费价格指数的变化情况,收集数据后,整理、分析数据的最佳方式是( )
A.画茎叶图 B.画扇形统计图
C.画折线统计图 D.计算方差
答案:C
探究一
探究二
思想方法
当堂检测
3.如图所示是容量为100的样本的频率分布直方图,试根据图形中的数据填空:
(1)样本数据落在范围[6,10)内的频率为 ;
(2)样本数据落在范围[10,14)内的频数为 ;
(3)总体在[2,6)内的频率约为 .
解析:(1)样本数据落在范围[6,10)内的频率为0.08×4=0.32;
(2)样本数据落在范围[10,14)内的频数为0.09×4×100=36;
(3)总体在[2,6)内的频率约为0.02×4=0.08.
答案:(1)0.32 (2)36 (3)0.08
探究一
探究二
思想方法
当堂检测
4.问题情境:湖南卫视推出的户外真人秀节目《爸爸去哪儿》在儿童观众中引起强烈反响,获得了很高的关注度和收视率.
问题:请设计统计方案,估计你所在市(县)的小学生中,喜欢《爸爸去哪儿》这个节目的学生所占的比例.
解:可以按照如下的步骤来进行这个统计活动:
(1)确定调查的对象:该县(市)的全体小学生;明确调查的目的:是否喜欢《爸爸去哪儿》这个节目.
(2)利用随机抽样抽取样本,收集数据.
由于一个县(市)的小学生太多,只能进行抽样调查.由于学校之间存在差别,采用分层抽样在各个小学抽取样本.为了统计的方便,设计如下的调查表,记录下来.
最好你和你的同学一起完成收集数据的任务.
探究一
探究二
思想方法
当堂检测
(3)整理数据,用表格来表示数据.
把所收集到的数据汇总成一个表格,如下表.
(4)分析数据.
由于是调查喜欢这个节目的学生所占的百分比,因此选用扇形统计图来表示.
(5)作出推断.通过分析数据作出推断.
根据扇形统计图作出推断.(共21张PPT)
§7 相关性
1.两个变量的关系
【做一做1】 下列语句所表示的事件中的因素不具有相关关系的是( )
A.瑞雪兆丰年
B.名师出高徒
C.吸烟有害健康
D.喜鹊叫喜,乌鸦叫丧
答案:D
2.散点图
在考虑两个变量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图.通常称这种图为变量之间的散点图.
3.曲线拟合
从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.
4.线性相关、非线性相关
若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的.
若所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关的,此时,可以用一条曲线来拟合.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.
【做一做2】 对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )
A.变量x与y线性相关,u与v非线性相关
B.变量x与y线性相关,u与v不相关
C.变量x与y线性相关,u与v线性相关
D.变量x与y不相关,u与v不相关
答案:C
思考辨析
判断下列说法是否正确,正确的在后面的括号里画“√”,错误的画“×”.
(1)相关关系就是函数关系. ( )
(2)函数关系就是相关关系. ( )
(3)线性相关关系就是一次函数关系. ( )
(4)画拟合直线时,要使尽可能多的点落在所画的这些直线上或使尽可能多的点在该条直线附近,且拟合直线不是唯一的. ( )
答案:(1)× (2)× (3)× (4)√
探究一
探究二
思维辨析
当堂检测
相关关系的理解
【例1】 下列两个变量间的关系是相关关系的是 ( )
A.正方体的棱长与体积
B.角的度数与它的正弦值
C.单产为常数时,土地面积与粮食总产量
D.日照时间与水稻的单位产量
解析:函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.因为A项V=a3,B项y=sin α,C项y=ax(a>0,且a为常数),所以这三项均是函数关系.D项是相关关系.
答案:D
探究一
探究二
思维辨析
当堂检测
反思感悟1.相关关系指的是两个变量之间的一种不确定性关系,它们之间可能具有因果关系,也可能具有伴随关系,当一个变量取一个值时,另一个变量的取值带有一定的随机性.
2.相关关系与函数关系不同,在函数关系中,对于一个变量的一个确定的值,另一个变量有唯一确定的值与之对应.
3.确定两个变量之间是否具有相关关系时,可根据日常生产、生活经验进行判断.
探究一
探究二
思维辨析
当堂检测
变式训练1(1)下列关系是相关关系的是 .(填序号)
①曲线上的点与该点的坐标之间的关系.
②苹果的产量与气候之间的关系.
③森林中的同一种树木,其横截面直径与高度之间的关系.
④学生与其学号之间的关系.
(2)某地农业技术指导站的技术员,经过在7块并排的,大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如表所示的一组数据(单位:kg):
判断施化肥量x和水稻产量y是否具有相关关系 (填“有”或“没有”).
探究一
探究二
思维辨析
当堂检测
(1)答案:②③
(2)解析:散点图如图所示.
从散点图可以看出施化肥量x和水稻产量y的确存在一定的相关关系.
答案:有
探究一
探究二
思维辨析
当堂检测
散点图的画法及其应用
【例2】 (1)下列选项中的两个变量,具有相关关系的是( )
探究一
探究二
思维辨析
当堂检测
(2)某种木材体积与树木的树龄之间有如下的对应关系:
①请作出这些数据的散点图.
②你能从散点图发现木材体积与树木的树龄近似成什么关系吗
探究一
探究二
思维辨析
当堂检测
(1)解析:由图易知,A,C描述的是两个变量之间的函数关系,B和D是散点图,其中B中的两个变量具有相关关系,且是线性相关关系,D中的散点图分布没有规律,两个变量不具有相关关系.
答案:B
(2)解:①以x轴表示树木的树龄,y轴表示树木的体积,可得相应的散点图如图所示.
②由散点图发现木材体积随着树龄的增加而呈增加的趋势.所以木材的体积与树龄成线性相关关系.
探究一
探究二
思维辨析
当堂检测
反思感悟散点图的作用及画法
1.画散点图时,各个散点用实心点表示.
2.散点图的重要作用就是用其判断两个变量之间是否具有相关关系.
3.散点图的画法:
(1)建立平面直角坐标系,两坐标轴的单位长度可以不一致;
(2)以两个变量对应的每一组取值,分别作为点的横坐标、纵坐标,在平面直角坐标系中作出各点,即得散点图.
探究一
探究二
思维辨析
当堂检测
变式训练2李老师为了了解学生的计算能力,对某同学进行了10次测验,收集数据如下:
画出散点图,并判断它们是否有线性相关关系.
解:散点图如图所示.
由散点图可以看出,做题时间随做题数的增加而增加,各个点分布在一条直线附近,因此两者之间具有线性相关关系.
探究一
探究二
思维辨析
当堂检测
不理解相关关系与函数关系的本质而致误
【典例】 下列关系是相关关系的有 .
①天空中的云量和下雨;
②圆柱体积与其底面直径的关系;
③自由下落的物体的质量与落地时间的关系;
④球的表面积与球的半径之间的关系.
错解①
正解①②
纠错心得本题错误的原因是对相关关系和函数关系的本质把握不准,尤其对于②,误认为圆柱体积是关于底面直径的函数,而实际上圆柱的体积除了与底面直径有关,还与圆柱高有关,是由这两个量共同决定的.如果圆柱的高固定,那么圆柱的体积就是关于底面直径的函数了.
探究一
探究二
思维辨析
当堂检测
变式训练有五组变量:
①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;
②平均日学习时间和学习成绩;
③某人每日吸烟量和其身体健康情况;
④立方体的棱长和体积.
其中两个变量具有相关关系的是 .
答案:①②③
探究一
探究二
思维辨析
当堂检测
1.根据一组数据判断两个变量之间是否线性相关时,应选哪个图( )
A.茎叶图 B.频率分布直方图
C.散点图 D.频率折线图
答案:C
探究一
探究二
思维辨析
当堂检测
2.如图所示两个变量具有相关关系的是( )
A.①② B.①③ C.②④ D.②③
解析:①中的两个变量具有函数关系,④中的两个变量不具有相关关系.
答案:D
探究一
探究二
思维辨析
当堂检测
3.下面各组变量之间具有相关关系的是 (填序号).
①高原含氧量与海拔高度.②速度一定时,汽车行驶的路程和所用的时间.③学生的成绩和学生的身高.④父母的身高和子女的身高.
答案:①④
4.5名学生的数学成绩和化学成绩如表:
则数学成绩与化学成绩之间是否具有线性相关关系 (填“有”或“没有”).
答案:有
探究一
探究二
思维辨析
当堂检测
5.在某种产品的表面进行腐蚀刻线试验,得到腐蚀时间x(单位:分)与腐蚀深度y(单位:微米)之间的一组数据:
请画出散点图并判断它们是否具有线性相关关系,若有线性相关关系,作出拟合直线.
解:作出散点图如图所示,显然这两者具有线性相关关系,拟合直线如图所示.(共31张PPT)
§8 最小二乘估计
1.最小二乘法
如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:
[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2.
使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.
2.回归直线方程
【做一做1】 已知x与y之间的一组数据如下表:
则y与x的线性回归方程y=bx+a,必过点( )
A.(2,3) B.(1.5,3)
C.(1.5,3.25) D.(2,3.25)
答案:C
3.线性回归分析
利用最小二乘法估计时,要先作出数据的散点图.如果散点图呈现一定的规律性,我们再根据这个规律进行拟合.如果散点图呈现出线性关系,我们可以用最小二乘法估计出线性回归方程;如果散点图呈现出其他的曲线关系,我们就要利用其他的曲线进行拟合.
规律总结线性回归分析的步骤:
(1)作散点图,判断两个变量是否线性相关,若是,再执行以下步骤;
(4)代入公式计算b,a的值;
(5)写出线性回归方程;
(6)根据回归系数的意义进行估计和判断.
【做一做2】 设有一个回归方程为 =-1.5x+2,则变量x增加一个单位时( )
A.y平均增加1.5个单位
B.y平均增加2个单位
C.y平均减少1.5个单位
D.y平均减少2个单位
解析:∵两个变量线性负相关,∴变量x增加一个单位,y平均减少1.5个单位.
答案:C
思考辨析
判断下列说法是否正确,正确的在后面的括号里画“√”,错误的画“×”.
(1)散点图能直观地反映数据的相关程度. ( )
(2)任意一组数据都有一个对应的线性回归方程. ( )
(3)散点图中的点越集中,两个变量的相关性越强. ( )
(4)线性回归方程最能代表线性相关的两个变量之间的关系. ( )
答案:(1)√ (2)× (3)× (4)√ (5)√
探究一
探究二
探究三
思想方法
当堂检测
求线性回归方程
【例1】某市近5年的煤气消耗量与使用煤气户数如下表:
(1)检验变量x,y是否线性相关;
(2)求y对x的线性回归方程.
分析:根据表中的数据→作出散点图→判断是否线性相关→若是,则根据公式求得a,b→得线性回归方程
探究一
探究二
探究三
思想方法
当堂检测
解:(1)作出散点图,由散点图知变量x,y线性相关.
探究一
探究二
探究三
思想方法
当堂检测
探究一
探究二
探究三
思想方法
当堂检测
变式训练1若在一次试验中,测得(x,y)的四组数值分别是A(1,3), B(2,3.8),C(3,5.2),D(4,6).则y与x之间的线性回归方程是( )
A.y=x+1.9 B.y=1.04x+1.9
C.y=0.95x+1.04 D.y=1.05x-0.9
答案:B
探究一
探究二
探究三
思想方法
当堂检测
回归直线的性质
【例2】 下表提供了某种产品投入的广告费用x(单位:万元)与相应销售金额y(单位:十万元)的几组数据,
根据上表提供的数据,求出y关于x的线性回归方程是y=0.25x+1.75,后来表中的某个数据被污染,则被污染的数据最有可能是( )
A.2.8 B.2.5 C.2.6 D.3.6
探究一
探究二
探究三
思想方法
当堂检测
答案:B
反思感悟回归直线y=bx+a一定经过样本点的中心 ,根据这一性质可以快速地确定回归直线系数的值或者根据回归系数的值确定未知数据.
探究一
探究二
探究三
思想方法
当堂检测
变式训练2已知x,y的取值如下表所示,
答案:B
探究一
探究二
探究三
思想方法
当堂检测
利用线性回归方程对总体进行估计
【例3】 对具有线性相关关系的变量x,y,测得一组数据如下:
根据上表,利用最小二乘法得它们的回归直线方程为y=10.5x+a,据此模型来预测当x=20时,y的估计值为 ( )
A.210 B.210.5 C.211.5 D.212.5
解析:由数据可知 ,代入回归直线方程得a=1.5,所以y=10.5x+1.5,当x=20时,y=10.5×20+1.5=211.5.
答案:C
反思感悟1.利用线性回归方程对总体进行估计,关键在于正确地求出线性回归方程.
2.利用线性回归方程进行预测和估计时,所得到的结果只是一个估计值,而不是精确值.
探究一
探究二
探究三
思想方法
当堂检测
变式训练3(1)根据下表样本数据:
得到的回归方程为y=bx+a.若a=7.9,则x每增加1个单位,y就( )
A.增加1.4个单位 B.减少1.4个单位
C.增加1.2个单位 D.减少1.2个单位
(2)从某一行业随机抽取12家企业,它们的生产量与生产费用的数据如表所示:
探究一
探究二
探究三
思想方法
当堂检测
①绘制生产量x和生产费用y相应数据对应的散点图.
②如果两个变量之间是线性相关关系,请用最小二乘法求出其线性回归方程.
③如果一个企业的生产量是120台,请预测它的生产费用.
探究一
探究二
探究三
思想方法
当堂检测
答案:B
(2)解:①散点图如图所示:
②根据散点图可知,两个变量x和y之间的关系是线性相关关系.下面用最小二乘法求线性回归方程:
探究一
探究二
探究三
思想方法
当堂检测
探究一
探究二
探究三
思想方法
当堂检测
(3)在线性回归方程y=0.42x+124.22中,常数项124.22可以认为是固定费用,它不随生产量的变化而变化;0.42可以认为是可变费用的增长系数,即每增加1个单位的生产量就增加0.42个单位的费用.将x=120代入线性回归方程得y=0.42×120+124.22=174.62,即如果一个企业的生产量是120台,它的生产费用约为174.62万元.
探究一
探究二
探究三
思想方法
当堂检测
线性回归方程的求法与应用
【典例】一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次实验,收集数据如下:
(1)画出散点图.
(2)求线性回归方程.
(3)关于加工零件的个数与加工时间,你能得出什么结论
分析:(1)横坐标表示加工零件个数,纵坐标表示加工时间,建立平面直角坐标系即可绘制散点图.
(2)利用散点图中点的走势即可得出变量之间是否线性相关,然后利用最小二乘法求出线性回归方程,利用方程得出(3)中的预测结论.
探究一
探究二
探究三
思想方法
当堂检测
解:(1)散点图如图所示.
由散点图知二者呈线性相关关系.
探究一
探究二
探究三
思想方法
当堂检测
(2)设线性回归方程为y=bx+a.
列表并利用科学计算器进行有关计算.
故所求线性回归方程为
y=0.668x+54.96.
(3)由线性回归方程可以得出每多加工10个零件,就多花费6.68时.
探究一
探究二
探究三
思想方法
当堂检测
方法点睛1.解决此类问题,因为已知y与x线性相关,所以只需代入公式进行求解,鉴于代入很烦琐,因此要分步来求解,并且要注意运算结果的正确性.
2.根据线性回归方程来进行预测或估计时,要注意明确方程中的各个量在实际问题的含义,不要混淆,做到有的放矢.
3.线性回归方程中的回归系数b代表x每增加一个单位,y平均增加的单位数,而不是增加单位数,也就是说,此时对y的预测是平均预测.
探究一
探究二
探究三
思想方法
当堂检测
变式训练下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对应数据.
(1)请画出表中数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程y=bx+a;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的回归直线方程,预测技改后生产100吨甲产品的生产能耗比技改前降低多少吨标准煤
探究一
探究二
探究三
思想方法
当堂检测
解:(1)由题设所给数据可得散点图,如图所示.
因此,所求的回归直线方程为y=0.7x+0.35.
(3)由(2)的回归直线方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90-(0.7×100+0.35)=19.65(吨标准煤).
探究一
探究二
探究三
思想方法
当堂检测
1.工人月工资y(单位:元)依劳动生产率x(单位:千元)变化的线性回归方程为y=50+80x,下列判断正确的是 ( )
A.劳动生产率为1 000元时,工资为130元
B.劳动生产率提高1 000元,则工资平均提高80元
C.劳动生产率提高1 000元,则工资平均提高130元
D.当月工资为210元时,劳动生产率为2 000元
答案:B
2.下列命题:①线性回归方法就是寻找一条贴近已知样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系来表示;③通过线性回归方程y=bx+a可以估计和预测变量的取值和变化趋势.
其中正确的命题是( )
A.①② B.①③ C.②③ D.①②③
答案:D
探究一
探究二
探究三
思想方法
当堂检测
3.下表是x与y之间的一组数据,则y关于x的回归直线必过点( )
A.(2,2) B.(1.5,2)
C.(1,2) D.(1.5,4)
答案:D
探究一
探究二
探究三
思想方法
当堂检测
4.登山族为了了解某山高y(单位:km)与气温x(单位:℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:
由表中数据,得到线性回归方程y=-0.2x+a(a∈R),由此估计出山高为7.2 km处的气温为( )
A.-10 ℃ B.-8 ℃
C.-6 ℃ D.-4 ℃
答案:C
探究一
探究二
探究三
思想方法
当堂检测
5.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回归方程为 =0.72x-58.2,张明同学(20岁)身高178 cm,他的体重应该在 kg左右.
解析:用回归方程对身高为178 cm的人的体重进行预测,当x=178时,
=0.72×178-58.2=69.96(kg).
答案:69.96
探究一
探究二
探究三
思想方法
当堂检测
6.某车间为了规定工时定额,需要确定加工某零件所花费的时间,为此做了四次实验,得到的数据如下:
(1)求出y关于x的线性回归方程.
(2)试预测加工10个零件需要多少时间
故a=2.75-0.8×3.5=-0.05,
所以y=0.8x-0.05.
(2)将x=10代入回归直线方程,得y=0.8×10-0.05=7.95.
所以预测加工10个零件需要7.95时.