2020_2021学年高中数学第二章统计学案含解析(6份打包)新人教版必修3

文档属性

名称 2020_2021学年高中数学第二章统计学案含解析(6份打包)新人教版必修3
格式 zip
文件大小 1.6MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2021-03-16 12:31:37

文档简介

2.1 随机抽样
2.1.1 简单随机抽样
内 容 标 准
学 科 素 养
1.理解并掌握简单随机抽样的定义、特点和适用范围.2.掌握两种简单随机抽样的步骤,并能用简单随机抽样方法抽取样本.
提升数据分析发展数学抽象应用数学建模
授课提示:对应学生用书第26页
[基础认识]
知识点一 简单随机抽样
预习教材P54-56,思考并完成以下问题
我们生活在一个数字化时代,时刻都在和数据打交道,例如,产品的合格率,农作物的产量,商品的销售量,电视台的收视率等.这些数据你想知道是怎么获得的吗?
(1)为了了解高一学生身高的情况,我们找到了某地区高一8
000名学生的体检表,从中随机抽取了150张,表中有体重、身高、血压、肺活量等15个数据,那么我们收集的个体数据是什么?
提示:因为我们了解的是高一学生身高的情况,所以需要收集的个体数据是表中学生的身高的数据.
(2)要判断一锅汤的味道需要把整锅汤都喝完吗?应该怎样判断?
提示:不需要.只要将锅里的汤“搅拌均匀”,品尝一小勺就知道汤的味道了.
(3)在1936年美国总统选举前,一份颇有名气的杂志的工作人员对兰顿和罗斯福两位候选人做了一次民意测验.调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表.调查结果表明,兰顿当选的可能性大(57%),但实际选举结果正好相反,最后罗斯福当选(62%).你认为预测结果出错的原因是什么?
提示:在1936年电话和汽车只有少数富人拥有,仅抽取这些富人作为民意调查的个体,导致样本的代表性不强,所以由样本数据得出的结论可能不正确.
(4)要用随机抽样的方法从总体中抽出高质量的样本,应对总体做怎样的处理?
提示:要将总体“搅拌均匀”,使每个个体有同样的机会被抽中.
知识梳理 设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
知识点二 简单随机抽样的常用方法
预习教材P56-57,思考并完成以下问题
(1)假设要在我们班选派5个人去参加某项活动,为了体现选派的公平性,你有什么办法确定具体人选?如何操作?
提示:用抽签法(抓阄法)确定人选,用小纸条把每个同学的学号写下来放在盒子里,并搅拌均匀,然后随机从中逐个抽出5个学号,被抽到学号的同学即为参加活动的人选.
(2)假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,还可以用抽签法吗?
提示:当总体个数较多时很难搅拌均匀,抽签法不适合.
知识梳理 1.抽签法
把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
2.随机数法
随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.
[自我检测]
1.在简单随机抽样中,某一个个体被抽中的可能性(  )
A.与第几次抽样有关,第一次抽中的可能性要大些
B.与第几次抽样无关,每次抽中的可能性都相等
C.与第几次抽样有关,最后一次抽中的可能性要大些
D.每个个体被抽中的可能性无法确定
解析:在简单随机抽样中,每一个个体被抽中的可能性都相等,与第几次抽样无关.故选B.
答案:B
2.下列抽样方法是简单随机抽样的是(  )
A.从50个零件中一次性抽取5个做质量检验
B.从50个零件中有放回地抽取5个做质量检验
C.从整数集中逐个抽取10个分析是奇数还是偶数
D.运动员从8个跑道中随机抽取一个跑道
解析:A项中是一次性抽取5个,不是逐个抽取,则A项不是简单随机抽样;B项中是有放回抽取,则B项也不是简单随机抽样;C项中整数集是无限集,总体容量不是有限的,则C项也不是简单随机抽样;很明显D项是简单随机抽样.
答案:D
3.采用简单随机抽样,从6个标有序号A、B、C、D、E、F的球中抽取1个球,则每个球被抽到的可能性是__________.
解析:每个个体抽到的可能性是一样的.
答案:
授课提示:对应学生用书第27页
探究一 简单随机抽样的概念
[例1] 下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取20个个体作为样本;
(2)从50台冰箱中一次性抽取5台冰箱进行质量检查;
(3)一彩民选号,从装有36个大小、形状都相同的号签的盒子中不放回地逐个抽取6个号签.
[解析] (1)不是简单随机抽样.因为总体的个数是无限的,而不是有限的.(2)不是简单随机抽样.虽然“一次性”抽取和“逐个”抽取不影响个体被抽到的可能性,但简单随机抽样的定义要求的是“逐个不放回地抽取”.(3)是简单随机抽样.因为总体的个数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能地进行抽样.
方法技巧 简单随机抽样的四个特征
跟踪探究 1.下列抽样方式是否是简单随机抽样?
(1)在某车间包装一种产品,在自动包装的传送带上每隔30分钟抽一包产品,检验其质量是否合格;
(2)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
解析:由简单随机抽样的特点可知,(1)(2)均不是简单随机抽样.
探究二 抽签法
[例2] 某卫生单位为了支援抗震救灾,要在18名志愿者中选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.
[解析] 方案如下:
第一步,将18名志愿者编号,号码为:01,02,03,…,18.
第二步,将号码分别写在相同的纸条上,揉成团,制成号签.
第三步,将得到的号签放到一个不透明的盒子中,充分搅匀.
第四步,从盒子中依次取出6个号签,并记录上面的编号.
第五步,与所得号码对应的志愿者就是医疗小组成员.
方法技巧 1.一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.
2.应用抽签法时应注意以下几点:
(1)编号时,如果已有编号可不必重新编号;
(2)号签要求大小、形状完全相同;
(3)号签要均匀搅拌;
(4)要逐一不放回的抽取.
跟踪探究 2.从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴.
解析:第一步:将20架钢琴编号,号码是01,02,…,20;
第二步:将号码分别写在一张纸条上,揉成团,制成号签;
第三步:将得到的号签放入一个不透明的袋子中,并充分搅匀;
第四步:从袋子中逐个不放回抽取5个号签,并记录上面的编号;
第五步:所得号码对应的5架钢琴就是要抽取的对象.
探究三 随机数表法
[阅读教材P56]假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本.
方法步骤:
第一步,编号;
第二步,确定读数方向;
第三步,获取样本.
[例3] 为了检验某种药品的副作用,从编号为1,2,3,…,120的服药者中用随机数表法抽取10人作为样本,写出抽样过程.
[解析] 第一步,将120名服药者重新进行编号,分别为001,002,003,…,120;第二步,在随机数表(教材P103)中任选一数作为初始数,如选第9行第7列的数3;第三步,从选定的数3开始向右读,每次读取三位,凡不在001~120中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到074,100,094,052,080,003,105,107,083,092;
第四步,以上这10个号码所对应的服药者即是要抽取的对象.
方法技巧 1.在利用随机数法抽样的过程中应注意:
(1)编号要求数位相同.
(2)第一个数字的抽取是随机的.
(3)读数的方向是任意的,且事先定好的.
2.随机数法的特点:
优点:简单易行.它很好地解决了当总体中的个体数较多时用抽签法制签难的问题.
缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数法抽取样本容易重号.
延伸探究 1.如果本例改为“从编号1,2,3,…,100的服药者中用随机数表法抽取10人作为样本”.请写出抽样过程.
解析:第一步,将100名服药者重新编号,分别为00,01,02,…,99;
第二步,在随机数表(教材P103)中任选一数作为初始数,如选第9行第7列的数3.
第三步,从选定的数3开始向右读,每次读取两位数,凡在00~99中的读取出来,前面已读数字跳过不读,依次可得,34,29,78,64,56,07,82,52,42,44.
第四步,以上10个号码对应的服药者即是要抽取的对象.
2.本题其他条件不变,若要用抽签法取样,则:
(1)要不要对服药者进行重新编号?
(2)所选出的10人是不是相同的?
解析:(1)若运用抽签法取样,对已有编号的个体不用再重新进行编号.
(2)用抽签法选出的10人与用随机数表法选出的10人不一定相同,其实既使用相同的方法抽样,不同两次的抽取结果也不一定完全相同.
授课提示:对应学生用书第28页
[课后小结]
1.要判断所给的抽样方法是否为简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点.
2.一个抽样试验能否用抽签法,关键看两点:一是制作号签是否方便;二是号签是否容易被搅拌均匀.一般地,当总体容量和样本容量都较少时可用抽签法.
3.利用随机数表示抽取个体时,关键是先确定以表中的哪个数(哪行哪列)作为起点,以哪个方向作为读数的方向.需注意读数时结合编号特点进行读取,编号为两位,则两位两位地读取;编号为三位,则三位三位地读取.
[素养培优]
1.不理解编码规则而致错
某工厂的质检人员对生产的100件产品,采用随机数表法抽取10件进行检查,对100件产品采用下面的编号方法:①1,2,3,…,100;②001,002,003,…,100;③00,01,02,…,99.其中最恰当的编号是__________.
错解 因为是对100件产品编号,则编号为1,2,3,…,100,所以①最恰当.
易错分析 用随机数表法抽样时,如果所编号码的位数不相同,那么无法在随机数表中读数,因此,所编号码的位数要相同.
自我纠正 只有编号时数字位数相同,才能达到随机等可能抽样.所以①不恰当.②③的编号位数相同,都可以采用随机数表法,但②中号码是三位数,读数费时,所以③最恰当.
答案:③
2.对随机数表的随机性理解不到位
有的同学认为随机数表只有一张,并且读数时只能按照从左向右的方向读取,否则,产生的随机样本就不同了,对整体的估计就不准确了.你认为这种想法正确吗?
错解 正确.
易错分析 由于随机数表的产生是随机的,读数的方向也是随机的,不同的样本对总体的估计结果相差不大,故上述想法是不正确的.
自我纠正 不正确.
PAGE2.1.2 系统抽样
内 容 标 准
学 科 素 养
1.记住系统抽样的方法和步骤.2.会用系统抽样从总体中抽取样本.3.能用系统抽样解决实际问题.
提升数学运算发展数据分析应用数学建模
授课提示:对应学生用书第29页
[基础认识]
知识点一 系统抽样的概念
预习教材P58,思考并完成以下问题
在一次有奖明信片的100
000个有机会中奖的号码(编号00
000~99
999)中,邮政部门按照随机抽取的方式确定后两位为37的号码为中奖号码.
(1)上述抽样是简单随机抽样吗?
提示:不是.
(2)上述抽样方法有什么特点?
提示:每隔100个号码有一个中奖.
知识梳理 要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.
知识点二 系统抽样的步骤
预习教材P58,思考并完成以下问题
某学校高一年级有1
003名学生,为了解他们的视力情况,准备按1∶100的比例抽取一个样本,试采用系统抽样方法抽取所需的样本,并写出抽样过程.
(1)如何确定分段间隔k?需剔除几名学生?
提示:需从总体中剔除3名学生,分段间隔k==100.
(2)用什么方法剔除学生?
提示:可采用随机数法抽取样本.
知识梳理
[自我检测]
1.某影院有40排座位,每排有46个座位,一个报告会上坐满了听众,会后留下座号为20的所有听众进行座谈,这是运用了(  )
A.抽签法      
B.随机数表法
C.系统抽样法
D.放回抽样法
解析:此抽样方法将座位分成40组,每组46个个体,会后留下座号为20的相当于第一组抽20号,以后各组抽取20+46n,符合系统抽样特点.
答案:C
2.有20个同学,编号为1~20,现在从中抽取4人的作文卷进行调查,用系统抽样方法确定所抽的编号为(  )
A.5,10,15,20
B.2,6,10,14
C.2,4,6,8
D.5,8,11,14
解析:将20分成4个组,每组5个号,间隔等距离为5.
答案:A
3.为了解240名学生对某项教改的意见,打算从中抽取6名学生调查,采用系统抽样法,则分段间隔k为__________.
解析:k==40.
答案:40
授课提示:对应学生用书第30页
探究一 系统抽样的概念
[例1] 下列抽样中,最适宜用系统抽样的是(  )
A.某市的4个区共有2
000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200名入样
B.从某厂生产的2
000个电子元件中随机抽取5个入样
C.从某厂生产的2
000个电子元件中随机抽取200个入样
D.从某厂生产的20个电子元件中随机抽取5个入样
[解析] 根据系统抽样的定义和特点判断,A项中的总体有明显的层次区别,不适宜用系统抽样;B项中样本容量很小,适合随机数表法;D项中总体容量较小,适合抽签法.
答案:C
方法技巧 系统抽样的判断方法
判断一个抽样是否为系统抽样:(1)首先看是否在抽样前知道总体是由什么组成,多少个个体;(2)再看是否将总体分成几个均衡的部分,并在每一个部分中进行简单随机抽样;(3)最后看是否等距抽样.
跟踪探究 1.下列抽样方法不是系统抽样的是(  )
A.从标有1~15号的15个球中,任选三个作样本,按从小号到大号的顺序,随机选起点i0,以后选i0+5,i0+10(超过15则从1再数起)号入选
B.工厂生产的产品用传送带将产品送入包装车间前,在一天时间内检验人员从传送带上每隔五分钟抽一件产品进行检验
C.做某项市场调查,规定在商场门口随机抽一个人进行询问调查,直到达到事先规定的调查人数为止
D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
解析:A编号间隔相同,B时间间隔相同.D相邻两排座位号的间隔相同,均满足系统抽样的特征.只有C项无明显的系统抽样的特征.
答案:C
探究二 系统抽样中的计算问题
[例2] 采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为(  )
A.7         
B.9
C.10
D.15
[解析] 从960人中用系统抽样的方法抽取32人,则抽样间隔为k==30.
因为第一组号码为9,则第二组号码为9+1×30=39,…,第n组号码为9+(n-1)×30=30n-21.由451≤30n-21≤750,即15≤n≤25,所以n=16,17,…,25,共有25-16+1=10(人).
[答案] C
方法技巧 系统抽样计算问题的解法及技巧
(1)若已知总体数,且样本容量已知,则采用系统抽样方法进行抽样时,如果要剔除一些个体,那么需要剔除的个体数为总体数除以样本容量所得的余数.
(2)利用系统抽样的概念与等距特点,若在第一段抽取的编号为m,分段间隔为d,则在第k段中抽取的第k个编号为m+(k-1)d.
(3)若求落入区间[a,b]的样本个数,则可通过列出不等式a≤m+(k-1)d≤b,解出满足条件的k的取值范围.再根据k∈N
,求出其范围内的正整数个数即可.
跟踪探究 2.某单位有200名职工,现要从中抽取40名职工作为样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.
解析:由系统抽样的知识可知,将总体分成均等的若干部分是将总体分段,且分段间隔为5.因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.
答案:37
探究三 系统抽样的方案设计
[阅读教材P58]一般地,假设要从容量为N的总体中抽取容量为n的样本,我们可以按照下列步骤进行系统抽样.
方法步骤:
第一步,将总体的N个个体编号.
第二步,确定分段间隔k,对编号进行分段.
第三步,在第1段用简单随机抽样确定起始个体编号l.
第四步,按照一定的规则抽取样本.
[例3] 某工厂有工人1
007名,现从中抽取100人进行体检,试写出抽样方案.
[解析] 用系统抽样的方法抽取样本.
第一步,编号.将1
007名工人编号,号码为0
001,0
002,…,1
007.
第二步,利用随机数表法抽取7个号码,将对应编号的工人剔除.
第三步,将剩余的1
000名工人重新编号,号码为0
001,0
002,…,1
000.
第四步,确定分段间隔k==10,将总体分成100段,每段10名工人.
第五步,在第1段中,利用抽签法或者随机数表法抽取一个号码m.
第六步,利用分段间隔,将m,m+10,m+20,…,m+990共100个号码抽出.
方法技巧 1.当总体容量不能被样本容量整除时,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.
2.被剔除的部分个体可采用简单随机抽样法抽取.
3.剔除部分个体后应重新编号.
4.每个个体被抽到的机会均等,被剔除的机会也均等.
延伸探究 1.本例改为:某工厂有102名工人,现从中抽取10人进行体检,请写出抽样方案.
解析:根据条件,可采用抽签法抽取样本.
第一步:编号,把102名工人编号为1,2,3,…,102.
第二步:制签,做好大小、形状完全相同的号签,分别写上这102个数.
第三步:搅拌,将这些号签放入暗箱,充分摇匀.
第四步:入样,每次从中抽一个号签,不放回地连续抽10次,从而得到容量为10的入选样本.
2.本例改为:某工厂有1
007名工人,现从中抽取100人进行调查工资收入情况,能否用系统抽样方法抽取样本?为什么?
解析:不能用系统抽样抽取,因为工人的工资状况与其年龄、工种等因素有关,总体中个体有明显的分层.
授课提示:对应学生用书第31页
[课后小结]
1.体会系统抽样的概念,其中关键因素是“分组”,否则不是系统抽样.系统抽样适用于总体中的个体数较多的情况,因为这时采用简单随机抽样显得不方便.
2.解决系统抽样问题的两个关键步骤为:
(1)分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本.
(2)用系统抽样法抽取样本,当不为整数时,取k=,即先从总体中用简单随机抽样的方法剔除N-nk个个体,且剔除多余的个体不影响抽样的公平性.
[素养培优]
系统抽样操作失误致误
中秋节,相关部门对某食品厂生产的303盒中秋月饼进行质量检验,需要从中抽取10盒,请用系统抽样的方法完成对此样本的抽取.
易错分析 在第二步剔除3盒月饼后没有对剩下的月饼进行从000,001,…,299重新编号.
自我纠正 (1)将303盒月饼用随机的方式编号;
(2)从总体中用简单随机抽样的方式剔除3盒月饼,将剩下的月饼重新用000~299编号,并等距分成10段;
(3)在第一段000,001,002,…,029这三十个编号中用简单随机抽样确定起始号码l;
(4)将编号为l,l+30,l+2×30,l+3×30,…,l+9×30的个体抽出,组成样本.
PAGE2.1.3 分层抽样
内 容 标 准
学 科 素 养
1.记住分层抽样的特点和步骤.2.会用分层抽样从总体中抽取样本.3.给定实际抽样问题会选择合适的抽样方法进行抽样.
提升数学运算发展逻辑推理应用数学建模
授课提示:对应学生用书第31页
[基础认识]
知识点 分层抽样
预习教材P60-61,思考并完成以下问题
某市为调查中小学生的近视情况,在全市范围内分别对小学生、初中生、高中生三个群体抽样,进而了解中小学生的总体情况和三个群体近视情况的差异大小.
(1)上述问题中样本总体有什么特征?
提示:此总体,小学生、初中生、高中生三个群体在年龄、体质等方面存在着明显的差异.
(2)若采用抽签法或系统抽样法会出现什么结果?
提示:抽取的样本可能集中于某一个群体,不具有代表性.
(3)为使抽取的样本更合理,更有代表性,有更好的抽样方法解决该问题吗?
提示:有.可分不同群体抽取.
知识梳理 1.分层抽样的概念
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
2.分层抽样的适用条件
分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.
[自我检测]
1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是(  )
A.抽签法     
B.随机数法
C.系统抽样法
D.分层抽样法
解析:由于是调查男、女学生在学习兴趣与业余爱好方面是否存在差异,因此用分层抽样方法.
答案:D
2.要完成下列两项调查:
①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;
②从某中学的15名艺术特长生中选出3人调查学习负担情况.
宜采用的抽样方法依次为__________,__________.
解析:①中由于收入差别较大,宜于用分层抽样,②中个数较少,宜于用简单随机抽样.
答案:分层抽样 简单随机抽样
3.有一批产品,其中一等品10件,二等品25件,次品5件.用分层抽样从这批产品中抽出8件进行质量分析,则抽取的一等品有__________件.
解析:抽样为×10=2.
答案:2
授课提示:对应学生用书第32页
探究一 分层抽样的概念
[例1] 某中学有老年教师20人,中年教师65人,青年教师95人.为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是(  )
A.抽签法       B.系统抽样
C.分层抽样
D.随机数法
[解析] 各部分之间有明显的差异是分层抽样的依据.
[答案] C
方法技巧 各部分之间有明显的差异是分层抽样的依据,至于各层内用什么方法抽样是灵活的,可用简单随机抽样,也可采用系统抽样.分层抽样中,无论哪一层的个体,被抽中的机会均等,体现了抽样的公平性.
跟踪探究 1.某市有四所重点大学,为了解该市大学生的课外书籍阅读情况,采用下列哪种方法抽取样本最合适(四所大学图书馆的藏书有一定的差距)(  )
A.抽签法
B.随机数表法
C.系统抽样法
D.分层抽样法
解析:因为学校图书馆的藏书对学生课外书籍阅读影响比较大,因此采取分层抽样.
答案:D
2.某校高三年级有男生800人,女生600人,为了解该年级学生的身体健康情况,从男生中任意抽取40人,从女生中任意抽取30人进行调查.这种抽样方法是(  )
A.系统抽样法
B.抽签法
C.随机数表法
D.分层抽样法
解析:总体中个体差异比较明显,且抽取的比例也符合分层抽样.
答案:D
探究二 分层抽样的设计及应用
[阅读教材P60探究]假设某地区有高中生2
400人,初中生10
900人,小学生11
000人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生抽取1%的学生进行调查,你认为应当怎样抽取样本?
方法步骤:
第一步,按某种特征将总体分成若干部分(层);
第二步,计算样本容量与总体的个体数之比;
第三步,依据抽样比在各层分别按简单随机抽样的方法抽取样本;
第四步,综合每层抽样,组成样本.
[例2] 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级机关为了了解政府机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作.
[解析] ∵机构改革关系到每个人的不同利益,故采用分层抽样方法较妥.
∵=5,
∴=2,=14,=4.
∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.
因副处级以上干部与工人数都较少,他们分别按1~10编号和1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人进行00,01,…,69编号,然后用随机数表法抽取14人.这样便得到了一个容量为20的样本.
方法技巧 应用分层抽样的注意事项
在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即ni∶Ni=n∶N.
延伸探究 1.(变条件)某大型工厂有管理人员1
200人,销售人员2
000人,车间工人6
000人,若要了解改革意见,从全厂人员中抽取一个容量为46的样本,试确定用何种方法抽取,请具体实施操作.
解析:改革关系到每个人的利益,采用分层抽样较好.抽样比:=.
∵1
200×=6(人),2
000×=10(人),6
000×=30(人).
∴从管理人员中抽取6人,从销售人员中抽取10人,从车间工人中抽取30人.
因为各层中个体数目均较多,可以采用系统抽样的方法获得样本.
2.(变结论)某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革的意见,要用分层抽样的方法从中抽取一个容量为20的样本,试说明抽样的公平性与合理性.
解析:从100人中抽取20人,总体中每一个个体的入样可能性都是=,即抽样比,按此比例在各层中抽取个体;副处级以上干部抽取10×=2人,一般干部抽70×=14人,工人抽20×=4人,以保证每一层中每个个体的入样可能性相同,均为,故这种抽样是公平合理的.
探究三 三种抽样方法的比较
[例3] ①教育局督学组到校检查工作,临时需在每班各抽调两人参加座谈;②某班数学期中考试有15人在120分以上,40人在90~119分,1人不及格,现从中抽出8人研讨进一步改进教与学;③某班春节聚会,要产生两位“幸运者”.就这三件事,合适的抽样方法分别为(  )
A.分层抽样,分层抽样,简单随机抽样
B.系统抽样,系统抽样,简单随机抽样
C.分层抽样,简单随机抽样,简单随机抽样
D.系统抽样,分层抽样,简单随机抽样
[解析] ①每班各抽两人需用系统抽样.
②由于学生分成了差异比较大的几层,应用分层抽样.
③由于总体与样本容量较小,应用简单随机抽样.故选D.
[答案] D
方法技巧
方法类别
共同特点
抽样特征
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽取的概率相等
从总体中逐个不放回抽取
简单随机抽样是基础
总体中的个体数较少
系统抽样
将总体分成均衡几部分,按规则关联抽取
用简单随机抽样抽取起始号码
总体中的个体数较多
分层抽样
将总体分成几层,按比例分层抽取
用简单随机抽样或系统抽样对各层抽样
总体由差异明显的几部分组成
跟踪探究 3.700户家庭,其中高收入家庭225户,中等收入家庭400户,低收入家庭75户,为了调查社会购买力的某种指标,要从中抽取一个容量为100的样本,记为①;某中学高二年级有12名足球运动员,要从中选出3人调查学习负担情况,记作②;从某厂生产的802辆轿车中抽取8辆测试某项性能,记作③.则完成上述3项应采用的抽样方法是(  )
A.①用简单随机抽样,②用系统抽样,③用分层抽样
B.①用分层抽样,②用简单随机抽样,③用系统抽样
C.①用简单随机抽样,②用分层抽样,③用系统抽样
D.①用分层抽样,②用系统抽样,③用简单随机抽样
解析:对于①,总体由高收入家庭、中等收入家庭和低收入家庭差异明显的三部分组成,而所调查的指标与收入情况密切相关,所以应采用分层抽样.
对于②,总体中的个体数较少,而且所调查内容对12名调查对象是平等的,应用简单随机抽样.对于③,总体中的个体数较多,应用系统抽样.故选B.
答案:B
授课提示:对应学生用书第33页
[课后小结]
1.对于分层抽样中的比值问题,常利用以下关系式巧解:
(1)=;
(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
2.选择抽样方法的规律:
(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法.
(2)当总体容量较大,样本容量较小时,可采用随机数法.
(3)当总体容量较大,样本容量也较大时,可采用系统抽样法.
(4)当总体是由差异明显的几部分组成时,可采用分层抽样.
[素养培优]
1.抽样方法概率理解错误
某单位有老、中、青年人各32人,50人,20人,现用分层抽样从三个群体中共抽取20人进行某项调查,问:老、中、青每组应各抽取多少人?每人被抽中的机会是否相等?
错解 按分层抽样的要求,可先从老年人中用随机抽样法剔除2人,使三个群体的人数比为3∶5∶2,则共抽20人进行调查,三组中各抽取人数为6人,10人,4人;但由于老年组中先剔除2人,没有参与后面的抽取,因此每人抽中机会不相等.
易错分析 由于剔除的2位老人是随机剔除的,因而老年人中每人被抽中的机会仍相等.
自我纠正 先从老年人中随机剔除2人,余下的三个群体人数比为3∶5∶2,从三组中各抽取人数分别为6人,10人,4人.每人被抽中的机会相等.
2.抽样方法考虑不全致误
某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本,如果采用系统抽样和分层抽样方法抽取,不用剔除个体;如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求得样本容量为__________.
易错分析 (1)若没有考虑样本容量为n+1时的变化情况,会得到n=6或12或18或36的错误结论.(2)样本容量增加1个个体,若总体没有剔除1人,没有考虑到系统抽样的间隔为∈N
,而是利用n+1是36的约数,则易得n=5,从而导致解题错误.
自我纠正 总体容量N=36.
当样本容量为n时,系统抽样间隔为∈N
,所以n是36的约数;
分层抽样的抽样比为,求得工程师、技术员、技工的抽样人数分别为、、,所以n应是6的倍数,
所以n=6或12或18或36.
当样本容量为n+1时,总体中先剔除1人时还有35人,系统抽样间隔为∈N
,所以n只能是6.
答案:6
PAGE2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布
内 容 标 准
学 科 素 养
1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.3.能够利用图形解决实际问题.
提升数学运算发展数据分析应用数学建模
授课提示:对应学生用书第34页
[基础认识]
知识点一 频率分布表及频率分布直方图
预习教材P65-70,思考并完成以下问题
为了了解全市居民日常用水量的整体分布情况,采用抽样调查的方式,获得100位居民2018年的月均用水量如下表(单位:t):
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6
3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4
3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8
3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1
3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3
3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0
2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3
2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4
2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4
2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
(1)上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?
提示:最大值是4.3,最小值是0.2,数据的变化范围为0.2~4.3.
(2)样本数据中的最大值和最小值的差称为极差,如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?
提示:(4.3-0.2)÷0.5=8.2.因此可以将数据分为9组.
(3)以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?
提示:[0,0.5),[0.5,1),[1,1.5),…,[4,4.5).
(4)如何统计上述100个数据在各组中的频率?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?
提示:
分组
频数累计
频数
频率
[0,0.5)
4
0.04
[0.5,1)
8
0.08
[1,1.5)
正正正
15
0.15
[1.5,2)
正正正正丅
22
0.22
[2,2.5)
正正正正正
25
0.25
[2.5,3)
正正
14
0.14
[3,3.5)
正一
6
0.06
[3.5,4)
4
0.04
[4,4.5]

2
0.02
合计
100
1.00
知识梳理 1.用样本估计总体的两种情况
(1)用样本的频率分布估计总体分布.
(2)用样本的数字特征估计总体数字特征.
2.频率分布直方图的画法
3.频率分布折线图和总体密度曲线
(1)频率分布折线图:
连接频率分布直方图中各小长方形上端的中点,就得到了频率分布折线图.
(2)总体密度曲线:
随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.
知识点二 茎叶图
预习教材P70,思考并完成以下问题
某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:
甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
(1)你能理解这个图是如何记录这些数据的吗?
提示:中间的数字表示得分的十位数,旁边的数字分别表示两个人得分的个位数.
(2)你能通过该图说明哪个运动员的发挥更稳定吗?
提示:从图中看出乙运动员的发挥更稳定.
知识梳理 1.茎叶图的制作方法
将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出.
2.茎叶图的优缺点
在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.
[自我检测]
1.一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为(  )
A.10组       
B.9组
C.8组
D.7组
解析:由题意可知,=9.2,故应将数据分为10组.
答案:A
2.从一群学生中抽取一个一定容量的样本,对他们的学习成绩进行分析.已知不超过80分的为10人,其累积频率为0.5,则样本容量是(  )
A.20
B.40
C.80
D.60
解析:样本容量==20.
答案:A
3.如图是一个班的语文成绩的茎叶图(单位:分),则优秀率(90分以上)是__________,最低分是__________.
解析:由茎叶图知,样本容量为25,90分以上的有1人,故优秀率为=4%,最低分为51分.
答案:4% 51
授课提示:对应学生用书第35页
探究一 频率分布直方图的绘制
[阅读教材P65-67]题型:绘制频率分布直方图
方法步骤:
第一步,求极差;
第二步,确定组距与组数;
第三步,将数据分组;
第四步,列频率分布表;
第五步,画频率分布直方图.
[例1] 2019年高考已经结束,我校为了了解和掌握高考考生的实际答卷情况,随机地取出了100名考生的数学成绩,数据如下(单位:分):
135 98 102 110 99 121 110 96 100 103
125 97 117 113 110 92 102 109 104 112
105 124 87 131 97 102 123 104 104 128
109 123 111 103 105 92 114 108 104 102
129 126 97 100 115 111 106 117 104 109
111 89 110 121 80 120 121 104 108 118
129 99 90 99 121 123 107 111 91 100
99 101 116 97 102 108 101 95 107 101
102 108 117 99 118 106 119 97 126 108
123 119 98 121 101 113 102 103 104 108
(1)列出频率分布表;
(2)画出频率分布直方图和折线图.
[解析] 100个数据中,最大值为135,最小值为80,极差为135-80=55.取组距为5,则组数==11.
(1)频率分布表如下:
分组
频数
频率
频率/组距
[80,85)
1
0.01
0.002
[85,90)
2
0.02
0.004
[90,95)
4
0.04
0.008
[95,100)
14
0.14
0.028
[100,105)
24
0.24
0.048
[105,110)
15
0.15
0.030
[110,115)
12
0.12
0.024
[115,120)
9
0.09
0.018
[120,125)
11
0.11
0.022
[125,130)
6
0.06
0.012
[130,135]
2
0.02
0.004
合计
100
1
0.2
注:表中加上“频率/组距”一列,这是为画频率分布直方图准备的,因为它是频率分布直方图的纵坐标.
(2)根据频率分布表中的有关信息画出频率分布直方图及折线图,如图所示.
方法技巧 1.在列频率分布表时,极差、组距、组数有如下关系:
(1)若为整数,则=组数;
(2)若不为整数,则的整数部分+1=组数.
2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.
跟踪探究 1.某班50名同学参加数学测验,成绩的分组及各组的频数如下(单位:分):
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表.
(2)画出频率分布直方图.
解析:(1)频率分布表如下:
分组
频数
频率
[40,50)
2
0.04
[50,60)
3
0.06
[60,70)
10
0.2
[70,80)
15
0.3
[80,90)
12
0.24
[90,100]
8
0.16
(2)频率分布直方图如下:
探究二 频率分布直方图的应用
[例2] (1)某班50名学生在一次百米跑测试中,成绩全部介于13
s与19
s之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13
s且小于14
s;第二组,成绩大于等于14
s且小于15
s;…;第六组,成绩大于等于18
s且小于等于19
s,如图所示是按上述分组方法得到的频率分布直方图.设成绩小于17
s的学生人数占全班总人数的百分比为x,成绩大于等于15
s且小于17
s的学生人数为y,则从频率分布直方图(如图所示)中分析出x和y分别为(  )
A.0.9,35       B.0.9,45
C.0.1,35
D.0.1,45
(2)为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
①第二小组的频率是多少?样本容量是多少?
②若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
[解析] (1)由频率分布直方图知x=0.34+0.36+0.18+0.02=0.9,∵=0.36+0.34=0.7,∴y=35.
(2)①频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,
因此第二小组的频率为=0.08.
又因为第二小组的频率=,
所以样本容量===150.
②由直方图可估计该校高一年级学生的达标率为×100%=88%.
[答案] (1)A (2)见解析
方法技巧 频率分布直方图的意义
(1)频率分布直方图以面积的形式反映了数据落在各组内的频率大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3)=样本容量.
跟踪探究 2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是(  )
A.56
B.60
C.120
D.140
解析:由频率分布直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.
答案:D
探究三 茎叶图
[例3] 某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下(单位:分):
甲:95,81,75,91,86,89,71,65,76,88,94,110,107.
乙:83,86,93,99,88,103,98,114,98,79,78,106,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
[思路探究] 题中可以用十位数字为茎,个位数字为叶作茎叶图.然后由茎叶图的特点分析两人的成绩.
[解析] 甲、乙两人数学成绩的茎叶图如图所示:
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.
方法技巧 1.绘制茎叶图的关键是分清茎和叶,如本题中数据是两位数,十位数字为“茎”,个位数字为“叶”;如果是小数时,通常把整数部分作为“茎”,小数部分为“叶”,解题时要根据数据的特点合理选择茎和叶.
2.利用茎叶图进行数据分析时,一般从数据分布的对称性、中位数、稳定性等几个方面来考虑.
跟踪探究 3.如图是某年青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图(图中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有(  )
A.a1>a2
B.a2>a1
C.a1=a2
D.a1,a2的大小与m的值有关
解析:根据茎叶图可知,去掉一个最高分和一个最低分后,甲的平均分为a1=80+=84,乙的平均分为a2=80+=85,故a2>a1.
答案:B
授课提示:对应学生用书第37页
[课后小结]
1.列频率分布直方图的步骤:
(1)计算数据中最大值和最小值的差.知道了极差就知道了这组数据的变动范围有多大;
(2)决定组数和组距.组距是指每个小组的两个端点之间的距离;
(3)决定分点;
(4)列频率分布表;
(5)绘制频率分布直方图.
2.列频率分布直方图的注意事项:
(1)组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).
(2)分点数的决定方法是:若数据为整数,则分点数据减去0.5;若数据是小数点后一位的数,则分点减去0.05,以此类推.
[素养培优]
频率分布直方图中忽视纵轴的意义致误
中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示.从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,则全市高一学生视力在[3.95,4.25)范围内的学生人数约有__________.
易错分析 虚线处对频率分布直方图理解不正确,将纵轴上的0.5误认为是第五小组的频率,从而导致答案不正确.
自我纠正 由图知,第五小组的频率为0.5×0.3=0.15,所以第一小组的频率为0.15×=0.125,所以全市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60
000×0.125=7
500(人).
答案:7
500人
PAGE2.2.2 用样本的数字特征估计总体的数字特征
内 容 标 准
学 科 素 养
1.会求样本的众数、中位数、平均数、标准差、方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决实际统计问题.
提升数学运算发展数据分析应用数学建模
授课提示:对应学生用书第37页
[基础认识]
知识点一 众数、中位数、平均数
预习教材P71-73,思考并完成以下问题
现从甲、乙、丙三个厂家生产的同一种产品中,各抽取8件产品,对其使用寿命进行跟踪调查,其结果如下(单位:年)
甲:3,4,5,6,8,8,8,10;
乙:4,6,6,6,8,9,12,13;
丙:3,3,4,7,9,10,11,12.
三家广告中都称其产品的使用寿命为8年,利用初中所学的知识,你能说明为什么吗?
提示:三个厂家是从不同角度进行了说明,以宣传自己的产品.其中甲:众数为8年,乙:平均数为8年,丙:中位数为8年.
知识梳理 1.众数:在一组数据中,出现次数最多的数叫做众数.如果有两个或两个以上数据出现的最多且出现的次数相等,那么这些数据都是这组数据的众数;如果一组数据中,所有数据出现的次数都相等,那么认为这组数据没有众数.
2.中位数:将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的那个数是这组数据的中位数;当数据有偶数个时,处在最中间的两个数的平均数是这组数据的中位数.
3.平均数:一组数据的总和除以这组数据的个数取得的商叫做这组数据的平均数,一般记为x=(x1+x2+…+xn).
4.在频率分布直方图中,众数是最高矩形中点的横坐标,中位数左边和右边的直方图的面积应该相等,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
知识点二 方差和标准差
预习教材P74-78,思考并完成以下问题
甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:
甲:8,6,7,8,6,5,9,10,4,7;
乙:6,7,7,8,6,7,8,7,9,5.
(1)甲、乙两战士命中环数平均数甲,乙各是多少?
提示:甲=7环,乙=7环.
(2)由甲,乙能否判断两人的射击水平?
提示:由于甲=7环,乙=7环,所以不能判断.
(3)观察上述两组数据,你认为哪个人的射击水平更稳定?
提示:从数字分布来看,甲命中的环数较分散,乙命中的环数较集中.故乙的射击水平更稳定.
知识梳理 1.标准差的计算公式
标准差是样本数据到平均数的一种平均距离,一般用s表示,s=
.
2.方差的计算公式
标准差的平方s2叫做方差.
s2=[(x1-x)2+(x2-x)2+…+(xn-x)2].
其中,xi(i=1,2,…,n)是样本数据,n是样本容量,x是样本平均数.
3.变形探究
(1)若x1,x2,…,xn的平均数为x,那么mx1+a,mx2+a,…,mxn+a的平均数是mx+a;
(2)数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等;
(3)若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.
[自我检测]
1.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是(  )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
解析:众数为50,平均数x=(20+30+40+50+50+60+70+80)=50,中位数为(50+50)=50,故选D.
答案:D
2.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值为(  )
A.4.55      
B.4.5
C.12.5
D.1.64
解析:x=≈4.55.
答案:A
3.某学员在一次射击测试中射靶10次,命中环数如下:
7,8,7,9,5,4,9,10,7,4.
则:(1)平均命中环数为__________;
(2)命中环数的标准差为__________.
解析:利用平均值和标准差公式求解.
(1)x==7.
(2)s2=[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s=2.
答案:(1)7 (2)2
授课提示:对应学生用书第38页
探究一 众数、中位数、平均数
[例1] 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
成绩(单位:m)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数
2
3
2
3
4
1
1
1
分别求这些运动员成绩的众数、中位数与平均数.
[解析] 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;这组数据的平均数是=(1.50×2+1.60×3+…+1.90×1)=≈1.69(m).
答:17名运动员成绩的众数、中位数、平均数依次为1.75
m,1.70
m,1.69
m.
方法技巧 根据样本频率分布直方图,可以分别估计总体的众数、中位数和平均数.
(1)众数:最高矩形下端中点的横坐标;
(2)中位数:直方图面积平分线与横轴交点的横坐标.
(3)平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和.
跟踪探究 1.从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则(  )
A.甲<乙,m甲>m乙
B.甲<乙,m甲<m乙
C.甲>乙,m甲>m乙
D.甲>乙,m甲<m乙
解析:由茎叶图知,甲的平均数为
(5+6+8+10+10+14+18+18+22+25+27+30+30+38+41+43)÷16=21.562
5,
乙的平均数为(10+12+18+20+22+23+23+27+31+32+34+34+38+42+43+48)÷16=28.562
5,
所以甲<乙.
甲的中位数为(18+22)÷2=20,
乙的中位数为(27+31)÷2=29,
所以m甲<m乙.
答案:B
探究二 方差与标准差
[阅读教材P77例2)]方法步骤:
第一步,求平均值;
第二步,求方差;
第三步,比较平均值和方差;
第四步,结论.
[例2] 从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米苗长得高?
(2)哪种玉米苗长得齐?
[解析] (1)∵甲=(25+41+40+37+22+14+19+39+21+42)=×300=30(cm),
乙=(27+16+44+27+44+16+40+40+16+40)=×310=31(cm).
∴甲<乙,
即乙种玉米苗长得高.
(2)s=[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]
=(25+121+100+49+64+256+121+81+81+144)=×1
042=104.2,
s=[(2×272+3×162+3×402+2×442)-10×312]=×1
288=128.8,
∴s<s,即甲种玉米苗长得齐.
方法技巧 在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定.
跟踪探究 2.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
运动员
第1次
第2次
第3次
第4次
第5次

87
91
90
89
93

89
90
91
88
92
则成绩较为稳定(方差较小)的那位运动员成绩的方差为__________.
解析:由表中的数据计算可得甲=90,乙=90,且方差s=
=4.
s=
=2.所以乙运动员的成绩较稳定,方差为2.
答案:2
探究三 频率分布直方图与数字特征的综合
应用
[例3] 统计局就某地居民的月收入(元)情况调查了10
000人,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[500,1
000)内.
(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10
000人中用分层抽样的方法抽出100人作进一步分析,则月收入在[2
000,2
500)内的应抽取多少人?
(2)根据频率分布直方图估计样本数据的中位数;
(3)根据频率分布直方图估计样本数据的平均数.
[解析] (1)因为(0.000
2+0.000
4+0.000
3+0.000
1)×500=0.5,所以a==0.000
5,月收入在[2
000,2
500)内的频率为0.25,所以100人中月收入在[2
000,2
500)内的人数为0.25×100=25.
(2)因为0.000
2×500=0.1,
0.000
4×500=0.2.
0.000
5×500=0.25.
0.1+0.2+0.25=0.55>0.5,
所以样本数据的中位数是
1
500+=1
900(元).
(3)样本平均数为(750×0.000
2+1
250×0.000
4+1
750×0.000
5+2
250×0.000
5+2
750×0.000
3+3
250×0.000
1)×500=1
900(元).
方法技巧 1.利用频率分布直方图估计数字特征:
(1)众数是最高的矩形的底边的中点.
(2)中位数左右两侧直方图的面积相等.
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.
延伸探究 1.(变条件)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的中位数.
(2)求这次测试数学成绩的平均分.
解析:(1)由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.
(2)由图知这次数学成绩的平均分为:×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.
2.(变结论)本例条件不变.
(1)若再从这10
000人中用分层抽样的方法抽出若干人,分析居民收入与幸福指数的关系,已知月收入在[2
000,2
500)内的抽取了40人.则月收入在[3
000,3
500]内的该抽多少人?
(2)根据频率分布直方图估计样本数据的众数.
解析:(1)因为(0.000
2+0.000
4+0.000
3+0.000
1)×500=0.5.
所以a==0.000
5.
故月收入在[2
000,2
500)内的频率为0.000
5×500=0.25.
∴新抽样本容量为=160(人).
∴月收入在[3
000,3
500]内的该抽:160×(0.000
1×500)=8(人).
(2)由图知众数为2
000元.
授课提示:对应学生用书第40页
[课后小结]
1.一组数据中的众数可能不止一个,中位数是唯一的,求中位数时,必须先排序.
2.利用直方图求数字特征
(1)众数是最高的矩形的底边的中点;
(2)中位数左右两边直方图的面积应相等;
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
3.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.
[素养培优]
由茎叶图求中位数中不排序致误
如图所示表示的是甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是(  )
A.56分        B.57分
C.58分
D.59分
错解 因为甲的得分为4,14,14,24,25,31,32,35,36,36,39,45,49,
所以中间的数32分即为甲得分的中位数;又因为乙的得分为8,12,15,18,23,27,25,32,33,34,41,所以中间的数27分即为乙得分的中位数,故甲和乙得分的中位数的和是59分.
易错分析 本题错误的根本原因是,在求乙得分的中位数时,没有将数据从小到大(或从大到小)排列起来,将原始数据中的中间一个数误认为就是乙得分的中位数而导致错误.
自我纠正 选B.由错解中可知甲得分的中位数为32分,乙得分的数据从小到大排列为:8,12,15,18,23,25,27,32,33,34,41,故乙得分的中位数为25分,即甲、乙得分的中位数的和是57分.
答案:B
PAGE2.3 变量间的相关关系
2.3.1 变量间的相关关系
2.3.2 两个变量的线性相关
内 容 标 准
学 科 素 养
1.理解两个变量的相关关系的概念.2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.3.会求回归直线方程.4.相关关系与函数关系.
提升数学运算发展数据分析应用数学建模
授课提示:对应学生用书第40页
[基础认识]
知识点一 变量间的相关关系
预习教材P84,思考并完成以下问题
在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系.
(1)当一个变量的取值一定时,另一个变量的取值被唯一确定,则这两个变量之间是怎样的关系?
提示:这两个变量是一个函数关系.
(2)商品销售收入与广告支出经费是一种函数关系吗?
提示:不是函数关系.因为当其中一个变量变化时,另一个变量的变化还受其它因素的影响.
知识梳理 如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系.
知识点二 散点图
预习教材P85-86,思考并完成以下问题
在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:
年龄
23
27
39
41
45
49
50
脂肪
9.5
17.8
21.2
25.9
27.5
26.3
28.2
年龄
53
54
56
57
58
60
61
脂肪
29.6
30.2
31.4
30.8
33.5
35.2
34.6
(1)观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?
提示:随着年龄的增加,人体中脂肪的百分比也有所增加.
(2)以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?
提示:
  
知识梳理 1.散点图
将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.
2.正相关和负相关
(1)正相关:散点图中的点散布在从左下角到右上角的区域.
(2)负相关:散点图中的点散布在从左上角到右下角的区域.
知识点三 回归直线方程
预习教材P87-91,思考并完成以下问题
在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中点的分布有什么特点?
提示:这些点大致分布在一条直线附近.
知识梳理 1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线;
2.回归方程:回归直线的方程,简称回归方程.
3.回归方程的推导过程:
(1)假设已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn);
(2)设所求回归方程为=x+__,其中,是待定参数;
(3)由最小二乘法得
eq
\b\lc\{(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\o(∑,\s\up6(n),\s\do4(i=1))
(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))
(xi-\o(x,\s\up6(-)))2)=\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n
\o(x,\s\up6(-))
\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))x-n
\o(x,\s\up6(-))2),\o(a,\s\up6(^))=\o(y,\s\up6(-))-\o(b,\s\up6(^))
\o(x,\s\up6(-))
))
其中:是回归方程的斜率,是截距.
[自我检测]
1.过(3,10),(7,20),(11,24)三点的回归直线方程是(  )
A.=1.75+5.75x    
B.=-1.75+5.75x
C.=5.75+1.75x
D.=5.75-1.75x
解析:求过三点的回归直线方程,目的在于训练求解回归系数的方法,这样既可以训练计算,又可以体会解题思路,关键是能套用公式.代入系数公式得=1.75,=5.75.代入直线方程,求得=5.75+1.75x.故选C.
答案:C
2.已知x与y之间的一组数据:
x
0
1
2
3
4
y
1
3
5
7
9
则y与x的线性回归方程=bx+a必过点(  )
A.(1,2)
B.(5,2)
C.(2,5)
D.(2.5,5)
解析:线性回归方程一定过样本中心(,).
由==2,==5.
故必过点(2,5).
答案:C
3.如图所示的两个变量不具有相关关系的有__________.
解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.
答案:①④
授课提示:对应学生用书第41页
探究一 相关关系的判断
[例1] 某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下对应数据:
x
10
15
17
20
25
28
32
y
1
1.3
1.8
2
2.6
2.7
3.3
(1)画出散点图;
(2)判断y与x是否具有线性相关关系.
[解析] (1)散点图如下:
(2)由图知,所有数据点接近直线排列,因此,认为y与x有线性相关关系.
方法技巧 判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
跟踪探究 1.有个男孩的年龄与身高的统计数据如下.
年龄(岁)
1
2
3
4
5
6
身高(cm)
78
87
98
108
115
120
画出散点图,并判断它们是否有相关关系?如果有相关关系,是正相关还是负相关?
解析:散点图是分析变量相关关系的重要工具.作出散点图如图:
由图可见,具有线性相关关系,且是正相关.
探究二 求回归方程
[例2] 某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图;
(2)求回归方程.
[解析] (1)散点图如图所示.
(2)列出下表,并用科学计算器进行有关计算.
i
1
2
3
4
5
xi
2
4
5
6
8
yi
30
40
60
50
70
xiyi
60
160
300
300
560
x
4
16
25
36
64
=5,=50,x=145,xiyi=1
380
于是可得,=eq
\f(\o(∑,\s\up6(5),\s\do4(i=1))xiyi-5
\o(x,\s\up6(-))
\o(y,\s\up6(-)),\o(∑,\s\up6(5),\s\do4(i=1))x-5
\o(x,\s\up6(-))2)==6.5,
=-
=50-6.5×5=17.5.
于是所求的回归方程是=6.5x+17.5.
方法技巧 求线性回归方程的步骤
(1)计算平均数,.
(2)计算xi与yi的积,求xiyi.
(3)计算x.
(4)将结果代入公式=eq
\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n
\o(x,\s\up6(-))
\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))x-n
\o(x,\s\up6(-))2),求.
(5)用=-
,求.
(6)写出回归方程.
跟踪探究 2.已知变量x,y有如下对应数据:
x
1
2
3
4
y
1
3
4
5
(1)作出散点图;
(2)用最小二乘法求关于x,y的回归直线方程.
解析:(1)散点图如图所示:
(2)==,
==,
xiyi=1+6+12+20=39.
x=1+4+9+16=30,
==,
=-×=0,
所以=x为所求回归直线方程.
探究三 回归方程的应用
[阅读教材P90例]有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:
摄氏温度/℃
-5
0
4
7
12
15
19
23
27
31
36
热饮杯数
156
150
132
120
130
116
104
89
93
76
54
(1)画出散点图;
(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;
(3)求回归方程;
(4)如果某天的气温是2
℃,预测这天卖出的热饮杯数.
方法步骤:
第一步,画散点图;
第二步,求回归直线方程;
第三步,预测.
[例3] 某5名学生的总成绩和数学成绩(单位:分)如表所示:
学生
A
B
C
D
E
总成绩x
428
383
421
364
362
数学成绩y
78
65
71
64
61
(1)画出散点图;
(2)求y对x的线性回归方程(结果保留到小数点后3位数字);
(3)如果一个学生的总成绩为450分,试预测这个学生的数学成绩.
[解析] (1)散点图如图所示:
(2)由题中数据计算可得
=391.6,=67.8,x=770
654,xiyi=133
548.代入公式得=≈0.204,
=67.8-0.204×391.6≈-12.086,
所以y对x的线性回归方程为=-12.086+0.204x.
(3)由(2)得当总成绩为450分时,=-12.086+0.204×450≈80,即这个学生的数学成绩大约为80分.
方法技巧 回归分析的三个步骤
(1)进行相关性检验,若两变量无线性相关关系,则所求的线性回归方程毫无意义;
(2)求回归直线方程,其关键是正确地求得,;
(3)根据直线方程进行预测.
跟踪探究 3.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得xi=80,yi=20,xiyi=184,x=720.
(1)求月储蓄y(千元)关于月收入x(千元)的线性回归方程;
(2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄.
解析:(1)由题意知n=10,=xi=×80=8,
=yi=×20=2,
又x-n
2=720-10×82=80,
xiyi-n
=184-10×8×2=24,
由此得==0.3,
=-
=2-0.3×8=-0.4,
故所求线性回归方程为=0.3x-0.4.
(2)将x=7代入线性回归方程,可以得到该家庭的月储蓄约为=0.3×7-0.4=1.7(千元).
授课提示:对应学生用书第43页
[课后小结]
1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关.
2.求回归直线方程时应注意的问题
(1)知道x与y呈线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.
(2)用公式计算、的值时,要先算出,然后才能算出.
3.利用回归方程,我们可以进行估计和预测.若回归直线方程为=x+,则x=x0处的估计值为0=x0+.
PAGE