【优化方案】2016年高中数学 第二章 统计学案(打包9套)

文档属性

名称 【优化方案】2016年高中数学 第二章 统计学案(打包9套)
格式 zip
文件大小 4.0MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2016-04-24 19:29:32

文档简介

2.1 随机抽样
2.1.1 简单随机抽样
1.问题导航
(1)什么叫简单随机抽样?
(2)最常用的简单随机抽样方法有哪两种?
(3)抽签法是如何操作的?
(4)随机数表法是如何操作的?
2.例题导读
通过教材中的“思考”,我们了解抽签法的优、缺点及适用条件.
1.简单随机抽样的定义
设一个总体含有N个个体,从中逐个不放回地 ( http: / / www.21cnjy.com )抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
2.简单随机抽样的分类
简单随机抽样
3.随机数法的类型
随机数法
1.判断下列各题.(对的打“√”,错的打“×”)
(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次抽到的可能性最小;(  )
(2)有同学说:“随机数表只有一张,并且读数时只能按照从左向右的顺序读取,否则产生的随机样本就不同了,对总体的估计就不准确了”.(  )
解析:(1)在简单随机抽样中,每个个体被抽到的可能性相等,与第几次抽取无关;
(2)随机数表的产生是随机的,读数的顺序也是随机的,不同的样本对总体的估计相差并不大.
答案:(1)× (2)×
2.某校期末考试后,为了分析该校高一年级1 ( http: / / www.21cnjy.com ) 000名学生的学习成绩,从中随机抽取了100名学生的成绩单,就这个问题来说,下面说法中正确的是(  )
A.1 000名学生是总体
B.每名学生是个体
C.每名学生的成绩是所抽取的一个样本
D.样本的容量是100
解析:选D.该问题中,1 000名学生的成绩是总体,每个学生的成绩是个体,抽取的100名学生的成绩是样本,样本的容量是100.
3.抽签法的优点、缺点各是什么?
解:优点:简单易行,当总体个数不多的时候搅 ( http: / / www.21cnjy.com )拌均匀很容易,每个个体有均等的机会被抽中,从而保证样本的代表性.缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.
1.简单随机抽样是一种最简 ( http: / / www.21cnjy.com )单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.
2.随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型.
3.简单随机抽样中每个个体入样的可能性 ( http: / / www.21cnjy.com )都相等,均为n/N,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的可能性这三种情况区分开来,避免在解题中出现错误.
       简单随机抽样的概念
下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取20个个体作为样本;
(2)从50台冰箱中一次性抽取5台冰箱进行质量检查;
(3)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽取6个号签.
[解] (1)不是简单随机抽样.因为总体的个数是无限的,而不是有限的.
(2)不是简单随机抽样.虽然“一次性”抽取和“逐个”抽取不影响个体被抽到的可能性,但简单随机抽样的定义要求的是“逐个不放回地抽取”.
(3)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能地进行抽样.
方法归纳
判断一个抽样是否为简单随机抽样的依据是其四个特征
1.下列抽样方式是否是简单随机抽样?
(1)在某车间包装一种产品,在自动包装的传送带上每隔30分钟抽一包产品,称其质量是否合格;
(2)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
解:由简单随机抽样的特点可知,(1)(2)均不是简单随机抽样.
       抽签法的应用
2015年,某师范大学为了支援西部教育事业,现从报名的18名免费师范毕业生中选取6人组成志愿小组,请用抽签法确定志愿小组成员,写出抽样步骤.
[解] 抽样步骤是:
第一步,将18名志愿者编号,号码是1,2,…,18;
第二步,将号码分别写在同样大小的小纸片上,揉成团,制成号签;
第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀;
第四步,从袋子中依次抽取6个号签,并记录上面的编号;
第五步,与所得号码对应的志愿者就是志愿小组的成员.
方法归纳
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.
(2)应用抽签法时应注意以下几点:
①编号时,如果已有编号可不必重新编号;
②号签要求大小、形状完全相同;
③号签要均匀搅拌;
④要逐一不放回地抽样.
2.某校高一(1)班有学生48人,为了调查某种情况,打算抽取一个样本容量为10的样本,问若采用抽签法抽样将如何进行?
解:首先把该校学生都编上号,号码是 ( http: / / www.21cnjy.com )1,2,3,4,…,48.并制成48个形状、大小相同的号签,然后将这些号签放在一个不透明的容器内,搅拌均匀后,逐个无放回地抽取10个号签,这样就可以得到一个容量为10的样本.
       随机数表法的应用
(2015·衡阳模拟)已知某总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表中第1行的第5列和第6列的数字开始由左到右依次选取两个数字,则选出来的第4个个体的编号为(  )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.08 B.07
C.02 D.01
[解析] 从随机数表第1行的第5列 ( http: / / www.21cnjy.com )和第6列的数字开始由左到右依次选取两个数字,依次为65,72,08,02,63,14,07,…,其中08,02,14,07,…符合条件,故选B.
[答案] B
[互动探究] 如将本例中的“从随机数表中第1 ( http: / / www.21cnjy.com )行的第5列和第6列的数字开始由左到右依次选取两个数字”改为“从随机数表中第1行的倒数第2列和第3列的数字开始由右到左依次选取两个数字”,其他条件不变,则选出来的第4个个体的编号为多少?
解:从随机数表中第1行的倒 ( http: / / www.21cnjy.com )数第2列和第3列的数字开始由右到左依次选取两个数字,依次为91,08,27,99,63,42,07,04,13,…,其中08,07,04,13,…符合条件,故选出来的第4个个体的编号为13.
方法归纳
利用随机数表法抽样时应注意的问题:
(1)编号要求位数相同, ( http: / / www.21cnjy.com )若不相同,需先调整到一致后再进行抽样,如当总体中有100个个体时,为了操作简便可以选择从00开始编号,那么所有个体的号码都用两位数字表示即可,从00~99号.如果选择从1开始编号,那么所有个体的号码都必须用三位数字表示,从001~100.很明显每次读两个数字要比读三个数字节省读取随机数的时间.
(2)第一个数字的抽取是随机的.
(3)当随机数选定,开始读数时,读数的方向可左,可右,可上,可下,但应是事先定好的.
3.有一批机器编号为1,2,3,…,112,请用随机数表法抽取10台入样,写出抽样过程(随机数表见教材P103附表).
解:第一步,将原来的编号调整为001,002,…,112.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第9行第7个数“3”向右读.
第三步,从“3”开始向右读,每次取三位 ( http: / / www.21cnjy.com ),凡不在001~112中的数跳过去不读.前面已经读过的数不读,依次可得到074,100,094,052,080,003,105,107,083,092.
第四步,对应原来编号为074,100,094,052,080,003,105,107,083,092的机器便是要抽取的对象.
易错警示 因基本概念不明致误
为了了解参加第27届世界大学生冬运会的2 015名运动员的身高情况,从中抽取100名运动员进行调查,就这个问题,下面说法中正确的是(  )
①2 015名运动员是总体;②每个运动员是个体;③所抽取的100名运动员是一个样本;④样本容量为100;⑤每个运动员被抽到的可能性相等.
A.④⑤ B.①②③
C.①②④⑤ D.①②③④⑤
[解析] 抽样的目的是了解参加冬运会的 ( http: / / www.21cnjy.com )2 015名运动员的身高情况,故总体应该是2 015名运动员的身高,而不是这2 015名运动员,同理,个体应该是每个运动员的身高,样本应该是所抽取的100名运动员的身高.故①②③都不正确,④⑤正确.
[答案] A
[错因与防范] 
(1)解决本题易搞错考察的对象,误认为考察对象为运动员,从而误认为①②③也正确.
(2)解决此类问题时,关键是明确考察的对象,根据有关的概念可得总体、个体与样本的考察对象是相同的.
4.(2014·高考四川卷)在“世 ( http: / / www.21cnjy.com )界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是(  )
A.总体 B.个体
C.样本的容量 D.从总体中抽取的一个样本
解析:选A.调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体.
1.一个总体共有15个个体,用简单随机抽样的方法从中抽取一个容量为5的样本,每个个体被抽到的可能性是(  )
A. B.
C. D.
解析:选A.简单随机抽样具有等可能性,每个个体被抽到的可能性是=.
2.下面的抽样方法是简单随机抽样的是(  )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2 709的为三等奖
B.从20个零件中一次性抽出3个进行质量检查
C.某学校分别从行政人员、老师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见
D.用抽签法从10件产品中选取3件进行质量检验
解析:选D.根据简单随机抽样的定义及特点可判断D为简单随机抽样.
3.在某年的高考中,A省有20万名考生, ( http: / / www.21cnjy.com )为了估计他们的数学平均成绩,从中逐个抽取2 015名学生的数学成绩作为样本进行统计分析,请回答以下问题:本题中,总体、个体、样本、样本容量各指什么?
解:总体是指在该年的高考中,A省20 ( http: / / www.21cnjy.com )万名考生的数学成绩;个体是指在该年的高考中,A省20万名考生中每一名考生的数学成绩;样本是指被抽取的2 015人的数学成绩;样本容量是2 015.
[A.基础达标]
1.用随机数表法从100名学生(男生25人)中抽选20人进行评教,某男学生被抽到的机率是(  )
A. B.
C. D.
解析:选C.简单随机抽样是等可能性抽样,每个个体被抽到的机率都是=.故选C.
2.(2015·昌乐二中检测)用随机数法进行抽样有以下几个步骤:
①将总体中的个体编号;②获取样本号码;③选定开始的数字;④选定读数的方向.
这些步骤的先后顺序应为(  )
A.①②③④ B.①③④②
C.③②①④ D.④③①②
解析:选B.先编号,再选数.
3.下列抽样试验中,适合用抽签法的是(  )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
解析:选B.A、D中个体总数较大,不适 ( http: / / www.21cnjy.com )合用抽签法;C中甲、乙两厂生产的两箱产品性质可能差别较大,因此未达到搅拌均匀的条件,也不适于用抽签法;B中个体数和样本容量均较小,且同厂生产的两箱产品,性质差别不大,可以看成是搅拌均匀了.
4.某工厂的质检人员对生产的1 ( http: / / www.21cnjy.com )00件产品采用随机数表法抽取10件检查,对100件产品采用下面的编号方法:①01,02,03,…,100;②001,002,003,…,100;③00,01,02,…,99.其中正确的序号是 (  )
A.①② B.①③
C.②③ D.③
解析:选C.根据随机数表法的要求,只有编号数字位数相同,才能达到随机等可能抽样.
5.(2015·青岛检测)对于简单随机抽样,下列说法中正确的为(  )
①它要求总体的个数有限,以便对其中各个 ( http: / / www.21cnjy.com )个体被抽取的概率进行分析;②它是从总体中逐个地进行抽取;③它是一种不放回抽样;④它是一种等概率抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在整个抽样过程中,各个个体被抽取的概率也相等,从而保证了这种抽样方法的公平性.
A.①②③ B.①②④
C.①③④ D.①②③④
解析:选D.这四点全是简单随机抽样的特点.
6.下列调查的样本合理的是________.
①在校内发出一千张印有全校各班级的选票,要 ( http: / / www.21cnjy.com )求被调查学生在其中一个班级旁画“√”,以了解最受欢迎的教师是谁;②从一万多名工人中,经过选举,确定100名代表,然后投票表决,了解工人们对厂长的信任情况;③到老年公寓进行调查,了解全市老年人的健康状况;④为了了解全班同学每天的睡眠时间,在每个小组中各选取3名学生进行调查.
解析:①中样本不具有代表性、有效性,在班级前画“√”与了解最受欢迎的老师没有关系;③中样本缺乏代表性;而②④是合理的样本.
答案:②④
7.某中学高一年级有400人 ( http: / / www.21cnjy.com ),高二年级有320人,高三年级有280人,以每人被抽取的可能性均为0.2,从该中学抽取一个容量为n的样本,则n=________.
解析:∵=0.2,
∴n=200.
答案:200
8.一个总体数为60的个体编号为00, ( http: / / www.21cnjy.com )01,02,…,59,现需从中抽取一个容量为7的样本,请从随机数表的倒数第5行(下表为随机数表的最后5行)第11~12列的18开始,依次向下,到最后一行后向右,直到取足样本,则抽取样本的号码是________.
95 33 95 22 00 18 74 72 00 18 46 40 62 98 80 54 97 20 56 95
38 79 58 69 32 81 76 80 26 92 15 74 80 08 32 16 46 70 50 80
82 80 84 25 39 90 84 60 79 80 67 72 16 42 79 71 59 73 05 50
24 36 59 87 38 82 07 53 89 35 08 22 23 71 77 91 01 93 20 49
96 35 23 79 18 05 98 90 07 35 82 96 59 26 94 66 39 67 98 60
解析:先选取18,向下81、90、82 ( http: / / www.21cnjy.com )不符合要求,下面选取05,向右读数,07、35、59、26、39,因此抽取的样本的号码为:18、05、07、35、59、26、39.
答案:18、05、07、35、59、26、39
9.某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?
解:法一:(抽签法)将100件轴编号为1 ( http: / / www.21cnjy.com ),2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着逐个不放回地抽取10个号签,然后测量这10个号签对应的轴的直径.
法二:(随机数表法)将100件轴编号为00, ( http: / / www.21cnjy.com )01,…,99,在随机数表中选定一个起始位置,如取第21行第1个数开始(见教材P103附表),向右选取10个为68,34,30,13,70,55,74,77,40,44,这10个号码对应的轴即为所要抽取的对象.
10.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,并写出抽样过程.
解:应使用抽签法,步骤如下:
①将30辆汽车进行编号,号码是1,2,3,…,30;
②将1~30这30个编号写到大小、形状都相同的号签上;
③将写好的号签放入一个不透明的容器中,并搅拌均匀;
④从容器中每次抽取一个号签,连续抽取3次,并记录下上面的编号;
⑤所得号码对应的3辆汽车就是要抽取的对象.
[B.能力提升]
1.采用简单随机抽样从含有6个个体的总体中抽取一个容量为3的样本,某个个体前两次未被抽到,则第三次被抽到的机会是(  )
A. B.
C. D.
解析:选A.从含有6个个体的总体中,抽取容量为3的样本,则每个个体在每次被抽到的机会都是,这与第几次抽取无关.
2.为了了解全校240名高一学生的体重情况,从中抽取40名学生进行测量.下列说法正确的是(  )
A.总体是240  B.个体是每一名学生
C.样本是40名学生 D.样本容量是40
解析:选D.本题中的研究对象是学生的 ( http: / / www.21cnjy.com )体重,而不是学生自身.总体是240名学生的体重,个体是每一名学生的体重,样本是抽取的40名学生的体重,总体容量是240,样本容量是40.
3.齐鲁风彩“七乐彩”的中奖号码是从1 ( http: / / www.21cnjy.com )~30个号码中选出7个号码来按规则确定中奖情况,这种从30个号码中选7个号码的抽样方法是________.
解析:当总体的个数不多时,宜采用抽签法.因为它简便易行,可用不同的方式制签,抽签也方便.
答案:抽签法
4.2014年10月10日,袁隆平“超级 ( http: / / www.21cnjy.com )稻”亩产创1 026.7公斤新纪录.要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子进行试验,利用随机数表法抽取种子,先将850颗种子按001,002,…,850进行编号,如果从随机数表第3行第6列的数开始向右读,请依次写出最先检验的4颗种子的编号:________.(随机数表见教材P103附表)
解析:从随机数表第3行第6列的数2 ( http: / / www.21cnjy.com )开始向右读第一个小于850的数字是227,第二个数字是665,第三个数字是650,第四个数字是267,符合题意.
答案:227,665,650,267
5.某电视台举行颁奖典礼,邀请20名 ( http: / / www.21cnjy.com )港台、内地艺人演出,其中从30名内地艺人中随机挑选10人,从18名香港艺人中随机挑选6人,从10名台湾艺人中随机挑选4人.试用抽签法确定选中的艺人,并确定他们的表演顺序.
解:第一步:先确定艺人:(1)将30名 ( http: / / www.21cnjy.com )内地艺人从01到30编号,然后用相同的纸条做成30个号签,在每个号签上写上这些编号,然后放入一个不透明小筒中摇匀,从中抽出10个号签,则相应编号的艺人参加演出;(2)运用相同的办法分别从18名香港艺人中抽取6人,从10名台湾艺人中抽取4人.
第二步:确定演出顺序:确定了 ( http: / / www.21cnjy.com )演出人员后,再用相同的纸条做成20个号签,上面写上1到20这20个数字,代表演出的顺序,让每个演员抽一张,每人抽到的号签上的数字就是这位演员的演出顺序,再汇总即可.
6.(选做题)(2015· ( http: / / www.21cnjy.com )洛阳高一检测)现在有一种够级游戏,其用具为四副扑克,包括大小鬼(又称为花)在内共216张牌,参与人数为6人,并围成一圈.够级开始时,从这6人中随机指定一人从已经洗好的扑克牌中随机抽取一张牌(这叫开牌),然后按逆时针方向,根据这张牌上的数字来确定抓牌的先后,这6人依次从216张牌中抓取36张牌,问这种抓牌的方法是否是简单随机抽样?
解:简单随机抽样的实质是逐个地从总体中随机 ( http: / / www.21cnjy.com )抽取样本,而这里只是随机确定了起始的牌,其他各张牌虽然是逐张抓牌,但是各张在谁手里已被确定,只有抽取的第一张扑克牌是随机抽取的,其他215张牌已经确定,即这215张扑克牌被抽取的可能性与第一张扑克牌被抽取的可能性不相同,所以不是简单随机抽样.2.2.2 用样本的数字特征估计总体的数字特征
1.问题导航
(1)什么是众数、中位数、平均数、方差、标准差?
(2)如何从频率分布直方图中估计众数、中位数、平均数?
(3)方差与标准差的联系与区别是什么?
2.例题导读
通过对例1的学习,理解标准差的意义;
通过对例2的学习,学会在实际生活中,如何用平均数与标准差来进行估计.
1.众数、中位数、平均数
(1)众数、中位数、平均数的概念
①众数:在一组数据中,出现次数最多的数据(即频率分布最大值所对应的样本数据)叫这组数据的众数.
若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.
②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或中间两个数据的平均数)叫这组数据的中位数.
③平均数:指样本数据的算术平均数.
即=(x1+x2+…+xn).
(2)众数、中位数、平均数与频率分布直方图的关系
众数 众数是最高矩形的中点所对应的数据,表示样本数据的中心值
中位数 ①在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;②表示样本数据所占频率的等分线
平均数 ①平均数等于每个小长方形的面积乘以小长方形底边中点的横坐标之和;②平均数是频率分布直方图的重心,是频率分布直方图的平衡点
2.标准差与方差
(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示,计算时通常用公式
s=eq \r(\f(1,n)[(x1-)2+(x2-)2+…+(xn-)2]).
显然,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
(2)方差:标准差s的平方s2,即s2 ( http: / / www.21cnjy.com )=[(x1-)2+…+(xn-)2]叫做这组数据的方差,同标准差一样,方差也是用来测量样本数据的分散程度的特征数.
1.判断下列各题.(对的打“√”,错的打“×”)
(1)数据5,4,4,3,5,2的众数为4;(  )
(2)数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半;(  )
(3)方差与标准差具有相同的单位;(  )
(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(  )
解析:(1)中的众数应为4和5;(2)正确;(3)二者单位不一致;(4)正确,平均数也应减去该常数,方差不变.
答案:(1)× (2)√ (3)× (4)√
2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是(  )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.众数=中位数=平均数
解析:选D.平均数、中位数、众数皆为50,故选D.
3.已知五个数据3,5,7,4,6,则该样本的标准差为________.
解析:∵x=×(3+5+7+4+6)=5,
∴s==.
答案:
4.标准差、方差的意义是什么?
解:标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.
2.中位数不受少数几个极端数据 ( http: / / www.21cnjy.com )(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.
3.平均数受样本中的每一个数 ( http: / / www.21cnjy.com )据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.
4.如果样本平均数大于样本中位数,说明数据 ( http: / / www.21cnjy.com )中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.
5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.
       中位数、平均数的综合应用
下面是某快餐店所有工作人员一周的收入表:
老板 大厨 二厨 采购员 杂工 服务生 会计
3 000元 450元 350元 400元 320元 320元 410元
(1)计算所有人员的周平均收入;
(2)这个平均收入能反映打工人员的周收入的一般水平吗?为什么?
(3)去掉老板的收入后,再计算平均收入,这能代表打工人员的周收入的水平吗?
[解] (1)周平均收入
1=(3 000+450+350+400+320+320+410)
=750(元).
(2)这个平均收入不能反映打工人员的周收 ( http: / / www.21cnjy.com )入水平,可以看出打工人员的收入都低于平均收入,因为老板收入特别高,这是一个异常值,对平均收入产生了较大的影响,并且他不是打工人员.
(3)去掉老板的收入后的周平均收入2=(450+350+400+320+320+410)=375(元),这能代表打工人员的周收入水平.
方法归纳
平均数与每一个数据都有关,可以 ( http: / / www.21cnjy.com )反映更多的总体信息,但受极端值的影响大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.
1.(1)10名工人某天生产同一零件,生产 ( http: / / www.21cnjy.com )的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有(  )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
解析:选D.总和为147, ( http: / / www.21cnjy.com )a=14.7;样本数据17分布最广,即频率最大,为众数,c=17;从小到大排列,中间一位,或中间二位的平均数,即b=15.
(2)某校甲班、乙班各有49名学生,两班在一次数学测验中的成绩(满分100分)统计如下表:
班级 平均分 众数 中位数 标准差
甲班 79 70 87 19.8
乙班 79 70 79 5.2
①请你对下面的一段话给予简要分析:
甲班的小刚回家对妈妈说:“昨天的数学测验,全班平均分是79分,得70分的人最多,我得了85分,在班里算是上游了!”
②请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议.
解:①由中位数可知,85分排在第2 ( http: / / www.21cnjy.com )5名之后,从名次上讲,85分不算是上游.但也不能单以名次来判断学习成绩的好坏,小刚得了85分,说明他对这阶段的学习内容掌握较好.
②甲班学生成绩的中位数为87分 ( http: / / www.21cnjy.com ),说明高于或等于87分的学生占一半以上,而平均分为79分,标准差很大,说明低分也多,两极分化严重,建议对学习有困难的同学多给一些帮助;乙班学生成绩的中位数是79,平均数为79,说明平均水平与甲班相同,而标准差较小说明乙班分数大多数都集中在79分左右,高分人数和低分人数都较少,建议培养高分学生,提高平均水平.
       用频率分布表或直方图求数字特征
已知一组数据:
125 121 123 125 127 129 125 128 130 129
126 124 125 127 126 122 124 125 126 128
(1)填写下面的频率分布表:
分组 频数 频率
[120.5,122.5)
[122.5,124.5)
[124.5,126.5)
[126.5,128.5)
[128.5,130.5]
合计
(2)作出频率分布直方图;
(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.
(链接教材P76例1)
[解] (1)
分组 频数 频率
[120.5,122.5) 2 0.1
[122.5,124.5) 3 0.15
[124.5,126.5) 8 0.4
[126.5,128.5) 4 0.2
[128.5,130.5] 3 0.15
合计 20 1
  (2)频率分布直方图如图:
(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.
又∵前两个小矩形的频率和为0.25.
∴设第三个小矩形底边的一部分长为x.
则x×0.2=0.25,得x=1.25.
∴中位数为124.5+1.25=125.75.
事实上中位数为125.5.使用“组 ( http: / / www.21cnjy.com )中值”求平均数:=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8,平均数的精确值为=125.75.
方法归纳
利用频率分布直方图求数字特征:
①众数是最高的矩形的底边的中点.
②中位数左右两侧直方图的面积相等.
③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标.
④利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致.但它们能粗略估计其众数、中位数和平均数.
2.(1)(2015·福建检测)为了普及环保 ( http: / / www.21cnjy.com )知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为m0,平均值为x,则(  )
A.me=m0= B.me=m0<
C.me解析:选D.由题意得m0=5,me==5.5,=
=,显然x>me>m0,故选D.
(2)某中学举行电脑知识竞 ( http: / / www.21cnjy.com )赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.
求:①高一参赛学生的成绩的众数、中位数;
②高一参赛学生的平均成绩.
解:①用频率分布直方图中最高矩形所在的 ( http: / / www.21cnjy.com )区间的中点值作为众数的近似值,得众数为65,又∵第一个小矩形的面积为0.3,∴设第二个小矩形底边的一部分长为x,
则x×0.04=0.2,得x=5,∴中位数为60+5=65.
②依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,
∴平均成绩约为67分.
       标准差、方差的应用
甲、乙两机床同时加工直径为100 mm的零件,为检验质量,各从中抽取6件测量,数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
(链接教材P77例2)
[解] (1) 甲=(99+100+98+100+100+103)
=100,
乙=(99+100+102+99+100+100)=100.
s=[(99-100) ( http: / / www.21cnjy.com )2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
s=[(99-100)2+(1 ( http: / / www.21cnjy.com )00-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,
又s>s,
所以乙机床加工零件的质量更稳定.
[互动探究] 在本例中,若甲机床所加工的6个零件的数据全都加10,那么所得新数据的平均数及方差分别是多少?
解:甲的数据为99+10,100+10,98+10,100+10,100+10,103+10,平均数为100+10=110,
方差仍为[(109-110)2+(110 ( http: / / www.21cnjy.com )-110)2+(108-110)2+(110-110)2+(110-110)2+(113-110)2]=.
方法归纳
在实际应用中,常常把平均数与标准差结合起来进行决策,在平均值相等的情况下,比较方差或标准差以确定稳定性.
3.(2014·高考陕西卷)某公 ( http: / / www.21cnjy.com )司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为(  )
A.,s2+1002 B.+100,s2+1002
C.,s2 D.+100,s2
解析:选D.=,yi=xi+100,所以y1,y2,…,y10的均值为+100,方差不变,故选D.
数学思想 分类讨论思想在解决统计问题中的应用
  某班4个小组的人数为10,10,x,8,已知这组数据的中位数与平均数相等,求这组数据的中位数.
[解] 该组数据的平均数为(x+28),中位数一定是其中两个数的平均数,由于x不知是多少,所以要分几种情况讨论.
(1)当x≤8时,原数据按从小到大的顺序 ( http: / / www.21cnjy.com )排列为x,8,10,10,其中位数为×(10+8)=9.若(x+28)=9,则x=8,此时中位数为9.
(2)当8(3)当x>10时,原数据按从小到 ( http: / / www.21cnjy.com )大的顺序排列为8,10,10,x,其中位数为×(10+10)=10.若(x+28)=10,则x=12,此时中位数为10.
综上所述,这组数据的中位数为9或10.
[感悟提高]
在解决问题时,由于条件的变化,问题的结果有多种情况,不能用同一标准或同一种方法解决,这就需要对条件进行分类讨论.
当在数据中有未知数x求其中位数时,因x的取值不同,所以数据由大到小(或由小到大)的排列顺序不同,故中位数也不同,这就是本题分类讨论的原因.
1.一组数据的方差一定是(  )
A.正数 B.负数
C.任意实数 D.非负数
解析:选D.方差可为0和正数.
2.(2015·长沙四校联考)为了了解某同学 ( http: / / www.21cnjy.com )的数学学习情况,对他的6次数学测试成绩(满分100分)进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是(  )
A.中位数为83 B.众数为85
C.平均数为85 D.方差为19
解析:选C.易知该同学的6次数学测试成绩的中位数为84,众数为83,平均数为85,方差为19.7.
3.某班50名学生右眼视力的检查结果如表所示:
视力 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 1.0 1.2 1.5
人数 1 1 3 4 3 4 4 6 8 10 6
则该班学生右眼视力的众数为________,中位数为________.
解析:中间位置的数据0.8为中位数,出现次数最多的数据1.2是众数.
答案:1.2 0.8
4.从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下:
甲:3,4,5,6,8,8,8,10;
乙:4,6,6,6,8,9,12,13;
丙:3,3,4,7,9,10,11,12.
三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数.
甲:________,乙:________,丙:________.
解析:甲的众数为8,乙的平均数为8,丙的中位数为8.
答案:众数 平均数 中位数
[A.基础达标]
1.某学习小组在一次数学测验中,得 ( http: / / www.21cnjy.com )100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是(  )
A.85、85、85        B.87、85、86
C.87、85、85 D.87、85、90
解析:选C.从小到大列出所有数学成绩 ( http: / / www.21cnjy.com ):75,80,85,85,85,85,90,90,95,100,观察知众数和中位数均为85,计算得平均数为87.
2.(2015·合肥检测)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则(  )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
解析:选C.由题意可知,甲的 ( http: / / www.21cnjy.com )成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙的成绩的方差分别为×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=,C对;甲、乙的成绩的极差均为4,D错.
3.十八届三中全会指出要 ( http: / / www.21cnjy.com )改革分配制度,要逐步改变收入不平衡的现象.已知数据x1,x2,x3,…,xn 是上海普通职工n(n≥3,n∈N*)个人的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入xn+1,则这n+1个数据中,下列说法正确的是(  )
A.年收入平均数大大增大,中位数一定变大,方差可能不变
B.年收入平均数大大增大,中位数可能不变,方差变大
C.年收入平均数大大增大,中位数可能不变,方差也不变
D.年收入平均数可能不变,中位数可能不变,方差可能不变
解析:选B.插入大的极端值,平均数增加,中位数可能不变,方差也因为数据更加分散而变大.
4.如图是某赛季甲、乙两名篮球运动员每场 ( http: / / www.21cnjy.com )比赛得分的茎叶图,甲、乙两人这几场比赛得分的平均数分别为甲,乙;标准差分别是s甲,s乙,则有(  )
A.甲>乙,s甲>s乙 B.甲>乙,s甲<s乙
C.甲<乙,s甲>s乙 D.甲<乙,s甲<s乙
解析:选C.观察茎叶图可大致比较出平均数与标准差的大小关系.
5.(2013·高考山东卷)将某选手 ( http: / / www.21cnjy.com )的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
8 7 7
9 4 0 1 0 x 9 1
则7个剩余分数的方差为(  )
A. B.
C.36 D.
解析:选B.根据茎叶图,去掉1个最低分87,1个最高分99,
则[87+94+90+91+90+(90+x)+91]=91,
∴x=4.
∴s2=[(87-91)2 ( http: / / www.21cnjy.com )+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=.
6.已知样本9,10,11,x,y的平均数是10,标准差是,则xy=________.
解析:由平均数是10,得x+y=20,由标准差是,得
=,
∴(x-10)2+(y-10)2=8,∴xy=96.
答案:96
7.甲、乙两人在相同的条件下练习射击,每人打5发子弹,命中的环数如下:
甲:6,8,9,9,8;
乙:10,7,7,7,9.
则两人的射击成绩较稳定的是________.
解析:由题意求平均数可得
甲=乙=8,s=1.2,s=1.6,
s答案:甲
8.(2013·高考辽宁卷)为了考察某校各班 ( http: / / www.21cnjy.com )参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.
解析:设5个班级中参加的人数分别为x1,x ( http: / / www.21cnjy.com )2,x3,x4,x5,则由题意知=7,(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20,五个整数的平方和为20,则必为0+1+1+9+9=20,由|x-7|=3可得x=10或x=4.由|x-7|=1可得x=8或x=6,由上可知参加的人数分别为4,6,7,8,10,故最大值为10.
答案:10
9.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.
(1)根据茎叶图判断哪个班的平均身高较高;
(2)计算甲班的样本方差.
解:(1)乙班的平均身高较高.(可由茎叶图判断或计算得出)
(2)因为甲班的平均身高为=(158+162+…+182)=170(cm),所以甲班的样本方差s2=[2×92+2×(-2)2+12+(-7)2+(-8)2+122+(-12)2+02)]=57.2.
10.(2014·高考课标全国卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125)
频数 6 26 38 22 8
(1)作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?
解:(1)
(2)质量指标值的样本平均数为=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.
[B.能力提升]
1.下列说法:①一组数据不 ( http: / / www.21cnjy.com )可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差恒不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率,其中错误的有(  )
A.0个 B.1个
C.2个 D.3个
解析:选C.一组数据的众数不一定唯一, ( http: / / www.21cnjy.com )即①不对;一组数据的方差必须是非负数,即②不对;根据方差的定义知③正确;根据频率分布直方图的概念知④正确.
2.某市有15个旅游景点,经计算,黄金周 ( http: / / www.21cnjy.com )期间各个景点的旅游人数平均为20万,标准差为s,后来经核实,发现甲、乙两处景点统计的人数有误,甲景点实际为20万,被误统计为15万,乙景点实际为18万, 被统计成23万;更正后重新计算,得到标准差为s1,则s与s1的大小关系为(  )
A.s=s1 B.s<s1
C.s>s1 D.不能确定
解析:选C.由已知,两次统计所得的旅游人数总数没有变,即两次统计的各景点旅游人数的平均数是相同的,设为,
则s=eq \r(\f(1,15)[(15-)2+(23-)2+(x2-)2+…+(x15-)2]),
s1=eq \r(\f(1,15)[(20-)2+(18-)2+(x2-)2+…+(x15-)2]).
若比较s与s1的大小,只需比 ( http: / / www.21cnjy.com )较(15-)2+(23-)2与(20-)2+(18-)2的大小即可.而(15-)2+(23-)2=754-76+22,(20-)2+(18-)2=724-76+22,所以(15-)2+(23-)2>(20-)2+(18-)2.从而s>s1.
3.甲、乙两同学在高考前各做5次立定跳远测试 ( http: / / www.21cnjy.com ),测得甲的成绩如下(单位:米):2.20,2.30,2.30,2.40,2.30.若甲、乙两人的平均成绩相同,乙的成绩的方差是0.005,那么甲、乙两人成绩较稳定的是________.
解析:求得甲的平均成绩为2.30,甲的成绩的方差是0.004.由已知得甲、乙平均成绩相同,但甲的成绩的方差比乙的小,所以甲的成绩较稳定.
答案:甲
4.如图是某青年歌手大奖赛上七位 ( http: / / www.21cnjy.com )评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有________.
解析:去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.
答案:a2>a1
5.(2013·高考安徽卷)为调查甲 ( http: / / www.21cnjy.com )、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图:
(1)若甲校高三年级每位 ( http: / / www.21cnjy.com )学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为1,2,估计1-2 的值.
解:(1)设甲校高三年级学生总人数为n.
由题意知=0.05,解得n=600.
样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为1-=.
(2)设甲、乙两校样本平均数分别为1′,2′.
根据样本茎叶图可知30(1′-2′)=301′-302′
=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92
=2+49-53-77+2+92=15.
因此1′-2′=0.5.故1-2的估计值为0.5分.
6.(选做题)在每年的春节 ( http: / / www.21cnjy.com )后,某市政府都会发动公务员参与到植树绿化活动中去.林业管理部门在植树前,为了保证树苗的质量,都会在植树前对树苗进行检测.现从甲、乙两种树苗中各抽测了10株树苗,量出它们的高度如下(单位:厘米),甲:37,21,31,20,29,19,32,23,25,33;
乙:10,30,47,27,46,14,26,10,44,46.
(1)画出两组数据的茎叶图,并根据茎叶图对甲、乙两种树苗的高度作比较,写出两个统计结论;
(2)设抽测的10株甲种树苗高度 ( http: / / www.21cnjy.com )平均值为x,将这10株树苗的高度依次输入,按程序框(如图)进行运算,问输出的S大小为多少?并说明S的统计学意义.
解:(1)茎叶图:
统计结论:(任意两个即可)
①甲种树苗的平均高度小于乙种树苗的平均高度;
②甲种树苗比乙种树苗长得整齐;
③甲种树苗的中位数为27,乙种树苗的中位数为28.5;
④甲种树苗的高度基本上是对称的,而且大多数集中在均值附近,乙种树苗的高度分布比较分散.
(2)x=27,S=35,S表示10株甲种树苗高度的方差.2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布
1.问题导航
(1)画频率分布直方图有哪些步骤?频率分布直方图的特征是什么?
(2)什么是频率分布折线图?
(3)什么是总体密度曲线?
(4)画茎叶图的步骤有哪些?茎叶图有什么特征?
2.例题导读
对“P68探究”内容的导读:同 ( http: / / www.21cnjy.com )样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断.
对“P68思考”内容的导 ( http: / / www.21cnjy.com )读:由于约有88%的居民月均用水量都在3吨以下,因此,只要将月用水量标准制定为3吨时,就可以满足85%以上的居民每月的用水量不超过标准.
对“P69思考”内容的导读:不同的样本得到的 ( http: / / www.21cnjy.com )频率分布折线图不同;即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,因此不能由样本的频率分布折线图得到准确的总体密度曲线.
1.频率分布表与频率分布直方图
(1)频数与频率
将一批数据按要求分成若干个组,数 ( http: / / www.21cnjy.com )据分布在各个小组的个数,叫做该组的频数,每组频数除以全体数据总数的商,叫做该组的频率,频率反映数据在每组中所占比例的大小.
(2)样本的频率分布与频率分布表
①相关概念
根据随机所抽样本的大小,分别计算数据分 ( http: / / www.21cnjy.com )布在各个小组的频率,这些频率的分布规律(取值情况),就叫做样本的频率分布.为了能直观地显示样本的频率分布情况,通常我们会将样本的分组情况、数据分布在各个小组的频数以及计算所得的相应频率列在一张表中,叫做样本频率分布表.
②求一组数据的频率分布表的步骤:
a.求极差.
b.决定组距与组数.
c.将数据分组.
d.列频率分布表.
(3)用样本的频率分布估计总体的分布
从一个总体得到一个包含大量数据的 ( http: / / www.21cnjy.com )样本时,很难从一个个的数字中直接看出样本所包含的信息.如果把这些数据形成频率分布表或频率分布直方图,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况.
(4)频率分布直方图
①在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积的总和等于1.
②频率分布直方图的绘制方法与步骤:
a.先制作频率分布表,然后作直角坐标系,横轴表示总体,纵轴表示.
b.把横轴分成若干段,每一段对应一个组.以每个组距为底,以各频率除以组距的商为高,分别画成矩形.这样得到的直方图就是频率分布直方图.
2.频率分布折线图与总体密度曲线
(1)频率分布折线图
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线
一般地,当总体中的个体数较多时,抽 ( http: / / www.21cnjy.com )样时样本容量就不能太小.可以想象,随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线,如图所示.
3.茎叶图
茎叶图也是用来表示数据的一种图,其画法如下:
(1)将一个或两个样本的数据分为“茎”(高位)和“叶”(低位)两部分.
(2)将最小茎和最大茎之间的数按大小次序排成一列.
(3)将各个数据的“叶”按大小次序写在其茎一侧或两侧.
1.判断下列各题.(对的打“√”,错的打“×”)
(1)频率分布折线图与总体密度曲线无关;(  )
(2)频率分布折线图就是总体密度曲线;(  )
(3)样本容量很大的频率分布折线图就是总体密度曲线;(  )
(4)如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线;(  )
(5)频率分布直方图不能保留原始数据,而茎叶图可以保留原始数据,而且可以随时记录.(  )
解析:总体密度曲线通常都是用样本频率分 ( http: / / www.21cnjy.com )布估计出来的.如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于一条光滑曲线,这条光滑曲线就是总体密度曲线.
答案:(1)× (2)× (3)× (4)√ (5)√
2.一个容量为32的样本,分成5组,已知第三组的频率为0.375,则另外四组的频数之和为________.
解析:由题意,得第三组的频数为32×0.375=12.
∴另外四组的频数之和为32-12=20.
答案:20
3.在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?
解:各小长方形的面积表示样本中落在该组内的数据的频率;总和等于1.
1.茎叶图的优缺点
优点:用茎叶图表示数据有两个优点:一 ( http: / / www.21cnjy.com )是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.
缺点:茎叶图在样本数据较多时, ( http: / / www.21cnjy.com )显得不太方便,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两组记录那么直观、清晰.
2.茎叶图、频率分布表和 ( http: / / www.21cnjy.com )频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录(这对于教练员发现运动员现场状态特别有用);而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
3.频率分布表和频率分布直方图之间的密 ( http: / / www.21cnjy.com )切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指定区间组的频数.
       作频率分布表、绘制频率分布直方图
[学生用书P37]
调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165
171 169 167 169 151 168 170 168 160 174
165 168 174 159 167 156 157 164 169 180
176 157 162 161 158 164 163 163 167 161
(1)作出频率分布表;
(2)画出频率分布直方图.
[解] (1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:
分组 频数 频率
[149.5,153.5) 1 0.025
[153.5,157.5) 3 0.075
[157.5,161.5) 6 0.15
[161.5,165.5) 9 0.225
[165.5,169.5) 14 0.35
[169.5,173.5) 3 0.075
[173.5,177.5) 3 0.075
[177.5,181.5] 1 0.025
合计 40 1
(2)频率分布直方图如图所示.
[互动探究] 本例中,画出相应的频率分布折线图.
解:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图如下:
方法归纳
(1)在列频率分布表时,极差、组距、组数有如下关系:
①若为整数,则=组数;
②若不为整数,则的整数部分+1=组数.
(2)组距和组数的确定没有固定的标准,将数 ( http: / / www.21cnjy.com )据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.
1.美国历届总统中,就任时年纪最小的是罗 ( http: / / www.21cnjy.com )斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:
57,61,57,57,58 ( http: / / www.21cnjy.com ),57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
解:(1)以4为组距,列表如下:
分组 频数累计 频数 频率
[41.5,45.5) [45.5,49.5)[49.5,53.5)[53.5,57.5)[57.5,61.5)[61.5,65.5)[65.5,69.5] 正正正正正正 27816542 0.045 50.159 10.181 80.363 60.113 60.090 90.045 5
合计 44 1.00
画频率分布直方图及频率分布折线图如下:
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.
       茎叶图及其应用
某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记下抽查记录如下(单位:千克):
甲:52 51 49 48 53 48 49
乙:60 65 40 35 25 65 60
画出茎叶图,并说明哪个车间的产品质量比较稳定.
[解] 茎叶图如图所示(茎为十位上的数字):
由图可以看出甲车间的产品质量较集中,而乙车间的产品质量较分散,所以甲车间的产品质量比较稳定.
方法归纳
画茎叶图时,用中间的数表 ( http: / / www.21cnjy.com )示数据的十位和百位数,两边的数分别表示两组数据的个位数.要先确定中间的数取数据的哪几位,填写数据时边读边填.比较数据时从数据分布的对称性、中位数、稳定性等几方面来比较.
绘制茎叶图的关键是分清茎 ( http: / / www.21cnjy.com )和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.
2.从两个班中各随机抽取10名学生,他们的数学成绩如下:
甲班:76,74,82,96,66,76,78,72,52,68
乙班:86,84,62,76,78,92,82,74,88,85
画出茎叶图并分析两个班学生的数学学习情况.
解:茎叶图如下:
由茎叶图可知,乙班的数学成绩较好,而且较稳定.
       频率分布直方图的综合应用
为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:
[10.75,10.85),3;[10.8 ( http: / / www.21cnjy.com )5,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2
(1)列出频率分布表;
(2)画出频率分布直方图以及频率分布折线图;
(3)据上述图表,估计数据落在[10.95,11.35)范围内的可能性是百分之几;
(4)数据小于11.20的可能性是百分之几.
[解] (1)频率分布表如下:
分组 频数 频率
[10.75,10.85) 3 0.03
[10.85,10.95) 9 0.09
[10.95,11.05) 13 0.13
[11.05,11.15) 16 0.16
[11.15,11.25) 26 0.26
[11.25,11.35) 20 0.20
[11.35,11.45) 7 0.07
[11.45,11.55) 4 0.04
[11.55,11.65] 2 0.02
合计 100 1.00
  (2)频率分布直方图及频率分布折线图,如图
(3)由上述图表可知数据落在[10.95, ( http: / / www.21cnjy.com )11.35)范围内的频率为1-(0.03+0.09)-(0.07+0.04+0.02)=0.75=75%,即数据落在[10.95,11.35)范围内的可能性是75%.
(4)数据小于11.20的可能性 ( http: / / www.21cnjy.com )即数据小于11.20的频率,设为x,则(x-0.41)÷(11.20-11.15)=(0.67-0.41)÷(11.25-11.15),
所以x-0.41=0.13,即x=0.54,
从而估计数据小于11.20的可能性是54%.
方法归纳
(1)用样本的频率分布估计总体的分布,是列 ( http: / / www.21cnjy.com )频率分布表和画频率分布直方图的主要目的,频率分布表比较准确地反映样本的频率分布,而频率分布直方图则能直观地反映样本的频率分布.
(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.
3.(1)随机抽取100名学生,测得他们 ( http: / / www.21cnjy.com )的身高(单位:cm),按照区间[160,165),[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图.
①求频率分布直方图中x的值及身高在170 cm以上的学生人数;
②将身高在[170,175),[175 ( http: / / www.21cnjy.com ),180),[180,185]区间内的学生依次记为A,B,C三个组,用分层抽样的方法从三个组中抽取6人,求从这三个组分别抽取的学生人数.
解:①由频率分布直方图可知5x=1-5×(0.07+0.04+0.02+0.01),
所以x=×(1-5×0.14)=0.06.
即身高在170 cm以上的学生人数为100×(0.06×5+0.04×5+0.02×5)=60人.
②A,B,C三组的人数分别为30人,20人,10人.
因此应该从A,B,C三组中每组各抽取30×=3人,20×=2人,10×=1人.
(2)从高一学生中抽取50名参加调研考试, ( http: / / www.21cnjy.com )成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
①列出样本的频率分布表;
②画出频率分布直方图;
③估计成绩在[70,80)分的学生所占总体的百分比;
④估计成绩在[70,100]分的学生所占总体的百分比.
解:①频率分布表如下:
成绩分组 频数 频率
[40,50) 2 0.04
[50,60) 3 0.06
[60,70) 10 0.2
[70,80) 15 0.3
[80,90) 12 0.24
[90,100] 8 0.16
合计 50 1.00
②由题意知组距为10,取小矩形的高为,计算得到如下的数据表:
成绩分组 频率 小矩形高
[40,50) 0.04 0.004
[50,60) 0.06 0.006
[60,70) 0.2 0.02
[70,80) 0.3 0.03
[80,90) 0.24 0.024
[90,100] 0.16 0.016
合计 1.00
根据表格画出频率分布直方图如图:
③由频率分布表可知成绩在[70,80)分的学生所占总体的百分比约是0.3=30%.
④估计成绩在[70,100]分的学生所占总体的百分比是0.3+0.24+0.16=0.7=70%.
数学思想 统计问题中的数形结合思想
某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:357,359,367 ( http: / / www.21cnjy.com ),368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454
品种B:363,371,374, ( http: / / www.21cnjy.com )383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430
(1)完成数据的茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
[解] (1)
(2)由于每个品种的数据都只有25个,样本不 ( http: / / www.21cnjy.com )大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.
(3)通过观察茎叶图可以看出:①品种A的亩产量比品种B高;②品种A的亩产量比较分散,故品种A的亩产稳定性较差.
[感悟提高]
数形结合思想是中学数学很重要的方法 ( http: / / www.21cnjy.com )之一,是高考的重要内容之一,是根据数的结构特征,构造出与之相应的几何图形,并利用图形的特性和规律,解决数的问题.
1.没有信息的损失,所有的原始数据都可以从图中得到的统计图是(  )
A.总体密度曲线 B.茎叶图
C.频率分布折线图 D.频率分布直方图
解析:选B.所有的统计图中,仅有茎叶统计图完好无损地保存着所有的数据信息.
2.(2015·湖南师大附中月考)某厂对一批 ( http: / / www.21cnjy.com )元件的长度(单位:mm)进行抽样检测,得到如图所示的频率分布直方图.若长度在区间[90,96)内的元件为合格品,则估计这批元件中合格产品所占的百分比是(  )
A.70% B.75%
C.80% D.85%
解析:选C.易知在区间[90,96)内的直方 ( http: / / www.21cnjy.com )图的面积S=1-(0.027 5+0.027 5+0.045 0)×2=0.8,故合格品所占的百分比是80%.
3.(2014·高考江苏卷)为了了解一片 ( http: / / www.21cnjy.com )经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.
解析:底部周长在[80,90)的频率为0.0 ( http: / / www.21cnjy.com )15×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24.
答案:24
[A.基础达标]
1.在抽查某产品尺寸的过程中,将其尺寸分成 ( http: / / www.21cnjy.com )若干组,[a,b)是其中一组,抽查出的个体数在该组内的频率为m,该组直方图的高为h,则|a-b|的值等于(  )
A.h·m B.
C. D.与m,h无关
解析:选B.小长方形的高=,
∴|a-b|==.
2.某雷达测速区规定:凡车 ( http: / / www.21cnjy.com )速大于或等于70 km/h的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对300辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为(  )
A.30辆 B.40辆
C.60辆 D.80辆
解析:选C.车速大于或等于70 km/h的汽车数为0.02×10×300=60(辆).故选C.
3.某超市连锁店统计了城市甲、乙的各16台自动售货机在12:00至13:00间的销售金额,并用茎叶图表示如图.则可估计有(  )
A.甲城市销售额多,乙城市销售额不够稳定
B.甲城市销售额多,乙城市销售额稳定
C.乙城市销售额多,甲城市销售额稳定
D.乙城市销售额多,甲城市销售额不够稳定
解析:选D.十位数字是3、4、5时乙城市的销售额明显多于甲,估计乙城市销售额多,甲的数字过于分散,不够稳定.故选D.
4.(2013·高考辽宁卷)某班的全体学生参 ( http: / / www.21cnjy.com )加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是(  )
A.45 B.50
C.55 D.60
解析:选B.根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,所以该班的学生人数是=50.
5.(2015·宿迁质检)某校100 ( http: / / www.21cnjy.com )名学生的数学测试成绩频率分布直方图如图所示,分数不低于a即为优秀,如果优秀的人数为20,则a的估计值是(  )
A.130 B.140
C.133 D.137
解析:选C.由已知可以判断a∈(130,140),所以[(140-a)×0.015+0.01×10]×100=20.
解得a≈133.
6.(2015·辽宁名校联考)为了解一片经济 ( http: / / www.21cnjy.com )林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图(如图),那么这100株树木中,底部周长小于110 cm的树有________株.
解析:(0.01×10+0.02×10+0.04×10)×100=70.
答案:70
7.(2015·丹东质检)茎叶图表示的是甲、 ( http: / / www.21cnjy.com )乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的总成绩是445,则污损的数字是________.
解析:设污损的叶对应的成绩是x,由茎叶图可得445=83+83+87+x+99,解得x=93,故污损的数字是3.
答案:3
8.(2015·江西宜春质检)为了帮助班上 ( http: / / www.21cnjy.com )的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们的捐款数(单位:元)如下:19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图时先计算最大值与最小值的差是________.若取组距为2,则应分成________组;若第一组的起点定为18.5,则在[26.5,28.5)内的频数为________.
解析:由题意知,极差为30-19 ( http: / / www.21cnjy.com )=11;由于组距为2,则=5.5不是整数,所以取6组;捐款数落在[26.5,28.5)内的有27,27,28,28,27共5个,因此频数为5.
答案:11 6 5
9.某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:
甲:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙:83,86,93,99,88,103,98,114,98,79,78,106,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
解:甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的 ( http: / / www.21cnjy.com )得分情况是大致对称的;甲同学的得分情况也大致对称,相对乙来说有些分散.乙同学的成绩比较稳定,总体情况比甲同学好.
10.某市高三数学抽测考试中,对9 ( http: / / www.21cnjy.com )0分以上(含90分)的成绩进行统计,其频率分布直方图如图所示,若[130,140)分数段的人数为900,求[90,100)分数段的人数.
解:由频率分布直方图可得[130,140)分数段的人数所占的百分比为0.005×10=0.05,
所以参加考试的总人数为=18 000.
因此[90,100)分数段的人数为
18 000×(0.045×10)=8 100.
[B.能力提升]
1.(2013·高考四川卷)某学校随机抽 ( http: / / www.21cnjy.com )取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是(  )
解析:选A.法一:由题意知样本容量为20,组距为5.
列表如下:
分组 频数 频率
[0,5) 1 0.01
[5,10) 1 0.01
[10,15) 4 0.04
[15,20) 2 0.02
[20,25) 4 0.04
[25,30) 3 0.03
[30,35) 3 0.03
[35,40] 2 0.02
合计 20 1
观察各选择项的频率分布直方图知选A.
法二:由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、也分别相等.比较四个选项知A正确,故选A.
2.某工厂对一批产品进行了抽 ( http: / / www.21cnjy.com )样检测.如图是根据抽样检测后的产品净重(单元:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是(  )
A.90 B.75
C.60 D.45
解析:选A.产品净重小于100克的频率为 ( http: / / www.21cnjy.com )(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n,则=0.300,所以n=120,净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A.
3.有一个容量为200的样本,其频率分布 ( http: / / www.21cnjy.com )直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为________.
解析:设样本数据落在区间[10,12 ( http: / / www.21cnjy.com )]内的频率为2x,则(0.02+0.05+x+0.15+0.19)×2=1,得x=0.09,所以样本数据落在区间[10,12]内的频数为0.09×2×200=36.
答案:36
4.将容量为n的样本中的数据分成6组,绘制 ( http: / / www.21cnjy.com )频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n等于________.
解析:设第一组至第六组数据的频率分别为2x ( http: / / www.21cnjy.com ),3x,4x,6x,4x,x,则2x+3x+4x+6x+4x+x=1,解得x=,所以前三组数据的频率分别是,,,故前三组数据的频数之和等于++=27,解得n=60.
答案:60
5.近年来,我国“雾霾天气”频发,严重影响人们的身体健康.根据空气质量指数API(为整数)的不同,可将空气质量分级如下表:
API 0~50 51~100 101~150 151~200 201~250 251~300 >300
级别 Ⅰ Ⅱ Ⅲ1 Ⅲ2 Ⅳ1 Ⅳ2 Ⅴ
状况 优 良 轻微污染 轻度污染 中度污染 中度重污染 重度污染
对某城市一年(365天)的空气质量进行监 ( http: / / www.21cnjy.com )测,获得的API数据按照区间[0,50],(50,100],(100,150],(150,200],(200,250],(250,300]进行分组,得到频率分布直方图如图.
(1)求频率分布直方图中x的值;
(2)计算一年中空气质量分别为良和轻微污染的天数.
解:(1)根据频率分布直方图可知,
x=÷50=.
(2)空气质量为Y的天数=(Y ( http: / / www.21cnjy.com )对应的频率÷组距)×组距×365天,所以一年中空气质量为良和轻微污染的天数分别是×50×365=119(天)和×50×365=100(天).
6.(选做题)对某电子元件进行寿命追踪调查,情况如下:
寿命(h) [100,200) [200,300) [300,400) [400,500) [500,600]
个数 20 30 80 40 30
(1)列出频率分布表;
(2)画出频率分布直方图;
(3)估计电子元件寿命在400 h以上的频率.
解:(1)列出频率分布表如下:
寿命(h) 频数 频率
[100,200) 20 0.10
[200,300) 30 0.15
[300,400) 80 0.40
[400,500) 40 0.20
[500,600] 30 0.15
合计 200 1
(2)画出频率分布直方图如图:
(3)估计电子元件寿命在400 h以上的频率为0.35.2.3 变量间的相关关系
1.问题导航
(1)相关关系分为哪两种?
(2)什么叫散点图?
(3)什么叫回归直线?求回归直线的方法及步骤是什么?
2.例题导读
通过对例题的学习,(1)学会如 ( http: / / www.21cnjy.com )何作散点图;(2)学会如何用散点图判断两个变量是否相关;(3)掌握求回归直线方程的方法;(4)熟悉回归直线方程的实际应用.
1.两个变量的线性相关
(1)散点图:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形.
(2)正相关与负相关
①正相关:散点图中的点散布在从左下角到右上角的区域.
②负相关:散点图中的点散布在从左上角到右下角的区域.
2.回归直线的方程
(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程.
(3)最小二乘法
求回归直线方程=x+时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
= eq \f((x i-)( yi-),(x i-)) = eq \f( -n,- n)
=-其中,是回归方程的斜率,是回归方程在y轴上的截距.
1.判断下列各题.(对的打“√”,错的打“×”)
(1)线性回归方程必经过点(,);(  )
(2)对于方程=x+,x增加一个单位时,y平均增加个单位;(  )
(3)样本数据中x=0时,可能有y=;(  )
(4)样本数据中x=0时,一定有y=.(  )
解析:根据回归直线方程的意义知,(1)(2)都正确,而(3)(4)中,样本数据x=0时,y的值可能为,也可能不是,故(3)正确.
答案:(1)√ (2)√ (3)√ (4)×
2.判断下列图形中具有相关关系的两个变量是(  )
解析:选C.A、B为函数关系,D无相关关系.
3.下列关系中,有相关关系的是________.
①正方形的边长与面积之间的关系;
②水稻产量与施肥量之间的关系;
③人的身高与年龄之间的关系.
解析:①正方形的边长与面积之间的 ( http: / / www.21cnjy.com )关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具备相关关系.
答案:②
4.一位母亲记录了儿子3 ( http: / / www.21cnjy.com )~9岁的身高,由此建立的身高与年龄的回归模型为=7.19x+73.93,那么这个孩子10岁时的身高是否一定是145.83 cm
解:不一定,用回归模型=7.19x+73.93只能预测,其结果不一定是个确定值.
1.两个变量之间的关系与其对应的散点图特征
(1)两个变量间的关系是函数关系时,数据点位于某曲线上.
(2)两个变量间的关系是相关关系时,数据点位于某曲线附近.
(3)两个变量间的关系是线性相关时,数据点位于某直线附近.
2.对回归直线与回归方程的理解
(1)回归方程被样本数据唯一确定,各 ( http: / / www.21cnjy.com )样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.
(2)对于任意一组样本数据,利用最小二乘法公 ( http: / / www.21cnjy.com )式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.
       相关关系的判断
(1)下列关系中,属于相关关系的是________.
①人的身高与视力的关系;
②做自由落体运动的物体的质量与落地时间的关系;
③降雪量与交通事故的发生率之间的关系.
(2)下表是某地的年降雨量与年平均气温,判断两者是相关关系吗?求回归直线方程有意义吗?
年平均气温(℃) 12.51 12.74 12.74 13.69 13.33 12.84 13.05
年降雨量(mm) 748 542 507 813 574 701 432
  [解析] (1)
题号 判断 原因分析
① 不是相关关系 身高与视力无关,不具有函数关系,也不具有相关关系
② 不是函数关系,也不是相关关系 自由落体的物体的质量与落地时间无关,不具有相关关系
③ 相关关系 降雪量越大,交通事故发生率越高,不确定性的关系
[答案] ③
(2)解:以x轴为年平均气温,y轴为年降雨量,可得相应的散点图,如图所示:
因为图中各点并不在一条直线附近,所以两者不具有相关关系,求回归直线方程也是没有意义的.
方法归纳
(1)两个变量x和y相关关系的确定方法:
①散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;
②表格、关系式法:结合表格或关系式进行判断;
③经验法:借助积累的经验进行分析判断.
(2)判断两个变量x和y之间是否具有 ( http: / / www.21cnjy.com )线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
1.(1)对变量x,y有观测数据(xi, ( http: / / www.21cnjy.com )yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断(  )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
解析:选C.图(1)中的数据y随着x的增大而减小,因此变量x与变量y负相关;图(2)中的数据v随着u的增大而增大,因此u与v正相关.
(2)下面是随机抽取的9名15岁男生的身高、体重表:
编号 1 2 3 4 5 6 7 8 9
身高/cm 165 157 155 175 168 157 178 160 163
体重/kg 52 44 45 55 54 47 62 50 53
判断所给的两个变量是否存在相关关系.
解:法一:根据经验可知,人的身高和体重之间存在相关关系.
法二:观察表格数据可知,人的体重随着身高的增加而增加,因此人的身高和体重之间存在相关关系.
法三:以x轴表示身高,以y轴表示体重,得到相应的散点图.如图所示:
我们会发现,随着身高的增高,体重基本上呈增加趋势.所以体重与身高之间存在相关关系,并且是正相关.
       线性回归方程的建立
下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
x 3 4 5 6
y 2.5 3 4 4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(3)已知该厂技改前100吨甲产品的生产能 ( http: / / www.21cnjy.com )耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
(链接教材P90例题)
[解] (1)散点图如图:
(2) ==4.5,
==3.5,
=3×2.5+4×3+5×4+6×4.5=66.5,
=32+42+52+62=86,
∴= eq \f( -4,- 4) ==0.7,
=-=3.5-0.7×4.5=0.35.
∴所求的线性回归方程为=0.7x+0.35.
(3)当x=100时,y=0.7×100+0.35=70.35(吨标准煤),
90-70.35=19.65(吨标准煤).由此可预测生产100吨甲产品的生产能耗比技改前大约降低了19.65吨标准煤.
[互动探究] 如果把本题中的y的值2.5及4.5分别改为2和5,如何求回归直线方程?
解:散点坐标分别为(3,2),(4,3),(5,4),(6,5).
可验证这四点共线,斜率k==1,
∴直线方程为y-2=x-3,即回归直线方程为=x-1.
方法归纳
求线性回归方程的步骤:
(1)计算平均数,.
(2)计算xi与yi的积,求.
(4)将结果代入公式= eq \f( -n,- n) ,求.
(5)用=-,求.
(6)写出回归方程.
2.测量某地10对父子身高(单位:英寸)如下:
父亲身
高(x) 60 62 64 65 66 67 68 70 72 74
儿子身
高(y) 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70
如果x与y之间具有线性相关关系,求回归直线方程;如果父亲的身高为78英寸,试估计儿子的身高.
解:先将两个变量的数字在表中计算出来,如下表所示:
序号 xi yi x y xiyi
1 60 63.6 3 600 4 044.96 3 816
2 62 65.2 3 844 4 251.04 4 042.4
3 64 66 4 096 4 356 4 224
4 65 65.5 4 225 4 290.25 4 257.5
5 66 66.9 4 356 4 475.61 4 415.4
6 67 67.1 4 489 4 502.41 4 495.7
7 68 67.4 4 624 4 542.76 4 583.2
8 70 68.3 4 900 4 664.89 4 781
9 72 70.1 5 184 4 914.01 5 047.2
10 74 70 5 476 4 900 5 180
∑ 668 670.1 44 794 44 941.93 44 842.4
由上表可得==66.8,==67.01,
=44 941.93,
=44 794,=44 842.4.
代入公式得=≈0.464 6,
=67.01-0.464 6×66.8≈35.975,
故所求回归直线方程为=0.464 6x+35.975.
当x=78时,=0.464 6×78+35.975=72.213 8,
所以当父亲的身高为78英寸时,估计儿子的身高约为72.213 8英寸.
       线性回归方程的应用
假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:
使用年限x 2 3 4 5 6
维修费用y 2.2 3.8 5.5 6.5 7.0
若由资料知:y对x呈线性相关关系,试求:
(1)线性回归方程=x+的回归系数、;
(2)估计使用年限为10年时,维修费用是多少?
[解] (1)制表
i 1 2 3 4 5 合计
xi 2 3 4 5 6 20
yi 2.2 3.8 5.5 6.5 7.0 25
xiyi 4.4 11.4 22.0 32.5 42.0 112.3
x 4 9 16 25 36 90
x=4,y=5=90, yi=112.3
于是有===1.23;
=-=5-1.23×4=0.08.
(2)回归直线方程是:=1.23x+0.08,当x=10(年)时,=1.23×10+0.08=12.3+0.08=12.38(万元),即估计使用10年时维修费用是12.38万元.
方法归纳
(1)求回归直线方程关键是求,,也是本题易错点,由于计算量较大,计算时一定要认真.
(2)知道x与y有线性相 ( http: / / www.21cnjy.com )关关系,无需进行相关性检验(课本对此不作要求).只有两个变量之间存在线性相关关系,才能求其线性回归方程,才能用其估计和预测.否则即使求出其线性回归方程,也是毫无意义的,而且用其估计和预测的量也是不可信的.
3.(1)提倡节约,反对浪费.2015年元旦前夕,某市统计局统计了该市10户家庭的年收入和年饮食支出的统计资料如下表:
年收入x(万元) 2 4 4 6 6 6 7 7 8 10
年饮食支出y(万元) 0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3
①若y与x是线性相关的,求回归方程,否则请说明理由;
②若某家庭年收入为9万元,预测其年饮食支出.
(参考数据:=117.7,
解:散点图如图:
由散点图可知,年收入越高,年饮食支出越高, ( http: / / www.21cnjy.com )图中点的趋势表明两个变量间确实存在着线性相关关系.,依题意可计算得:=6,=1.83,, 2=36,,  =10.98,,又∵=117.7,=406,
∴= eq \f( -10,- 10) ≈0.17,
=-=0.81,
∴=0.17x+0.81.
∴所求的回归方程为=0.17x+0.81.
②当x=9时,=0.17×9+0.81=2.34(万元).
可估计年收入为9万元的家庭,每年饮食支出约为2.34万元.
(2)有一台机床可以按各种不同 ( http: / / www.21cnjy.com )的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化.下面是试验的步骤:
机床运转的速度(转/秒) 每小时生产二级品的数量(个)
8 5
12 8
14 9
16 11
①作出散点图;
②求出机床运转的速度x与每小时生产二级品数量y的回归直线方程;
③若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?
解:①散点图如图所示:
②易求得=12.5,=8.25,≈0.728 6,=-0.857 5,
∴所求回归直线方程为=0.728 6x-0.857 5.
③依题意,要使≤10,只要0.728 ( http: / / www.21cnjy.com ) 6x-0.857 5≤10,解得x≤14.901 9,即机床的运转速度不能超过14.901 9转/秒.
规范解答 散点图的画法及应用
  (本题满分12分)某化工厂的原料中,有A和B两种有效成分,现随机抽取了10份原料样品进行抽样检测,测得A和B的含量如下表所示:
i 1 2 3 4 5 6 7 8 9 10
x 67 54 72 64 39 22 58 43 46 34
y 24 15 23 19 16 11 20 16 17 13
其中x表示成分A的百分含量x%,y表示成分B的百分含量y%.
(1)作出两个变量y与x的散点图;
(2)两个变量y与x是否线性相关?若是线性相关,求出线性回归方程.
[解] (1)按照y从小到大的顺序调整表中数据(这样有利于描点,如用画图软件则不需要调整表格数据),?
如下表所示:
x 22 34 54 43 39 46 64 58 72 67
y 11 13 15 16 16 17 19 20 23 24
散点图如图所示:
4分
(2)观察散点图可知,y与x是线性相关关系.?
下面求线性回归方程:
i 1 2 3 4 5 6 7 8 9 10 合计
xi 22 34 54 43 39 46 64 58 72 67 499
yi 11 13 15 16 16 17 19 20 23 24 174
xiyi 242 442 810 688 624 782 1 216 1 160 1 656 1 608 9 228
x 484 1 156 2 916 1 849 1 521 2 116 4 096 3 364 5 184 4 489 27 175
所以=49.9,=17.4,10=8 682.6,102=24 900.1
设所求的线性回归方程是=+x,?8分
= eq \f( -10,- 10)
==≈0.239 7,?
=y-x=17.4-0.239 7×49.9≈5.439,10分
所求的线性回归方程是=0.239 7x+5.439.…12分
[规范与警示] 
?将题中给出的y的值按一定顺序排列.描点则可按一定顺序进行.
?利用散点图可直观地验证是否具有相关关系.只有判断出两变量具有线性相关关系才能再进一步求线性回归方程,否则就没有意义.
?将公式中所有涉及到的数据在表格中一一列出,以便计算减少失误.
?此步运算量较大,是关键点也是失分点.
1.我们常说“吸烟有害健康”,吸烟与健康之间的关系是(  )
A.正相关 B.负相关
C.无相关 D.不确定
解析:选B.烟吸得越多,则健康程度越差.
2.线性回归直线是指(  )
A.样本少数点在其上的直线
B.样本所有点在其上的直线
C.样本大部分点在其上的直线
D.样本所有点到其距离的平方和最小的直线
解析:选D.由线性回归直线的求法可知线性回归直线是样本所有点到其距离的平方和最小的直线.
3.回归直线方程=x+中,斜率的含义是________.
解析:回归方程的斜率的含义是x每增加一个单位,y平均增加的单位数.
答案:x每增加一个单位,y平均增加的单位数
4.已知工厂加工零件的个数x与花费时间y(h)之间的线性回归方程为=0.01x+0.5,则加工200个零件大约需要________小时.
解析:将200代入线性回归方程=0.01x+0.5,
得y=2.5.
答案:2.5
[A.基础达标]
1.(2015·张掖高一检测)有几组变量:
①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;
②平均日学习时间和平均学习成绩;
③立方体的棱长和体积.
其中两个变量成正相关的是(  )
A.①③          B.②③
C.② D.③
解析:选C.①是负相关;②是正相关;③是函数关系,不是相关关系.
2.对于给定的两个变量的统计数据,下列说法正确的是(  )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
解析:选C.由两个变量的 ( http: / / www.21cnjy.com )数据统计,不能分析出两个变量的关系,A错;不具有线性相关的两个变量不能用一条直线近似地表示他们的关系,更不能用确定的表达式表示他们的关系,B,D错.
3.对有线性相关关系的两个变量建立的回归直线方程=+x中,回归系数(  )
A.不能小于0 B.不能大于0
C.不能等于0 D.只能小于0
解析:选C.当=0时,r=0,这时不具有线性相关关系,但能大于0,也能小于0.
4.(2013·高考湖北卷) 四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:(  )
① y与x负相关且=2.347x-6.423;② y与x负相关且=-3.476x+5.648;③ y与x正相关且=5.437x+8.493;④ y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是(  )
A.①② B.②③
C.③④ D.①④
解析:选D.由正负相关性的定义知①④一定不正确.
5.设某大学的女生体重y(单位 ( http: / / www.21cnjy.com ):kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是(  )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
解析:选D.当x=170时,=0.85×170-85.71=58.79,体重的估计值为58.79 kg,故D不正确.
6.已知一个回归直线方程为=1.5x+45,x∈{1,7,5,13,19},则=________.
解析:因为=(1+7+5+13+19)=9,
且回归直线过样本中心点(x,y),
所以=1.5×9+45=58.5.
答案:58.5
7.对具有线性相关关系的变量x和y,测得一组数据如下表,若已求得它们回归直线的斜率为6.5,则这条回归直线的方程为________.
x 2 4 5 6 8
y 30 40 60 50 70
解析:设回归直线方程为=x+,则=6.5,易知=50,=5,所以=-=50-32.5=17.5,即回归直线方程为=6.5x+17.5.
答案:=6.5x+17.5
8.对某台机器购置后的运营年限x(x=1 ( http: / / www.21cnjy.com ),2,3,…)与当年利润y的统计分析知具备线性相关关系,线性回归方程为=10.47-1.3x,估计该台机器使用________年最合算.
解析:只要预计利润不为负数,使用该机器就算合算,即≥0,所以10.47-1.3x≥0,解得x≤8.05,所以该台机器使用8年最合算.
答案:8
9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元) 8 8.2 8.4 8.6 8.8 9
销量y(件) 90 84 83 80 75 68
(1)求回归直线方程=x+,其中=-20,=-;
(2)预计在今后的销售中,销量与单价 ( http: / / www.21cnjy.com )仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
解:(1)由于=(8+8.2+8.4+8.6+8.8+9)=8.5,
=(90+84+83+80+75+68)=80.
所以=-=80+20×8.5=250,
从而回归直线方程为=-20x+250.
(2)设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)
=-20x2+330x-1 000
=-20(x-)2+361.25.
当且仅当x=8.25时,L取得最大值.
故当单价定为8.25元时,工厂可获得最大利润.
10.(2013·高考重庆卷 ( http: / / www.21cnjy.com ))从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得=80,
=20,=184,=720.
(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:线性回归方程y=bx+a中,b= eq \f( -n,- n) a=-b,其中为,样本的平均值,线性回归方程也可写为=x+
解:(1)由题意知n=10, =i==8,
=i==2,
又- n=720-10×82=80,
-n=184-10×8×2=24,
由此得b==0.3,a=,-b,=2-0.3×8=-0.4,
故所求线性回归方程为y=0.3x-0.4.
(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间是正相关.
(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).
[B.能力提升]
1.回归直线方程的系数,是最小二乘法估计中使函数Q(,)取得最小函数值时所满足的条件,其中Q(,)的表达式是(  )
A. eq \i\su(i=1,n, (yi--xi)2)) B. eq \i\su(i=1,n, |yi--xi|2))
C. (yi--xi)2 D. |yi--xi|
解析:选A.用最小二乘法确定两变量 ( http: / / www.21cnjy.com )之间的线性回归方程的思想,即求,使n个样本点(xi,yi)(i=1,2,…,n)与直线y=+x的“距离”的平方和最小,即使得Q(,)=(y1--x1)2+(y2--x2)2+…+(yn--xn)2=eq \i\su(i=1,n, (yi--xi)2))达到最小,故选A.
2.对于两个变量的散点图:①若所有 ( http: / / www.21cnjy.com )点都落在某一函数曲线上,则变量之间具有函数关系;②若所有点都落在某一曲线附近,则变量之间具有相关关系;③若所有点都落在某一直线附近,则变量之间具有线性相关关系;④若所有点都杂乱无章,则变量之间不具有相关关系.其中正确的是(  )
A.①② B.①②③
C.①②④ D.①②③④
解析:选D.①②③④四个说法全部正确.
3.(2015·江西重点中学盟校联考)某 ( http: / / www.21cnjy.com )车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.
零件数x(个) 10 20 30 40 50
加工时间y(min) 62 75 81 89
现发现表中有一个数据看不清,请你推断该数据的值为________.
解析:由已知可计算求出=30,而回归直线方程必过点(,),则=0.67×30+54.9=75,设模糊数字为a,则=75,
计算得a=68.
答案:68
4.近年来,我国高等教育事业有了迅 ( http: / / www.21cnjy.com )速发展,为了解某省从2000年到2014年18岁到24岁的青年人每年考入大学的人数,我们把农村、县镇和城市分别标记为一组、二组、三组分开统计.为了便于计算,把2000年编号为1,2001年编号为2,…,2014年编号为15,如果把年份从1到15作为自变量进行回归分析,可得三个回归方程:农村:=0.42x+1.80;县镇:=2.32x+6.72;城市:=2.84x+9.50(y的单位是万).则下列说法中正确的是________.(把你认为正确说法的序号填上)
①三个组的两个变量都是正相关关系;②对于县 ( http: / / www.21cnjy.com )镇组而言,每年考入大学的人数约是上一年的2.32倍;③在这一阶段,城市组的大学入学人数增长最快;④0.42表示农村青年考入大学的人数以每年约4 200人递增.
解析:①由于三个组的线性回归方程 ( http: / / www.21cnjy.com )中x的系数均为正数,故三个组的两个变量都是正相关关系,故①正确;②中县镇组的线性回归直线方程=2.32x+6.72的意义是县镇考入大学的人数每年大约比上一年增加23 200人,故②不正确,由此可推知④正确;由于三个组的线性回归方程中,城市组所对应的方程的x的系数最大,表示城市组入学人数增加得最快,故③正确.
答案:①③④
5.现对x,y有如下观测数据:
x 18 25 30 39 41 42 49 52
y 3 5 6 7 8 8 9 10
(1)作出散点图;
(2)试求y对x的线性回归方程.
解:(1)散点图如下:
(2)可求得x=37,y=7,=11 920,yi=2 257.
设线性回归方程为=+x,
则= eq \f( -8,- 8)
==≈0.19,
=-=7-0.19×37=-0.03.
所以线性回归方程为=0.19x-0.03.
6.(选做题)在某种产品表面进行腐蚀性实验,得到腐蚀深度与腐蚀时间之间对应的一组数据:
时间t(s) 5 10 15 20 30 40 50 60 70 90 120
深度
y(mm) 6 10 10 13 16 17 19 23 25 29 46
(1)画出散点图;
(2)试求腐蚀深度对时间的回归直线方程.
解:(1)散点图如图:
(2)经计算可得:
≈46.36,y≈19.45, yi=13 910.
= eq \f( -11,- 11)
=≈0.3.
=-=19.45-0.3×46.36=5.542.
故所求的回归直线方程为=0.3t+5.542.【优化方案】2016年高中数学 第二章 统计 章末演练轻松闯关学案 新人教A版必修3
[A.基础达标]
1.抽签法中确保样本代表性的关键是(  )
A.制签         B.搅拌均匀
C.逐一抽取 D.抽取不放回
解析:选B.只有搅拌均匀每个个体被抽取的可能性相等,这样抽取的样本才有代表性,故选B.
2.下列抽样方式是简单随机抽样的是(  )
A.按居民身份证号码的后3位数字是632作为样本,来进行中央电视台春节联欢晚会的收视率的调查
B.对不同地区,不同职业的人,按一定比例抽取作为样本,来进行中央电视台春节联欢晚会的收视率的调查
C.从产品生产流水线上随机抽取100个个体作为样本
D.某公司从800袋牛奶中抽取60袋.利用随机数表法抽取样本,检验某项指标是否合格
解析:选D.因为随机数表法是简单随机抽样,故选D.
3.某市政府在人大会上,要从农业、工业和教育系统的代表中抽查对政府工作报告的意见,为了更具有代表性, 抽样应采取(  )
A.抽签法 B.随机数表法
C.系统抽样法 D.分层抽样
解析:选D.因为样本来自差异较大的三个部分:农业、工业、教育,故选D.
4.某校为了了解高三学生的身体状况,抽 ( http: / / www.21cnjy.com )取了100名女生的体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重在40~45 kg的人数是(  )
A.10 B.2
C.5 D.15
解析:选A.由图可知频率=×组距,
故频率=0.02×5=0.1.
∴0.1×100=10人.
5.有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲 7 , 8 , 7 , 9 , 5 , 4 , 9 , 10 , 7 , 4
乙 9 , 5 , 7 , 8 , 7 , 6 , 8 , 6 , 7 , 7
那么,根据这次测试成绩得出的结论是(  )
A.甲与乙技术一样稳定
B.甲比乙技术稳定
C.乙比甲技术稳定
D.无法确定
解析:选C.因为甲=乙=7,s甲=2,s乙≈1.1,故选C.
6.如图是2005年至2014年某省城镇 ( http: / / www.21cnjy.com )居民百户家庭人口数的茎叶图, 图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到2005年至2014年我省城镇居民百户家庭人口数的平均数为________.
解析:这10年的家庭人口数为291,291 ( http: / / www.21cnjy.com ),295,298,302,306, 310,312,314,317,再求这10个数的平均数为=303.6.
答案:303.6
7.(2015·山东滨州质检)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人)
篮球组 书画组 乐器组
高一 45 30 a
高二 15 10 20
学校要对这三个小组的活动效果进行抽样调 ( http: / / www.21cnjy.com )查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.
解析: 根据分层抽样各层抽样比是一样的,则有=,解得a=30.
答案:30
8.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:
月平均气温x(℃) 17 13 8 2
月销售量y(件) 24 33 40 55
由表中数据算出线性回归方程=x+中的≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量约为________件.
解析:==10,==38,=-=58,所以下个月的平均气温约为6 ℃,下个月的销售量估计值为=x+=58-12=46.
答案:46
9.从甲、乙两种棉花苗中各抽10株,测得它们的株高分别如下(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
估计两种棉花苗总体的长势:
(1)哪种棉花的苗长得高一些?
(2)哪种棉花的苗长得整齐一些?
解:(1) 甲=(25+41+40+37+22+14+19+39+21+42)=30,
乙=(27+16+44+27+44+16+40+40+16+40)=31,
从棉花株样本的平均数来看,乙苗长得高一些.
(2)s=[(25-30)2 ( http: / / www.21cnjy.com )+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2;
同样s=128.8,所以s因此,甲苗株高较平稳,即甲苗长得整齐一些.
10.某车站在春运期间为了了解旅客购票情 ( http: / / www.21cnjy.com )况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图(如图所示).
分组 频数 频率
一组 0≤t<5 0 0
二组 5≤t<10 10 0.10
三组 10≤t<15 10 ②
四组 15≤t<20 ① 0.50
五组 20≤t≤25 30 0.30
合计 100 1.00
解答下列问题:
(1)这次抽样的样本容量是多少?
(2)在表中填写出缺失的数据并补全频率分布直方图;
(3)旅客购票用时的平均数可能落在哪一组?
解:(1)样本容量是100.
(2)①50 ②0.10
所补频率分布直方图如图中的阴影部分:
(3)设旅客平均购票用时为t min,则有
≤t<

即15≤t<20.
所以旅客购票用时的平均数可能落在第四组.
[B.能力提升]
1.某校共有学生2 000名,各年级男、女生人数如下表,现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为(  )
一年级 二年级 三年级
女生 373 380 y
男生 377 370 z
A.24 B.18
C.16 D.12
解析:选C.一、二年级的人数为750+750=1 500,所以三年级人数为2 000-1 500=500,
又64∶2 000=4∶125,因此三年级应抽取人数为500×=16.
2.总体容量为832, 若采用系统抽样, 当抽样间隔为多少时不需要剔除个体(  )
A.12 B.13
C.14 D.15
解析:选B.因为分段间隔k=,所以n===64.故选B.
3.一个容量为100的样本,其数据的分组与各组的频数如下表
组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70]
频数 12 13 24 15 16 13 7
则样本数据落在(10,40]上的频率为________.
解析:由题意可知频数在(10,40]的有13+24+15=52,由频率=频数÷总数可得,样本数据落在(10,40]上的频率为0.52.
答案:0.52
4.(2015·寿光高一检测)从甲、乙两个品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:
甲品种:271 273 280 285 ( http: / / www.21cnjy.com ) 285 287 292 294 295 301 303 303 307 308 310 314 319 323
325 325 328 331 334 337 352
乙品种:284 292 295 ( http: / / www.21cnjy.com ) 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327
329 331 333 336 337 343 356
由以上数据设计的茎叶图如图所示:
根据以上茎叶图,对甲、乙两个品种棉花的纤维长度作比较,写出两个统计结论:
(1)________________________________________________________________________
________________________________________________________________________;
(2)________________________________________________________________________
________________________________________________________________________.
解析:由茎叶图可以看出甲品种棉花的纤维长度比 ( http: / / www.21cnjy.com )较分散,乙品种棉花的纤维长度比较集中(大部分集中在312~337之间)等,通过分析可以得到答案.
答案:(1)从茎叶图上看,甲品种棉花的纤维长度较分散,而乙品种棉花的纤维长度比较集中
(2)甲品种棉花的纤维长度中位数是307 ( http: / / www.21cnjy.com ),乙品种棉花的纤维长度中位数是318,并且它们的对称性较好,因此乙品种的平均长度大于甲品种的平均长度
5.以下是在某地搜集到的不同楼盘新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:
房屋面积x(m2) 115 110 80 135 105
销售价
格y(万元) 24.8 21.6 19.4 29.2 22
(1)画出数据对应的散点图;
(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?
解:(1)数据对应的散点图如图所示:
(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关关系,且是正相关.
6.(选做题)(2014·高考广东卷)某车间20名工人年龄数据如下表:
年龄(岁) 工人数(人)
19 1
28 3
29 3
30 5
31 4
32 3
40 1
合计 20
(1)求这20名工人年龄的众数与极差;
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差.
解:(1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:40-19=21.
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:
( http: / / www.21cnjy.com )
(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;
所以这20名工人年龄的方差为:
(30-19)2+(30-28)2+(30-29)2+(30-30)2+(30-31)2+(30-32)2+(30-40)2=12.6.章末优化总结
       抽样方法及应用
应用抽样方法抽取样本时,应注意以下几点:
(1)用随机数法抽样时,对个体所编的号码位数要相等.当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.
(2)用系统抽样法抽样时, ( http: / / www.21cnjy.com )如果总体容量N能被样本容量n整除,则抽样间隔为k=;如果总体容量N不能被样本容量n整除,则先用简单随机抽样剔除多余个体,抽样间隔为k=.
(3)三种抽样方法的适用范围 ( http: / / www.21cnjy.com ):当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数法;当总体容量较大,样本容量也较大时,可采用系统抽样;当总体中个体差异较显著时,可采用分层抽样.
在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.
(1)采用简单随机抽样法,将零件编号为00,01,02,…,99,利用抽签法随机抽取20个.
(2)采用系统抽样法,将所有零件分成20组,每组5个,然后从每组中随机抽取1个.
(3)采用分层抽样法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.
对于上述问题,下面说法是否正确,说明理由.
①不论采用哪一种抽样方法,这100个零件中每一个被抽到的机会都相等.
②(1)(2)两种抽法,这100个零件中每一个被抽到的机会相等,而(3)并非如此.
③采用不同的抽样方法,这100个零件中每一个被抽到的机会是不相等的.
[解] ①是正确的,②③都不正确.
因为无论是简单随机抽样还是系统抽样,分层抽样,由其操作步骤知,都能保证每一个个体被抽到的机会是均等的.
       用样本的频率分布估计总体的分布
利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体情况作出估计.
(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.
(2)茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到,二是便于记录和表示,但数据较多时不方便.
下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料(单位:cm):
区间界限 [122,126) [126,130) [130,134) [134,138) [138,142)
人数 5 8 10 22 33
区间界限 [142,146) [146,150) [150,154) [154,158]
人数 20 11 6 5
  (1)列出样本的频率分布表(频率保留两位小数);
(2)画出频率分布直方图;
(3)估计身高低于134 cm的人数占总人数的百分比.
[解] (1)列出样本频率分布表:
分组 频数 频率
[122,126) 5 0.04
[126,130) 8 0.07
[130,134) 10 0.08
[134,138) 22 0.18
[138,142) 33 0.28
[142,146) 20 0.17
[146,150) 11 0.09
[150,154) 6 0.05
[154,158] 5 0.04
合计 120 1.00
(2)画出频率分布直方图,如图所示.
(3)因为样本中身高低于134 cm的人数的频率为
=≈0.19.
所以估计身高低于134 cm的人数约占总人数的19%.
      用样本的数字特征估计总体的数字特征
样本的数字特征可分为两大类: ( http: / / www.21cnjy.com )一类是反映样本数据集中趋势的,包括平均数、众数、中位数;另一类是反映样本数据的波动大小,包括样本方差及标准差.通常,我们用样本的数字特征估计总体的数字特征.
甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示:
(1)填写下表:
平均数 方差 中位数 命中9环及以上
甲 7 1.2 1
乙 5.4 3
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
③从平均数和命中9环以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
[解] (1)乙的射靶环数依次 ( http: / / www.21cnjy.com )为2,4,6,8,7,7,8,9,9,10.所以乙=(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:
平均数 方差 中位数 命中9环及以上
甲 7 1.2 7 1
乙 7 5.4 7.5 3
(2)①甲、乙的平均数相同,均为7,但s<s,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.
③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.
       求回归方程
除了函数关系这种确定性的关系外,还 ( http: / / www.21cnjy.com )有大量因变量的取值带有一定随机性的两个变量之间的关系——相关关系.分析两个变量的相关关系时,我们可根据样本数据的散点图给出判断.若是线性相关,还可以利用最小二乘法求出回归方程.
求回归方程的步骤:
(1)由已知数据计算出,,,yi;
(2)计算回归方程的系数,,
( http: / / www.21cnjy.com )
(3)写出回归归方程=x+
下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长性计算的,且对于给定的x,y为正态变量,其方差与x无关.
x(℃) 300 400 500 600 700 800
y(%) 40 50 55 60 67 70
(1)画出散点图;
(2)指出x,y是否线性相关;
(3)若线性相关,求y关于x的回归方程;
(4)估计退水温度是1 000 ℃时,黄酮延长性的情况.
[解] (1)散点图如图: ( http: / / www.21cnjy.com )
(2)由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.,(3)列出下表并用科学计算器进行有关计算.
i 1 2 3 4 5 6
xi 300 400 500 600 700 800
yi 40 50 55 60 67 70
xiyi 12 000 20 000 27 500 36 000 46 900 56 000
x 90 000 160 000 250 000 360 000 490 000 640 000
=550, =57,=1 990 000, =198 400
  于是可得
( http: / / www.21cnjy.com )
因此所求的回归直线的方程为:
=0.058 86x+24.627.
(4)将x=1 000代入回归方程得
=0.058 86×1 000+24.627=83.487,
即退水温度是1 000 ℃时,
黄酮延长性大约是83.487%.
1.(2015·聊城高一检测)某商场有四 ( http: / / www.21cnjy.com )类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种.现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是(  )
A.4 B.5
C.6 D.7
解析:选C.食品共有100种,抽取容量为20的样本,即抽样比为,故抽取植物油类与果蔬类食品种数之和为2+4=6.故选C.
2.如图所示是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知(  )
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分
解析:选A.从茎叶图可以看出:甲运动员的成绩集中在大茎上的叶多,故成绩好.
3.设矩形的长为a,宽为b,其比满足b∶ ( http: / / www.21cnjy.com )a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确的结论是(  )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定
解析:选A.计算可得甲批次样本的平均数为0. ( http: / / www.21cnjy.com )617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近.故选A.
4.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃) 18 13 10 -1
用电量(度) 24 34 38 64
由表中数据得线性回归方程y=x+中=-2,预测当气温为-4 ℃时,用电量的度数约为________.
解析:==10,==40,将点(,)代入线性回归方程,得=-=40+20=60,所以线性回归方程为y=-2x+60.将x=-4代入线性回归方程,得y=68.
答案:68
[A.基础达标]
1.抽签法中确保样本代表性的关键是(  )
A.制签         B.搅拌均匀
C.逐一抽取 D.抽取不放回
解析:选B.只有搅拌均匀每个个体被抽取的可能性相等,这样抽取的样本才有代表性,故选B.
2.下列抽样方式是简单随机抽样的是(  )
A.按居民身份证号码的后3位数字是632作为样本,来进行中央电视台春节联欢晚会的收视率的调查
B.对不同地区,不同职业的人,按一定比例抽取作为样本,来进行中央电视台春节联欢晚会的收视率的调查
C.从产品生产流水线上随机抽取100个个体作为样本
D.某公司从800袋牛奶中抽取60袋.利用随机数表法抽取样本,检验某项指标是否合格
解析:选D.因为随机数表法是简单随机抽样,故选D.
3.某市政府在人大会上,要从农业、工业和教育系统的代表中抽查对政府工作报告的意见,为了更具有代表性, 抽样应采取(  )
A.抽签法 B.随机数表法
C.系统抽样法 D.分层抽样
解析:选D.因为样本来自差异较大的三个部分:农业、工业、教育,故选D.
4.某校为了了解高三学生 ( http: / / www.21cnjy.com )的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重在40~45 kg的人数是(  )
A.10 B.2
C.5 D.15
解析:选A.由图可知频率=×组距,
故频率=0.02×5=0.1.
∴0.1×100=10人.
5.有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲 7 , 8 , 7 , 9 , 5 , 4 , 9 , 10 , 7 , 4
乙 9 , 5 , 7 , 8 , 7 , 6 , 8 , 6 , 7 , 7
那么,根据这次测试成绩得出的结论是(  )
A.甲与乙技术一样稳定
B.甲比乙技术稳定
C.乙比甲技术稳定
D.无法确定
解析:选C.因为甲=乙=7,s甲=2,s乙≈1.1,故选C.
6.如图是2005年至2014年某省城镇居 ( http: / / www.21cnjy.com )民百户家庭人口数的茎叶图, 图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到2005年至2014年我省城镇居民百户家庭人口数的平均数为________.
解析:这10年的家庭人口数 ( http: / / www.21cnjy.com )为291,291,295,298,302,306, 310,312,314,317,再求这10个数的平均数为=303.6.
答案:303.6
7.(2015·山东滨州质检)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人)
篮球组 书画组 乐器组
高一 45 30 a
高二 15 10 20
学校要对这三个小组的活动效 ( http: / / www.21cnjy.com )果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.
解析: 根据分层抽样各层抽样比是一样的,则有=,解得a=30.
答案:30
8.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:
月平均气温x(℃) 17 13 8 2
月销售量y(件) 24 33 40 55
由表中数据算出线性回归方 ( http: / / www.21cnjy.com )程=x+中的≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量约为________件.
解析:==10,==38,=-=58,所以下个月的平均气温约为6 ℃,下个月的销售量估计值为=x+=58-12=46.
答案:46
9.从甲、乙两种棉花苗中各抽10株,测得它们的株高分别如下(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
估计两种棉花苗总体的长势:
(1)哪种棉花的苗长得高一些?
(2)哪种棉花的苗长得整齐一些?
解:(1) 甲=(25+41+40+37+22+14+19+39+21+42)=30,
乙=(27+16+44+27+44+16+40+40+16+40)=31,
从棉花株样本的平均数来看,乙苗长得高一些.
(2)s=[(25-30)2+(41-3 ( http: / / www.21cnjy.com )0)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2;
同样s=128.8,所以s因此,甲苗株高较平稳,即甲苗长得整齐一些.
10.某车站在春运期间为了了解旅客购 ( http: / / www.21cnjy.com )票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图(如图所示).
分组 频数 频率
一组 0≤t<5 0 0
二组 5≤t<10 10 0.10
三组 10≤t<15 10 ②
四组 15≤t<20 ① 0.50
五组 20≤t≤25 30 0.30
合计 100 1.00
解答下列问题:
(1)这次抽样的样本容量是多少?
(2)在表中填写出缺失的数据并补全频率分布直方图;
(3)旅客购票用时的平均数可能落在哪一组?
解:(1)样本容量是100.
(2)①50 ②0.10
所补频率分布直方图如图中的阴影部分:
(3)设旅客平均购票用时为t min,则有
≤t<

即15≤t<20.
所以旅客购票用时的平均数可能落在第四组.
[B.能力提升]
1.某校共有学生2 000名,各年级男、女生人数如下表,现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为(  )
一年级 二年级 三年级
女生 373 380 y
男生 377 370 z
A.24 B.18
C.16 D.12
解析:选C.一、二年级的人数为750+750=1 500,所以三年级人数为2 000-1 500=500,
又64∶2 000=4∶125,因此三年级应抽取人数为500×=16.
2.总体容量为832, 若采用系统抽样, 当抽样间隔为多少时不需要剔除个体(  )
A.12 B.13
C.14 D.15
解析:选B.因为分段间隔k=,所以n===64.故选B.
3.一个容量为100的样本,其数据的分组与各组的频数如下表
组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70]
频数 12 13 24 15 16 13 7
则样本数据落在(10,40]上的频率为________.
解析:由题意可知频数在(10,40]的有13+24+15=52,由频率=频数÷总数可得,样本数据落在(10,40]上的频率为0.52.
答案:0.52
4.(2015·寿光高一检测)从甲、乙两个品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:
甲品种:271 273 280 28 ( http: / / www.21cnjy.com )5 285 287 292 294 295 301 303 303 307 308 310 314 319 323
325 325 328 331 334 337 352
乙品种:284 292 2 ( http: / / www.21cnjy.com )95 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327
329 331 333 336 337 343 356
由以上数据设计的茎叶图如图所示:
根据以上茎叶图,对甲、乙两个品种棉花的纤维长度作比较,写出两个统计结论:
(1)________________________________________________________________________
________________________________________________________________________;
(2)________________________________________________________________________
________________________________________________________________________.
解析:由茎叶图可以看出甲品种棉花的纤维 ( http: / / www.21cnjy.com )长度比较分散,乙品种棉花的纤维长度比较集中(大部分集中在312~337之间)等,通过分析可以得到答案.
答案:(1)从茎叶图上看,甲品种棉花的纤维长度较分散,而乙品种棉花的纤维长度比较集中
(2)甲品种棉花的纤维长度中位数是307, ( http: / / www.21cnjy.com )乙品种棉花的纤维长度中位数是318,并且它们的对称性较好,因此乙品种的平均长度大于甲品种的平均长度
5.以下是在某地搜集到的不同楼盘新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:
房屋面积x(m2) 115 110 80 135 105
销售价
格y(万元) 24.8 21.6 19.4 29.2 22
(1)画出数据对应的散点图;
(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?
解:(1)数据对应的散点图如图所示:
(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关关系,且是正相关.
6.(选做题)(2014·高考广东卷)某车间20名工人年龄数据如下表:
年龄(岁) 工人数(人)
19 1
28 3
29 3
30 5
31 4
32 3
40 1
合计 20
(1)求这20名工人年龄的众数与极差;
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差.
解:(1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:40-19=21.
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:
( http: / / www.21cnjy.com )
(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;
所以这20名工人年龄的方差为:
(30-19)2+(30-28)2+ ( http: / / www.21cnjy.com )(30-29)2+(30-30)2+(30-31)2+(30-32)2+(30-40)2=12.6.
(时间:100分钟,满分:120分)
一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列说法错误的是(  )
A.在统计里,最常用的简单随机抽样方法有抽签法和随机数法
B.一组数据的平均数一定大于这组数据中的每个数据
C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势
D.一组数据的方差越大,说明这组数据的波动越大
解析:选B.平均数不大于最大值,不小于最小值.
2.已知某乡农田有山地8 000亩,丘陵 ( http: / / www.21cnjy.com )12 000亩,平地24 000亩,洼地4 000亩.现抽取农田480亩估计全乡农田粮食平均亩产量,则采用________抽样比较合适.(  )
A.抽签法 B.随机数表法
C.系统抽样法 D.分层抽样法
解析:选D.该乡农田由差异明显的四种类型组成,应采用分层抽样法.故选D.
3.有一个容量为80的样本,数据的最大值是140,最小值是51,组距为10,则可以分为(  )
A.10组 B.9组
C.8组 D.7组
解析:选B.据题意:最大值与最小值的差为89,=8.9,故应分9组较合适.
4.某学校有老师200人,男学生1 20 ( http: / / www.21cnjy.com )0人,女学生1 000人,现用分层抽样的方法从全体师生中抽取一个容量为n的样本,已知女学生一共抽取了80人,则n的值是(  )
A.193 B.192
C.191 D.190
解析:选B.=80,解得n=192.
5.某班学生父母年龄的茎叶图如图,左边是父亲年龄,右边是母亲年龄,则该班同学父亲的平均年龄比母亲的平均年龄大(  )
A.2.7岁 B.3.1岁
C.3.2岁 D.4岁
解析:选C.分别求出父亲年龄和母亲年龄的平均值,可得父亲的平均年龄比母亲的平均年龄大3.2岁,故选C.
6.在某项体育比赛中,七位裁判为一选手打出的分数如下:
90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(  )
A.92,2 B.92,2.8
C.93,2 D.93,2.8
解析:选B.去掉最高分95,最低 ( http: / / www.21cnjy.com )分89,所剩数据的平均值为(90×2+93×2+94)=92,方差s2=[(90-92)2×2+(93-92)2×2+(94-92)2]=2.8.
7.(2014·高考湖北卷)根据如下样本数据
x 3 4 5 6 7 8
y 4.0 2.5 -0.5 0.5 -2.0 -3.0
得到的回归方程为=bx+a,则(  )
A.a>0,b>0 B.a>0,b<0
C.a<0,b>0 D.a<0,b<0
解析:选B.作出散点图如下:
观察图象可知,回归直线=bx+a的斜率b<0,当x=0时,=a>0.故a>0,b<0.
8.小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为(  )
图1
图2
A.1% B.2%
C.3% D.5%
解析:选C.由图2知,小波 ( http: / / www.21cnjy.com )一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%,故选C.
9.
某校高一、高二年级各有7个班参加歌咏比赛,他们的得分的茎叶图如图所示,对这组数据分析正确的是(  )
A.高一的中位数大,高二的平均数大
B.高一的平均数大,高二的中位数大
C.高一的平均数、中位数都大
D.高二的平均数、中位数都大
解析:选A.由茎叶图可以看出,高一 ( http: / / www.21cnjy.com )的中位数为93,高二的中位数为89,所以高一的中位数大.由计算得,高一的平均数为91,高二的平均数为,所以高二的平均数大.故选A.
10.(2014·高考山东卷 ( http: / / www.21cnjy.com ))为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(  )
A.6 B.8
C.12 D.18
解析:选C.志愿者的总人数为=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.
二、填空题(本大题共5小题,每小题4分,共20分.把答案填在题中的横线上)
11.(2014·高考天津 ( http: / / www.21cnjy.com )卷)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.
解析:根据题意,应从一年级本科生中抽取的人数为×300=60.
答案:60
12.(2015·广州调研)在某次测量中 ( http: / / www.21cnjy.com )得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的数字特征(众数、中位数、平均数、方差)对应相同的是________.
解析:由s2=[(x1-x)2+ ( http: / / www.21cnjy.com )(x2-x)2+…+(xn-x)2],可知B样本数据每个变量增加2,平均数也增加了,但s2不变,故方差不变.
答案:方差
某校开展“爱我济宁,爱我家乡”摄影比赛,9 ( http: / / www.21cnjy.com )位评委为参赛作品A给出的分数如茎叶图所示,记分员去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________.
解析:最低分为88,最高 ( http: / / www.21cnjy.com )分若为90+x,则计算平均分=≠91,所以最高分应为94,则有91×7-(89×2+92×2+93+91)=91,∴x=1.
答案:1
14.已知回归方程y=4.4x+838.19,则可估计x与y的增长速度之比约为________.
解析:x与y的增长速度之比应是回归方程斜率的倒数,即.
答案:
15.某校从参加高一年级期中 ( http: / / www.21cnjy.com )考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试的平均分为________.
解析:在频率分布直方图中,所有小长方形的面积和为1,
设[70,80)的小长方形面积为x,则(0.01+0.015×2+0.025+0.005)×10+x=1,
解得x=0.3,即该组频率为0.3, ( http: / / www.21cnjy.com )所以本次考试的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
答案:71
三、解答题(本大题共5小题,共50分.解答时应写出必要的文字说明、证明过程或演算步骤)
(本小题满分8分)有以下三个案例:
案例一:从同一批次同类型号的10袋牛奶中抽取3袋检测其三聚氰胺含量;
案例二:某公司有员工800人,其中 ( http: / / www.21cnjy.com )具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.从中抽取容量为40的样本,了解该公司职工收入情况;
案例三:从某校1 000名高一学生中抽取10人参加一项主题为“学雷锋,树新风”的志愿者活动.
(1)你认为这些案例应采用怎样的抽样方式较为合适?
(2)在你使用的分层抽样案例中写出抽样过程;
(3)在你使用的系统抽样案例中按 ( http: / / www.21cnjy.com )以下规定取得样本编号:如果在起始组中随机抽取的号码为L(编号从0开始),那么第K组(组号K从0开始,K=0,1,2,…,9)抽取的号码的百位数为组号,后两位数为L+31K的后两位数.若L=18,试求出K=3及K=8时所抽取的样本编号.
解:(1)案例一用简单随机抽样,案例二用分层抽样,案例三用系统抽样.
(2)①分层,将总体分为高级职称、中级职称、初级职称及其余人员四层;
②确定抽样比例k==;
③按上述比例确定各层样本数分别为8人、16人、10人、6人;
④按简单随机抽样方式在各层确定相应的样本;
⑤汇总构成一个容量为40的样本.
(3)K=3时,L+31K=18+31×3=111,故第三组样本编号为311.K=8时,L+31K=18+31×8=266,
故第8组样本编号为866.
(本小题满分8分)某制造商为运动会生 ( http: / / www.21cnjy.com )产一批直径为40 mm的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm,保留两位小数)如下:
40.02 40.00 39.98 40.00 39.99
40.00 39.98 40.01 39.98 39.99
40.00 39.99 39.95 40.01 40.02
39.98 40.00 39.99 40.00 39.96
(1)完成下面的频率分布表,并画出频率分布直方图;
分组 频数 频率
[39.95,39.97)
[39.97,39.99)
[39.99,40.01)
[40.01,40.03]
合计
(2)假定乒乓球的直径误差不超过0.02 mm为合格品,若这批乒乓球的总数为10 000只,试根据抽样检查结果估计这批产品的合格只数.
解:(1)
分组 频数 频率
[39.95,39.97) 2 0.10 5
[39.97,39.99) 4 0.20 10
[39.99,40.01) 10 0.50 25
[40.01,40.03] 4 0.20 10
合计 20 1 50
(2)∵抽样的20只产品中在[39.98,40.02]范围内有18只,
∴合格率为×100%=90%,
∴10 000×90%=9 000(只).
即根据抽样检查结果,可以估计这批产品的合格只数为9 000.
18.(本小题满分10分)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲:82 81 79 78 95 88 93 84
乙:92 95 80 75 83 80 90 85
(1)用茎叶图表示这两组数据;
(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由.
解:(1)作出茎叶图如下:
(2)甲=(78+79+81+82+84+88+93+95)=85,
乙=(75+80+80+83+85+90+92+95)=85.
s=[(78-85)2+(79-85 ( http: / / www.21cnjy.com ))2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,
s=[(75-85)2+(8 ( http: / / www.21cnjy.com )0-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41.
∵甲=乙,s<s,
∴甲的成绩较稳定,派甲参赛比较合适.
19.(本小题满分12分)有5名学生的数学和化学成绩如下表所示:
学生学科 A B C D E
数学成绩(x) 88 76 73 66 63
化学成绩(y) 78 65 71 64 61
(1)如果y与x具有相关关系,求线性回归方程;
(2)预测如果某学生数学成绩为79分,他的化学成绩为多少(结果保留整数)
( http: / / www.21cnjy.com )
( http: / / www.21cnjy.com )
( http: / / www.21cnjy.com )
20.(本小题满分12分)( ( http: / / www.21cnjy.com )2015·河南三市调研)PM2.5是指环境空气中直径小于等于25微米的颗粒物,对人体健康及环境影响很大.某市2014年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之 ( http: / / www.21cnjy.com )间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
解:(1)频率分布表:
分组 频数 频率
[41,51) 2
[51,61) 1
[61,71) 4
[71,81) 6
[81,91) 10
[91,101) 5
[101,111] 2
(2)频率分布直方图:
(3)答对下述两条中的一条即可:
(ⅰ)该市一个月中空气污染指数有2天处于 ( http: / / www.21cnjy.com )优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数共有28天,占当月天数的.说明该市空气质量基本良好.
(ⅱ)轻微污染有2天,占当月天数的.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%.说明该市空气质量有待进一步改善.2.1.2 系统抽样
1.问题导航
(1)什么是系统抽样?
(2)系统抽样与简单随机抽样有什么关系?
(3)系统抽样的特点是什么?
2.例题导读
对“探究”内容的导读:除了用简单随机抽样获取样本外,还可以设计系统抽样来抽取样本;
对“思考”内容的导读:从系统抽样 ( http: / / www.21cnjy.com )的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想,从而,系统抽样能提高样本的代表性.
1.系统抽样的概念
一般地,要从容量为N的总体中抽取容 ( http: / / www.21cnjy.com )量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法就是系统抽样.
2.系统抽样的步骤
一般地,假设要从容量为N的总体中抽取容量为n的样本,我们可以按下列步骤进行系统抽样:
(1)编号:先将总体的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.
(2)分段:确定分段间隔k,对编号进行分段.当(n是样本容量)是整数时,取k=.
(3)确定第一个编号:在第1段用简单随机抽样确定第一个个体编号l(l≤k).
(4)成样:按照一定的规则 ( http: / / www.21cnjy.com )抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
1.下列抽样问题中最适合用系统抽样法抽样的是(  )
A.从全班48名学生中随机抽取8人参加一项活动
B.一个城市有210家百货商店 ( http: / / www.21cnjy.com ),其中大型商店20家,中型商店40家,小型商店150家,为了掌握各商店的营业情况,要从中抽取一个容量为21的样本
C.从参加模拟考试的1 200名高中生中随机抽取100人分析试题作答情况
D.从参加模拟考试的1 200名高中生中随机抽取10人了解某些情况
解析:选C.A总体容量较小,样本容量也较小, ( http: / / www.21cnjy.com )可采用抽签法;B总体中的个体有明显的层次,不适宜用系统抽样法;C总体容量较大,样本容量也较大,可用系统抽样法;D总体容量较大,样本容量较小,可用随机数表法.故选C.
2.为了对生产线上的产品质量进行检验,质检人员每隔5分钟抽一件产品进行检验,这种抽样方法是________.
解析:可看作是等距离的系统抽样.
答案:系统抽样
3.从1 003名学生的成绩中,按系统抽样抽取50名学生的成绩时,需先剔除3个个体,这样每个个体被抽取的可能性就不相等了,你认为正确吗?
解:不正确.因为总体个体数不能被50 ( http: / / www.21cnjy.com )整除,需剔除3个个体,按照简单随机抽样的方法,在总体中的每个个体被剔除的概率是相等的,都是,每个个体不被剔除的概率也是相等的,都是;在剩余的1 000个个体中,采用系统抽样时每个个体被抽取的概率都是,所以在整个抽样过程中每个个体被抽取的概率仍相等,都是×=.所以系统抽样是公平的、均等的.
1.在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为:
(1)采用随机的方法将总体中个体编号;
(2)将整体编号进行分段,确定分段间隔k(k∈N);
(3)在第一段内采用简单随机抽样的方法确定起始个体编号L;
(4)按照事先预定的规则抽取样本.
2.在确定分段间隔k时应注意:分段间隔k为整数,当不是整数时,应采用等可能剔除的方法剔除部分个体,以获得整数间隔k.
       系统抽样的概念
某市场想通过检查发票及销售记录的2%来快速估计每月的销量总额.采取如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序往后将65号,115号,165号,…抽出,发票上的销售额组成一个调查样本.这种抽取样本的方法是(  )
A.抽签法 B.随机数法
C.系统抽样法 D.其他的抽样方法
[解析] 上述抽样方法是将发票平均分成若干组,每组50张.从第一组抽取15号,以后各组抽取15+50n(n∈N*)号,符合系统抽样的特点.
[答案] C
[互动探究] 本例中的分段间隔为多少?
解:因为15号, 65号,115号,165号,…每两个之间的间隔为50,所以分段间隔为50.
方法归纳
判断一种抽样是否是系统抽 ( http: / / www.21cnjy.com )样,首先看是否在抽样前知道总体是由什么构成的,抽样方法能否保证每个个体按事先规定的可能性入样,再看是否将总体分成几个均衡的部分,并在第一个部分中进行简单随机抽样.
1.下列抽样中不是系统抽样的是(  )
A.从标有1~15号的1 ( http: / / www.21cnjy.com )5个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样
B.工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔十分钟抽一件产品检验
C.进行某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止
D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
解析:选C.C不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样.
       系统抽样的方案设计
中国机动车呈现几何增长,城市交通压力日益增大.为了调查某路口一个月的车流量情况,交警采用系统抽样的方法,样本距为7,从每周中随机抽取一天,他正好抽取的是星期日,经过调查后做出报告.你认为交警这样的抽样方法有什么问题?应当怎样改进?如果是调查一年的车流量情况呢?
[解] 交警所统计的数据以及由此所推断出来的结论,只能代表星期日的交通流量.由于星期日是休息时间,很多人不上班,不能代表其他几天的情况.
改进方法可以将所要调查的时间段的每一天先随机地编号,再用系统抽样方法来抽样,或者使用简单随机抽样来抽样亦可.
如果是调查一年的交通流量,使用简单随机抽样法显然已不合适,比较简单可行的方法是把样本距改为8.
方法归纳
(1)系统抽样的样本距相等,本题中第一次抽取的是星期日,则以后抽取的都应是星期日,这可能会使样本产生误差.
(2)系统抽样所得到的样本的代表性和个体的编号有关,如果编号的特征随编号的变化呈一定的周期性,可能造成系统抽样的代表性很差.
2.(1)某校高中三年级的295名学 ( http: / / www.21cnjy.com )生已经编号为1,2,……,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.
解:按照1∶5的比例,应该抽取的样本容 ( http: / / www.21cnjy.com )量为295÷5=59,把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,…,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,…,288,293.
(2)某工厂有1 002名工人,从中抽取20人参加体检.试用系统抽样进行具体实施.
解:第一步,将每个人编号,从0 001至1 002.
第二步,利用随机数表法找到2个号,将这2个号所对应的2个人剔除.
第三步,重新编号,从1至1 000.
第四步,分段,取分段间隔k==50,
所以1至50为第1段.
第五步,在第1段内用简单随机抽样确定第1个样本号码k.
第六步,将编号为k,k+50,k+100,…,k+950,共20个号码选出.
这20个号码所对应的人组成一个样本.
       系统抽样的综合运用
某集团有员工1 019人,其中获得过国家级表彰的有29人,其他人员有990人,该集团拟组织一次出国学习,参加人员确定为:获得过国家级表彰的人员5人,其他人员30人,如何确定人选?
[解] 获得过国家级表彰的人员人选为5人,适宜使用抽签法;其他人员选30人,适宜使用系统抽样.
(1)确定获得过国家级表彰的人员人选:
①用随机方式给29人编号,号码为1,2,…,29;
②将这29个号码分别写在一个小纸条上,揉成小球,制成号签;
③将得到的号签放入一个不透明的袋子中,搅拌均匀;
④从袋子中逐个抽取5个号签,并记录上面的号码;
⑤从总体中将与抽到的号签的号码相一致的个体取出,人选就确定了.
(2)确定其他人员人选:
第一步:将990名其他人员重新编号(分别为0,1,…,989),并分成30段,每段33人;
第二步:在第一段0,1,…,32这33个编号中用简单随机抽样法抽出一个(如3)作为起始号码;
第三步:将编号为3,36,69,…,960的个体抽出,人选就确定了.
由(1),(2)确定的人选合在一起就是最终确定的人选.
方法归纳
系统抽样与简单随机抽样的对比:
(1)总体容量较大,抽取样本较多时,系统抽样比简单随机抽样更易实施,可节约成本.
(2)系统抽样所得到的样本的代表性和个体的编号有关,而简单随机抽样所得到的样本的代表性与个体编号无关.
(3)系统抽样的实质是简单随机抽样.
(4)系统抽样比简单随机抽样应用更广泛.
3.某校高中二年级有253名学生,为了了解他们的视力情况,准备按1∶5的比例抽取一个样本,试用系统抽样方法进行抽取,并写出过程.
解:具体过程如下:
①先把这253名学生编号为001,002,…,253.
②用随机数表法任取出3个号,从总体中剔除与这三个号对应的学生.
③把余下的250名学生重新编号为1,2,…,250.
④分段.取分段间隔k=5,将总体均分成50段.每段含5名学生.
⑤从第一段即1~5号中随机抽取一个号作为起始号,如l.
⑥从后面各段中依次取出l+5,l+10,l+15,…,l+245这49个号.
这样就按1∶5的比例抽取了一个样本容量为50的样本.
规范解答 系统抽样问题的操作步骤
  (本题满分12分)某单位在职职工共624人,为了调查工人用于上班途中的时间,决定抽取10%的工人进行调查,试采用系统抽样方法抽取所需的样本.
[解] 系统抽样的步骤:
第一步,将624名职工用随机方式进行编号.?2分
第二步,从总体中用随机数表法剔除4人,?4分
将剩下的620名职工重新编号(分别为0,1,2,…,619),并分成62段.6分
第三步,在第一段0~9中用简单随机抽样确定起始号码l.8分
第四步,将编号为l,l+10,l+20,…,l+610的个体抽出,组成所需的样本.?12分
[规范与警示]
?编号时应均为三位数,切不可1位、2位、3位数都有.
?用随机数表法剔除4人,每人被剔除的可能性相等.
?被抽出个体的编号应从第二个号码开始每一个号码都比前一个号码大10.
根据样本容量计算分段间隔时,总体中的个体 ( http: / / www.21cnjy.com )数如果正好能被样本容量整除,则可以用它们的比值作为进行系统抽样的间隔.如果不能被整除,则可以用简单随机抽样的方法从总体中剔除部分个体,剔除的个数为总体中的个体数除以样本容量所得的余数.然后再编号、分段,确定第一段的起始(号码),进而确定整个样本.
1.(2014·高考广东卷)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为(  )
A.50 B.40
C.25 D.20
解析:选C.根据系统抽样的特点可知分段间隔为=25,故选C.
2.老师在班级50名学生中,依次抽取学 ( http: / / www.21cnjy.com )号为5,10,15,20,25,30,35,40,45,50的学生进行作业检查,这种抽样方法是(  )
A.随机抽样 B.分层抽样
C.系统抽样 D.以上都不是
解析:选C.因为所抽取学生的学号依次相差5,即为等距离抽样,属于系统抽样.故选C.
3.将参加数学竞赛的1 000名学生编号如下 ( http: / / www.21cnjy.com ):1,2,3,…,1 000,从中抽取一个容量为50的样本,按系统抽样方法分成50部分,如果第一部分编号为1,2,3,…,20,第一部分随机抽取的一个号码为15,则抽取的第40个号码为________.
解析:抽取的第40个号码为15+(40-1)×20=795.
答案:795
[A.基础达标]
1.为了检查某城市汽车尾气排放执行情况,在该城市的主要干道上抽取车牌末尾数字为5的汽车检查,这种抽样方法为(  )
A.抽签法        B.随机数表法
C.系统抽样法 D.其他抽样
解析:选C.符合系统抽样的特点.
2.中央电视台“动画城节目”为 ( http: / / www.21cnjy.com )了对本周的热心小观众给予奖励,要从已确定编号的一万名小观众中抽出十名幸运小观众.现采用系统抽样的方法抽取,每段容量为(  )
A.10 B.100
C.1 000 D.10 000
解析:选C.将10 000个个体平均分成10段,每段取一个,故每段容量为1 000.
3.(2015·罗源高一检测)为了 ( http: / / www.21cnjy.com )了解一次期终考试的1 253名学生的成绩,决定采用系统抽样方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是(  )
A.2 B.3
C.4 D.5
解析:选B.1 253÷50=25…3,故剔除3个.
4.要从已编号(1~60)的 ( http: / / www.21cnjy.com )60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是(  )
A.5,10,15,20,25,30 B.3,13,23,33,43,53
C.1,2,3,4,5,6 D.2,4,8,16,32,48
解析:选B.=10,∴间隔为10,故选B.
5.系统抽样又称为等距抽样,从N个个体中抽取 ( http: / / www.21cnjy.com )n个个体为样本,抽样距为k=(取整数部分),从第一段1,2,…,k个号码中随机抽取一个号码i0,则i0+k,…,i0+(n-1)k号码均被抽取构成样本,所以每个个体被抽取的可能性是(  )
A.相等的 B.不相等的
C.与i0有关 D.与编号有关
解析:选A.系统抽样是公平的,所以每个个体被抽到的可能性都相等,与i0编号无关,故选A.
6.大、中、小三个盒子中分别装有同一种产品 ( http: / / www.21cnjy.com )1 201个、608个、216个,现在需从这三个盒子中抽取一个样本容量为25的样本,较为恰当的抽样方法为________.
解析:因为三个盒子中装的是同一种产品,且按比例抽取每盒中抽取的不是整数,所以将三盒中产品放在一起搅匀按系统抽样法较为适合.
答案:系统抽样法
7.若总体中含有1 600个个体,现在要采用 ( http: / / www.21cnjy.com )系统抽样,从中抽取一个容量为50的样本,则编号应均分为________段,每段有________个个体.
解析:=32,∴均分为50段,每段32个个体.
答案:50 32
8.某班有学生48人,现用系统 ( http: / / www.21cnjy.com )抽样的方法,抽取一个容量为4的样本,已知座位号分别为6,30,42的同学都在样本中,那么样本中另一位同学的座位号应该是________.
解析:由题意,分段间隔k==12,所以6应该在第一组,所以第二组为6+=18.
答案:18
9.(2015·烟台高一检测)从2 015名同学中,抽取一个容量为20的样本,试叙述系统抽样的步骤.
解:(1)先给这2 015名同学编号为1,2,3,4,…,2 015.
(2)利用简单随机抽样剔除15个个体,再对剩余的2 000名同学重新编号为1,2,…,2 000.
(3)分段,由于20∶2 000=1∶100,故将总体分为20个部分,其中每一部分有100个个体.
(4)然后在第1部分随机抽取1个号码,例如第1部分的个体编号为1,2,…,100,抽取66号.
(5)从第66号起,每隔100个抽取1个号码 ( http: / / www.21cnjy.com ),这样得到容量为20的样本:66,166,266,366,466,566,666,766,866,966,1 066,1 166,1 266,1 366,1 466,1 566,1 666,1 766,1 866,1 966.
10.实验中学有职工1 021人,其中管理人员20人.现从中抽取非管理人员40人,管理人员4人组成代表队参加某项活动.你认为应如何抽样?
解:先在1 001名非管理人员中抽取40人,用系统抽样法抽样过程如下:
第一步:将1 001名非管理人员用随机方式编号为1,2,3,…,1 001;
第二步:利用简单随机抽样从总体中随机剔除1人,将剩下的1 000名非管理人员重新编号(分别为1,2,…,1 000),并分成40段;
第三步:在第一段1,2,…,25这25个编号中,用简单随机抽样法抽出一个(如5)作为起始号码;
第四步:将编号为5,30,55,…,980的个体抽出.
再从20个管理人员中,抽取4人,用抽签法,其操作过程如下:
第一步:将20名管理人员用随机方式编号,编号为1,2,…,20;
第二步:将这20个号码分别写在一个小纸条上,揉成小球,制成大小、形状相同的号签;
第三步:把得到的号签放入一个不透明的盒子里,充分搅匀;
第四步:从盒子中逐个抽取4个号签,并记录上面的编号;
第五步:从总体中将与抽到的号签的编号相一致的个体取出.
由以上两类方法得到的个体便是代表队队员.
[B.能力提升]
1.为了了解运动员对志愿者服务质量的意见,打算从1 200名运动员中抽取一个容量为40的样本,考虑用系统抽样,则分段间隔为(  )
A.40 B.30
C.20 D.12
解析:选B.分段间隔为=30.
2.在一个个体数目为2 015的总体中,利用系统抽样抽取一个容量为62的样本,则总体中每个个体被抽到的机会为(  )
A. B.
C. D.不确定
答案:C
3.将参加数学竞赛的800 ( http: / / www.21cnjy.com )名学生编号为:001,002,…,800.采用系统抽样方法抽取一个容量为40的样本,且随机抽得的号码为006.这800名学生分在四个考点参加比赛,从001到200在第Ⅰ考点,从201到400在第Ⅱ考点,从401到500在第Ⅲ考点,从501到800在第Ⅳ考点,四个考点被抽中的人数依次为________.
解析:依题意可知,在随机抽样中,首次抽到006号,以后每隔20个号抽到一个人,
则分别是006、026、0 ( http: / / www.21cnjy.com )46….故可分别求出在001到200号中有10人,在201至400号中共有10人,从401到500号中有5人,从501到800号中有15人.
答案:10,10,5,15
4.一个总体中有100个个体,随机编 ( http: / / www.21cnjy.com )号为00,01,02,…,99,依编号顺序平均分成10个小组,组号分别为1,2,3,…,10.现抽取一个容量为10的样本,规定如果在第1组中随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=5,则在第5组中抽取的号码是____________.
解析:由题意知第5组中的数为“40~49 ( http: / / www.21cnjy.com )”10个数.由题意知m=5,k=5,故m+k=10,其个位数字为0,即第5组中抽取的号码的个位数是0,综上知第5组中抽取的号码为40.
答案:40
5.一个总体中的1 000个个体编 ( http: / / www.21cnjy.com )号为0,1,2,…,999,并依次将其分为10个小组,组号为0,1,2,…,9.要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x,那么依次错位地得到后面各组的号码,即第k组抽取的号码的后两位数是x+33k的后两位数.
(1)当x=24时,写出所抽样本的10个号码;
(2)若所抽取样本的10个号码中有一个的后两位是87,求x的取值范围.
解:(1)由题意知此系统抽样的间隔 ( http: / / www.21cnjy.com )是100,第1组后两位数是24+33=57,所以第1组号码为157;k=2,24+66=90,所以第2组号码为290,以此类推,10个号码为:24,157,290,323,456,589,622,755,888,921.
(2)当k=0,1,2,…, ( http: / / www.21cnjy.com )9时,33k的值依次为:0,33,66,99,132,165,198,231,264,297.又抽取的10个号码中有一个的后两位数是87,从而x可以是87,54,21,88,55,22,89,56,23,90.所以x的取值范围是{21,22,23,54,55,56,87,88,89,90}.
6.(选做题)某电视机厂每天大约 ( http: / / www.21cnjy.com )生产1 000台电视机,要求质检员每天抽取30台,检查其质量状况,假设一天的生产时间中生产电视机的台数是均匀的,请你设计一个调查方案.
解:可采用系统抽样,按下面的步骤设计方案:
第一步:把一天生产的电视机分成30个组,由于的商是33,余数是10,所以每个组有33台电视机,还剩10台,这时,抽样距为33.
第二步:先用简单随机抽样的方法从总体中抽取10台电视机,不进行检验.
第三步:将剩下的电视机进行编号,编号分别为0,1,2,…,989.
第四步:第一组(编号为0,1,2,3,…,32)的电视机中按照简单随机抽样的方法抽取1台电视机,比如说其编号为k.
第五步:按顺序抽取编号分别为下列数字 ( http: / / www.21cnjy.com )的电视机:k+33,k+66,k+99,…,k+29×33,这样总共抽取了容量为30的一个样本,对此样本进行检验即可.2.1.3 分层抽样
问题导航
(1)什么叫分层抽样?
(2)分层抽样适用于什么情况?
(3)分层抽样时,每个个体被抽到的机会是相等的吗?
1.分层抽样的概念
一般地,在抽样时,将总体 ( http: / / www.21cnjy.com )分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
2.分层抽样的适用条件
分层抽样尽量利用事先所掌握的各 ( http: / / www.21cnjy.com )种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.
1.判断下列各题.(对的打“√”,错的打“×”)
(1)系统抽样时,将总体分成均等的几部分,每部分抽取一个,符合分层抽样,故系统抽样就是一种特殊的分层抽样;(  )
(2)在分层抽样时,每层可以不等可能抽样;(  )
(3)在分层抽样的过程中,每个个体被抽到的可能性是相同的,与层数及分层有关.(  )
解析:(1)因为分层抽样是从各 ( http: / / www.21cnjy.com )层独立地抽取个体,而系统抽样各段上抽取时是按事先定好的规则进行的,各层编号有联系,不是独立的,故系统抽样不同于分层抽样.
(2)分层抽样时,每层仍然要等可能抽样.
(3)与层数及分层无关.
答案:(1)× (2)× (3)×
2.某地区为了解居民家庭生活状况,先把居民按所在行业分为几类,然后每个行业抽取的居民家庭进行调查,这种抽样是(  )
A.简单随机抽样     B.系统抽样
C.分层抽样 D.分类抽样
解析:选C.符合分层抽样的特点.
3.一个班共有54人,其中男、女比 ( http: / / www.21cnjy.com )为5∶4,若抽取9人参加教改调查会,则每个男同学被抽取的可能性为________,每个女同学被抽取的可能性为________.
解析:男、女每人被抽取的可能是相同的,因为男同学共有54×=30(人),女同学共有54×=24(人),
所以每个男同学被抽取的可能性为=,每个女同学被抽取的可能性为=.
答案: 
4.分层抽样的操作步骤是什么?
解:总体分层;按照比例独立抽取.
1.分层抽样的特点
(1)适用于总体由有明显差别的几部分组成的情况.
(2)抽取的样本更好地反映了总体的情况.
(3)是等可能性抽样,每个个体被抽到的可能性都是.
2.分层抽样的公平性
如果总体中个体的总数是N,样本容量为n, ( http: / / www.21cnjy.com )第i层中个数为Ni,则第i层中要抽取的个体数为ni=n·.每一个个体被抽取的可能性是=·n·=,与层数无关.所以对所有个体来说,被抽取的可能性是一样的,与层数及分层无关,所以分层抽样是公平的.
3.分层抽样需注意的问题
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是每层内样本的差异要小,不同层之间的样本差异要大,且互不重叠.
(2)抽取比例由每层个体占总体的比例确定.
(3)各层抽样按简单随机抽样或系统抽样进行.
       分层抽样的概念
某中学有老年教师20人,中年教师65人,青年教师95人.为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是(  )
A.抽签法 B.系统抽样
C.分层抽样 D.随机数法
[解析] 各部分之间有明显的差异是分层抽样的依据.
[答案] C
方法归纳
各部分之间有明显的差异是分层抽样 ( http: / / www.21cnjy.com )的依据,至于各层内用什么方法抽样是灵活的,可用简单随机抽样,也可采用系统抽样.分层抽样中,无论哪一层的个体,被抽中的机会均等,体现了抽样的公平性.
1.(1)某市有四所重点大学,为了解该 ( http: / / www.21cnjy.com )市大学生的课外书籍阅读情况,则采用下列哪种方法抽取样本最合适(四所大学图书馆的藏书有一定的差距)(  )
A.抽签法 B.随机数表法
C.系统抽样法 D.分层抽样法
解析:选D. 因为学校图书馆的藏书对学生课外书籍阅读影响比较大,因此采取分层抽样.
(2)某校高三年级有男生800人,女生6 ( http: / / www.21cnjy.com )00人,为了解该年级学生的身体健康情况,从男生中任意抽取40人,从女生中任意抽取30人进行调查.这种抽样方法是(  )
A.简单随机抽样法 B.抽签法
C.随机数表法 D.分层抽样法
解析:选D.总体中个体差异比较明显,且抽取的比例也符合分层抽样.
       分层抽样的应用
(2014·高考湖北卷)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.
[解析] 设乙设备生产的产品 ( http: / / www.21cnjy.com )总数为x件,则甲设备生产的产品总数为(4 800-x)件.由分层抽样特点,结合题意可得=,解得x=1 800.
[答案] 1 800
[互动探究] 将本例条件 ( http: / / www.21cnjy.com )“若样本中有50件产品由甲设备生产”换为“已知甲、乙两套设备生产的同类型产品数量之比为5∶3”,求样本中抽取的由甲、乙设备生产的数量分别是多少件?
解:设样本中抽取的由甲、乙设备生产的数量分别是x,y件,则x=80×=50,y=80×=30.
故样本中抽取的由甲、乙设备生产的数量分别是50,30件.
方法归纳
在分层抽样的过程中,为了保证每个个体被抽 ( http: / / www.21cnjy.com )到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即ni∶Ni=n∶N.
2.(1)为了调查城市PM2.5的情况 ( http: / / www.21cnjy.com ),按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为8,16,24.若用分层抽样的方法抽取12个城市,则应抽取的中型城市数为(  )
A.3 B.4
C.5 D.6
解析:选B.根据分层抽样的特点可知,抽样比例为=,则应抽取的中型城市数为16×=4.
(2)一个单位共有职工200人,其中不 ( http: / / www.21cnjy.com )超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,则应抽取超过45岁的职工________人.
解析:抽样比为25∶200=1∶8,而超过45岁的职工有80人,则从中应抽取的个体数为80×=10.
答案:10
       三种抽样方法的考查
选择合适的抽样方法抽样,并写出抽样过程.
(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取10个入样;
(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个入样;
(3)有甲厂生产的300个篮球,抽取10个入样;
(4)有甲厂生产的300个篮球,抽取30个入样.
[解] (1)总体容量较小,用抽签法.
①将30个篮球编号,编号为00,01,…,29.
②将以上30个编号分别写在完全一样的一张小纸条上,揉成小球,制成号签.
③把号签放入一个不透明的袋子中,充分搅拌均匀.
④从袋子中逐个抽取10个号签,并记录上面的号码.
⑤找出和所得号码对应的篮球即可得到样本.
(2)总体由差异明显的两个层次组成,需选用分层抽样.
①确定抽取个数.因为=,所以甲厂生产的应抽取=7(个),乙厂生产的应抽取=3(个).
②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.
(3)总体容量较大,样本容量较小,宜用随机数表法.
①将300个篮球用随机方式编号,编号为001,002,…,300.
②在随机数表中随机地确定一个数作为开始,如(教材P103附表)第8行第29列的数“7”开始.任选一个方向作为读数方向,比如向右读.
③从数“7”开始向右读,每次读三 ( http: / / www.21cnjy.com )位,凡不在001~300中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到10个号码,这就是所要抽取的10个样本个体的号码.
(4)总体容量较大,样本容量也较大,宜用系统抽样.
①将300个篮球用随机方式编号,编号为000,001,002,…,299,并分成30段,其中每一段包含=10个个体.
②在第一段000,001,002,…,009这十个编号中用简单随机抽样抽出一个(如002)作为起始号码.
③将编号为002,012,022,…,292的个体抽出,即可组成所要求的样本.
方法归纳
(1)简单随机抽样、系统抽样和分层抽样是三种常用的抽样方法,在实际生活中有着广泛的应用.
(2)三种抽样的适用范围不同,各自的特点也不同,但各种方法间又有密切联系.在应用时要根据实际情况选取合适的方法.
(3)三种抽样中每个个体被抽到的可能性都是相同的.
3.(1)某饮料公司在华东 ( http: / / www.21cnjy.com )、华南、华西、华北四个地区分别有200个、180个、180个、140个销售点.公司为了调查产品销售的情况,需从这700个销售点中抽取一个容量为100的样本,记这项调查为①;在华南地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是(  )
A.分层抽样法、系统抽样法
B.分层抽样法、简单随机抽样法
C.系统抽样法、分层抽样法
D.简单随机抽样法、分层抽样法
解析:选B. 当总体中个体较多时宜 ( http: / / www.21cnjy.com )采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用简单随机抽样.依题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B.
(2)调查某班学生的平均身高 ( http: / / www.21cnjy.com ),从50名学生中抽取5名,抽样方法是________,如果男女身高有显著不同(男生30人,女生20人),抽样方法是________.
解析:从50名学生中抽取5名,总体中个体数不多,采用简单随机抽样;总体中个体差异比较明显,采用分层抽样.
答案:简单随机抽样 分层抽样
(3)下列问题中,采用怎样的抽样方法较为合理?
①从10台电冰箱中抽取3台进行质量检查;
②某学校有160名教职工,其中教师12 ( http: / / www.21cnjy.com )0名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
解:①抽签法,因为总体容量较小,宜用抽签法.
②分层抽样,由于学校各类人员对这一问题的看法可能差异较大,用分层抽样.
易错警示 分层抽样的应用
某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本,如果采用系统抽样和分层抽样方法抽取,不用剔除个体;如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,则样本容量为________.
[解析] 总体容量N=36.
当样本容量为n时,系统抽样间隔为∈N+,所以n是36的约数;
分层抽样的抽样比为,求得工程师、技术员、技工的抽样人数分别为,,,所以n应是6的倍数,
所以n=6或12或18或36.
当样本容量为n+1时,总体中先剔除1人时还有35人,系统抽样间隔为∈N+,所以n只能是6.
[答案] 6
[错因与防范]
由,,,∈N+求n时,n的值有遗漏;∈N+易错写成∈N+.
为获取各层入样数目,需先正确计算出抽样比k=,若k与某层个体数的积不是整数时,可先将该层等可能性剔除多余个体.
4.某林场有树苗30 000棵,其中松树苗 ( http: / / www.21cnjy.com )4 000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为(  )
A.30 B.25
C.20 D.15
解析:选C.抽样比为150∶30 000=1∶200,则样本中松树苗的数量为4 000×=20.故选C.
1.某大学共有学生5 6 ( http: / / www.21cnjy.com )00人,其中有专科生1 300人、本科生3 000人、研究生1 300人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为280人,则应在专科生、本科生与研究生这三类学生中分别抽取(  )
A.65人、150人、65人 B.30人、150人、100人
C.93人、94人、93人 D.80人、120人、80人
解析:选A.根据分层抽样按比例抽取的特点,有 ( http: / / www.21cnjy.com )===,解得x=z=65,y=150,即专科生、本科生与研究生应分别抽取65、150、65,故选A.
2.某地共有10万户居民,从中随机调查了1 000户拥有彩电的调查结果如下表:
彩电 城市 农村
有 432 400
无 48 120
若该地区城市与农村住户之比为4∶6,估计该地区无彩电的农村总户数约为(  )
A.0.923万户 B.1.385万户
C.1.8万户 D.1.2万户
解析:选B.无彩电的农村总户数约为10××≈1.385万户.
3.某工厂生产A、B、C三种不 ( http: / / www.21cnjy.com )同型号的产品,产品数量之比依次为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A种型号产品有16件,那么此样本的容量n=________.
解析:由分层抽样的特点,得n×=16,所以n=80.
答案:80
4.某校对全校男、女学生共1 200名进 ( http: / / www.21cnjy.com )行健康调查,选用分层抽样抽取一个容量为200的样本,已知男生比女生多抽了10人,则该校男生人数为________.
解析:入样比例==,则男生应抽105人,设男生为x人,所以= x=630.
答案:630
[A.基础达标]
1.某社区有500个家庭,其中高 ( http: / / www.21cnjy.com )收入家庭125户,中等收入家庭280户,低收入家庭95户.为了调查社会购买力的某项指标,要从中抽取1个容量为100的样本,记作①;某学校高一年级有12名女排运动员,要从中选出3名调查学习负担情况,记作②.那么完成上述两项调查应采用的抽样方法是(  )
A.①用简单随机抽样法;②用系统抽样法
B.①用分层抽样法;②用简单随机抽样法
C.①用系统抽样法;②用分层抽样法
D.①用分层抽样法;②用系统抽样法
解析:选B.对于①,总体由 ( http: / / www.21cnjy.com )高收入家庭、中等收入家庭和低收入家庭差异明显的3部分组成,而所调查的指标与收入情况密切相关,所以应采用分层抽样法.对于②,总体中的个体数较少,而且所调查内容对12名调查对象是“平等”的,所以应采用简单随机抽样法.
2.已知某单位有职工120人,其中男 ( http: / / www.21cnjy.com )职工90人,现采用分层抽样的方法(按男、女分层)抽取一个样本,若已知样本中有27名男职工,则样本容量为(  )
A.30            B.36
C.40 D.无法确定
解析:选B.分层抽样中抽样比一定相同,设样本容量为n,由题意得,=,解得n=36.
3.(2014·高考重庆卷) ( http: / / www.21cnjy.com )某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为(  )
A.100 B.150
C.200 D.250
解析:选A.法一:由题意可得=,解得n=100,故选A.
法二:由题意,抽样比为=,总体容量为3 500+1 500=5 000,故n=5 000×=100.
4.(2015·中山高一检测)某校选修乒乓 ( http: / / www.21cnjy.com )球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为(  )
A.6 B.8
C.10 D.12
解析:选B.设高二年级抽取x人,则有=,解得x=8,故选B.
5.(2015·潍坊高一检测 ( http: / / www.21cnjy.com ))某学校在校学生2 000人,为了学生的“德、智、体”全面发展,学校举行了跑步和登山比赛活动,每人都参加而且只参与其中一项比赛,各年级参与比赛的人数情况如下表:
高一年级 高二年级 高三年级
跑步人数 a b c
登山人数 x y z
其中a∶b∶c=2∶5∶3,全 ( http: / / www.21cnjy.com )校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高三年级参与跑步的学生中应抽取(  )
A.15人 B.30人
C.40人 D.45人
解析:选D.全校参与登山的人数是2 ( http: / / www.21cnjy.com )000×=500,所以参与跑步的人数是1 500,应抽取×200=150,c=150×=45(人).
6.某学校高一、高二、高三年级的学 ( http: / / www.21cnjy.com )生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取一个容量为50的样本,则应从高二年级抽取________名学生.
解析:抽取比例与学生比例一致.
设应从高二年级抽取x名学生,则x∶50=3∶10.解得x=15.
答案:15
7.某公司生产三种型号的轿车,产量分别为1 ( http: / / www.21cnjy.com ) 200辆,6 000辆和2 000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应该抽取________辆,________辆,________辆.
解析:因为=,所以这三种型号的 ( http: / / www.21cnjy.com )轿车依次应该抽取1 200×=6辆,6 000×=30辆,2 000×=10辆.即这三种型号的轿车依次应该抽取6辆、30辆、10辆进行检验.
答案:6  30  10
8.某地区有农民、工人、知识分子家庭共 ( http: / / www.21cnjy.com )计2 015家,其中农民家庭1 600户,工人家庭303户.现要从中抽出容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法中的________.(将你认为正确的选项的序号都填上)
①简单随机抽样;②系统抽样;③分层抽样.
解析:为了保证抽样的合理性,应对 ( http: / / www.21cnjy.com )农民、工人、知识分子分层抽样,在各层中采用系统抽样和简单随机抽样,抽样时还要先用简单随机抽样剔除多余的个体.
答案:①②③
9.(2015·莱州高一检测)某校高 ( http: / / www.21cnjy.com )一年级500名学生中,血型为O的有200人,血型为A的有125人,B型的有125人,AB型的有50人.为了研究血型与色弱的关系,要从中抽取一个容量为40的样本,应如何抽样?写出血型为AB型的抽样过程.
解:因为40÷500=,所以应用分层抽样法抽取血型为O型的×200=16(人),A型的×125=10(人),B型的×125=10(人),AB型的×50=4(人).
AB型的4人可以这样抽取:
第一步,将50人随机编号,编号为1,2,…,50.
第二步,把以上50人的编号分别写在大小相同的小纸片上,揉成小球,制成号签.
第三步,把得到的号签放入一个不透明的袋子中,充分搅拌均匀.
第四步,从袋子中逐个抽取4个号签,并记录上面的编号.
第五步,根据所得编号找出对应的4人即可得到样本.
10.某单位最近组织了一次健身活动,活动分为 ( http: / / www.21cnjy.com )登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
解:(1)设登山组人数为x,游泳组中,青年人、中年人、老年人所占比例分别为a、b、c,
则有=47.5%,=10%,
解得b=50%,c=10%,
故a=100%-50%-10%=40%,
即游泳组中,青年人、中年人、老年人所占比例分别为40%、50%、10%.
(2)游泳组中,
抽取的青年人人数为200××40%=60(人);
抽取的中年人人数为200××50%=75(人);
抽取的老年人人数为200××10%=15(人).
即游泳组中,青年人、中年人、老年人分别应抽取的人数为60人,75人,15人.
[B.能力提升]
1.某鱼贩一次贩运草鱼、青鱼、鲢鱼、鲤 ( http: / / www.21cnjy.com )鱼及鲫鱼各有80条、20条、40条、40条、20条,现从中抽取一个容量为20的样本进行质量检测,若采用分层抽样的方法抽取样本,则抽取的青鱼与鲤鱼共有(  )
A.6条 B.8条
C.10条 D.12条
解析:选A.设抽取的青鱼与鲤鱼共有x条,根据分层抽样的比例特点有=,所以x=6.
2.某校做了一次关于“感恩父母”的问卷调查 ( http: / / www.21cnjy.com ),从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为(  )
A.60 B.80
C.120 D.180
解析:选C.11~12岁回收180份,其中在11~12岁学生问卷中抽取60份,则抽样比为.
∵从回收的问卷中按年龄段分层抽取容量为300的样本,
∴从8~10岁,11~12岁,13~14岁, ( http: / / www.21cnjy.com )15~16岁四个年龄段回收的问卷总数为=900(份),则15~16岁回收问卷份数为:x=900-120-180-240=360(份).
∴在15~16岁学生中抽取的问卷份数为360×=120(份),故选C.
3.某校高一年级有x名学生,高二年级有 ( http: / / www.21cnjy.com )y名学生,高三年级有z名学生,采用分层抽样抽取一个容量为45的样本,高一年级被抽取20人,高二年级被抽取10人,高三年级共有学生300人,则此学校共有学生________人.
解析:高三年级被抽取了45-20-10=15(人),设此学校共有学生N人,则=,解得N=900.
答案:900
4.(2015·泰安质检)某企业三月中旬生产A,B,C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:
产品类型 A B C
产品数量(件) 1 300
样本容量 130
由于不小心,表格中A、C ( http: / / www.21cnjy.com )两种产品的有关数据已被污染看不清楚了,统计员只记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是________件.
解析:抽样比为130∶1 300=1∶ ( http: / / www.21cnjy.com )10,又A产品的样本容量比C产品的样本容量多10,故C产品的数量是[(3 000-1 300)-100]×=800(件).
答案:800
5.某校有在校高中生共1 6 ( http: / / www.21cnjy.com )00人,其中高一年级学生520人,高二年级学生500人,高三年级学生580人.如果想通过抽查其中的80人来调查学生的消费情况,考虑到不同年级学生的消费情况有明显差别,而同一年级内消费情况差异较小,问应采用怎样的抽样方法?高三年级学生中应抽查多少人?
解:因不同年级的学生消费 ( http: / / www.21cnjy.com )情况有明显差别,所以应采用分层抽样.因为520∶500∶580=26∶25∶29,于是将80分成比例为26∶25∶29的三部分.设三部分各抽个体数分别为26x,25x,29x,由26x+25x+29x=80,解得x=1.所以高三年级学生中应抽查29人.
6.(选做题)某中学举行 ( http: / / www.21cnjy.com )了为期3天的新世纪体育运动会,同时进行全校精神文明擂台赛.为了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3 000名初中生、4 000名高中生中进行问卷调查,如果要在所有答卷中抽出120份用于评估.
(1)应如何抽取才能得到比较客观的评价结论?
(2)要从3 000份初中生的答卷中抽取一个容量为48的样本,如果采用简单随机抽样,应如何操作?
(3)为了从4 000份高中生的答卷中抽取一个容量为64的样本,如何使用系统抽样抽取得到所需的样本?
解:(1)由于这次活动对教职员工、初中生和高中生产生的影响不相同,所以应当采取分层抽样的方法进行抽样.
∵样本容量为120,总体个数为500+3 000+4 000=7 500(名),则抽样比为=.
∴500×=8(人),3 000×=48(人),4 000×=64(人),∴在教职员工、初中生、高中生中抽取的个体数分别是8、48、64.
分层抽样的步骤是:
第一步,分为教职员工、初中生、高中生共三层.
第二步,确定每层抽取个体的个数:在教职员工、初中生、高中生中抽取的个体数分别是8、48、64.
第三步,各层分别按简单随机抽样的方法抽取样本.
第四步,综合每层抽样,组成样本.
这样便完成了整个抽样过程,就能得到比较客观的评价结论.
(2)由于简单随机抽样有两种方法:抽签法或随机数表法.若用抽签法,则要做3 000个号签,费时费力,因此采用随机数表法抽取样本,步骤是:
第一步,编号:将3 000份答卷都编上号码:0 001,0 002,…,3 000.
第二步,在随机数表上随机选取一个起始位置.
第三步,规定读数方向:向右连续取数字, ( http: / / www.21cnjy.com )以4个数为一组,碰到右边线时接下一行左边线继续向右连续取数,若读取的4位数大于3 000,则去掉,如果遇到相同号码则只取一个,这样一直到取满48个号码为止.
(3)由于4 000÷64=62.5不是整数 ( http: / / www.21cnjy.com ),故应先使用简单随机抽样法从4 000名学生中随机剔除32个个体,再将剩余的3 968个个体进行编号:1,2,…,3 968,然后将整体分为64个部分,其中每个部分中含有62个个体,如第一部分个体的编号为1,2,…,62.从中随机抽取一个号码,若抽取的是23,则从第23号开始,每隔62个号码抽取一个,这样得到一个容量为64的样本:23,85,147,209,271,333,395,457,…,3 929.【优化方案】2016年高中数学 第二章 统计 章末综合检测学案 新人教A版必修3
(时间:100分钟,满分:120分)
一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列说法错误的是(  )
A.在统计里,最常用的简单随机抽样方法有抽签法和随机数法
B.一组数据的平均数一定大于这组数据中的每个数据
C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势
D.一组数据的方差越大,说明这组数据的波动越大
解析:选B.平均数不大于最大值,不小于最小值.
2.已知某乡农田有山地8 ( http: / / www.21cnjy.com ) 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩.现抽取农田480亩估计全乡农田粮食平均亩产量,则采用________抽样比较合适.(  )
A.抽签法 B.随机数表法
C.系统抽样法 D.分层抽样法
解析:选D.该乡农田由差异明显的四种类型组成,应采用分层抽样法.故选D.
3.有一个容量为80的样本,数据的最大值是140,最小值是51,组距为10,则可以分为(  )
A.10组 B.9组
C.8组 D.7组
解析:选B.据题意:最大值与最小值的差为89,=8.9,故应分9组较合适.
4.某学校有老师200人,男学生1 200人 ( http: / / www.21cnjy.com ),女学生1 000人,现用分层抽样的方法从全体师生中抽取一个容量为n的样本,已知女学生一共抽取了80人,则n的值是(  )
A.193 B.192
C.191 D.190
解析:选B.=80,解得n=192.
5.某班学生父母年龄的茎叶图如图,左边是父亲年龄,右边是母亲年龄,则该班同学父亲的平均年龄比母亲的平均年龄大(  )
A.2.7岁 B.3.1岁
C.3.2岁 D.4岁
解析:选C.分别求出父亲年龄和母亲年龄的平均值,可得父亲的平均年龄比母亲的平均年龄大3.2岁,故选C.
6.在某项体育比赛中,七位裁判为一选手打出的分数如下:
90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(  )
A.92,2 B.92,2.8
C.93,2 D.93,2.8
解析:选B.去掉最高分95,最低分89 ( http: / / www.21cnjy.com ),所剩数据的平均值为(90×2+93×2+94)=92,方差s2=[(90-92)2×2+(93-92)2×2+(94-92)2]=2.8.
7.(2014·高考湖北卷)根据如下样本数据
x 3 4 5 6 7 8
y 4.0 2.5 -0.5 0.5 -2.0 -3.0
得到的回归方程为=bx+a,则(  )
A.a>0,b>0 B.a>0,b<0
C.a<0,b>0 D.a<0,b<0
解析:选B.作出散点图如下:
观察图象可知,回归直线=bx+a的斜率b<0,当x=0时,=a>0.故a>0,b<0.
8.小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为(  )
图1
图2
A.1% B.2%
C.3% D.5%
解析:选C.由图2知,小波一 ( http: / / www.21cnjy.com )星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%,故选C.
9.
某校高一、高二年级各有7个班参加歌咏比赛,他们的得分的茎叶图如图所示,对这组数据分析正确的是(  )
A.高一的中位数大,高二的平均数大
B.高一的平均数大,高二的中位数大
C.高一的平均数、中位数都大
D.高二的平均数、中位数都大
解析:选A.由茎叶图可以看出,高一的中 ( http: / / www.21cnjy.com )位数为93,高二的中位数为89,所以高一的中位数大.由计算得,高一的平均数为91,高二的平均数为,所以高二的平均数大.故选A.
10.(2014·高考山东卷 ( http: / / www.21cnjy.com ))为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(  )
A.6 B.8
C.12 D.18
解析:选C.志愿者的总人数为=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.
二、填空题(本大题共5小题,每小题4分,共20分.把答案填在题中的横线上)
11.(2014·高考天津卷) ( http: / / www.21cnjy.com )某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.
解析:根据题意,应从一年级本科生中抽取的人数为×300=60.
答案:60
12.(2015·广州调 ( http: / / www.21cnjy.com )研)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的数字特征(众数、中位数、平均数、方差)对应相同的是________.
解析:由s2=[(x1-x)2+( ( http: / / www.21cnjy.com )x2-x)2+…+(xn-x)2],可知B样本数据每个变量增加2,平均数也增加了,但s2不变,故方差不变.
答案:方差
某校开展“爱我济宁,爱我家乡”摄影比赛, ( http: / / www.21cnjy.com )9位评委为参赛作品A给出的分数如茎叶图所示,记分员去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________.
解析:最低分为88,最高分若为 ( http: / / www.21cnjy.com )90+x,则计算平均分=≠91,所以最高分应为94,则有91×7-(89×2+92×2+93+91)=91,∴x=1.
答案:1
14.已知回归方程y=4.4x+838.19,则可估计x与y的增长速度之比约为________.
解析:x与y的增长速度之比应是回归方程斜率的倒数,即.
答案:
15.某校从参加高一年级期中考试的学生中随 ( http: / / www.21cnjy.com )机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试的平均分为________.
解析:在频率分布直方图中,所有小长方形的面积和为1,
设[70,80)的小长方形面积为x,则(0.01+0.015×2+0.025+0.005)×10+x=1,
解得x=0.3,即该组频率为0. ( http: / / www.21cnjy.com )3,所以本次考试的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
答案:71
三、解答题(本大题共5小题,共50分.解答时应写出必要的文字说明、证明过程或演算步骤)
(本小题满分8分)有以下三个案例:
案例一:从同一批次同类型号的10袋牛奶中抽取3袋检测其三聚氰胺含量;
案例二:某公司有员工80 ( http: / / www.21cnjy.com )0人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.从中抽取容量为40的样本,了解该公司职工收入情况;
案例三:从某校1 000名高一学生中抽取10人参加一项主题为“学雷锋,树新风”的志愿者活动.
(1)你认为这些案例应采用怎样的抽样方式较为合适?
(2)在你使用的分层抽样案例中写出抽样过程;
(3)在你使用的系统抽样案例中按以下规定取得 ( http: / / www.21cnjy.com )样本编号:如果在起始组中随机抽取的号码为L(编号从0开始),那么第K组(组号K从0开始,K=0,1,2,…,9)抽取的号码的百位数为组号,后两位数为L+31K的后两位数.若L=18,试求出K=3及K=8时所抽取的样本编号.
解:(1)案例一用简单随机抽样,案例二用分层抽样,案例三用系统抽样.
(2)①分层,将总体分为高级职称、中级职称、初级职称及其余人员四层;
②确定抽样比例k==;
③按上述比例确定各层样本数分别为8人、16人、10人、6人;
④按简单随机抽样方式在各层确定相应的样本;
⑤汇总构成一个容量为40的样本.
(3)K=3时,L+31K=18+31×3=111,故第三组样本编号为311.K=8时,L+31K=18+31×8=266,
故第8组样本编号为866.
(本小题满分8分)某制造商为运动会生产一 ( http: / / www.21cnjy.com )批直径为40 mm的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm,保留两位小数)如下:
40.02 40.00 39.98 40.00 39.99
40.00 39.98 40.01 39.98 39.99
40.00 39.99 39.95 40.01 40.02
39.98 40.00 39.99 40.00 39.96
(1)完成下面的频率分布表,并画出频率分布直方图;
分组 频数 频率
[39.95,39.97)
[39.97,39.99)
[39.99,40.01)
[40.01,40.03]
合计
(2)假定乒乓球的直径误差不超过0.02 mm为合格品,若这批乒乓球的总数为10 000只,试根据抽样检查结果估计这批产品的合格只数.
解:(1)
分组 频数 频率
[39.95,39.97) 2 0.10 5
[39.97,39.99) 4 0.20 10
[39.99,40.01) 10 0.50 25
[40.01,40.03] 4 0.20 10
合计 20 1 50
(2)∵抽样的20只产品中在[39.98,40.02]范围内有18只,
∴合格率为×100%=90%,
∴10 000×90%=9 000(只).
即根据抽样检查结果,可以估计这批产品的合格只数为9 000.
18.(本小题满分10分)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲:82 81 79 78 95 88 93 84
乙:92 95 80 75 83 80 90 85
(1)用茎叶图表示这两组数据;
(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由.
解:(1)作出茎叶图如下:
(2)甲=(78+79+81+82+84+88+93+95)=85,
乙=(75+80+80+83+85+90+92+95)=85.
s=[(78-85)2+(79-85) ( http: / / www.21cnjy.com )2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,
s=[(75-85)2+( ( http: / / www.21cnjy.com )80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41.
∵甲=乙,s<s,
∴甲的成绩较稳定,派甲参赛比较合适.
19.(本小题满分12分)有5名学生的数学和化学成绩如下表所示:
学生学科 A B C D E
数学成绩(x) 88 76 73 66 63
化学成绩(y) 78 65 71 64 61
(1)如果y与x具有相关关系,求线性回归方程;
(2)预测如果某学生数学成绩为79分,他的化学成绩为多少(结果保留整数)
( http: / / www.21cnjy.com )
( http: / / www.21cnjy.com )
( http: / / www.21cnjy.com )
20.(本小题满分12分)(2 ( http: / / www.21cnjy.com )015·河南三市调研)PM2.5是指环境空气中直径小于等于25微米的颗粒物,对人体健康及环境影响很大.某市2014年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时 ( http: / / www.21cnjy.com ),空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
解:(1)频率分布表:
分组 频数 频率
[41,51) 2
[51,61) 1
[61,71) 4
[71,81) 6
[81,91) 10
[91,101) 5
[101,111] 2
(2)频率分布直方图:
(3)答对下述两条中的一条即可:
(ⅰ)该市一个月中空气污染指数有2天处于 ( http: / / www.21cnjy.com )优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数共有28天,占当月天数的.说明该市空气质量基本良好.
(ⅱ)轻微污染有2天,占当月天数的.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%.说明该市空气质量有待进一步改善.