2014年秋《随堂优化训练》高中数学 (人教新课标A版,必修三)(课前自主预习课件+课后能力提升专练+章节自主检测):第二章 统计(9份)

文档属性

名称 2014年秋《随堂优化训练》高中数学 (人教新课标A版,必修三)(课前自主预习课件+课后能力提升专练+章节自主检测):第二章 统计(9份)
格式 zip
文件大小 2.2MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2014-08-22 07:10:48

文档简介

课件16张PPT。第二章统计 2.1 随机抽样
2.1.1 简单随机抽样【学习目标】1.能从生活中或其他学科中提出具有一定价值的统计问题.
2.了解简单随机抽样的方式与操作步骤.
3.初步理解随机抽样的必要性和重要性. 1.简单随机抽样的含义
一般地,设一个总体有 N 个个体, 从中逐个__________
抽取 n 个个体作为样本(n≤N), 如果每次抽取时总体内的各个
个体被抽到的机会都________, 那么这种抽样方法叫做简单随机抽样.不放回地相等 2.简单随机抽样方法——抽签法和随机数法
(1)抽签法:
它的步骤如下:
① 编号:将总体的 N 个个体进行编号;
②制签:将 1~N 个编号写在大小、形状都相同的号签上;
③均匀搅拌:将写好的号签放入一个不透明的容器中,搅
拌均匀;
④抽签:从容器中每次抽取一个号签,连续抽____次,并记录其__________;n编号号码 ⑤确定样本:从总体中找出与号签上的________对应的个
体,组成样本.(2)随机数法:
利用随机数表或计算机产生的随机数进行抽样.其步骤如下:读取方向 ①编号:将总体的 N 个个体进行编号;
②选定初始数:为保证所选数字的随机性,在面对随机数
表之前就应该指出开始数字的纵横位置及__________;
③选号:从选定的数字开始按照选定的方向读下去,得到
的号码不在编号中或已被选用,则跳过,直到选满 n 个号码为
止;
④确定样本:按步骤③选出的号码从总体中找出与其对应
的个体,组成样本.【问题探究】 有同学认为:随机数表只有一张,并且读数时只能按照从
左向右的顺序读取,否则产生的随机样本就不同了,对总体的
估计就不准确了.你认为正确吗?答案:不正确.随机数表的产生是随机的,读数的顺序也是随机的,不同的样本对总体的估计相差不大.题型 1 简单随机抽样的概念【例 1】 下列抽样的方式是否属于简单随机抽样?为什么?(1)从无限多个个体的总体中逐个不放回地抽取 50 个个体作为样本; (2)箱子里共有 100 个零件,从中选出 10 个零件进行质量
检验,在抽样操作中,从中任意取出 1 个零件进行质量检验后,
再把它放回箱子.解:(1)不是简单随机抽样.因为简单随机抽样要求被抽取的样本的总体个数 N 是有限的.(2)不是简单随机抽样.因为简单随机抽样是一种不放回的抽样. 判断简单随机抽样的关键是:①总体个数 N
是有限的;②逐个抽取且不放回;③每个个体被抽到的可能性
相等.【变式与拓展】 1.有一批机器共 112 台,按出厂时间顺序依次放置在 1 号,
2 号,…,6 号库房内.为调查这批机器的质量问题,现指定从
放在 1 号库房中的 20 台抽取 10 台入样检测.你认为这样的抽样
方法是简单随机抽样吗?解:不是.因为总体中不能保证每个个体有相同机会被抽到.题型 2 简单随机抽样的实际操作 【例 2】 某车间工人加工一种轴 100 件,为了解这种轴的
直径,要从中抽取 10 件轴在同一条件下进行测量,如何用简单
随机抽样的随机数表法抽取样本? 解:将 100 件轴编号为 00,01,…,99,在随机数表中选定
一个起始位置和读取方向,如取第 21 行第 1 个数开始,选取
10 个数为 68,34,30,13,70,55,74,77,40,44,这 10 件即为所要抽取
的样本. (1)当总体个数不多时,适宜采用简单随机抽样.
(2)不超过100 的总体 N,编号用两位数即可:00,01,…,99. 【变式与拓展】
2.(2013 年江西)总体由编号为 01,02,…,19,20 的 20 个个
体组成.利用下面的随机数表选取 5 个个体,选取方法是从随机
数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为()7816 6572 0802
3204 9234 49356314 0702 4369
8200 3623 48699728 0198
6938 7481A.08B.07C.02D.01解析:从随机数表第1 行的第5 列和第6 列数字开始由左到右一次选取两个数字开始向右读,第 1 个数为65,不符合条件,第2 个数为72,不符合条件,
第 3 个数为08,符合条件,以下符合条件依次为:02,14,07,01,
故第 5 个数为 01.
答案:D 【例 3】 一个布袋中有 6 个同样质地的小球,从中不放回
地抽取 3 个小球,则某一特定小球被抽到的概率等于______;
第三次抽取时,每个小球被抽到的概率等于________.
易错分析:混淆了抽样中样本被抽到的可能性与每次抽取个体被抽到的可能性.[方法·规律·小结]1.简单随机抽样的特点.(1)要求被抽取样本的总体的个体数有限. (2)它是一种不放回抽样.由于抽样实践中多采用不放回抽
样,使其具有较广泛的实用性,而且由于所抽取的样本中没有
被重复抽取的个体,便于进行有关的分析和计算. (3)它是一种等概率抽样.不仅每次从总体中抽取一个个体
时,各个个体被抽取的概率相等,而且在整个抽样过程中,各
个个体被抽取的概率也相等,从而保证了这种抽样方法的公平
性.2.抽签法与随机数法的联系和区别.(1)抽签法与随机数法,两种方法都简便易行,在总体个数不多时,都行之有效. (2)抽签法中将总体的编号“搅拌均匀”比较困难,用此种
方法产生的样本代表性差,而随机数法中每个个体被抽到的可
能性相等.课件16张PPT。2.1.2 系统抽样【学习目标】1.理解系统抽样的概念.2.掌握系统抽样的一般步骤,会用系统抽样从总体中抽取样本.3.理解系统抽样与简单随机抽样的关系.
4.了解系统抽样在实际生活中的应用.1.系统抽样的定义 一般地,要从容量为 N 的总体中抽取容量为 n 的样本,可
将总体分成均衡的若干部分,然后按照预先制定的规则,从每
一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫
做系统抽样. 2.系统抽样的步骤
(1)先将总体的 N 个个体编号(有时可直接利用个体自身所
带的号码,如学生证、准考证号等).
(2)确定分段间隔 k,对编号进行分段.当________(n 是样本容量)是整数时,取 k=________. (3)在第 1 段用简单随机抽样确定起始个体编号 l(l≤k).
(4)按照一定的规则抽取样本.通常是将 l 加上______得到第
2 个个体编号__________,再加 k 得到第 3 个个体编号(l+2k),依次进行下去,直到获得整个样本.间隔 k(l+k) 练习:为了调查某产品的销售情况,销售部门从下属的 92
家销售连锁店中抽取 30 家了解情况.若用系统抽样法,则抽样)A间隔和随机剔除的个体数分别为(
A.3,2
B.2,3
C.2,30
D.30,2【问题探究】体中剩余的个体数能被样本容量整除.那么,从总体中剔除一些
个体时,采用的方法是什么?在整个抽样过程中,对于被剔除
者是否公平? 答案:剔除一些个体可采用简单随机抽样,因为剔除个体
是随机的,每个个体被剔除的可能性是相等的.若需剔除 m 个个从整个过程来看,对于被剔除者是公平的.题型 1 系统抽样的概念【例 1】 下列抽样中,最适宜用系统抽样的是() A.某市的 4 个区共有 2000 名学生,且 4 个区的学生人数之
比为 3∶2∶8∶2,从中抽取 200 名学生
B.从某厂生产的 2000 个电子元件中随机抽取 5 个电子元件
C.从某厂生产的 2000 个电子元件中随机抽取 200 个电子元件
D.从某厂生产的 20 个电子元件中随机抽取 5 个电子元件解析:A 总体有明显层次,不宜用系统抽样,B,D 宜用简单随机抽样.故选 C.答案:C系统抽样的特点:①总体个体数目比较大,抽样个体数也较大;②个体间无明显差异.【变式与拓展】C 1.从 2004 名学生中选取 50 名组成参观团,若采用下面的
方法选取:先用简单随机抽样从 2004 人中剔除 4 人,剩下的2000 人再按系统抽样的方法进行.则每人入选的概率()A.不全相等B.均不相等解析:注意随机抽样,每个个体被抽到的概率都一样.此题 题型 2 系统抽样方案的设计
【例 2】 某校高二年级有 260 名学生,学校打算从中抽取
20 名进行心理测验.试采用系统抽样方法抽取所需的样本.
解:由于总体容量恰能被样本容量整除,所以分段间隔 k 第一步,将260名学生用随机方式进行编号(分别为
000,001,002,…,259). 第二步,由于样本容量与总体容量的比是1∶13,所以将
总体平均分为 20 个部分,其中每一部分包含 13 个个体.
第三步,在第一段000,001,002,…,012 这13 个编号中用简单随机抽样确定起始号码 l.第四步,将编号为l,l+13,l+26,…,l+13×19 的个体抽出,组成样本.【变式与拓展】 2.某单位在职职工共 624 人,为了调查工人用于上班途中
的时间,决定抽取 10%的工人进行调查,试采用系统抽样方法
抽取所需的样本. 解:第一步,从总体中用随机数表法剔除4 人,将剩下的620
名职工重新编号(分别为 000,001,002,…,619),并分成 62 段.
第二步,在第一段 000,001,002,…,009 这10 个编号中用简单随机抽样确定起始号码 l.第三步,将编号为l,l+10,l+20,…,l+610 的个体抽出,组成样本. 【例 3】 从 102 个总体中,抽取 10 个个体,若采用系统
抽样方法抽样,则分段间隔 k 是________,每个个体被抽到的
可能性为________.[方法·规律·小结]1.系统抽样的特点.(1)系统抽样适用于总体容量较大,且个体之间无明显的差异的情况.(2)剔除的多余个体及第一段起始号码都用简单随机抽样.
(3)抽样过程中是等可能抽样,即每个个体被抽到的可能性相等.(4)是不放回抽样. 2.从系统抽样的步骤可以看出,系统抽样是把一个问题划
分成若干部分分块解决,从而把复杂问题简单化.在进行系统抽
样时,若总体容量不能被样本容量整除,要随机地从总体中剔
除余数,以保证抽样的公平性.
如果总体中个体数 N 被样本容量 n 整除,则每个个体被入3.简单随机抽样与系统抽样的区别与联系(见下表).课件19张PPT。2.1.3 分层抽样【学习目标】1.掌握分层抽样的步骤方法.2.理解三种抽样方法的区别与联系.3.会正确计算分层抽样方法中各层应抽取的个体数目.1.分层抽样比例 一般地,抽样时,将总体分成互不相交的层,然后按照一
定的________,从各层独立地抽取一定数量的个体,再将各层
抽出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
2.分层抽样的步骤
(1)分层:按某种特征将总体分成若干部分.
(2)按比例确定每层被抽取的个体个数.
(3)各层分别按简单随机抽样的方法抽取.
(4)综合每层抽样,组成样本. 练习:(2014 年四川模拟)为了解某地区中小学生的视力情
况,拟从该地区的中小学生中抽取部分学生进行调查,事先已
经了解到该地区小学、初中、高中三个学段学生的视力情况有
较大差异,而男女生视力情况差异不大.在下面的抽样方法中,)C最合理的抽样方法是(
A.简单的随机抽样
B.按性别分层抽样
C.按学段分层抽样
D.系统抽样【问题探究】 某市(包括市区及所属各县和村镇)为了了解中小学生平时
的零花钱情况,为了节省人力、物力、财力,只在位于市区的
12 所中小学,按小学、初中、高中在校人数采取分层抽样方法
抽取一部分学生了解情况,你认为这样做合理吗?请说明理由.
答案:不合理.因为影响学生零花钱的不只有学生的年龄,
同时市区学生和农村学生零花钱也会有区别,故不合理.题型 1 分层抽样的概念 【例 1】 设广州亚运会主体育场馆有由学生、工人和其他
人组成的志愿者共 2008 人,其中学生 1600 人,工人 303 人,
现要从中抽取容量为 40 的样本,则在整个抽样过程中,可以用
到下列抽样方法中的________(将你认为正确的选项的序号填
上).①简单随机抽样;②系统抽样;③分层抽样. 解析:因为个体差异较大,只用到分层抽样.又学生、工人
样本容量较大,用系统抽样方法,对系统抽样中每一段,宜用
简单随机抽样.
答案:①②③ 注意分层抽样使用的前提是总体可以分层、层
与层之间有明显区别,而层内个体差异较小. 【变式与拓展】
1.已知某校的初中学生人数、高中学生人数、教师人数之
比为 20∶15∶2,若教师人数为 120 人,现在用分层抽样的方
法对从所有师生中抽取一个容量为 n 的样本进行调查,若应从高中学生中抽取 60 人,则 n=________.148 解析:因为每个个体被抽到的可能性相等,初中学生、高
中学生、教师人数分别为 1200,900,120,总人数为2220.所以由 题型 2 分层抽样的计算问题
【例 2】 具有 A,B,C 三种性质的总体,其容量为 63,
将 A,B,C 三种性质的个体按 1∶2∶4 的比例进行分层抽样调
查,如果抽取的样本容量为 21,那么 A,B,C 三种元素分别抽取()A.12,6,3B.12,3,6C.3,6,12D.3,12,6解析:∵A,B,C 按 1∶2∶4 的比例抽取的样本数为 21, 答案:C
当总体差异明显时,用分层抽样得到的样本能
包含总体的各种信息,能较好地代表总体.【变式与拓展】 2.已知甲、乙、丙三个车间的设备不同,一天内生产同一
产品分别是 150 件、130 件、120 件,为掌握这天生产的整体产
品的质量情况,从中取出一个容量为 40 的样本,请选用适当抽
样方法,并写出简明的抽样过程. 解:因总体来自三个不同车间,故适宜用分层抽样法,因
抽取产品数与产品总数之比为 40∶400=1∶10,所以,各车间
抽取产品数量分别为 15 件、13 件、12 件.具体抽样过程在各车
间产品中用随机抽样的方法依次抽取(过程略). 题型 3 三种抽样方法的综合应用
【例 3】 某单位有工程师 6 人,技术员 12 人,技工 18 人,
要从这些人中抽取一个容量为 n 的样本.如果采用系统抽样和分
层抽样,不用剔除个体,若样本容量增加 1,则在采用系统抽
样时,需要在总体中先剔除 1 个个体,求样本容量 n.
解:总体容量为 6+12+18=36(人). 三种抽样方法各自的适用范围:①简单随机抽
样——总体中的个体数较少;②系统抽样——总体中的个体数
较多;③分层抽样——总体由差异明显的几部分组成. 【变式与拓展】
3.某公司在甲、乙、丙、丁四个地区分别有 150 个、120 个、
180 个、150 个销售点,公司为了调查产品销售的情况,需要从
这 600 个销售点中抽取一个容量为 100 的样本,记这项调查为
①.在某地区有 20 个销售点,要从中抽取 7 个调查其销售收入
和售后服务的情况,记这项调查为②,则完成①、②这两项调)查宜采用的方法依次是(
A.分层抽样,系统抽样
C.系统抽样,分层抽样B.分层抽样,简单随机抽样
D.简单随机抽样,分层抽样 解析:在①中,由于不同地区的产品销售情况差异较大,
应采用分层抽样;在②中总体中个体的数量不大,宜采用简单
随机抽样.答案:B 【例 4】 某市有 3000 家酒店,其中大型酒店有 300 家,
中型酒店有 800 家,小型酒店有 1900 家,为了掌握酒店营业情
况,从中抽取容量为 150 的样本,如何抽取较好?请写出过程.
解:因为大、中、小型酒店营情况差别较大,故应采用分
层抽样方法.抽取大、中、小酒店数目分别是 15,40,95.对第一、
二层可用简单随机抽样,而第三层可用系统抽样.[方法·规律·小结]1.分层抽样的特点.(1)适用于总体有明显差别的几部分组成的情况.
(2)抽取的样本更好地反映总体的情况.2.需注意的问题. (1)分层抽样使用的前提是总体可以分层,层与层之间有明
显区别,而层内个体间差异较小,每层中所抽取的个体数可按
各层个体在总体上所占比例进行抽取.分层抽样要求对总体的
内容有一定的了解,明确分层的界限和数目,只要分层恰当,
一般说来抽样结果比简单随机抽样更能反映总体情况.
(2)分层抽样将总体分成几层,分层抽取时采用简单随机抽样或系统抽样.3.三种抽样方法的联系和区别.课件35张PPT。2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布【学习目标】1.了解频率分布的意义和作用.2.能正确列频率分布表,画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.1.频数与频率频率60 将一批数据按要求分为若干个组,各组内数据的个数,叫
做该组的频数 . 每组频数除以全体数据的总数,得该组的
________.
练习 1:将容量为 n 的样本中的数据分成 6 组,绘制频率
分布直方图.若第 1 组至第 6 组数据的频率之比为 2∶3∶4∶6∶
4∶1,且前 3 组数据的频数之和等于 27,则 n=________. 2.频率分布表
当总体很大或不便于获得时,可以用样本的频率分布估计
总体的频率分布,反映总体频率分布的表格称为频率分布表.3.频率分布直方图1 在频率分布直方图中,纵轴表示________,数据落在各小
组内的频率用小长方形的面积来表示,各小长方形的面积的总
和等于________.4.绘制频率分布直方图的一般步骤
(1)求极差(极差=最大值-最小值).
(2)决定组距与组数.
(3)决定分点,并将数据分组.(5)绘制频率分布直方图.5.频率分布折线图中点 连接频率分布直方图中各小长方形上端的______,就得到
频率分布折线图. 6.总体密度曲线
频率分布折线图的优点是它反映了数据的变化趋势,如果
将样本容量取得足够大,分组的组距取得足够小,则相应的频
率分布折线图将越来越接近于一条光滑曲线 y=f(x), 统计中称
这条光滑曲线为总体密度曲线.7.茎叶图十位数个位数茎叶 统计中还常用茎叶图表示数据.茎是数据的高位,叶为数据
低位.通常数据为两位整数时,茎为________,叶为________;
当数据由整数部分和小数部分组成时,可以把整数部分作为
________,小数部分作为________. 练习 2:为了了解某校教师使用多媒体进行教学的情况,
从该校 200 名授课教师中随机抽取 20 名教师,调查他们上学期
使用多媒体进行教学的次数,结果用茎叶图表示如图 2-2-1:据
此可估计该校上学期 200 名教师中使用多媒体进行教学次数在[15,25)内的人数是________.
图 2-2-160 【问题探究】
画频率分布直方图时,需对数据分组,组数、组距和极差
有何关系?组数一般如何确定?组数为大于 k 的最小整数.取样容量越大,分的级数越多.当样本
容量不超过 100 时,常分为 5~12 组.题型 1 频率分布的概念
【例 1】 用样本频率分布估计总体频率分布的过程中,下列说法正确的是()A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确答案:C总体是不变的,样本是随机可变的,体会样本估计总体的思想.【变式与拓展】C1.图 2-2-2 为某试验的总体密度曲线,下列说法正确的是( )
图 2-2-2
A.组距越大,频率分布折线图越接近于它
B.样本容量越小,频率分布折线图越接近于它
C.阴影部分的面积代表总体在(a,b)上取值的百分比
D.阴影部分的高度代表总体在(a,b)上取值的百分比题型 2 用频率分布表、频率分布直方图表示数据【例 2】抽查100 袋洗衣粉,测得它们的重量如下(单位:g):494 498 493 505 496 492 487 483 508 511
495 494 483 485 511 493 505 485 501 503
493 509 512 484 509 510 495 497 498 509
504 498 483 510 503 497 502 511 497 500
493 509 510 493 491 497 515 503 515 518
510 514 509 499 493 499 509 492 505 489
494 501 509 498 502 500 508 491 509 509
499 495 493 509 496 509 505 499 486 491
492 496 499 508 485 498 496 496 495 505
499 505 493 501 510 496 487 511 501 496 (1)列出样本频率分布表;
(2)画出频率分布直方图.
解:(1)在样本数据中,最大值是 518,最小值是 483,极
差为 35.组距为 4,分 9 组,分点比数据多一位小数,故把第一组起点
稍微小一点,故分组如下:
[482.5,486.5],[486.5,490.5],…,[514.5,518.5].列表如下:(2)频率分布直方图,如图 D13.图 D13【变式与拓展】 2.为了让学生了解环保知识,增强环保意识,某中学举行
了一次“环保知识竞赛”,共有 900 名学生参加了这次竞赛.为
了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为
整数,满分为 100 分)进行统计.请你根据尚未完成并有局部污损
的频率分布表和频率分布直方图(如图 2-2-3),解答下列问题:(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图.图 2-2-3解:(1)从左到右、从上到下依次填:8 0.20 12 0.24 1.00(2)图略.题型 3 频率分布直方图、折线图的应用 【例 3】 某加工厂在生产过程中,测得纤维产品的纤度(表
示纤维粗细的一种量),共有 100 个数据,其频率分布直方图如
图 2-2-4.图 2-2-4(1)画出频率分布折线图;(2)估计纤维产品纤度的平均值;(3)估计数据落在[1.38,1.50]范围的概率.解:(1)将直方图中每个小矩形上底边中点用线段依次边起即可(图略).(2)平均值约为:1.32×0.04 + 1.36×0.25 + 1.40×0.3 +1.44×0.29+1.48×0.10+1.52×0.02=1.408 8.(3)落在[1.38,1.50)范围的概率约为:(7.5+7.25+2.50)×0.04=0.69. 用频率分布直方图解决相关问题时,应正确理解
图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:①纵轴表示;②频率分布直方图中各长方形高的比也就是其频率之比;③直方图中每一
个矩形的面积是样本数据落在这个区间上的频率,所有的小矩
形的面积之和等于 1,即频率之和为 1. 【变式与拓展】
3.(2013 年福建)某校从高一年级学生中随机抽取部分学生,
将他们的模块测试成绩分为6组:[40,50), [50,60), [60,70), [70,80),
[80,90), [90,100],加以统计,得到如图 2-2-5 所示的频率分布
直方图,已知高一年级共有学生 600 名,据此估计,该模块测)试成绩不少于 60 分的学生人数为(
图 2-2-5A.588 人B.480 人C.450 人D.120 人解析:成绩不少于 60 分的学生的频率为(0.030+0.025+0.015+0.01)×10=0.8,故不少于 60 分的学生人数为 600×0.8=480(人).
答案:B题型 4 茎叶图 【例 4】 某良种培育基地正在培育一种小麦新品种 A,将
其与原有的一个优良品种 B 进行对照试验,两种小麦各种植了
25 亩,所得亩产数据(单位:千克)如下:品种 A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.品种 B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.(1)用茎叶图表示数据;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种 A 与 B 的亩产量及其稳定性进行比较,写出统计结论. 思维突破:由统计知识可求出 A,B 两个品种的小麦稳定
性大小并画出茎叶图,用茎叶图处理数据,可直接从图中比较
数据的差异.解:(1)茎叶图如图 D14.图 D14(2)用茎叶图处理现有的数据不仅可以看出数据的分布状况,且可以看出每组中的具体数据. (3)通过观察茎叶图,可以发现品种A 的平均亩产量为411.1
千克,品种 B 的平均亩产量为397.8 千克.由此可知,品种A 的
平均亩产量比品种B 的平均亩产量高.但品种A 的亩产量不够稳
定,而品种 B 的亩产量比较集中在平均产量附近.
茎叶图能保留原始数据,所有的数据都可以很容易地从图中获得. 【变式与拓展】
4.(2013 年四川)某学校随机抽取 20 个班,调查各班中有网
上购物经历的人数,所得数据的茎叶图如图 2-2-6.以组距为 5
将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()图 2-2-6A
CB
D解析:根据题意,频率分布表可得:答案为 A.
答案:A【例 5】 图 2-2-7 是一个容量为 200 的样本频率分布直方图,请根据图形中的数据填空:图 2-2-7(1)样本数据落在范围[5,9)的频率为________;
(2)样本数据落在范围[9,13)的频数为________.答案:(1)0.32 (2)72 [方法·规律·小结]
1.画频率分布直方图的原则.
(1)决定组距与组数,将数据分组时,组数应力求合适,以
使数据的分布规律能较清楚地呈现出来.这时应注意:
①一般样本容量越大,所分组数越多;
②为方便起见,组距的选择应力求“取整”;
③当样本容量不超过 100 时,按照数据的多少,通常分成
5~12 组.(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积的总
和等于 1.2.频率分布表和频率分布直方图. 频率分布是指一个样本数据在各个小范围内所占比例的大
小,总体分布是指总体取值的频率分布规律.我们通常用样本的
频率分布表或频率分布直方图去估计总体的分布.3.频率分布折线图与总体密度曲线.(1)频率分布折线图不但可以表示出数量的多少,而且能够以折线的起伏,表示出数量增减的情况. (2)总体密度曲线反映了总体在各个范围内取值的百分比.
总体在区间(a,b)内取值的百分比,也就是曲线在区间(a,b)
上方所围成的面积.4.茎叶图的特点.(1)在统计图上没有原始信息的损失,所有的信息都可以从这个茎叶图中得到.(2)茎叶图的数据可以随时记录,随时添加,方便记录与表示.课件21张PPT。2.2.2 用样本的数字特征估计总体的数字特征【学习目标】1.理解样本数字特征的定义.2.掌握由图表数据求(估)数字特征的方法.
3.体会用样本分布估计总体分布的思想.1.众数、中位数、平均数
(1) 一组数据中重复出现次数最多的数称为这组数据的________.众数最中间位置相等 (2)把一组数据按从小到大(或从大到小)的顺序排列,把处
在____________的一个数据(或中间两个数据的平均数)称为这
组数据的中位数.
注意:在频率分布直方图中,中位数左边和右边的直方图
的面积________,由此可以估计中位数的值.(3)如果有n个数x1,x2,…,xn,那么_________________叫做这 n 个数的平均数.(4)样本中所有个体的平均数叫做样本平均数. 练习 1:若某校高一年级 8 个班参加合唱比赛的得分如图
2-2-12 所示的茎叶图,则这组数据的中位数和平均数分别是()A图 2-2-12A.91.5 和 91.5
C.91 和 91.5B.91.5 和 92
D.92 和 922.标准差、方差
(1)统计量标准差的作用是考察样本数据的______程度的大小.分散(2)标准差是样本数据到平均数的一种平均距离,一般用 s表示,计算公式 s=___________________________________.(3)标准差的平方 s2 叫做方差,即 s2=_________________________________________. 练习 2:甲、乙、丙、丁四人参加奥运会射击项目选拔赛,
四人的平均成绩和方差如下表所示:)C选是(
A.甲
C.丙B.乙
D.丁从这四个人中选择一人参加奥运会射击项目比赛,最佳人【问题探究】 如何通过频率分布直方图估计众数、中位数和平均数?
答案:(1)众数是最高矩形底边的中点;(2)中位数左边和右
边的直方图的面积应相等,由此可以估计中位数的值;(3)平均
数是频率分布直方图的“重心”,它等于每个小矩形的面积乘
以小矩形底边中点的横坐标之和.题型 1 众数、中位数、平均数的求法【例 1】 在一次中学生田径运动会上,参加男子跳高的 17名运动员的成绩如下表:分别求这些运动员成绩的众数、中位数与平均数. 解:在这17 个数据中,1.75 出现了4 次,出现的次数最多,
即这组数据的众数是 1.75.
表里的17 个数据可看成是按从小到大的顺序排列的,其中
第 9 个数据1.70 是最中间的一个数据,即这组数据的中位数是
1.70.2+1.70×3+1.75×4+1.80+1.85+1.90)≈1.69.
答:17 名运动员成绩的众数、中位数、平均数依次是1.75
米、1.70 米、1.69 米. 【变式与拓展】
1.某食品厂对某天生产的瓶装饮料抽查了 10 瓶,样本净重
如下(单位:mL):
342,348,346,340,344,341,343,350,340,342则样本的平均数是________.343.6 解析:由于数据较大,又都在常数 342 附近波动,把各数
据都减去 342,得 0,6,4,-2,2,-1,1,8,-2,0, 2.在广雅中学“十佳学生”评选的演讲比赛中,图 2-2-13
是七位评委为某学生打出的分数的茎叶图,去掉一个最高分和)C一个最低分后,所剩数据的众数和中位数分别为(
图 2-2-13
A.85,85
B.84,86
C.84,85
D.85,86题型 2 平均数、方差的应用【例 2】 有甲、乙两种钢筋,现从中各抽取 10 个样本检查它们的抗拉强度(单位:kg/mm2),数据如下:已知:甲、乙两种钢筋的平均数都等于 125.
(1)求 x,y 的值;(2)哪种钢筋的质量较好?思维突破:若平均数相同,则方差越小的,质量越好.
解:(1)由已知,得 110+120+130+125+120+125+135+125+135+x=125×10,∴x=125.又∵115+110+125+130+115+125+125+145+125+y=125×10,∴y=145. 用样本估计总体时,样本的平均数、标准差只
是总体的平均数、标准差的近似值.在实际应用时,当所得数据
平均数不同时,须先分析平均水平,再计算标准差(方差)分析
稳定情况. 【变式与拓展】
3.(2013 年山东)将某选手的 9 个得分去掉 1 个最高分,去
掉 1 个最低分,7 个剩余分数的平均分为 91,现场做的 9 个分
数的茎叶图,后来有一个数据模糊,无法辨认,在图 2-2-14 中)以 x 表示.则 7 个剩余分数的方差为(
图 2-2-14解析:∵由题意知去掉一个最高分和一个最低分后,
所剩的数据是 87,90,90,91,91,94,90+x.答案:B 【例 3】 小明是班里的优秀学生,他的历次数学成绩分别
是 96,98,95,93,但最近一次的考试成绩只有 45 分,原因是他带
病参加考试.那么,在期末评价时,计算他的平均分是 85.4,故
只能评他一个“良好”,这种评价是否合理呢? 易错分析:尽管平均分是反映一组数据平均水平的重要特
征,但任何一个数的改变都会引起它的变化,而中位数则不受
某些极端值的影响,本题的中位数为 95,较为合理地反映了小
明的数学水平,因而应用中位数衡量小明的数学成绩.
解:不合理. 小明 5 次的考试成绩,从小到大排列为45,93,95,96,98,中位数是 95,应评定为“优秀”.[方法·规律·小结]1.用样本平均数估计总体平均数.(1)平均数描述了数据的平均水平,定量地反映了数据的集中趋势所处的水平. (2)两次从总体中抽取容量相同的样本,分别求出样本的平
均数,两个样本的平均数一般是不同的,所以用样本平均数去
估计总体平均数时,样本平均数只是总体平均数的近似值.
2.平均数与方差、标准差的实际应用. 在实际应用中,若对平均数相同的两组数据评价好坏,常
结合方差、标准差进行分析,方差较小的数据体现了该组数据
的总体稳定性较好,方差较大的数据,体现该组数据的总体波
动较大.课件26张PPT。2.3 变量间的相关关系【学习目标】1.了解相关关系的概念.2.会利用散点图直观地判断两个变量之间是否有较强的线性关系.3.了解最小二乘法的思想,并能根据给出的线性回归方程系数公式求线性回归方程.1.相关关系的概念不确定随机性 相关关系是指变量之间存在某种程度上的________关系,
即当自变量取值一定时,因变量的取值带有一定的________.
2.两个变量的线性相关
(1)散点图:
将样本中 n 个数据点(xi,yi)(i=1,2,…,n)描在平面直角
坐标系中,以表示具有相关关系的两个变量的一组数据的图形
叫做散点图. (2)正相关、负相关的概念:
如果一个变量的值由小变大时,另一个变量的值也是由小
变大,那么这种相关称为__________;反之,如果一个变量的
值由小变大时,另一个变量的值是由大变小,那么这种相关称为__________.正相关负相关 (3)回归直线方程:
定义:如果散点图中点的分布从整体上看大致在一条直线
附近,那么我们就称这两个变量之间具有______________,这条直线叫做____________.线性相关关系回归直线练习:有关线性回归的说法,不正确的是()A.相关关系的两个变量是非确定关系DB.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.散点图中的点越集中,两个变量的相关性越强3.最小二乘法通过求 (yi-bxi-a)2的最小值而得到回归直线的方法,叫做最小二乘法.【问题探究】
答案:(1)回归直线方程中的截距与斜率都是通过样本估计出来的,存在随机误差.题型 1 相关关系的概念)【例 1】 下面两个变量之间的关系是相关关系的是(
A.正四面体的棱长与体积
B.电压一定时,电流与电阻
C.两地距离一定,车辆运行的平均速度与运行的时间
D.数学成绩与物理成绩
思维突破:函数关系是确定性关系,是因果关系.
答案:D【变式与拓展】1.下列关系不是相关关系的是()BA.日照时间与水稻亩产量
B.圆的半径与圆的内接正三角形的面积
C.父母的身高与子女的身高
D.降雪量与交通事故的发生率题型 2 求线性回归方程【例 2】 一车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了实验,收集数据如下表:(1)画出散点图;
(2)求回归方程;(3)关于加工零件的个数与加工时间,你能得出什么结论?思维突破:作散点图进行判断,若是线性相关,则利用公式计算回归系数.解:(1)散点图如图 D16.图 D16(2)列表如下:(3)由回归直线方程,可知:每增加 1 个零件,加工时间平均增加 0.667 分钟.【变式与拓展】
2.(2013 年广东六校一模)已知 x,y 取值如下表:)Ba,则 a=(
A.1.30
C.1.65B.1.45
D.1.80题型 3 利用回归直线对总体进行估计 【例 3】 下表提供了某厂节能降耗技术改造后生产甲产品
过程中记录的产量 x(单位:吨)与相应的生产能耗 y(单位:吨标
准煤)的几组对照数据:(1)请画出上表数据的散点图;(2)根据上表提供的数据,用最小二乘法求出 y 关于 x 的线 (3)已知该厂技改前生产 100 吨甲产品的生产能耗为 90 吨
标准煤.试根据(2)求出的线性回归方程,预测技改后生产 100 吨
甲产品的生产能耗比技改前降低多少吨标准煤?思维突破:获得线性回归方程后,用解释变量的取值,对总体进行估计.解:(1)散点图如图 D17.图 D17【变式与拓展】3.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程(2)利用(1)中所求出的直线方程预测该地 2016 年的粮食需求量. 解:(1)由所给数据,需求量与年份之间的关系是近似直线
上升,为此对数据处理如下表:
对处理后的数据计算,得所求回归直线方程为 y-257=b(x-2010)+a=6.5×(x-2010)+3.2,即 y=6.5(x-2010)+260.2.(2)当 x=2016 时,y=6.5×(2016-2010)+260.2=299.2(万吨),即该地 2016 年的粮食需求量为 299.2 万吨.【例 4】 观察下列变量 x,y 的散点图:图 2-3-1图 2-3-1 所示的两个变量具有相关关系的是()A.(2)(3)
C.(2)(4)B.(1)(2)
D.(3)(4) 易错分析:误认为(4)不具有相关关系,而误认为(3)具有相
关关系.
解析:(3)是严格地共线点,是确定的关系,即函数关系,
(4)的散点图大致在一抛物线上.
答案:C[方法·规律·小结]1.两变量之间的关系分两类.(1)确定性的函数关系.例如以前学习过的一次函数、二次函数等. (2)带有随机性的变量间的相关关系.例如:“身高者,体也
重”,我们就说身高与体重这两个变量具有相关关系.
两者的相同点是均指两变量间的关系.不同点是函数关系
是一种确定关系,相关关系是一种不确定关系,具有随机性;
函数关系是一种因果关系,而相关关系不一定是因果关系,也
可能是伴随关系.2.根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系. 如果散点图中变量的对应点分布在某条直线的周围,我们
就可以得出结论:这两个变量具有相关关系.如果变量的对应点
分布没有规律,我们就可以得出结论:这两个变量不具有相关
关系.课件23张PPT。章末整合提升专题一抽样方法的应用 【例 1】 某单位200名职工的年龄分布情况如图 2-1.现从
中抽取40名职工作样本,用系统抽样法,将全体职工随机按 1~
200 编号,并按编号顺序平均分为40 组(1~5 号,6~10 号,…,
196~200 号).若第 5 组抽到的号码为 22,则第 8 组抽出的号码
应是________.若用分层抽样方法,则 40 岁以下年龄段应抽取
________名.图 2-1思维突破:系统抽样特点:等间距(间隔k),分层抽样特点:本容量,N1为该层在总体中所占的个体数,N0为总体个体数). 解析:抽号间隔为5,则第8 组号码为22+3×5=37;40
岁以下的职工人数为 200×0.5 =100( 名) ,故抽取的人数为答案:37 20【互动与探究】 1.某学校共有学生 2000 名,各年级男、女生人数如下表:
已知在全校学生中随机抽取 1 名,抽到高二年级女生的概率为
0.19.现用分层抽样的方法在全校抽取 64 名学生,则高三年级应
抽取的学生人数为________.∴y+z=2000-(373+380+377+370)=500.设高三年级应抽取 n 人,则∴n=16(人).
答案:16专题二 样本估计总体的思想与方法的应用 【例 2】 (2012 年广东)某校 100 名学生期中考试语文成绩
的频率分布直方图如图 2-2,其中成绩分组区间分别是:[50,60),
[60,70),[70,80),[80,90),[90,100).图 2-2(1)求图中 a 的值;(2)根据频率分布直方图,估计这 100 名学生的语文成绩的平均分; (3)若这 100 名学生语文成绩在某些分数段的人数 x 与数学
成绩相应分数段的人数 y 之比如下表所示,求数学成绩在[50,90)
之外的人数.思维突破:抓住小矩形面积之和为 1、组距为 10 及每个小矩形面积为该段的频率这三个重要信息解题.解:(1)由(2a+0.02+0.03+0.04)×10=1,得 a=0.005.
(2)估计平均分为 55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73(分). (3)语文成绩在[50,60),[60,70),[70,80),[80,90)之间的人
数分别为 100×0.05=5,100×0.4=40,100×0.3=30,100×0.2=
20;而数学成绩在这相应区间内的人数分别为为5,20,40,25,共
90 名,故数学成绩在[50,90)之外的人数为 100-90=10(名).【互动与探究】
2.有一个容量为 66 的样本,数据的分组及各组的频数如下:[11.5,15.5),2;
[19.5,23.5),9;
[27.5,31.5),11;
[35.5,39.5),7;[15.5,19.5),4;
[23.5,27.5),18;
[31.5,35.5),12;
[39.5,43.5),3.根据样本的频率分布估计,小于或等于 31.5 的数据约占()解析:小于或等于 31.5 的数据共有 66 -(12 +7 +3) =答案:D 3.图 2-3 是某市有关部门根据对当地干部的月收入情况调
查后画出的样本频率分布直方图,已知图(1)中从左向右第一组
的频数为 4000. 在样本中记月收入在[1000,1500),[1500,2000),
[2000,2500),[2500,3000),[3000,3500),[3500,4000]的人数依
次为A1,A2,…,A6.图(2)是统计图(1)中月工资收入在一定范围
内的人数的算法流程图,则样本的容量 n=________,图乙输
出的 S=________(用数字作答).(1)(2) 图 2-3答案:10 000 6000可知:输出的S=A2+A3+…+A6=10 000-4000=6000.解析:∵月收入在[1000 , 1500) 的频率为 0.000 8×500 = 4.(2012 年湖南)图 2-4 是某校一名篮球运动员在 5 场比赛中
所得分数的茎叶图,则该运动员在这 5 场比赛中得分的方差为________.图 2-4答案:6.8专题三线性回归方程的应用 A.y 与 x 具有正的线性相关关系

C.若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kg
D.若该大学某女生身高为 170 cm,则可断定其体重必为
58.79 kg答案:D 【互动与探究】
5.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样
本点,直线 l 是由这些样本点通过最小二乘法得到的线性回归直线(如图 2-5),以下结论正确的是()A.x 和 y 的相关系数为直线 l 的斜率
B.x 和 y 的相关系数在 0 到 1 之间
C.当 n 为偶数时,分布在 l 两侧的样本点图 2-5的个数一定相同
解析:直线 l 是这些样本点通过最小二乘法得到的线性回归直线,回归直线方程一定过样本中心.故选 D.答案:D 6.为了解篮球爱好者小李的投篮命中率与打篮球时间之间
的关系,下表记录了小李某月 1 号到 5 号每天打篮球的时间(单
位:小时)与当天投篮命中率之间的关系:
小李这 5 天的平均投篮命中率为________.用线性回归分析
的方法,预测小李该月 6 号打 6 小时篮球的投篮命中率为________.0.50.537.某设备的使用年限 x(单位:年)和所支出的维修费用 y(单位:万元),有如下的统计资料:由资料可知,y 与 x 具有相关关系.(2)估计当使用年限为 10 年时,维修费用是多少?解:(1)相关数据表:故估计当使用年限为 10 年时,维修费用是 12.38 万元.
第二章 统计
2.1 随机抽样
2.1.1 简单随机抽样
                 
1.下列调查中,属于简单随机抽样的是(  )
A.2014年仁川亚运会志愿者的体检
B.袋装牛奶合格率调查
C.日本首相安倍晋三的支持率调查
D.汽车车站行李安检
2.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是(  )
A.1000名运动员是总体
B.每个运动员是个体
C.抽取的100名运动员是样本
D.样本容量是100
3.关于简单随机抽样的特点,有以下几种说法,其中不正确的是(  )
A.要求总体的个数有限
B.从总体中逐个抽取
C.它是一种不放回抽样
D.每个个体被抽到的机会不一样,与先后顺序有关
4.已知总体容量为106,若用随机数表法抽取一个容量为10的样本,下面对总体的编号正确的是(  )
A.1,2,…,106 B.0,1,…,105
C.00,01,…,105 D.000,001,…,105
5.从某鱼池中捕得120条鱼,做了记号之后,再放回池中,经过适当的时间后,再从池中捕得100条鱼,计算其中有记号的鱼为10条,试估计鱼池中共有鱼的条数为(  )
A.1000条 B.1200条 C.130条 D.1300条
6.为了解某产品的使用寿命,从中抽取10件产品进行实验,在这个问题中,总体是________________,个体是________________,样本是______________________,样本容量是__________.
7.某中学为了支持广州市的创文工作,从报名的20名教师志愿者中选5名教师组成志愿小组,请用抽签法和随机数表法设计抽样方案.
8.一个总体中含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率是________.
9.在某年的高考中,A省有20万考生,为了估计他们的数学平均成绩,从中随机抽取2000名学生的数学成绩作为样本进行统计分析,请回答下面问题:
(1)本题中,总体、个体、样本、样本容量各指什么?
(2)本题中采用的抽样方法是什么?
(3)若考生甲参加了这次高考,那么他被选中的可能性有多大?
10.在简单随机抽样中,某一个个体被抽到的可能性是(  )
A.与第几次抽到有关,第一次抽到的可能性大一些
B.与第几次抽到无关,每次抽到的可能性相等
C.与第几次抽到有关,最后一次抽到的可能性大一些
D.与第几次抽到无关,每次都是等可能的抽取,但各次抽取的可能性不一样
2.1.2 系统抽样
1.某影院有40排座位,每排有46个座位,一个报告会上坐满了听众,会后留下座号为20的所有听众进行座谈,这是运用了(  )
A.抽签法  B.随机数表法
C.系统抽样法  D.放回抽样法
2.下列说法正确的是(  )
①总体的个体数不多时,宜用简单随机抽样法;
②在系统抽样过程中,总体均分后,对起始部分进行抽样时,采用的是简单随机抽样;
③百货商场的抽奖活动是抽签法;
④系统抽样过程中,每个个体被抽取的概率相等(有剔除时例外).
A.①②③ B.①②④
C.①③④ D.②③④
3.为了了解1200名学生对学校食堂管理的意见,打算从中抽取一个容量为30的样本,考虑用系统抽样,则分段的间隔k为(  )
A.30 B.40 C.20 D.12
4.某校为了了解高三模底考试的数学成绩,从年级1252名学生的成绩中,采用系统抽样方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是________.
5.从编号为0000~7999的8000个个体中,用系统抽样的方法抽取一个容量为50的样本,则最后一段的编号为________.若已知最后一个入样的编号为7894,则前5个入样的编号为________________________________________________________________________.
6.采用系统抽样法,从121人中抽取一个容量为12人的样本,则每人被抽取的概率是________.
7.学校为了了解全校同学参加学生社团的基本情况,从503名学生中抽取50名作为样本,如何采用系统抽样的方法完成这一抽样?
8.(2013年陕西)某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为(  )
A.11人  B.12人  
C.13人     D.14人
9.一个总体共有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,3,…,10,现用下面的方法抽取一个容量为10的样本.规定:如果在第一组随机抽取的号码为m,那么在第k组中抽取的号码个位数与m+k的个位数字相同.如果m=6,那么在第7组中抽取的号码是________.
10.下面给出某村委调查本村各户收入情况所做的抽样,阅读并回答问题:
本村人口:1200人,户数300,每户平均人口数4人;应抽户数:30户;抽样间隔:=40;确定随机数字:取一张人民币,编码的后两位数为12;确定第一样本户:编码的后两位数为12的户为第一样本户;确定第二样本户:12+40=52,52号为第二样本户……
(1)该村委采用了何种抽样方法?
(2)抽样过程中存在哪些问题?并修改;
(3)何处使用了简单随机抽样?
2.1.3 分层抽样
             
1.简单随机抽样、系统抽样、分层抽样之间的共同点是(  )
A.都是从总体中逐个取得
B.将总体分成几部分,按事先规定的要求在各部分抽取
C.抽样过程中每个个体被抽到的机会相同
D.将总体分成几层,分层进行抽取
2.某校高一、高二和高三年级分别有学生n1,n2和n3名,为了解全校学生视力情况,现用分层抽样方法从中抽取一个容量为n0的样本,则在高一抽的人数占高一总人数的比例是(  )
A. B.
C. D.
3.某校师生共2400人,现用分层抽样方法从所有师生中抽取一个容量为160的样本,已知从教师中抽取的人数为10,则该校教师人数是(  )
A.150人 B.60人 C.600人 D.15人
4.(2013年湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=(  )
A.9   B.10 
C.12  D.13
5.(2012年四川)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有96人,若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为(  )
A.101 B.808 C.1212 D.2012
6.(1)教育局督学组到学校检查工作,需在学号为0001~1000的高三年级的学生中抽20人参加学校管理的综合座谈会;
(2)该校高三年级有1000名学生参加2014年新年晚会,要产生20名“幸运之星”;
(3)该校高三年级1000名学生一模考试的数学成绩有240人在120分以上(包括120分),600人在120分以下,90分以上(包括90分),其余在90分以下,现欲从中抽取20人研讨进一步改进数学教与学的座谈会.
用如下三种抽样方法选取样本:①简单随机抽样;②系统抽样;③分层抽样.则以上三件事,最合理的抽样方法序号依次为__________.
7.某学校共有教师490人,其中不到40岁的有350人,40岁及以上的有140人.为了了解普通话在该校中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为70人的样本进行普通话水平测试,那么在不到40岁的教师中应抽取的人数为多少人?
8.某校共有学生2000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为(  )
一年级
二年级
三年级
女生
373
x
y
男生
377
370
z
A.24人 B.18人
C.16人 D.12人
9.为了保证分层抽样时,每个个体等可能地被抽取,必须要求(  )
A.不同的层以不同的抽样比例抽样
B.每层抽样的个体数相同
C.每层的抽样比例都相同
D.以上都不对
10.一个县区共有4个乡镇,人口3万人,其中4个乡镇的人口比例为3∶2∶2∶3,从3万人中抽取一个300人的样本,分析某种流行病发病率,已知这种疾病与地理位置及水土有关,问应采用什么抽样方法?请写出基本抽样步骤.
2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布
                 
1.在频率分布直方图中,各小长方形的面积等于(  )
A.相应各组的频数 B.相应各组的频率
C.组数 D.组距
2.一个样本如下:
78 80 81 81 72 77 89 90 92 85
则这个样本的极差是(  )
A.72 B.92 C.7 D.20
3.从一堆苹果中任取10个称得它们的质量如下(单位:g):
125 120 122 105 130 114 116 95 120 134
则样本落在[114.5,124.5]内的频率为(  )
A.0.2 B.0.3 C.0.4 D.0.5
4.一个容量为66的样本,数据分组及各组频数如下:
[11,15) 2;[15,19) 4;[19,23) 9;[23,27) 18;
[27,31) 11;[31,35) 12;[35,39) 7;[39,43) 3.
由此估计,大于或等于31的数据约占(  )
A. B. C. D.
5.(2014年广东汕头二模)图2-2-8是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,若80分以上为优秀,根据图形信息可知:这次考试的优秀率为(  )
图2-2-8
A.25%   B.30% C.35% D.40%
6.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据得出样本频率分布直方图(如图2-2-9).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中用分层抽样方法抽出100人做进一步调查,则在[2500,3000)(单位:元)月收入段中应抽出________人.
图2-2-9
7.A,B两个班各选出10名学生进行测验,成绩的茎叶图如图2-2-10,用图估计,________班的平均分较高.
图2-2-10
8.为了解初三学生中女生的身高情况,某中学对初三女生的身高进行了一次测量,所得数据整理后列出了频率分布表如下:
组别
频数
频率
145.5~149.5
1
0.02
149.5~153.5
4
0.08
153.5~157.5
20
0.40
157.5~161.5
15
0.30
161.5~165.5
8
0.16
165.5~169.5
m
n
合计
M
N
(1)求出表中m,n,M,N所表示的数分别是多少;
(2)画出频率分布直方图;
(3)全体女生中身高在哪组范围内的人数最多?
9.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图2-2-11,其中支出在[50,60)的同学有30人,若想在这n人中抽取50人,则在[50,60)之间应抽取的人数为(  )
图2-2-11
A.10人 B.15人 C.25人 D.30人
10.为考察某种皮鞋的各种尺码的销售情况,以某天销售的40双皮鞋为一个样本,按尺码分为5组,第3组的频率为0.25,第1,2,4组的频数分别为6,7,9,若第5组表示的是40-42码的皮鞋,则售出的200双皮鞋中含40—42码的皮鞋(  )
A.50双 B.40双 C.20双 D.30双
11.(2012年安徽)若某产品的直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽样5000件进行检测,结果发现有50件不合格.计算这50件不合格的直径长与标准值的差(单位:mm),将所得数据进行分组,得出频率分布表如下:
分组
频数
频率
[-3,-2)
0.10
[-2,-1)
8
(1,2]
0.50
(2,3]
10
(3,4]
合计
50
1.00
(1)将上面表格缺少的数据补充完整;
(2)估计该厂生产的此种产品中,不合格的直径长与标准值的差落在(1,3]内的概率;
(3)现对该厂这种产品的某批次进行检查,结果发现有20件产品不合格,据此估算这批产品中合格品的件数.
2.2.2 用样本的数字特征估计总体的数字特征
                 
1.一个样本数据按照从小到大的顺序排列为13,14,19,x,23,27,28,31,其中中位数为22,则x为(  )
A.21  B.22
C.20  D.23
2.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是(  )
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
3.x1,x2,x3的平均数是3,x4,x5,…,x10的平均数是6,则x1,x2,…,x10的平均数是(  )
A.3 B.4
C.5 D.5.1
4.样本数为9的四组数据,它们的平均数都是5,频率分布图如图2-2-15,则标准差最大的一组是(  )
图2-2-15
A.第一组 B.第二组
C.第三组 D.第四组
5.从一堆苹果中任取5个,称得它们的质量如下(单位:克):125,124,121,123,127,则该样本的标准差s=________(用数字作答).
6.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:




平均成绩
8.5
8.8
8.8
8
方差s2
3.5
3.5
2.1
8.7
则参加奥运会的最佳人选是________.
7.划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲:27,38,30,37,35,31;
乙:33,29,38,34,28,36.
根据以上数据,试判断他们谁更优秀?
8.一组数据中,每个数都减去80,得到一组新数据,若新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别为(  )
A.81.2,4.4 B.78.8,4.4
C.81.2,84.4 D.78.8,75.6
9.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60 m;从南方抽取了200个男孩,平均身高为1.50 m.由此可推断我国13岁男孩的平均身高为(  )
A.1.57 m  B.1.56 m
C.1.55 m D.1.54 m
10.某校文学社开展“红五月”征文活动,作品上交时间为5月2号~5月22号,评委从收到的作品中抽出200,经统计,其频率分布直方图如图2-2-16.
(1)样本中的作品落在[6,10)内的频数是多少?
(2)估计众数、中位数和平均数各是多少?
图2-2-16
2.3 变量间的相关关系
           
1.下列关系中,是函数关系的是(  )
A.球的半径和体积的关系
B.农作物收获和施肥量的关系
C.商品成本和利润的关系
D.产品产量与单位产品成本的关系
2.(2013年湖北)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,
分别得到以下四个结论:
①y与x负相关,且=2.347x-6.423; 
②y与x负相关,且=-3.476x+5.648;
③y与x正相关,且=5.437x+8.493; 
④y与x正相关,且=-4.326x-4.578.
其中一定不正确的结论的序号是(  )
A.①② B.②③
C.③④ D.①④
3.在对两个变量x,y进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解析;
②收集数据(xi,yi),i=1,2,…,n;
③求回归直线方程;
④求相关系数;
⑤绘制散点图.
如果根据可靠性要求能够作出变量x,y具有线性相关结论,那么下列操作顺序正确的是(  )
A.①②⑤③④ B.③②④⑤①
C.②④③①④ D.②⑤④③①
4.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程为=x+,则下面说法不正确的是(  )
A.直线=x+必经过点(,)
B.直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
C.直线=x+的斜率为
D.直线=x+和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差是该坐标平面上所有直线与这些点偏差中最小的.
5.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x/万元
4
2
3
5
销售额y/万元
49
26
39
54
根据上表可得回归方程=x+中为9.4,据此模型预报广告费用为6万元时销售额为(  )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
6.工人月工资y(单位:元)依劳动生产率x(单位:千元)变化的回归方程为=60+90x,下列判断正确的是(  )
A.劳动生产率为1000元时,工资为60元
B.劳动生产率提高1000元时,工资提高150元
C.劳动生产率提高1000元时,工资提高90元
D.劳动生产率为1000元时,工资为90元
7.7个学生的数学成绩和物理成绩如下表:
学生
A
B
C
D
E
F
G
数学成绩/分
80
75
70
65
60
88
83
物理成绩/分
70
66
68
64
62
82
78
问:数学成绩与物理成绩是否具有相关关系?
8.(2012年全国)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为(  )
A.-1 B.0 C. D.1
9.已知x,y如下表:
x
0
1
4
5
6
m
y
1.3
1.8
5.6
6.1
7.4
9.3
从散点图知:y与x线性相关,由上表可求得回归方程为=0.95x+1.45,则m=________.
10.(2012年福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x/元
8
8.2
8.4
8.6
8.8
9
销量y/件
90
84
83
80
75
68
(1)求回归直线方程=x+,其中=-20,=-;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元(利润=销售收入-成本)?

第二章 统计
2.1 随机抽样
2.1.1 简单随机抽样
【课后巩固提升】
1.B 2.D 3.D
4.D 解析:随机数表法要求每个个体的编号长度一致.
5.B 解析:随机抽样中每个个体被抽到的可能性相等,则由=,得N=1200.
6.某产品所有产品的使用寿命 每个产品的使用寿命 被抽取的10件产品的使用寿命 10
7.解:抽签法:
(1)将20名志愿者编号,编号为1,2,3,…,20;
(2)将20个号码分别写在20张外形完全相同的纸条上,并揉成团,制成号签;
(3)将20个号签放入一个不透明的盒子里,充分搅匀;
(4)从盒子中逐个抽取5个号签,并记录上面的编号;
(5)所得号码对应的志愿者,就是志愿小组的成员.
随机数表法:
(1)将20名志愿者编号,编号为01,02,03,…,20;
(2)在随机数表中任选一数开始,按某一确定方向读数;
(3)凡不在01~20中的数或已读过的数,都跳过去不作记录,依次记录下5个读数;
(4)找出号码与记录的数相同的教师组成志愿小组.
8.0.05
9.解:(1)总体指在该年的高考中,A省20万考生的数学成绩;个体指在该年的高考中,A省20万考生每一名考生的数学成绩;样本是指被抽取的2000名学生的数学成绩;样本容量是2000.
(2)采用抽样方法是简单随机抽样.
(3)甲被选中的可能性为.
10.B 解析:简单随机抽样中每个个体被抽到的可能性相等.
2.1.2 系统抽样
【课后巩固提升】
1.C
2.A 解析:系统抽样有剔除时,每个个体被抽到的可能性也相等,都等于·=.
3.B 4.2
5.7840~7999 0054,0214,0374,0534,0694
解析:系统抽样又称等距抽样,间隔一般为k=.
6. 解析:系统抽样无论有无剔除都是等机率抽样,故机率为.
7.解:(1)因为得10余3,故用简单随机抽样方法剔除3个个体;
(2)对剩下的500名学生进行编号为000,001,002,…,499;
(3)确定间隔k==10,将总体分成50个部分,每部分包括10个个体.第1部分的个体编号为000,001,002,…,009,第2部分的个体编号为010,011,012,…,019,依此类推,第50部分的个体编号为490,491,…,499;
(4)在第1部分用简单随机抽样确定起始的个体编号,比如007;
(5)依次在第2部分,第3部分,…,第50部分取出号码007,017,…,497,这样就得到了一个容量为50的样本.
8.B 解析:使用系统抽样方法,从840人中抽取42人,即从20人抽取1人.
所以从编号1~480的人中,恰好抽取=24(人),接着从编号481~720共240人中抽取=12(人).
9.63 解析:第7组的编号依次为60,61,62,63,64,65,66,67,68,69.由6+7=13,个位数为3,所以在第7组中抽取的号码是63.
10.解:(1)采用了系统抽样.
(2)本题是对某村各户进行抽样,而不是对某村人口抽样,抽样间隔为:=10,其他步骤相应改为确定随机数字:取一张人民币,编码的后两位数为02;确定第一样本户:编号为02的户为第一样本户;确定第二样本户:02+10=12,12号为第二样本户……
(3)确定随机数字用的是简单随机抽样.
2.1.3 分层抽样
【课后巩固提升】
1.C 2.B 3.A 4.D
5.B 解析:由分层抽样特点,可知:×N=96,N=808.故选B.
6.②①③
7.解:因为每个个体被抽到的可能性相等,用分层抽样的方法,样本容量与总体个体数之比为70∶490=1∶7,所以不到40岁的教师中应抽取350×=50(人).
8.C 解析:由在全校2000名学生中随机抽取1名,抽到二年级女生的概率是0.19,得二年级女生有380人,所以三年级有2000-373-377-380-370=500(人).由=,得n=16.
9.C
10.解:应采取分层抽样方法.步骤如下.
(1)将3万人分四层,每个镇一层;
(2)各乡镇应抽人数:
300×=90(人),300×=60(人),
300×=60(人),300×=90(人);
(3)按系统抽样方法在各镇抽取相应人数;
(4)将每层抽取的人组到一起得到一个样本.
2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布
【课后巩固提升】
1.B 解析:小长方形面积为:组距×=频率.
2.D 3.C 4.B 5.B 6.25 7.B
8.解:(1)M==50,m=50-(1+4+20+15+8)=2,
N=1,n==0.04.
(2)频率分布直方图如图D15.
图D15
(3)在153.5~157.5范围内的人数最多.
9.B
10.B 解析:第3组的频数为40×0.25=10,则第5组的频数为40-10-6-7-9=8,第5组的频率为0.2,则答案为200×0.2=40(双).
11.解:(1)频数列:5,25,2;
频率列:0.16,0.20,0.04.
(2)0.50+0.20=0.70.
(3)设合格品数为x,依题意,得=,
∴x=1980.
∴这批次合格品件数为1980.
2.2.2 用样本的数字特征估计总体的数字特征
【课后巩固提升】
1.A 2.C 3.D
4.D 解析:频率分布越分散,标准差越大.
5.2 解析:因为样本平均数=(125+124+121+123+127)=124,则样本方差s2=(12+02+32+12+32)=4,所以标准差s=2.
6.丙
7.解:甲=×(27+38+30+37+35+31)=33,
乙=×(33+29+38+34+28+36)=33,
s=×[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]=15,
s=×[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]=12,
∵甲=乙,s>s,
∴二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.
8.A 解析:=′+80,s2=s′2.故选A.
9.B 解析:∵从北方抽取了300个男孩,平均身高1.60 m;
从南方抽取了200个男孩,平均身高为1.50 m.
∴这500个13岁男孩的平均身高是=1.56(m).
∴由此可推断我国13岁男孩的平均身高为1.56 m.
10.解:(1)作品落在[6,10)内的频率为1-0.08-0.36-0.12-0.12=0.32,
∴频数为200×0.32=64.
(2)众数估计值为:=12,中位数的估计值为:从左到右小矩形面积依次为0.08,0.32,0.36,0.12,0.12,由于中位数左、右两边的小矩形面积相等,若设为x,则(x-10)×0.09=0.1,∴x≈11.
平均数的估计值为0.08×4+0.32×8+0.36×12+0.12×16+0.12×20≈12.
2.3 变量间的相关关系
【课后巩固提升】
1.A 2.D 3.D 4.B
5.B 解析:易得=,=42.
∵回归直线过点(,),且=9.4,
∴=9.1,即线性回归方程为=9.4x+9.1,当x=6时,=65.5.
6.C
7.解:两变量的散点图如图D18.
图D18
由上图易知,数学与物理成绩具有相关关系.
8.D
9.8 解析:∵=(16+m),=5.25,
∴5.25=0.95×(16+m)+1.45,解得m=8.
10.解:(1)∵=8.5,=80,∴=- =250,
∴回归方程为=-20x+250.
(2)设利润为L元,则
L=x(-20x+250)-4(-20x+250)
=-202+361.25,
当且仅当x==8.25时,L取的最大值.
∴当该产品单价定为8.25元时,工厂可获得最大利润.
第二章自主检测
(满分150分,时间120分钟)
一、选择题(每小题5分,共50分)
1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是(  )
A.抽签法    B.随机数法
C.系统抽样法  D.分层抽样法
2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有(  )
A.a>b>c B.b>c>a C.c>a>b D.c>b>a
3.2014年某大学自主招生面试环节中,七位评委为一考生打出分数的茎叶图如图2-1,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为(  )
图2-1
A.84,4.84 B.84,1.6
C.85,1.6 D.85,4
4.甲、乙、丙、丁四人参加射击项目选拔赛,四人平均成绩和方差如下:




平均环数
8.6
8.9
8.9
8.2
方差s2
3.5
3.5
2.1
5.6
若从四人中选一人,则最佳人选是(  )
A.甲 B.乙 C.丙 D.丁
5.某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查,已知高二被抽取的人数为13人,则n=(  )
A.660    B.720 C.780   D.800
6.下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:
气温/℃
18
13
10
4
-1
杯数/杯
24
34
39
51
63
若热茶杯数y与气温x近似地满足线性关系,则其关系式最接近的是(  )
A.y=x+6 B.y=x+42 C.y=-2x+60 D.y=-3x+78
7.是x1,x2,…,x100的平均数,a是x1,x2,…,x40的平均数,b是x41,x42,…,x100的平均数,则下列各式正确的是(  )
A.= B.= C.=a+b D.=
8.在抽查某产品的尺寸过程中,将其尺寸数据分成若干组,[a,b]是其中一组,抽查出的个体数在该组上的频率是m,该组上的直方图的高为h,则|a-b|=(  )
A.h·m B. C. D.与m,h无关
9.甲、乙、丙三名运动员在某次测试中各射击20次,三人测试成绩的频率分布条形图分别如图2-2,图2-3和图2-4,若s甲,s乙,s丙分别表示他们测试成绩的标准差,则(  )
A.s甲图2-2   图2-3   图2-4
10.图2-5是某县参加2014年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1,A2,…,Am(如A2表示身高(单位:cm)在[150,155)内的学生人数).图2-6是统计图中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180 cm(含160 cm,不含180 cm)的学生人数,那么在流程图中的判断框内应填写的条件是(  )
图2-5   图2-6
A.i<9? B.i<8? C. i<7? D.i<6?
二、填空题(每小题5分,共20分)
11.下列四种说法中,①数据4,6,6,7,9,3的众数与中位数相等;②一组数据的标准差是这组数据的方差的平方;③数据3,5,7,9的标准差是数据6,10,14,18的标准差的一半;④频率分布直方图中各小长方形的面积等于相应各组的频数.其中正确的有__________(填序号).
12.将参加数学竞赛的1000名学生编号如下:0001,0002, 003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法把编号分成50个部分,如果第一部分编号为0001,0002,0003,…,0020,第一部分随机抽取一个号码为0015,那么抽取的第40个号码为________.
13.超速行驶已成为马路上最大杀手之一,已知某中段属于限速路段,规定通过该路段的汽车时速不超过80 km/h,否则视为违规.某天,有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图2-7,则违规的汽车大约为________辆.
图2-7
14.已知回归直线斜率估计值为1.23,样本点中心为(4,5),则回归方程是____________.
三、解答题(共80分)
15.(12分)某校500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,为了研究血型与色弱的关系,用分层抽样的方法抽取一个容量为20的样本,则各种血型的人分别抽多少?写出抽样过程.
16.(12分)对甲、乙两名自行车赛手在相同条件下进行了8次测试,测得他们的最大速度(单位:m/s)的数据如下表:

27
38
30
37
35
31
24
50

33
29
38
34
28
36
43
45
(1)画出茎叶图,由茎叶图你能获得哪些信息?
(2)分别求出甲、乙两名自行车赛手最大速度(单位:m/s)的数据的平均数、中位数、标准差,并判断选谁参加比赛更合适(可用计算器).
17.(14分)有一个容量为100的样本,数据的分组及各组的频数如下:
[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)数据落在[18.5,27.5)范围内的可能性为百分之几?
18.(14分)为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午 8:00~12:00间各自的车流量(单位:百辆),得如图2-8所示的统计图,根据统计图:
(1)甲、乙两个交通站的车流量的极差分别是多少?
(2)甲交通站的车流量在[10,40]间的频率是多少?
(3)甲、乙两个交通站哪个更繁忙?并说明理由.
图2-8
19.(14分)为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如图2-9),已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4.第一小组的频数是5.
(1)求第四小组的频率和参加这次测试的学生人数;
(2)在这次测试中,学生跳绳次数的中位数落在第几小组内?
(3)参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩的优秀率是多少?
图2-9
20.(14分)某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:
商店名称
A
B
C
D
E
销售额x/千万元
3
5
6
7
9
利润额y/百万元
2
3
3
4
5
(1)画出销售额和利润额的散点图;
(2)若销售额和利润额具有相关关系,用最小二乘法计算利润额y对销售额x的回归直线方程;
(3)据(2)的结果估计当销售额为1亿元时的利润额.

第二章自主检测
1.D 2.D
3.C 解析:平均分为80+(4×3+6+7)=85,s2=[3×(84-85)2+(86-85)2+(85-87)2]=1.6.
4.C 5.B 6.C 7.A 8.C 9.D 10.B 11.①③
12.0795 解析:抽取的第40个号码为0015+39×20=0795.
13.280
14.=1.23x+0.08
15.解:用分层抽样方法抽样.
∵=,∴200×=8,125×=5,50×=2.
故O型血抽8人,A型血抽5人,B型血抽5人,AB型血抽2人.
16.解:(1)茎叶图如图D31,中间数为数据的十位数.
图D31
从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是35,甲的中位数是33.因此乙发挥比较稳定,总体得分情况比甲好.
(2)利用科学计算器,得甲=34,乙=35.75;s甲≈7.55,s乙≈5.70;甲的中位数是33,乙的中位数是35. 综合比较,选乙参加比赛更合适.
17.解:(1)样本的频率分布表如下:
分组
频数
频率
[12.5,15.5)
6
0.06
[15.5,18.5)
16
0.16
[18.5,21.5)
18
0.18
[21.5,24.5)
22
0.22
[24.5,27.5)
20
0.20
[27.5,30.5)
10
0.10
[30.5,33.5]
8
0.08
合计
100
1.00
(2)频率分布直方图如图D32.
图D32
(3)0.18+0.22+0.20=0.60=60%.
18.解:(1)甲交通站的车流量的极差为73-8=65;
乙交通站的车流量的极差为71-5=66.
(2)甲交通站的车流量在[10,40]间的频率为=.
(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方.从数据的分布情况来看,甲交通站更繁忙.
19.解:(1)第四小组的频率=1-(0.1+0.3+0.4)=0.2,
因为第一小组的频数为5,其频率为0.1,
所以参加这次测试的学生人数为5÷0.1=50(人).
(2)0.3×50=15,0.4×50=20,0.2×50=10,则第一、第二、第三、第四小组的频数分别为5,15,20,10.
所以学生跳绳次数的中位数落在第三小组内.
(3)跳绳成绩的优秀率为(0.4+0.2)×100%=60%.
20.解:(1)销售额和利润额的散点图如图D33.
图D33
(2)销售额和利润额具有相关关系,列表如下:
xi
3
5
6
7
9
yi
2
3
3
4
5
xiyi
6
15
18
28
45
=6,=3.4,=112,=200
所以==0.5,
=-=3.4-6×0.5=0.4.
从而得回归直线方程=0.5x+0.4.
(3)当x=10时,=0.5×10+0.4=5.4(百万元).
故当销售额为1亿元时,利润额估计为540万元.