课堂设计2014-2015高一数学人教B版必修3 学案+章末检测:第二章 统计(11份)(11份打包)

文档属性

名称 课堂设计2014-2015高一数学人教B版必修3 学案+章末检测:第二章 统计(11份)(11份打包)
格式 zip
文件大小 788.6KB
资源类型 教案
版本资源 人教新课标B版
科目 数学
更新时间 2014-09-22 09:34:29

文档简介

2.3 变量的相关性
【入门向导】
西方流传的一首民谣
丢失一个钉子,坏了一只蹄铁;
坏了一只蹄铁,折了一匹战马;
折了一匹战马,伤了一位骑士;
伤了一位骑士,输了一场战斗;
输了一场战斗,亡了一个帝国.
马蹄铁上一个钉子是否丢失与一个帝国存与亡关系有多大呢?显然,这种关系不能用我们熟悉的函数关系来描述,那么这究竟是一种什么样的关系?
相关关系我们可以从以下三个方面加以认识:
(1)相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系,相关关系是一种非确定性关系.
(2)函数关系是一种因果关系,而相关关系不一定是因果关系,还可能是伴随关系.
(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化.
例1 有下列关系:
①人的年龄与其拥有的财富之间的关系;
②曲线上的点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一树木,其横截面直径与高度之间的关系;
⑤学生与其学号之间的关系.
其中是相关关系的是________.
解析 ②⑤中两变量间的关系是函数关系;①③④中两变量的关系是非确定性关系,是相关关系.
答案 ①③④
将样本中的n个数据点(xi,yi)(i=1, ( http: / / www.21cnjy.com )2,…,n)描在平面直角坐标系中,就得到了散点图.根据散点图中点的分布趋势可直观地判断并得出两个变量的关系.
散点图定义在具有相关关系的两个变量基础上,借助散点图,我们可以看两个变量关系的密切程度,进行相关回归分析.
如果散点图中的点散布在从左下角到右上角的区 ( http: / / www.21cnjy.com )域,对于两个变量的这种相关关系,我们称正相关;如果散点图中的点散布在左上角到右下角的区域,我们称为负相关.
例2 某种产品的广告支出费x与销售额y(单位:百万元)之间有如下对应数据:
x 2 4 5 6 8
y 30 40 60 50 70
试就此数据判断x与y之间是否有相关关系.
分析 怎样看两变量之间是否有相关关系呢?从数据表中看得出来吗?目前,简明直观的方法是画出散点图.
解 根据所给数据,画出散点图如下图.
由图可知,这些点大致位于一条直线的附近,故知广告支出费x与销售额y之间具有相关关系.
在观察散点图特征时,我们会发现 ( http: / / www.21cnjy.com )有时各点大致分布在一条直线的附近,且可以画出不止一条类似的直线,而最能代表变量x与y之间关系的直线的特征,即为n个偏差的平方和最小.设所求直线方程=a+bx,其中a,b是待定系数,则i=a+bxi(i=1,2,…,n).于是得到各个偏差yi-i=yi-(bxi+a)(i=1,2,…,n).
显然,偏差yi-i的符号有正有负,若将它们 ( http: / / www.21cnjy.com )相加会造成相互抵消,故采用n个偏差的平方和Q= (yi-bxi-a)2.采用最小二乘法可求出使Q为最小值时的a和b.
==,
=-,
其中=xi,=yi.
例3 设对变量x、y有如下观察数据:
x 151 152 153 154 156 157 158 160 160 162 163 164
y 40 41 41 41.5 42 42.5 43 44 45 45 46 45.5
(1)画出散点图;
(2)如果变量x、y有线性关系,求出回归直线方程.
解 (1)画出散点图.
(2)由(1)得变量x、y具有线性相关关系.
用计算器求得回归直线方程: =0.450x-27.759.
1.散点图及回归直线方程在实际中的应用有误
例1 有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童数量,如下表:
人均GDP(万元) 10 8 6 4 3 1
患白血病的儿童数 351 312 207 175 132 180
(1)画出散点图,并判定两个变量是否具有线性相关关系;
(2)通过计算可得两个变量的回归直线方程为=23.25x+102.25,假如一个城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?
错解 (1)根据表中数据画 ( http: / / www.21cnjy.com )出散点图,如图所示,从图可以看出,虽然后5个点大致分布在一条直线的附近,但第一个点离这条直线太远,所以这两个变量不具有线性相关关系.
(2)将x=12代入=23.25x+102.25,
得=23.25×12+102.25=381.25>380,
所以上述断言是正确的.
错解辨析 在第(1)问中,是否具有线性相关关 ( http: / / www.21cnjy.com )系,要看大部分点、主流点是否分布在一条直线附近,个别点是不影响“大局”的,所以可断定这两个变量具有线性相关关系.在第(2)问中,381.25只是一个估计值,由它不能断言这个城市患白血病的儿童一定超过380人.如果这个城市的污染很严重,有可能人数远远超过380,若这个城市的环境保护的很好,则人数就有可能远远低于380.
正解 (1)根据表中数据画散点图, ( http: / / www.21cnjy.com )如错解图所示,从图可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系.
(2)将x=12代入=23.25x+ ( http: / / www.21cnjy.com )102.25,得=23.25×12+102.25=381.25>380,即便如此,但因381.25只是一个估计值,会受其他情况的影响,所以不能断言这个城市患白血病的儿童一定超过380人.
2.忽略线性相关关系的判断致误
在学习本章内容时,很多同学总是认为,只要是给 ( http: / / www.21cnjy.com )出数据,就一定存在线性相关关系,当然一定可以求回归直线方程;其实不然,并非给出数据,就有线性相关关系,即便是求出回归直线也不一定有价值.
例2 假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:
x/年 1 2 3 4 5 6
y/万元 5.0 0.8 0.5 6.5 7.0 1.2
根据资料判断y对x是否呈线性相关关系? ( http: / / www.21cnjy.com )若存在,借助回归直线方程估计使用年限为10年时,维修费用大约是多少?若不存在,请根据资料,求出第二年到第五年维修费用总共是多少?
错解 由于=3.5,=3.5,x=91,
xiyi=76.3,
===0.16,
=-=3.5-0.16×3.5=2.94,
于是回归直线方程为=0.16x+2.94,
当x=10(年)时,=0.16×10+2.94=4.54(万元).
( http: / / www.21cnjy.com )
正解 先画出散点图,如下图所示.
观察这个散点图,这些点没有分布在一条直线附近,所以y对x不呈线性相关关系.
由于第二年到第五年的维修费用表 ( http: / / www.21cnjy.com )中已经给出,所以总费用W=0.8+0.5+6.5+7.0=14.8(万元),即第二年到第五年的维修费用为14.8万元.
1.数形结合的思想方法
数形结合是统计内容中一个很突 ( http: / / www.21cnjy.com )出的特点.获取了一个科学样本后,需要对样本数据进行整理分析,为了使样本的数据特征更直观,我们经常需要作图、读图,并精确地作出样本数据的频率分布直方图、茎叶图、折线图、散点图等,还要能理解各种图所包含的意义,通过图看出样本数据的分布状况、数据的变化趋势、变量间的关系,进而估计总体的状况.
2.转化与化归的思想方法
统计中充分体现出了转化与化归的思想方法,如部分与整体的转化,数与图的转化,随机性问题与确定性问题的转化等.
统计的基本思想是用样本去估计总体,也就是用有代表性的一部分来估计整体的情况,这就反映出由部分向整体转化的思想.
例 对变量x,y有观测数据(xi,yi)( ( http: / / www.21cnjy.com )i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断(  )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
解析 图(1)中的数据y随着x的增大而减小,因此变量x与变量y负相关;图(2)中的数据随着u的增大,v也增大,因此u与v正相关.
答案 C
1.(辽宁)调查了某地若干户家庭的年收入 ( http: / / www.21cnjy.com )x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程: =0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加______万元.
解析 由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254.
答案 0.254
2.(广东)某数学老师身高17 ( http: / / www.21cnjy.com )6 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm.
解析 儿子和父亲的身高可列表如下:
父亲身高 173 170 176
儿子身高 170 176 182
设回归直线方程 =+ x,由表中的三 ( http: / / www.21cnjy.com )组数据可求得 =1,故 =- =176-173=3,故回归直线方程为 =3+x,将x=182代入得孙子的身高为185 cm.
答案 185
3.(威海模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x 3 4 5 6
y 2.5 3 4 4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 =x+ ;
(3)已知该厂技改前100 ( http: / / www.21cnjy.com )吨甲产品的生产能耗为90吨标准煤.试根据(2)求出线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
解 (1)散点图如下:
(2)==4.5,==3.5
xiyi=3×2.5+4×3+4×5+6×4.5=66.5.
x=32+42+52+62=86,
∴===0.7,
=-=3.5-0.7×4.5=0.35.
∴ =0.7x+0.35.
(3)现在生产100吨甲产品用煤
=0.7×100+0.35=70.35,
∴90-70.35=19.65.∴降低19.65吨标准煤.2.1.3-2.1.4 分层抽样 数据的收集
自主学习
学习目标
1.理解分层抽样的概念,掌握分层抽样的使用条件和步骤,会进行简单的应用.
2.能通过做试验、查阅资料、设计调查问卷的方法收集数据.
自学导引
1.分层抽样的概念
当总体由有____________的几 ( http: / / www.21cnjy.com )部分组成时,为了使抽取的样本更好地反映总体的情况,常将总体中各个个体按某种特征分成若干个____________的几部分,每一部分叫做层,在各层中按层在总体中____________进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.
2.分层抽样的优点
(1)使样本具有较强的________.
(2)在________抽样时,可灵活地选用不同的抽样方法.
3.收集数据的常用方式有________、____________、____________.
4.做试验:根据调查项目的要求来设计一些合适的试验,能够________获得样本数据.
5.查阅资料:有些数据资料不容易直接调查得到 ( http: / / www.21cnjy.com ),这时可以通过查阅统计年鉴、图书馆文献等办法获得所需或相关的数据.还可以通过____________的资源得到数据资料.
6.调查问卷一般由一组________、有系统、________的题目组成.在调查问卷中,设计题目应注意符合以下要求:
(1)问题要________________,使受调查者能够容易作答.
(2)语言________________________,避免出现有歧义或意思含混的句子.
(3)题目不能出现________________________的语句.
对点讲练
知识点一 分层抽样的概念
例1 某社区有700户家庭,其中高收入家庭225户,中等收入家庭400户,低收入家庭75户,为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,记作①;某中学高二年级有12名足球运动员,要从中选出3人调查学习负担情况,记作②;从某厂生产的802辆轿车中抽取8辆测试某项性能,记作③.则完成上述3项应采用的抽样方法是(  )
A.①用简单随机抽样,②用系统抽样,③用分层抽样
B.①用分层抽样,②用简单随机抽样,③用系统抽样
C.①用简单随机抽样,②用分层抽样,③用系统抽样
D.①用分层抽样,②用系统抽样,③用简单随机抽样
点评 抽样方法的选择要结合三种 ( http: / / www.21cnjy.com )抽样方法去比较;明确其各自的特点以及在抽样过程中的可操作性,由明显差异的几部分组成时,要选用分层抽样,注意其取整要求.
变式迁移1 某镇有四所中学,为了了解该镇中学生的视力情况,用什么方法抽取人数(四所中学的学生视力有一定的差距)(  )
A.抽签法 B.随机数表法
C.系统抽样法 D.分层抽样法
知识点二 分层抽样法的应用
例2 某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人,教育部门为了了解学校机构的改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,并写出抽样过程.
点评 (1)当已知总体是由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常采用分层抽样法.
(2)分层抽样是将总体分成几层,分层进行抽取,抽取时可采用抽签法或随机数表法.
变式迁移2 某城市有210家百货商 ( http: / / www.21cnjy.com )店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,计划抽取一个容量为21的样本,按照分层抽样方法抽取时,各种百货商店分别要抽取多少家?写出抽样过程.
知识点三 数据的收集
例3 为了调查最近上映的影片的受欢迎程度,请设计一份调查问卷,调查对象是去电影院的人.
变式迁移3 请设计一份调查问卷,就最近结束的一次考试调查学生作弊情况.
1.分层抽样的概念和特点
当总体由差别明显的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样.
分层抽样的优点是使样本具有较强的代表性,而且在各层抽样时又可灵活地选用不同的抽样方法.
2.分层抽样方法的应用.
3.收集数据的方式要灵活,根据具体问题使用不同方式;设计调查问卷要考虑全面,才能得到真实,有效的数据.
课时作业
一、选择题
1.某地区为了解居民家庭生活状况,先把居民按所在行业分为几类,然后每个行业抽的居民家庭进行调查,这种抽样是(  )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.分类抽样
2.某地区的高中分三类,A类 ( http: / / www.21cnjy.com )学校共有学生4 000人,B类学校共有学生2 000人,C类学校共有学生3 000人.现欲抽样分析某次考试的情况,若抽取900份试卷进行分析,则从A类学校抽取的试卷份数应为(  )
A.450 B.400 C.300 D.200
3.某中学高一年级有540人,高二年级有44 ( http: / / www.21cnjy.com )0人,高三年级有420人,用分层抽样的方法抽取样本容量为70的样本,则高一、高二、高三三个年级分别抽取(  )
A.28人、24人、18人 B.25人、24人、21人
C.26人、24人、20人 D.27人、22人、21人
4.已知某单位有职工120人,男职工有90人,现采用分层抽样(按男、女分层)抽取一个样本,若已知样本中有27名男职工,则样本容量为(  )
A.30 B.36 C.40 D.无法确定
5.下列数据适合用试验的方法得到的有(  )
A.2008年的全国人口总数
B.某学校抽烟的学生在总人数中所占的比例
C.某班男生的平均身高
D.顾客对某种产品的满意程度
二、填空题
6.做饭时为了知道饭煮熟了没有,从饭煲中舀出一勺饭尝尝,这种试验方法________.(填“合适”或“不合适”)
7.计划从三个街道20 000人中抽取一个 ( http: / / www.21cnjy.com )200人的样本,现已知三个街道人数之比为2∶3∶5,采用分层抽样的方法抽取,则应分别抽取________人.
8.有A,B,C三种零件,分别为a个,300 ( http: / / www.21cnjy.com )个,b个.采用分层抽样法抽取一个容量为45的样本,A种零件被抽取20个,C种零件被抽取10个,则此三种零件共有________个.
三、解答题
9.某校高一年级500名学生中 ( http: / / www.21cnjy.com ),血型为O型的有200人,A型的有125人,B型的有125人,AB型的有50人.为了研究血型与色弱的关系,要从中抽取一个容量为40的样本,应如何抽样?写出AB血型的样本的抽样过程.
10.对某单位1 000名职工进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:
任职年限 人数
5年以下 300
5~10年 500
10年以上 200
试利用上述资料,设计一个抽样比为的抽样方法.
2.1.3 分层抽样
2.1.4 数据的收集
自学导引
1.明显差别 互不重叠 所占比例
2.(1)代表性 (2)各层
3.做试验 查阅资料 设计调查问卷
4.直接
5.因特网上
6.有目的 有顺序 (1)具体、有针对性 (2)简单、准确、含义清楚 (3)引导受调查者答题倾向
对点讲练
例1 B [对于①,总体由高收入家庭、中等收入家庭和低收入家庭差异明显的三部分组成,而所调查的指标与收入情况密切相关,所以应采用分层抽样.
对于②,总体中的个体数较少,而且所调查内容对12名调查对象是平等的,应用简单随机抽样.
对于③,总体中的个体数较多,应用系统抽样.故选B.]
变式迁移1 D
例2 解 因为本题样本总体分成三类:行政人员、教师、后勤人员,符合分层抽样的特点,故选用分层抽样方法.
因为=,
所以从行政人员中抽取16×=2(人),
从教师中抽取112×=14(人),
从后勤人员中抽取32×=4(人).
因为行政人员和后勤人员较少,可将他们分别按1 ( http: / / www.21cnjy.com )~16编号和1~32编号,然后采用抽签法分别抽取2人和4人,对教师从000,001,…,111编号,然后用随机数表法抽取14人.
这样就得到了符合要求的容量为20的样本.
变式迁移2 解 (1)样本容量与总体的个体数的比为=;
(2)确定各种商店要抽取的数目:
大型:20×=2(家),
中型:40×=4(家),
小型:150×=15(家);
(3)采用简单随机抽样在各层中抽取大型:2家;中型:4家;小型:15家;这样便得到了所要抽取的样本.
例3 解 问卷设计如下:
性别________ 年龄________(填“老”“中”“青”“少”)
职业________ (填“行政”“教育”“卫生”“个体”“务农”“其他”)
学历____________ (填“本科以上”“大专”“中专”“初中以下”)
1.今晚您看的电影的名字是________.
2.影片的艺术设计______(填“很好”“较好”“一般”“差”)
3.影片的音乐(歌曲)安排________(填“恰当”“不恰当”)
4.影片的视觉效果______________(填“很好”“较好”“一般”“差”)
5.影片的故事情节____________(填“精彩”“一般”“较差”“很差”)
6.您对影片的总体评价________(填“好”“一般”“差”)
变式迁移3 解 调查问卷设计如下:
姓名________ 所在班级________
为了防止你回答的问题被别人 ( http: / / www.21cnjy.com )知道,请你先从口袋里摸出一个棋子,若摸到的是白棋子,就如实回答问题一;若摸到的是黑棋子,就如实回答问题二,每个问题仅有两个答案:是或否,如你回答的是“是”,请在问卷最后的方框内划“√”;如你回答的是“否”不用做任何标记.
问题一:“你在这次考试中作弊了吗?”
问题二:你的选择题是满分吗?
注意:如你回答的是“是”,你在方框内划“√”.
课时作业
1.C [先将总体分成若干类型,每个类型再按比例抽取,这种抽样是分层抽样.]
2.B [试卷份数应为900×
=400.]
3.D
4.B
5.C
6.合适
7.40,60,100
8.900
9.解 因为40÷500=2/25,所以应用分层抽样法抽取血型为O型的16人;A型的10人;B型的10人;AB型的4人.
AB型的4人可这样抽取:
第一步:将50人随机编号,编号为1,2,…,50;
第二步:把以上50人的编号分别写在一张小纸条上,揉成小球,制成号签;
第三步:把得到的号签放入一个不透明的袋子中,充分搅匀;
第四步:从袋子中逐个抽取四个号签,并记录上面的编号;
第五步:根据对应得到的编号找出要抽取的4人.
10.解 因为抽样比为,
故只需从1 000人中抽取1 000×=100人.
故从5年以下的抽300×=30(人),
5~10年的抽500×=50(人),
10年以上的抽200×=20(人).第二章 章末检测
(时间:120分钟 满分:150分)
一、选择题(本大题共12小题,每小题5分,共60分)
1.某校共有学生2 000名, ( http: / / www.21cnjy.com )各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为(  )
一年级 二年级 三年级
女生 373 x y
男生 377 370 z
A.24 B.48 C.16 D.12
2.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为(  )
分数 5 4 3 2 1
人数 20 10 30 30 10
A. B. C.3 D.
3.为了抽查某城市自行车年检情况,在该城市主干道上采取抽车牌个位数为6的自行车检查,这种抽样方法是(  )
A.简单随机抽样 B.抽签法
C.系统抽样 D.分层抽样
4.某人从湖中打了一网鱼,共有m条,做上记号再放入湖中,数日后在此湖中又打了一网鱼,共有n条,其中k条有记号,则估计湖中有鱼(  )
A.条 B.m·条
C.m·k·条 D.无法估计
5.某同学使用计算器求30个数据的平均数时,错将其中的一个数据105输入为15,那么由此求出的平均数与实际平均数的差是(  )
A.3.5 B.3 C.0.5 D.-3
6.10名工人某天生产同一零件 ( http: / / www.21cnjy.com ),生产的件数分别为15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有(  )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
7.在抽查某产品尺寸过程中,将其尺寸分成若干组,[a,b]是其中一组,已知该组的频率为m,该组上的直方图的高为h,|a-b|等于(  )
A.mh B. C. D.m+h
8.如果a1,a2,a3,a4,a5,a6的 ( http: / / www.21cnjy.com )平均数为3,那么2(a1-3),2(a2-3),2(a3-3),2(a4-3),2(a5-3),2(a6-3)的平均数是(  )
A.0 B.3 C.6 D.12
9.下列命题:①线性回归方法就是由样本点去 ( http: / / www.21cnjy.com )寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线 = x+ 及回归系数 ,可以估计和预测变量的取值和变化趋势.其中正确的命题是(  )
A.①② B.①③ C.②③ D.①②③
10.一般地,家庭用电量 ( http: / / www.21cnjy.com )(千瓦·时)与气温(℃)有一定的关系.图1表示某市某年12个月中每月的平均气温,图2表示某家庭在这年12个月中每月的用电量.根据这些信息,以下关于该家庭用电量与气温间关系的叙述中,正确的是(  )
图1
图2
A.气温最高时,用电量最多
B.气温最低时,用电量最少
C.当气温大于某一值时,用电量随气温增高而增加
D.当气温小于某一值时,用电量随气温降低而增加
11.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的回归方程是(  )
A.=1.23x+4 B.=1.23x+5
C.=1.23x+0.08 D.=0.08x+1.23
12.某人对一个地区人均工资x与该地区人 ( http: / / www.21cnjy.com )均消费y进行统计调查,y与x有相关关系,得到回归直线方程为=0.66x+1.562(单位:百元).若该地区人均消费水平为7.675百元,估计该地区人均消费额占人均工资收入的百分比约为(  )
A.66% B.72.3% C.67.3% D.83%
二、填空题(本大题共4小题,每小题5分,共20分)
13.某单位200名职工的年龄 ( http: / / www.21cnjy.com )分布情况如图,现要从中抽取40名职工作样本,用系统抽样法将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.
14.为了了解学生的体能情况,现 ( http: / / www.21cnjy.com )抽取了某校一个年级的部分学生进行一分钟跳绳测试.将数据整理后,画出频率分布直方图,如图所示.已知图中从左到右三个小组的频率分别为0.1,0.2,0.4,第一小组的频数为5,那么第四小组的频数等于________.
15.已知一个样本1,3,4,a,7,它的平均数是4,则这个样本的标准差是________.
16.已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料:
使用年限x 2 3 4 5 6
维修费用y 2.2 3.8 5.5 6.5 7.0
若y对x呈线性相关关系,则回归直线方程 = x+ 表示的直线一定过定点________.
三、解答题(本大题共6小题,共70分)
17.(10分)某中学高 ( http: / / www.21cnjy.com )一年级有x名学生,高二年级有900名学生,高三年级有y名学生,采用分层抽样抽一个容量为370的样本,高一年级抽取120人,高三年级抽取100人,求全校高中部共有多少学生?
18.(12分)某中学对高一年级学生进行身高统计,测量随机抽取的40名学生的身高,如下表(单位:cm):
分组 频数 频率
[140,145) 1
[145,150) 2
[150,155) 5
[155,160) 9
[160,165) 13
[165,170) 6
[170,175) 3
[175,180) 1
合计 40
(1)完成上面的频率分布表;
(2)根据上表,画出频率分布直方图;
(3)根据图和表,估计数据落在[150,170)范围内的可能性是多少?
19.(12分)某学校对男女学生进行有关“习惯与礼貌”的评分,记录如下:
男:54,70,57,46,90,58,63,46,85,73,55,66,38,44,56,75,35,58,94,52;
女:77,55,69,58,76,70,77,89,51,52,63,63,69,83,83,65,100,74.
(1)请用茎叶图表示上面的数据,并从图中分别比较男、女生得分的平均数、标准差的大小;
(2)分别计算男、女生得分的平均数、标准差,由此你能得出什么结论?
20.(12分)某农场为了从两种不同 ( http: / / www.21cnjy.com )的西红柿品种中选取高产稳定的西红柿品种,分别在5块试验田上试种,每块试验田均为0.5公顷,产量情况如下表所示,问哪一种西红柿既高产又稳产?
品种 产量/千克
1 2 3 4 5
甲 21.5 20.4 22.0 21.2 19.9
乙 21.3 18.9 18.9 21.4 19.8
21.(12分)某公司为了了解一年内用水情况,抽查了10天的用水量如下表:
天数 1 1 1 2 2 1 2
吨数 22 38 40 41 44 50 95
根据表中提供的信息解答下面问题:
(1)这十天中,该公司用水的平均数是多少?
(2)这十天中,该公司每天用水的中位数是多少?
(3)你认为应该使用平均数和中位数中哪一个数来描述该公司每天的用水量?
22.(12分)大气压强与气温之间的关系有如下对应数据:
x(℃) 10 15 20 25 30
y(kPa) 1 003 1 005 1 010 1 011 1 014
(1)画出表中数据的散点图;
(2)如果y与x之间具有线性相关关系,求回归直线方程;
(3)若x=18℃,求;
(4)若=1 000 kPa,求x.
第二章 章末检测
1.C [依题意知二年级的女生有380名,那 ( http: / / www.21cnjy.com )么三年级学生的人数应该是2 000-373-377-380-370=500,即总体中各个年级的人数比例为3∶3∶2,故在分层抽样中应在三年级抽取的学生人数为64×=16.]
2.B [由标准差公式计算可得.]
3.C
4.B
5.D
6.D [c=17,b=15,a=14.7.]
7.C [因为h=.所以|a-b|=.]
8.A
9.D
10.C [由1月与8月的情况知,A ( http: / / www.21cnjy.com ),B两选项不对,对比1月,2月的情况,知D选项不对,故可确定C选项;由7月,8月的情况也可直接确定C选项对.]
11.C [当x=4时,y=1.23×4+0.08=5.]
12.D [令y=7.675,解得x=9.262,
∴百分比约为×100%≈83%.]
13.37 20
解析 由分组可知,抽号的间隔为5,又因为 ( http: / / www.21cnjy.com )第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.
40岁以下的年龄段的职工数为200×0.5=100,则应抽取的人数为×100=20(人).
14.15
15.2
16.(4,5)
解析 回归直线一定过点(,).
∵==4,
==5,
∴回归直线方程 = x+ 一定过定点(4,5).
17.解 由题意得
==,
解得x=720,y=600.
所以高中部共有学生2 220人.
18.解 (1)频率分布表如下:
分组 频数 频率
[140,145) 1 0.025
[145,150) 2 0.05
[150,155) 5 0.125
[155,160) 9 0.225
[160,165) 13 0.325
[165,170) 6 0.15
[170,175) 3 0.075
[175,180) 1 0.025
合计 40 1
(2)频率分布直方图如下图所示:
(3)由(1)知:0.125+0.225+0.325+0.15=0.825,
即落在[150,170)范围内的可能性为0.825.
19.解 (1)用茎叶图表示数据如下:
( http: / / www.21cnjy.com )
从茎叶图可以看出:男生的得分分布主要在茎叶 ( http: / / www.21cnjy.com )图的上方且相对分散;女生的得分分布则相对集中在茎叶图的中部,由此,我们可以估计:男生得分的平均数比女生的小,而标准差比女生的大.
(2)男生得分的平均数、 ( http: / / www.21cnjy.com )标准差分别为60.75,16.0,女生得分的平均数、标准差分别为70.8,12.7.由此可以得出:女生关于“习惯与礼貌”的得分相对较高且比较稳定.
20.解 甲=×(21.5+20.4+22.0+21.2+19.9)
=21.0,
乙=×(21.3+18.9+18.9+21.4+19.8)
=20.06,
s甲=
≈0.756,
s乙=
≈1.104.
因为甲>乙,s甲21.解 (1)=
=51(吨).
(2)中位数为=42.5(吨).
(3)用中位数42.5吨来描述该公司的每天用水量.
22.解 (1)散点图如图所示.
由散点图可知y与x具有线性正相关关系.
(2) ==0.56, =- =997.4,
故=997.4+0.56x.
(3)x=18℃时,=1 007.48 kPa.
(4)当=1 000 kPa时,x≈4.64℃.§2.2 用样本估计总体
2.2.1 用样本的频率分布估计 总体的分布
自主学习
学习目标
1.通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.
2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体的分布,初步体会样本频率分布的随机性.
自学导引
1.极差的概念
极差是一组数据的________________的差,它反映了一组数据____________,极差又叫________.
2.频数、频率的概念
将一批数据按要求分为若干组,对落在各个 ( http: / / www.21cnjy.com )小组内数据的________进行累计,这个累计数叫做各个小组的______,各个小组的______除以________,即得该小组的______.
3.频率分布直方图
在频率分布直方图中,纵轴表示________________,各小长方形的面积等于________________,所有长方形面积之和等于________.
4.频率分布折线图
连接频率分布直方图中各个小长方形的____________,就得到频率分布折线图.
5.总体密度曲线
如果样本容量越大,所分组数越多,频率分布直方 ( http: / / www.21cnjy.com )图中表示的频率分布就越接近总体在各个小组内所取值的________________的大小;当样本容量不断增大,分组的组距不断缩小时,频率分布直方图实际上越来越接近于____________,它可以用一条____________来描绘,这条光滑曲线就叫做________________.
6.茎叶图
用茎叶图表示数据的两个优点在于:一是从 ( http: / / www.21cnjy.com )茎叶图上没有____________的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时____________,方便记录与表示.
对点讲练
知识点一 画频率分布直方图、频率分布折线图
例1 某中学同年级40名男生的体重数据如下(单位:千克):
61 60 59 59 59 58 58 57 57 57 57
56 56 56 56 56 56 56 55 55 55 55
54 54 54 54 53 53 52 52 52 52 52
51 51 51 50 50 49 48
列出样本的频率分布表,画出频率分布直方图,画出频率分布折线图.
变式迁移1 有一容量为200的样本,数据的分组以及各组的频数如下:
[-20,-15),7; ( http: / / www.21cnjy.com )[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20),17.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)求样本数据不足0的频率.
知识点二 用样本的频率分布估计总体分布
例2 对某电子元件进行寿命追踪调查,情况如下:
寿命(h) 100~200 200~300 300~400 400~500 500~600
个数 20 30 80 40 30
(1)列出频率分布表;
(2)画出频率分布直方图及折线图;
(3)估计电子元件寿命在400 h以上的概率.
变式迁移2 为了解小学生的体能情况,抽 ( http: / / www.21cnjy.com )取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.
(1)求第四小组的频率;
(2)问参加这次测试的学生人数是多少?
(3)问在这次测试中,学生跳绳次数的中位数落在第几小组内?
例3 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:
甲的得分 12,15,24,25,31,31,36,36,37,39,44,49,50;
乙的得分 8,13,14,16,23,26,28,33,38,39,51.
(1)画出甲、乙两名运动员得分数据的茎叶图;
(2)根据茎叶图分析甲、乙两运动员的水平.
变式迁移3 在某电脑杂志的一篇文章中,每个句子所含的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17;
在某报纸的一篇文章中,每个句子所含的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,得到什么结论?
几种表示频率分布的方法的优点与不足
(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.
(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.
(3)频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体密度曲线.
(4)用茎叶图刻画数据有两个 ( http: / / www.21cnjy.com )优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.
课时作业
一、选择题
1.关于频率分布直方图中的有关数据,下列说法正确的是(  )
A.小矩形的高表示取某数的频率
B.小矩形的高表示该组上的个体在样本中出现的频率
C.小矩形的高表示该组上的个体数与组距的比值
D.小矩形的高表示该组上个体在样本中出现的频率与组距的比值
2.关于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是(  )
A.频率分布直方图与总体密度曲线无关
B.频率分布直方图就是总体密度曲线
C.样本容量很大的频率分布直方图就是总体密度曲线
D.如果样本容量无限增大,分组的组距无限减小,那么相应的频率分布折线图会越来越接近一条光滑曲线,则这条光滑曲线为总体密度曲线
3.已知10个数据如下: ( http: / / www.21cnjy.com )63,65,67,69,66,64,66,64,65,68.如果对这些数据绘制频率分布表,那么其中在64.5~66.5这组的频率是(  )
A.0.4 B.0.5 C.5 D.4
4.一个容量为20的样本数据,分组后组距与频数如下表:
组距 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70)
频数 2 3 4 5 4 2
则样本在[10,50)上的频率为(  )
A.0.5 B.0.24 C.0.6 D.0.7
二、填空题
5.在求频率分布时,把数 ( http: / / www.21cnjy.com )据分为5组,若已知其中的前四组频率分别为0.1,0.3,0.3,0.1,则第五组的频率是______,这五组的频数之比为________.
6.在样本的频率分布直方图中,共有5个小长方 ( http: / / www.21cnjy.com )形,已知中间一个小长方形面积是其余4个小长方形面积之和的,且中间一组的频数为10,则这个样本容量是________.
三、解答题
7.在学校开展的综合实践活动中,某班进 ( http: / / www.21cnjy.com )行了小制作评比,作品上交时间为6月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数量最多?有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?
8.有关部门从甲,乙两个城市所有的自动售货机中分别随机抽取了16台,记录下一上午各自的销售情况如下:(单位:元)
甲 18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41
乙 22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23
(1)请画出这两组数据的茎叶图.
(2)将这两组数据进行比较分析,你能得到什么结论?
§2.2 用样本估计总体
2.2.1 用样本的频率分布估计
总体的分布
自学导引
1.最大值与最小值 变化的幅度 全距
2.个数 频数 频数 样本容量 频率
3.频率与组距的比值 相应各组的频率 1
4.上边的中点
5.个数与总数比值 总体的分布 光滑曲线y=f(x) 总体密度曲线
6.原始信息 随时记录
对点讲练
例1 解 (1)计算:61-48=13;
(2)决定组距与组数,取组距为2,
∵=6,∴共分7组;
(3)决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下7组:
47.5~49.5,49.5~51.5,51.5~53.5,53.5~55.5,
55.5~57.5,57.5~59.5,59.5~61.5.
(4)列出频率分布表如下:
分组 频数累计 频数 频率
47.5~49.5 2 0.05
49.5~51.5 5 0.125
51.5~53.5 7 0.175
53.5~55.5 8 0.20
55.5~57.5 11 0.275
57.5~59.5 5 0.125
59.5~61.5 2 0.05
合计 40 40 1.00
(5)作出频率分布直方图如下:
(6)取各小长方形上边的中点并用线段连接就构成了频率分布折线图.
变式迁移1 解 (1)频率分布表如下:
分组 频数 频率
[-20,-15) 7 0.035
[-15,-10) 11 0.055
[-10,-5) 15 0.075
[-5,0) 40 0.200
[0,5) 49 0.245
[5,10) 41 0.205
[10,15) 20 0.100
[15,20) 17 0.085
合计 200
(2)频率分布直方图如图所示:
(3)样本数据不足0的频率为=0.365.
例2 解 (1)频率分布表如下:
寿命(h) 频数 频率
100~200 20 0.10
200~300 30 0.15
300~400 80 0.40
400~500 40 0.20
500~600 30 0.15
合计 200 1.00
(2)频率分布直方图及折线图如下图.
(3)由频率分布表可知,寿命在400 h以上 ( http: / / www.21cnjy.com )的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的频率为0.35.
变式迁移2 解 (1)第四小组的频率为1-(0.1+0.3+0.4)=0.2.
(2)n=第一小组的频数÷第一小组的频率=5÷0.1=50.
(3)由0.1×50=5, ( http: / / www.21cnjy.com )0.3×50=15,0.4×50=20,0.2×50=10,得第一、第二、第三、第四小组的频数分别为5,15,20,10.
所以学生跳绳次数的中位数落在第三小组内.
例3 解 (1)作出茎叶图如下图:
(2)由上面的茎叶图可以看 ( http: / / www.21cnjy.com )出,甲运动员的得分情况是大致对称的,中位数是36分;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26分.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.
变式迁移3 解 (1)茎叶图如图所示:
(2)电脑杂志上每个句子的字数集中在10~3 ( http: / / www.21cnjy.com )0之间,报纸上每个句子的字数集中在20~40之间,说明电脑杂志上每个句子的平均字数要比报纸上每个句子的平均字数要少.
课时作业
1.D
2.D
3.A [∵在这组中的数只有4个,
∴频率==0.4.]
4.D
5.0.2 1∶3∶3∶1∶2
6.40
解析 可知中间长方形的面积是所有长方形面积的,即频率为,∴样本容量为=40.
7.解 (1)依题意知第三组的频率为
=,
又∵第三组的频数为12,
∴本次活动的参评作品数为=60(件).
(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×=18(件)
(3)第四组的获奖率是=,
第六组上交的作品数量为
60×=3(件)
∴第六组的获奖率为=,
显然第六组的获奖率较高.
8.解 (1)茎叶图如图所示.
(2)由图可以看出乙城市的销售额分布较对称,集中程度较高,故乙城市一上午的销售情况比较稳定且销售额较高.第二章 统 计
§2.1 随机抽样
2.1.1 简单随机抽样
自主学习
学习目标
1.理解并掌握简单随机抽样的概念、特点和步骤.
2.掌握简单随机抽样的两种方法.
自学导引
1.总体与个体
一般把所考察对象的某一数值指标的____ ( http: / / www.21cnjy.com )____________看作总体,构成总体的____________作为个体,从总体中抽出若干个体所组成的集合叫做________.
2.随机抽样
在抽样时要保证每一个个体都____________,每一个个体被抽到的机会是________,满足这样的条件的抽样是随机抽样.
3.简单随机抽样
一般地,从元素个数为N的总体中____________抽取容量为n的样本,如果每一次抽取时总体中的各个个体有________的可能性被抽到,这种抽样方法叫做简单随机抽样,这样抽取的样本叫做________________.
4.常用的简单随机抽样方法有________和____________.
对点讲练
知识点一 简单随机抽样的概念
例1 下列抽取样本的方法是简单随机抽样吗?为什么?
(1)从无限多个个体中抽取50个个体作为样本.
(2)箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检验后再把它放回箱子里.
(3)从50个个体中一次性抽取5个个体作为样本.
点评 判定的依据是简单随机抽样的四个特点. ( http: / / www.21cnjy.com )“一次性”抽取和“逐个”抽取形式不同,但是不影响个体被抽到的可能性.而“一次性”抽取不符合简单随机抽样的定义,因而(3)不是简单随机抽样.
变式迁移1 下面的抽样方法是简单随机抽样吗?为什么?
(1)某班有40名同学,指定个子最高的5名同学参加校篮球赛;
(2)一儿童从玩具箱中的20件玩具中随意拿出一件来玩,玩后放回再拿出一件,连续玩了5件;
(3)从一批2 000个灯泡中逐个抽取20个进行质量检查.
知识点二 抽签法的应用
例2 某单位支援西部开发,现从报名的18名志愿者中选取6名组成志愿小组到西藏工作3年.请用抽签法设计抽样方案.
点评 抽签法注意:一是编号;二是搅拌均匀;三是依次抽取.
变式迁移2 从20名学生中抽取5名进行问卷调查,写出抽取样本的过程.
知识点三 随机数表法的应用
例3 设某校共有100名教师,为了支援西部教育事业,现要从中随机抽出12名教师组成暑期西部讲师团,请写出利用随机数表法抽取该样本的步骤.
点评 利用随机数表法抽取个 ( http: / / www.21cnjy.com )体时,关键是事先确定以表中的哪个数(哪行哪列)作为起点,以及读数的方向,向左、向右、向上或向下都可以,同时,读数时结合编号特点进行读取,编号为两位,则两位、两位地读取,编号为三位数,则三位、三位地读取,如果出现重号则跳过,接着读取.
变式迁移3 要从某汽车厂生产的3 000辆汽车中随机抽取10辆进行测试.请选择合适的抽样方法,并写出抽样过程.
抽签法与随机数表法的相同点与不同点
相同点:(1)抽签法和随机数表法都是简 ( http: / / www.21cnjy.com )单随机抽样的方法,并且要求被抽取样本的总体的个体数有限;(2)抽签法和随机数表法都是从总体中逐个地进行抽取,都是不放回抽样.
不同点:(1)抽签法相对于随机数表 ( http: / / www.21cnjy.com )法简单,随机数表法较抽签法稍麻烦一点;(2)随机数表法更适用于总体中的个体数较多的时候,而抽签法适用于总体中的个体数相对较少的情况,所以当总体中的个体数较多时,应当选用随机数表法,这样可以节约大量的人力和制作号签的成本与精力.
课时作业
一、选择题
1.我校期中考试后,为了分析高一年 ( http: / / www.21cnjy.com )级1 220名学生的学习成绩,从中随机抽取了50名学生的成绩单,就这个问题来说,下面说法中正确的是(  )
A.1 220名学生是总体
B.每个学生是个体
C.50名学生是所抽取的一个样本
D.样本容量是50
2.在简单随机抽样中,某个个体被抽中的可能性是(  )
A.与第几次抽样有关,第1次抽中的可能性要大些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽中的可能性大些
D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不一样
3.下列调查中属于抽样调查的是(  )
①每隔10年进行一次人口普查
②某商品的质量优劣
③某报社对某个事情进行舆论调查
④高考考生的查体
A.②③ B.①④ C.③④ D.①②
4.下列抽样实验中,用抽签法方便的是(  )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从某厂生产的3 000件产品中抽取10件进行质量检验
D.从甲乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
5.用随机数表进行抽样有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定开始的数字.这些步骤的先后顺序应为(  )
A.①②③ B.①③② C.③②① D.③①②
二、填空题
6.福利彩票的中奖号码是从1~36中选出7个号码来按规则确定中奖情况,这种从36个中选出7个号码的抽样方法是________.
7.从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N为________.
8.我班有50名学生,学号从01到50,数学 ( http: / / www.21cnjy.com )老师在上统计课时,运用随机数表法选取5名学生提问.老师首先选定随机数表中的第21行第29个数2开始提问,然后向右走,到头后从下一行返回,即下一行是从左向右,再下一行从右开始,如果不在50以内则跳过去,那么被提问的5名学生是________________.
附:随机数表的第21行第21个数开始到第22行的第10个数
…44 22 78 84 26 04 33 46 09 52
68 07 97 06 57 74 57 25 65 76…
三、解答题
9.现要在20名学生中抽取5名进行问卷调查,试写出抽取样本的过程.
10.某个车间工人已加工一种轴100件,为了了解这种轴的直径,要从中抽出10件在同一条件下测量,如何采用简单随机抽样的方法抽取上述样本?
第二章 统 计
§2.1 随机抽样
2.1.1 简单随机抽样
自学导引
1.全体构成的集合 每一个元素 样本
2.可能被抽到 均等的
3.不放回地 相同 简单随机样本
4.抽签法 随机数表法
对点讲练
例1 解 (1)不是简单随机抽样,因为被抽取的样本的总体的个数是无限的而不是有限的.
(2)不是简单随机抽样,因为它是有放回地抽样.
(3)不是简单随机抽样,因为它是一次性抽取,而不是“逐个”抽取.
变式迁移1 解 (1)不是简单随机抽样,因为这不是等可能抽样;
(2)不是简单随机抽样,因为它是有放回抽样;
(3)满足简单随机抽样的四个特点,故是简单随机抽样.
例2 解 按抽签法的一般步骤进行设计.
第一步:将18名志愿者编号,号码为1,2,…,18;
第二步:将号码分别写在一张纸条上,揉成团,制成号签;
第三步:将所有号签放入一个箱子中,充分搅匀;
第四步:依次取出6个号码,并记录其编号;
第五步:将对应编号的志愿小组成员选出.
变式迁移2 解 (1)先将20名学生进行编号,从1编到20;
(2)把号码写在形状、大小均相同的号签上;
(3)将号签放在某个箱子中进行充分搅拌,然后依次从箱子中取出5个号签,按这5个号签上的号码对应学生,即得样本.
例3 解 其步骤如下:
第一步:将100名教师进行编号:00,01,02,…,99.
第二步:给出的随机数表中是 ( http: / / www.21cnjy.com )5个数一组,使用各个5位数组的前2位,从各数组中任选一个前2位小于或等于99的数作为起始号码、例如从第1行的第3组数开始.
第三步:依次向右读可以得到40,48,60,16,29,61,43,27,26,84,78,39.
第四步:以上号码对应的12名教师就是要抽取的对象.
变式迁移3 解 第一步:将3 000辆汽车编号,号码是0000,0001,…,2999;
第二步:给出的随机数表中 ( http: / / www.21cnjy.com )是5个数一组,使用各个5位数组中的前4位,从各数组中任选一个前4位小于或等于2999的数作为起始号码,例如从第二行的第4组数开始;
第三步:依次向右读,可以得到2691,2778,2037,2104,1290,2881,1212,2298,1321,2624.
课时作业
1.D [总体、个体、样本都是学生的成绩,样本容量为50.]
2.B [简单随机抽样每个个体被抽取的可能性相等.]
3.A
4.B
5.B
6.抽签法
7.120
解析 ∵=0.25,∴N=120.
8.26 04 33 46 09
解析 用随机数法进行抽样,关键是弄清所选定的起始数码和读数的方向,还要弄清编号的位数与随机数表的构成.
9.解 (1)先将20名学生进行编号,编号为1,2,…,20;
(2)把号码写在形状、大小均相同的号签上;
(3)将号签放在某个箱子中充分搅拌,使之均匀,然后依次从箱子中抽取5个号签,于是和这5个号签上的号码对应的5名学生就构成了一个样本.
10.解 有两种方法:
方法一 (抽签法)将100个轴进行编号 ( http: / / www.21cnjy.com )1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,可将这些号签放在一起,并进行均匀搅拌,接着依次抽取10个号签,然后测量这10个号签对应的轴的直径.
方法二 (随机数表法)将100个轴进行 ( http: / / www.21cnjy.com )编号00,01,…,99,据课本上的随机数表,如取第6行第2组数开始选取10个,13,57,74,32,98,55,42,59,66,36,然后测量这10个编号对应的轴的直径.第二章 统 计
§2.1 随机抽样
【入门向导】
2008年8月8日举世瞩目的北京奥运会开幕了!
新华网北京8月10日电,国际奥委会新闻发言人吉赛尔·戴维斯今天说,8亿4千万中国电视观众收看了北京奥运会开幕式,这个收视率令人惊讶.
据CMS媒介研究所9日发布的数据,北 ( http: / / www.21cnjy.com )京奥运会开幕式收视观众规模占到全国电视总人口的68.8%,本届奥运会开幕式收视率创下了自国内有收视率调查以来的新纪录,在李宁环绕鸟巢飞奔点火的这一刻,收视份额攀上90%.
另据AGB尼尔森的统计显示,超过9成中国家庭收看了奥运会开幕式电视直播,其中天津观众收看比例为97%,达到全国最高.
同学们有没有考虑过收视率是如何统计出来的呢?可行的方法之一是抽取一部分地区进行收视率调查.如何抽取呢?
1.普查在实际应用中是不合适的
一般地,如果检验对于个体具有破坏性 ( http: / / www.21cnjy.com ),则需要通过抽样来推断总体的特性.有很多检验具有破坏性,如对产品的寿命、合格率等问题的检查.因此,我们需要通过随机抽样抽取样本来估计总体.
2.抽样时不能使用方便样本
方便样本的代表性差,基于这种样本得出的结论与事实不符的可能性大大增加.
3.随机抽样时,每个个体被抽到的机会都相等
在判断一锅汤的味道时,如果汤被充分搅拌 ( http: / / www.21cnjy.com )了,我们只需品尝一勺就可以了.同样,样本数据也要来自“搅拌均匀”的总体.在简单随机抽样的定义中,“总体内的各个个体被抽到的机会都相等”是“总体中的所有个体搅拌均匀”的统计描述.
例1 (1)为了了解某地参加计算 ( http: / / www.21cnjy.com )机水平测试的5 000名学生的成绩,从中抽取了200名学生的成绩进行统计分析.在这个问题中,5 000名学生成绩的全体是(  )
A.总体
B.个体
C.从总体中抽取的一个样本
D.样本的容量
解析 5 000名学生的成绩是我们所考查对象的全体,叫总体.
答案 A
(2)关于简单随机抽样的特点,有以下几种说法,其中不正确的是(  )
A.要求总体的个数有限
B.从总体中逐个抽取
C.它是一种不放回抽样
D.每个个体被抽到的机会不一样,与先后顺序有关
解析 随机抽样最重要的特点就是每个个体被抽到的机会都相等,与先后顺序无关.
答案 D
我们知道,三种抽样方法的 ( http: / / www.21cnjy.com )共同点是在抽样过程中每个个体被抽到的机会相等且都为不放回抽样.但是,在什么情况下使用简单随机抽样、系统抽样和分层抽样呢?三种方法中哪一种更好?下面就让我们通过对系统抽样与分层抽样的详细分析,感悟一下它们三者之间的联系与区别.
1.系统抽样
系统抽样适合总体中个体数较多,且个体之间 ( http: / / www.21cnjy.com )无明显差异的情况,其特点是等距抽取.当(N为总体中个体数目,n为样本容量)不是整数时,需先从总体中随机剔除多余的个体.在剔除多余的个体以及完成分段后,确定第一个个体编号时,使用的是简单随机抽样.
例2 某单位共有职工823人,为了调查工人上班时,从家到单位的平均所用时间,决定抽取10%的工人调查这一情况,问如何完成这一抽样?
思路分析 由于总体的人数较多,且不考虑个体差异,因此需采用系统抽样法.
解 (1)先将工人随机编号为000,001,…,822;
(2)用随机数表法,从编号000 ( http: / / www.21cnjy.com )~822中剔除3人,再把编号按顺序补齐为000,001,…,819,从而确定分段间隔为=10,分成82段,每段10人;
(3)在第一段000,001,… ( http: / / www.21cnjy.com ),009中随机确定一起始号k0(可以用抽签法),则编号k0,k0+10,…,k0+810对应的职工为所取得的一个样本.
注 使用系统抽样进行编号时,也可利用学生证号,座位号等.
感悟 (1)体会区别:简 ( http: / / www.21cnjy.com )单随机抽样和系统抽样的共同特点是总体中的个体差异较小,此题从这一个角度看,两种方法都适合.但是,由于抽取的样本容量较大,为了减少工作量,采用系统抽样法较为简捷.
(2)分析联系:简单随机抽样法 ( http: / / www.21cnjy.com )是系统抽样的基础.此题在剔除个体时,由于总体个数较多,因此使用随机数法剔除多余的个体;分段后的第一段个体数较少,因此可使用抽签法.
2.分层抽样
当总体中的个体差异较大时,一般 ( http: / / www.21cnjy.com )采用分层抽样法.抽样过程中,每层中所抽取的个体数可按各层在总体中所占比例抽取;在各层独立抽取时,可使用简单随机抽样或系统抽样法.
例3 某单位共有职工162人,其中 ( http: / / www.21cnjy.com )老年人27人,中年人54人,青年人81人,为了调查他们的身体状况,需要从他们中抽取一个容量为36的样本,问应当采用怎样的抽样方法?应从老年人、中年人、青年人中分别抽取多少人?
思路分析 从实际问题思考,老年人、中年人、青年人的身体状况有着较大的差异,因此应采用分层抽样法.
解 由于各部分之间的个体有较大的差别,所 ( http: / / www.21cnjy.com )以应采用分层抽样.因为27∶54∶81=1∶2∶3,设从老年人、中年人、青年人中各抽取个体数分别为x,2x,3x.则由6x=36得x=6,故应从老年人、中年人、青年人中分别抽取6人,12人,18人.
注 也可以按各部分所占总体的比进行计算,即×36=6,×36=12,×36=18.
感悟 (1)体会区别:分层抽样适 ( http: / / www.21cnjy.com )合总体中个体差异较大的情况,而系统抽样适合总体中的个体数较多的情况;另一方面分层抽样是按比例抽取,而系统抽样是等距抽取.
(2)分析联系:在分层抽样中,当每一层中个体数目较大时,可使用系统抽样,若数目较小时,使用简单随机抽样法抽取即可.
1.围绕抽样方法的概念设置的陷阱
例1 盒子中共有80个零件,从中任意拿 ( http: / / www.21cnjy.com )出一个进行质量检验,然后把它放回盒子,再次从中拿出一个进行质量检验,然后再把它放回盒子……,照此方法,依次抽取5个进行质量检验.这种抽样方法是否属于简单随机抽样?说明理由.
错解 是简单随机抽样,实质上就是从有限的80个零件中任意选出了5个进行质量检验.
( http: / / www.21cnjy.com )
正解 不是简单随机抽样,因为简单随机抽样是不放回抽样.
2.围绕“分层抽样”与“系统抽样”的选择设置的陷阱
例2 某乡镇有12个行政村,共30 00 ( http: / / www.21cnjy.com )0人,现从中抽出300人进行样本分析,考察其人口中癌症的发病率,应该采取哪种抽样方法?简述抽样过程.
错解 由于总体的个体相对较多 ( http: / / www.21cnjy.com ),因此可采用系统抽样法.过程如下:①用随机方式将总体中的个体编号00001,00002,…,30000;②把总体分成300段,每段100人;③在第一段中用简单随机抽样确定起始个体编号i;④将i,i+100,i+200,…,i+29 900分别抽出,从而获得整个样本.
( http: / / www.21cnjy.com )
正解 一般情况下,每个村 ( http: / / www.21cnjy.com )村民的健康状况是有差异的,各村的人口数量又有差别,所以应采用分层抽样.具体实施过程是:将30 000人按12个村分成12层,然后从每村的人口中抽取该村人口的,然后把各村抽到的人合起来,就得到了一个容量为300的样本.
3.围绕系统抽样“均分”原理设置的陷阱
例3 要从某学校的10 013名学生中抽取100名进行健康检验,采用哪种抽样方法较好?写出抽样过程.
错解 由于总体个数为10 013,数量较 ( http: / / www.21cnjy.com )大,而且都是学生,差别不大,因而应采用系统抽样法.具体过程如下:由系统抽样的步骤先分为100段,其中前87段每段100人,后13段每段101人,再在第一段中用简单随机抽样确定起始个体编号i;最后将i+100,i+200,…,i+9 900分别抽出,从而获得整个样本.
( http: / / www.21cnjy.com )
正解 先用简单随机抽样从总体中剔除学生 ( http: / / www.21cnjy.com )13人,再按如下步骤操作:①采用随机的方式将总体中的个体编号00001,00002,…,10000;②把整个的总体分成100段,每段=100人;③在第一段中用简单随机抽样确定起始个体编号i;④将i,i+100,i+200,…,i+9 900分别抽出,从而获得整个样本.
当今时代已进入数字时代,各种各样的统计 ( http: / / www.21cnjy.com )数字和图表充斥着媒体.由于数字给人的印象具体直观,所以大到中央机关小到日常生活中的广告,都喜欢让数据说明问题.比如我们日常接触的广告“现代研究证明,99%以上的人感染有螨虫……”,这里99%是怎么得到的?研究共检测了多少人?这些人是如何挑选的?收集数据的常用方法是随机抽样,随机抽样的本质就是研究如何从总体中抽取样本,使所抽取的样本能够更充分地反映总体的情况.若样本抽取不当,将直接影响到对总体估计的准确性.随机抽样时应注意把握以下四个方面.
1.样本的抽取要有普遍性和代表性
样本的抽取要具有普遍性和代表性, ( http: / / www.21cnjy.com )避免盲目性和随意性,比如要调查某种产品的使用情况,不能盲目地去人多的地方调查,因为不可能所有的人都使用过这种产品,应针对使用这种产品的顾客做调查.
2.随机抽样不能带有主观性
随机抽样要注意确保总体中每个个体被抽取的可能性相等,不能带有主观性,不能带有感彩,不能有意或无意地选择要抽取这一个或不抽取那一个.
3.应注意周围环境因素的影响
随机抽样时,不同的时间和不 ( http: / / www.21cnjy.com )同的环境都会对所抽取的样本产生影响.比如要考察某一路段的车速,在半夜或凌晨期间,由于车辆少、行人稀,车速一般较快;而在上班或下班时间,车速自然就慢.再比如,要调查老年人的健康状况,选定在医院或选定在公园都是不合理的,因为医院里的老人大多数都是身体不太健康的,而公园里的老人大多数都是比较健康的.
4.要注意选择合适的抽样方法
随机抽样时,要特别注意根据实际情况选择合适的抽样方法.
类别 共同点 各自特点 相互联系 适用范围
简单随机抽样 抽样过程中每个个体被抽取的机会相等 从总体中逐个抽取 总体中的个体数较少
系统抽样 将总体均分成几部分,按事先确定的规则在各部分抽取 在起始部分抽样时采用简单随机抽样 总体中的个体数较多
分层抽样 将总体分成几层,分层进行抽取 在各层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成
简单随机抽样、系统抽样和分层抽样关系密切,对抽取样本来说,可谓异曲同工.
无论采取哪一种抽样方法,必须保证在整个抽样过程中每个个体被抽到的机会相等.
例 根据下列情况选择合适的抽样方法:
(1)30台电视机,其中甲厂生产的有21台,乙厂生产的有9台,抽取10台入样;
(2)从甲厂生产的300台电视机中,抽取10台入样;
(3)从甲厂生产的300台电视机中,抽取100台入样.
分析 应用三种抽样方法时需搞清楚它们的使用原则:
(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法;
(2)当总体容量较大,样本容量较小时,可用随机数表法;
(3)当总体容量较大,样本容量也较大时,可用系统抽样法.
解 (1)总体由两类差异明显的个体组成,所以应采用分层抽样,又因为每层中样本容量较小,在每层中可采用抽签法.
(2)总体容量较大,样本容量较小,可用随机数表法;
(3)总体容量较大,样本容量也较大,可用系统抽样法.
为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:
学生A:我把这个用水量调查表放在互 ( http: / / www.21cnjy.com )联网上,只要登录该网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.
学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.
学生C:我在小区的电话号码本 ( http: / / www.21cnjy.com )上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.
我们对上述3种方案进行分析,看哪个方案更实用有效:
学生A的方法得到的样本不能够反映不上网 ( http: / / www.21cnjy.com )的居民情况,是一种方便样本,所得的结果代表性差,不能很准确地获得平均每户居民的月用水量;学生B的方法实际上是普查,花费的人力物力要多一些,但是如果统计过程不出错,可以准确地得到平均每户居民的月用水量;在小区的每户居民都装有电话的情况下,学生C的方法是一种随机抽样方法,所得的样本具有代表性,可以比较准确地获得平均每户居民的月用水量.
在小区的每户居民都装有电话的情况下,建议用随机抽样的方法获取数据,即用学生C的方法,以节省人力物力,并且可以得到比较精确的结果.
1.(日照模拟)某地区有300家商店,其中 ( http: / / www.21cnjy.com )大型商店有30家,中型商店有75家,小型商店有195家,为了掌握各商店的营业情况,要从中抽取一个容量为20的样本.若采用分层抽样的方法,抽取的中型商店数是(  )
A.2 B.3
C.5 D.13
解析 设抽取的中型商店数为x,依据分层抽样的原理,有=,解得x=5.
答案 C
2.(阜新模拟)一个总体 ( http: / / www.21cnjy.com )中共有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样的方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是________.
解析 根据题意,第七组中的号码是[60,69]内的正整数.因为m=6,k=7,m+k=13,所抽取的号码个位数为3,于是此号码为63.
答案 63
3.(2008·重庆)某校高三年级有男生50 ( http: / / www.21cnjy.com )0人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是__________________.
解析 由分层抽样的定义可知,该抽样为按比例的抽样.
答案 分层抽样法
4.(2008·湖北)一个公司 ( http: / / www.21cnjy.com )共有1 000名员工,下设一些部门,要采用分层抽样方式从全体员工中抽取一个容量为50的样本,已知某部门有200名员工,那么从该部门抽取的员工人数是____.
解析 从该部门抽取的员工人数是×200=10.
答案 10
5.(2009·天津)某学院的A,B,C ( http: / / www.21cnjy.com )三个专业共有1 200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本、已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取________名学生.
解析 C专业有学生1 200-380-420=400(名),
则C专业应抽取的学生数为×120=40(名).
答案 40章末复习课
知识概览
对点讲练
知识点一 三种抽样方法的选择
例1 选择合适的抽样方法抽样,写出抽样过程.
(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个.
(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个.
(3)有甲厂生产的300个篮球,抽取10个.
(4)有甲厂生产的300个篮球,抽取30个.
点评 弄清三种抽样方法的实质 ( http: / / www.21cnjy.com )和适用范围,是灵活选用抽样方法的前提和基础.若用分层抽样,应先确定各层的抽取个数,然后在各层中用系统抽样或简单随机抽样进行抽取.
变式迁移1 某商场有四类 ( http: / / www.21cnjy.com )食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是(  )
A.4 B.5 C.6 D.7
知识点二 用样本估计总体
例2 有1个容量为100的样本,数据的分组及各组的频数如下:
[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;
[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5),8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计小于30的数据约占多大百分比.
点评 频率分布直方图可直观看出在各个区间内机会的差异,可对总体情况作出估计.
变式迁移2 为了了解某校高三学生的视力情 ( http: / / www.21cnjy.com )况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图,如下图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为(  )
A.0.27,78 B.0.27,83 C.2.7,78 D.2.7,83
例3 甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2):
品种 第1年 第2年 第3年 第4年 第5年
甲 9.8 9.9 10.1 10 10.2
乙 9.4 10.3 10.8 9.7 9.8
其中产量比较稳定的小麦品种是________.
变式迁移3 随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.
(1)根据茎叶图判断哪个班的平均身高较高;
(2)计算甲班的样本方差.
知识点三 回归直线方程及应用
例4 在7块并排、形状大小相同的实验田上进行施化肥量对水稻产量影响的试验,得数据列表(单位:kg):
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
(1)画出散点图;
(2)求水稻产量y与施化肥量x之间的回归直线方程;
(3)当施化肥50 kg时,对水稻的产量予以估计.
点评 (1)回归分析是寻找相关关系中 ( http: / / www.21cnjy.com )非确定性关系的某种确定性;(2)求回归直线方程,关键在于正确地求出系数 , ,由于 , 的计算量大,计算时要仔细,避免计算失误.
变式迁移4 某个服装店经营某种服装,在某周内获纯利y(元)与该周每天销售这种服装件数x之间的一组数据关系见下表:
x 3 4 5 6 7 8 9
y 66 69 73 81 89 90 91
已知:x=280,y=45 309,xiyi=3 487,且y与x有线性相关关系.
(1)求,;
(2)求纯利y与每天销售件数x之间的回归直线方程.
课时作业
一、选择题
1.某质检人员从编号为1~1 ( http: / / www.21cnjy.com )00这100件产品中,依次抽出号码为3,7,13,17,23,27,…,93,97的产品进行检验,则这样的抽样方法是(  )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.以上都不对
2.下列说法:①一组数据不可能有两个众数;② ( http: / / www.21cnjy.com )一组数据的方差不可能是负数;③将一组数据中的每一个数据都加上或减去同一常数后,方差恒不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率,其中错误的个数有(  )
A.0 B.1 C.2 D.3
3.现有60瓶牛奶制品,编号从1至60,若从中抽取6瓶进行检验,用系统抽样方法确定所抽的编号为(  )
A.3,13,23,33,43,53 B.2,14,26,38,42,56
C.5,8,31,36,48,54 D.5,10,15,20,25,30
4.数学老师对某同学在参加高考前的5次数学 ( http: / / www.21cnjy.com )模拟考试成绩进行统计分析,判断该同学的数学成绩是否稳定,于是老师需要知道该同学这5次成绩的(  )
A.平均数或中位数 B.方差或标准差
C.众数或频率 D.频数或众数
5.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程为 = x+ ,那么下列说法不正确的是(  )
A.直线 = x+ 必经过点(,)
B.直线 = x+ 至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
C.直线 = x+ 的斜率为
D.直线 = x+ 和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差[yi-(bxi+a)]2是该坐标平面上所有直线与这些点的偏差中最小的
二、填空题
6.某校有教师200人,男 ( http: / / www.21cnjy.com )学生1 200人,女学生1 000人,现用分层抽样的方法从所有师生中抽取一个容量为n的样本,已知从女学生中抽取的人数为80人,则n的值为________.
7.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图所示,则平均分数较高的是________,成绩较为稳定的是________.
8.某中学期中考试后,对成绩进行分析,从某班中选出5名学生的总成绩和外语成绩如下表:
学生学科 1 2 3 4 5
总成绩(x) 482 383 421 364 362
外语成绩(y) 78 65 71 64 61
则外语成绩对总成绩的回归直线方程是______________.
三、解答题
9.对划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大速度(m/s)的数据如下:
甲 27,38,30,37,35,31;
乙 33,29,38,34,28,36.
根据以上数据,试判断他们谁更优秀.
10.随机选取15家销售公司,由营业报告中查出其上年度的广告费(占总费用的百分比)及盈利额(占销售总额的百分比)列表如下:
广告费x 1.5 0.8 2.6 1.0 0.6 2.8 1.2 0.9
盈利额y 3.1 1.9 4.2 2.3 1.6 4.9 2.8 2.1
广告费x 0.4 1.3 1.2 2.0 1.6 1.8 2.2
盈利额y 1.4 2.4 2.4 3.8 3.0 3.4 4.0
试根据上述资料:
(1)画出散点图;
(2)如果变量x与y之间具有线性相关关系,求出回归直线方程;
(3)已知某销售公司的广告费为其总费用的1.7%,试估计其盈利额占销售总额的百分比.
章末复习课
对点讲练
例1 解 (1)总体容量较小,用抽签法.
①将30个篮球编号,号码为00,01,…,29;
②将以上30个编号分别写在一张小纸条上,揉成小球,制成号签;
③把号签放入一个不透明的袋子中,充分搅拌;
④从袋子中逐个抽取3个号签,并记录上面的号码;
⑤找出和所得号码对应的篮球.
(2)总体由差异明显的两个层次组成,需选用分层抽样法.
①确定抽取个数.
=3,所以甲厂生产的应抽取=7(个),
乙厂生产的应抽取=3(个);
②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.
(3)总体容量较大,样本容量较小,宜用随机数表法.
①将300个篮球用随机方式编号,编号为000,001,…,299;
②在随机数表中随机的确定一个数作为开始,如第8行第11列的数“2”开始.任选一个方向作为读数方向,比如向右读;
③从数“2”开始向右读,每次读三位,凡 ( http: / / www.21cnjy.com )不在000~299中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到10个号码,这就是所要抽取的10个样本个体的号码.
(4)总体容量较大,样本容量也较大宜用系统抽样法.
①将300个篮球用随机方式编号,编号为001,002,003,…,300,并分成30段,其中每一段包含=10(个)个体;
②在第一段001,002,003,…,010这十个编号中用简单随机抽样抽出一个(如002)作为起始号码;
③将编号为002,012,022,…,292的个体抽出,组成样本.
变式迁移1 C [抽取的植物油类种数:
×20=2,
抽取的果蔬类食品种数:
×20=4,
故抽取的植物油类与果蔬类食品种数之和是6.]
例2 解 (1)样本的频率分布表如下:
分组 频数 频率
12.5~15.5 6 0.06
15.5~18.5 16 0.16
18.5~21.5 18 0.18
21.5~24.5 22 0.22
24.5~27.5 20 0.20
27.5~30.5 10 0.10
30.5~33.5 8 0.08
合计 100 1.00
(2)频率分布直方图如图.
(3)小于30的数据约占90%.
变式迁移2 A [100人分为10组,第1组1人,第2组3人,第三组9人,第四组27人,故a=0.27;后六组共87人,故b=78.]
例3 甲
解析 方法一 甲=×(9.8+9.9+10.1+10+10.2)=10,
乙=×(9.4+10.3+10.8+9.7+9.8)=10,
即甲、乙两种冬小麦的平均单位面积产量的均值都等于10,其方差分别为
s=×(0.04+0.01+0.01+0+0.04)=0.02,
s=×(0.36+0.09+0.64+0.09+0.04)
=0.244,
即s方法二 (通过特殊的数据作出合理的推测) ( http: / / www.21cnjy.com )表中乙品种在第一年的产量为9.4,在第三年的产量为10.8,其波动比甲品种大得多,所以甲种冬小麦的产量比较稳定.
变式迁移3 解 (1)由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间,因此乙班平均身高高于甲班.
(2)=
=170.
甲班的样本方差
s2=×[(158-170 ( http: / / www.21cnjy.com ))2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+(171-170)2+(179-170)2+(179-170)2+(182-170)2]=57.2.
例4 解 (1)画出散点图如下图:
由图可见是线性相关的.
(2)借助计算器列表:
i 1 2 3 4 5 6 7
xi 15 20 25 30 35 40 45
yi 330 345 365 405 445 450 455
xiyi 4 950 6 900 9 125 12 150 15 575 18 000 20 475
=30,≈399.3,iyi=87 175.
=7 000.计算得: =≈4.75, =399.3-4.75×30=256.8.
即得回归直线方程=256.8+4.75x.
(3)施化肥50 kg时,可以估计水稻产量约为494.3 kg.
变式迁移4 解 (1)==6,
==≈79.86.
(2)设回归直线方程为 = x+ ,
因为x=280,y=45 309,xiyi=3 487,
=6,=,
所以 ===4.75,
=-6×4.75≈51.36.
所以回归直线方程为 =4.75x+51.36.
课时作业
1.B
2.B
3.A
4.B
5.B
6.192
解析 =,n=192.
7.甲 甲
解析 甲的平均分为==70,
乙的平均分为=68;
甲的方差为
s=
=2.
乙的方差为s=7.2,
故甲的平均分高于乙,甲的成绩比乙稳定.
8.=14.7+0.132x
9.解 甲=×(27+38+30+37+35+31)==33.
s=×[(27-33)2+(38-33)2+…+(31-33)2]
=×94≈15.7.
乙=×(33+29+38+34+28+36)==33,
s=×[(33-33)2+(29-33)2+…+(36-33)2]
=×76≈12.7
∴甲=乙,s>s,说明甲乙二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.
10.解 (1)散点图如图所示.
(2)回归直线方程是 =1.414 68x+0.821 23.
(3)当x=1.7时,由回归直线方程得y=3.23,即可估算其盈利额占销售总额的3.23%.2.2.2 用样本的数字特征估计
总体的数字特征
自主学习
学习目标
1.能根据实际问题的需要合理选择样本,从样本数据中提取基本的数字特征(如平均数、众数等),并做出合理解释.
2.会用样本的基本数字特征估计总体的数字特征.
3.进一步体会样本估计总体的思想,解决一些实际问题.
自学导引
1.设样本数据为x1,x2,…, ( http: / / www.21cnjy.com )xn,则样本数据的平均数为=,它描述了数据的数值____________,定量地反映数据的集中趋势所处的水平.在频率分布直方图中,平均数是直方图的________.
2.数据的离散程度可以用________、________或________来描述,样本方差描述了一组数据围绕________波动的大小.一般地设样本元素为x1,x2,…,xn样本平均数为,则方差s2=________________________,标准差s=________________________________.
对点讲练
知识点一 平均数的计算
例1 某班在一次数学竞赛中有10名同学参加(满分150分).成绩分别如下:
118,119,120,122,117,
125,117,120,125,117.
问10名参赛学生的平均成绩是多少?
点评 在一般情况下,要计算一组数 ( http: / / www.21cnjy.com )据的平均数可使用平均数计算公式;当数据较大,且大部分数据在某一常数左右波动时,方法二可以减少运算量,所以此法比较简便.
变式迁移1 若x1,x2,…,xn和y1,y2,…,yn的平均数分别是和,试求出下列几组数据的平均数.
(1)3x1,3x2,…,3xn;
(2)x1-y1,x2-y2,…,xn-yn;
(3)2x1+m,2x2+m,…,2xn+m.
知识点二 方差、标准差的计算
例2 甲机床加工直径为100 mm的零件,现从产品中随机抽出6件进行测量,测得如下数据(单位:mm):99,100,98,100,100,103.
计算上述数据的方差和标准差(标准差结果精确到0.1).
点评 首先计算出平均数,然后根据数 ( http: / / www.21cnjy.com )据的特点,可以直接利用公式求出方差和标准差,或对公式进行合理变形(如s2=[(x+x+…+x)-n2]),从而使运算更简便.
变式迁移2 乙机床加工直径为100 m ( http: / / www.21cnjy.com )m的零件,现从产品中随机抽出6件进行测量,测得如下数据(单位:mm):99,100,102,99,100,100.
(1)计算上述数据的方差和标准差(标准差精确到0.1).
(2)据计算结果与例题中甲机床比较,说明哪一台机床加工这种零件更符合要求.
知识点三 用样本的数字特征估计总体的数字特征
例3 从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下:(单位:cm)
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米的苗长得高?
(2)哪种玉米的苗长得齐?
点评 特别要注意本题两问中说法的不同 ( http: / / www.21cnjy.com ),这就意味着计算方式不一样.平均数和方差是样本的两个重要数字特征,方差越大,表明数据越分散;相反地,方差越小,数据越集中.
变式迁移3 甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:
甲:8,6,7,8,6,5,9,10,4,7;
乙:6,7,7,8,6,7,8,7,9,5.
(1)分别计算以上两组数据的平均数;
(2)分别求出两组数据的方差;
(3)根据计算结果,估计一下两名战士的射击情况.
(1)平均数与每一个样本的数据 ( http: / / www.21cnjy.com )有关,任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.
(2)标准差反映了各个样本数 ( http: / / www.21cnjy.com )据聚集于样本平均数周围的程度.标准差越小,表明各个样本数据在样本平均数的周围越集中;反之,表明各个样本数据在样本平均数的周围越分散.
课时作业
一、选择题
1.期中考试以后,班长算出了全班40个人数 ( http: / / www.21cnjy.com )学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N,那么M∶N为(  )
A. B.1 C. D.2
2.与原始数据单位不一致的样本数据是(  )
A.众数 B.中位数 C.标准差 D.方差
3.在某项体育比赛中,七位裁判为一选手打出的分数如下:
90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(  )
A.92,2 B.92,2.8
C.93,2 D.93,2.8
4.某中学人数相等的甲、乙两班学生参加同一 ( http: / / www.21cnjy.com )次数学测试,两班平均分和方差分别为甲=82分,乙=82分,s=245,s=190,那么成绩较为整齐的是(  )
A.甲班 B.乙班
C.两班一样齐 D.无法确定
5.下图是某学校举行的运动会上七位评委为 ( http: / / www.21cnjy.com )某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为(  )
A.84,4.84 B.84,1.6
C.85,1.6 D.85,4
二、填空题
6.一个样本按从小到大的顺序排列为10,12,13,x,17,19,21,24,其中位数为16,则x=______.
7.如果数据x1,x2,x3 ( http: / / www.21cnjy.com ),…,xn的平均数为10,方差为2,则数据7x1-2,7x2-2,7x3-2,…,7xn-2的平均数为________,方差为________.
8.甲、乙、丙、丁四名射击手在选拔赛中的平均环数及其标准差s如下表所示,则选送决赛的最佳人选应是________.
甲 乙 丙 丁
7 8 8 7
s 2.5 2.5 2.8 3
三、解答题
9.某校团委为响应顺义区倡导的“我与奥运同行,人人爱护环境”的号召,举办了英语口语竞赛.甲、乙两个小组成绩如下:
甲组:76 90 84 86 81 87 86
乙组:82 84 85 89 80 94 76
(1)分别求出甲、乙两个小组的平均分、标准差(精确到0.01);
(2)说明哪个小组成绩比较稳定?
10.为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100只日光灯在必须换掉前的使用天数如下表:
天数 151~180 181~210 211~240 241~270
灯管数 1 11 18 20
天数 271~300 301~330 331~360 361~390
灯管数 25 16 7 2
(1)试估计这种日光灯的平均使用寿命;
(2)若定期更换,可选择多长时间统一更换合适?
2.2.2 用样本的数字特征估计总体
的数字特征
自学导引
1.平均水平 平衡点
2.极差 方差 标准差 平均数
 
对点讲练
例1 解 方法一 利用平均数的公式计算
=×(118+119+120+…+125+117)
=×1 200=120.
方法二 建立新数据,再利用平均数简化公式计算.
取a=120,将上面各数据同时减去120,得到一组新数据:-2,-1,0,2,-3,5,-3,0,5,-3.
′=×(-2-1+0+2-3+5-3+0+5-3)=0,
∴=′+a=0+120=120.
答 该班10名参赛学生的平均成绩是120分.
变式迁移1 解 (1)×(3x1+3x2+…+3xn)
=3××(x1+x2+…+xn)=3;
(2)×[(x1-y1)+(x2-y2)+…+(xn-yn)]
=×(x1+x2+…+xn)-×(y1+y2+…+yn)
=-;
(3)×[(2x1+m)+(2x2+m)+…+(2xn+m)]
=×(2x1+2x2+…+2xn)+×nm
=2××(x1+x2+…+xn)+m
=2+m.
例2 解 ①甲=100+×(-1+0-2+0+0+3)
=100(mm).
②计算xi-甲(i=1,2,…,6)得数据分别为-1,0,-2,0,0,3.
③计算(xi-甲)2(i=1,2,…,6)得数据分别为1,0,4,0,0,9.
④计算方差s=×(1+0+4+0+0+9)=(mm2).
⑤计算标准差s甲= ≈1.5(mm).
所以这组数据的方差为,标准差约为1.5.
变式迁移2 解 (1)乙=100+×(-1+0+2-1+0+0)=100(mm).
∵xi-乙(i=1,2,……,6)所得数据分别为-1,0,2,-1,0,0.
∴(xi-乙)2(i=1,2,…,6)所得数据分别为1,0,4,1,0,0.
所以s=×(1+0+4+1+0+0)=1(mm)2,
s乙=1(mm).
(2)由上述计算结果可知,甲=乙,s甲>s乙.
∴乙机床加工这种零件更符合要求.
例3 解 (1)甲=×(25+41+40+37+22+14+19+39+21+42)=×300=30 (cm),
乙=×(27+16+44+27+44+16+40+40+16+40)
=×310=31 (cm).
∴甲<乙.
(2)s=×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]
=×(25+121+100+49+64+256+121+81+81+144)
=×1 042=104.2 (cm2),
s=×[(2×272+3×162+3×402+2×442)-10×312]=×1 288=128.8 (cm2).
∴s答 乙种玉米的苗长得高,甲种玉米的苗长得整齐.
变式迁移3 解 (1)甲=×(8+6+7+8+6+5+9+10+4+7)
=7(环),
乙=×(6+7+7+8+6+7+8+7+9+5)
=7(环).
(2)由方差公式s2=[(x1-)2+(x2-)2+…+(xn-)2],得s=3.0(环2),s=1.2(环2).
(3)甲=乙,说明甲、乙两战士的平均水平相当;
s>s,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定.
课时作业
1.B [N==M,∴M∶N=1.]
2.D
3.B [去掉最高分95 ( http: / / www.21cnjy.com )和最低分89后,剩余数据的平均数为==92,方差为s2=[(92-90)2+(92-90)2+(93-92)2+(94-92)2+(93-92)2]=(4+4+1+4+1)=2.8.]
4.B
5.C [去掉最高分93,最低分79,
平均分为×(84+84+86+84+87)=85,
方差s2=×[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]==1.6.]
6.15
7.68 98
解析 平均数=7×10-2=68,方差=72×2=98.
8.乙
解析 平均数反映平均水平大小,标准差表明稳定性.标准差越小,稳定性越好.
9.解 (1)甲=×(76+90+84+86+81+87+86)
≈84.29,
乙=×(82+84+85+89+80+94+76)≈84.29,
s甲=
≈4.15,
s乙=
≈5.40.
(2)∵s甲10.解 (1)各组中值分别为165,19 ( http: / / www.21cnjy.com )5,225,255,285,315,345,375,由此可算得平均数约为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).
(2)将组中值对于此平均数求方差:
×[1×(165-268)2+11×(1 ( http: / / www.21cnjy.com )95-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]
=2 128.60(天2)
故标准差为≈46(天).
答 估计这种日光灯的平均使用寿命约为268天,标准差约为46天,故可在222天到314天左右统一更换较合适.2.3 变量的相关性
自主学习
学习目标
1.通过收集现实问题中两个有关联变量的数据,作出散点图,并利用散点图直观认识变量间的相关关系.
2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
自学导引
1.两个变量间的相互关系
变量与变量之间的关系常见的有两类:一类是确定性的________关系,另一类是带有随机性的________关系.
2.相关关系的分类
(1)正相关:如果一个变量的值由小变大时,另一个变量的值也____________,这种相关称为正相关.
(2)负相关:如果一个变量的值由小变大时,另一个变量的值____________,这种相关称为负相关.
3.散点图
在一个统计数表中,为了更清楚地看出x ( http: / / www.21cnjy.com )和y是否具有相关关系,常将x的取值作为________,将y的相应取值作为________,在直角坐标中描点____________________,这样的图形叫散点图.
4.回归直线方程
一般地,设x和y是具有相关关系的两个变量,且对应于n个观测值的n个点大致分布在一条直线的附近,若所求的直线方程=+x,则
我们将这个方程叫做y对x的________________,叫做____________,相应的直线叫做回归直线.
5.最小二乘法
设x、y的一组观察值为(xi,yi),i=1 ( http: / / www.21cnjy.com ),2,…,n,且回归直线方程为=a+bx,当x取值xi(i=1,2,…,n)时,y的观察值为yi,差yi-i(i=1,2,…,n)刻画了实际观察值yi与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q=________________作为总离差,并使之达到________.这样,回归直线就是所有直线中Q取________的那一条,由于平方又叫二乘方,所以这种使“____________________”的方法,叫最小二乘法.
对点讲练
知识点一 相关关系的判断
例1 根据你的生活经验及掌握的知识,将下列所有你认为正确的结论填入题空中.
①一般的,学生的数学成绩与物理成绩之间是正相关的;
②一般的,学生的数学成绩与英语成绩是负相关的;
③一块农田的水稻产量与施肥量之间是相关关系;
④对于在校儿童,脚的大小与阅读能力有很强的相关关系.
以上正确的结论是________.
变式迁移1 下列两变量中具有相关关系的是(  )
A.角度和它的余弦值 B.正方形的边长和面积
C.人的年龄与身高 D.人的身高和体重
知识点二 散点图的应用
例2 某地农业技术指导站的技术员,经过在7块并排大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据:(单位:千克)
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
施化肥量x和水稻产量y是否具有相关关系?
变式迁移2 5个学生的数学和物理成绩如下表:
学生学科 A B C D E
数学 80 75 70 65 60
物理 70 66 68 64 62
画出散点图,并判断它们是否有相关关系.
知识点三 回归直线方程及应用
例3 随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司做了一次抽样调查,并统计得出某款车的使用年限x与所支出的总费用y(万元)有如下的数据资料:
使用年限x 2 3 4 5 6
总费用y 2.2 3.8 5.5 6.5 7.0
若由资料,知y对x呈线性相关关系.试求:
(1)线性回归方程=x+的回归系数、;
(2)估计使用年限为10年时,车的使用总费用是多少?
变式迁移3 某厂某产品的产量x(单位:千件)与单位成本y(单位:万元/千件)的对应数据如下:
x 29 28 28.5 29.5 30 31 30 29
y 500 510 504 494 493 485 492 498
(1)对变量y与x作出散点图;
(2)若y与x具有线性相关关系,求回归直线方程;
(3)预测产量x=25千件时的单位成本.
1.相关关系与函数关系
(1)相同点:两者均是指两个变量的关系.
(2)不同点:
①函数关系是一种确定的关系,相关关系是一种非确定的关系.
②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
2.用回归直线进行拟合两变量关系的线性相关的一般步骤为:
(1)作出散点图,判断散点是否在一条直线附近;
(2)如果散点在一条直线附近,用公式求出、,并写出线性回归方程.
3.在回归直线方程 =x+中的含义容易理解成增加的单位数,而实际上,它代表x每增加一个单位,y平均增加的单位数.一般地说,当回归系数>0时,说明两个变量呈正相关关系,它的意义是:当x每增加一个单位时y就增加个单位;当<0时,说明两个变量呈负相关关系,它的意义是:当x每增加一个单位时,y就减少||个单位.
课时作业
一、选择题
1.下列两变量中不属于相关关系的是(  )
A.产品的成本与产量 B.家庭的收入与支出
C.球的表面积与体积 D.吸烟与健康
2.下列有关线性回归的说法,不正确的是(  )
A.变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图
C.回归直线方程最能代表观测值x、y之间的线性关系
D.任何一组观测值都能得到具有代表意义的回归直线方程
3.设一个回归方程为 =3-1.2x,则变量x增加一个单位时(  )
A.y平均增加1.2个单位 B.y平均增加3个单位
C.y平均减少1.2个单位 D.y平均减小3个单位
4.2003年春季,我国部分地区SARS流 ( http: / / www.21cnjy.com )行,党和政府采取果断措施,防治结合,很快使病情得到控制.下表是某同学记载的5月1日至5月12日每天北京市SARS病患治愈者数据及根据这些数据绘制的散点图.
日期 5.1 5.2 5.3 5.4 5.5 5.6
人数 100 109 115 118 121 134
日期 5.7 5.8 5.9 5.10 5.11 5.12
人数 141 152 168 175 186 203
下列说法:
①根据此散点图,可以判断日期与人数具有线性相关关系;
②根据此散点图,可以判断日期与人数具有一次函数关系;
③后三天治愈出院的人数占这12天治愈出院人数的30%;
④后三天中每天治愈出院的人数均超过这12天内北京市SARS病患治愈者总人数的10%.
其中正确的个数是(  )
A.1 B.2 C.3 D.4
5.回归方程为 =1.5x-15,则(  )
A.=1.5-15 B.15是回归系数
C.1.5是回归系数 D.x=10时,y=0
二、填空题
6.命题:①路程与时间、速度的关 ( http: / / www.21cnjy.com )系是相关关系;②同一物体的加速度与作用力是函数关系;③产品的成本与产量之间的关系是函数关系;④圆的周长与面积的关系是相关关系;⑤广告费用与销售量之间的关系是相关关系.
其中正确的命题序号是________.
7.已知回归直线方程为 =0.50x-0.81,则x=25时,y的估计值为________.
8.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:
温度x(℃) 0 10 20 50 70
溶解度y 66.7 76.0 85.0 112.3 128.0
则由此得到回归直线的斜率为________.
三、解答题
9.一般来说,一个人的身高越高,他的手就越大,为调查这一问题,对某校10名高一男生的身高与右手长度进行测量得到如下数据(单位:cm):
身高 168 170 171 172 174 176 178 178 180 181
右手长度 19.0 20.0 21.0 21.5 21.0 22.0 24.0 23.0 22.5 23.0
(1)根据上述数据制作散点图,判断两者有无线性相关关系;
(2)如果具有线性相关关系,求回归方程;
(3)如果一名同学身高为185 cm,估计他的右手长.(精确到小数点后一位)
§2.3 变量的相关性
自学导引
1.函数 相关
2.(1)由小变大 (2)由大变小
3.横坐标 纵坐标 (xi,yi)(i=1,2,…,n)
4. - 回归直线方程 回归系数
5. (yi-a-bxi)2 最小 最小值 离差平方和为最小
对点讲练
例1 ①③④
解析 ①由于数学是自然科学的基础,数学成绩好,往往有利于学好与之相关联的学科,特别是物理,实际统计情况也是如此.所以①是正确的.
②在时间有限的情况下,数学学习投 ( http: / / www.21cnjy.com )入多,英语学习投入就少,反之亦然.于是就断定二者成绩是负相关的.这种主观臆断是错误的.因为实际情况是:有不少学生数学成绩与英语成绩都好或者是都不好.所以②是错误的.
③一般情况下,一块农田的水稻产量与施肥量之间是相关的.
④有很强的相关关系.这是因为在校儿 ( http: / / www.21cnjy.com )童随着年龄的增长阅读能力在变强,而年龄增长了,脚也在长大.脚的大小和阅读能力之间无因果关系,而是通过第三个因素“年龄”沟通起来的.
变式迁移1 D [A、B具有确定性的函数关系.C无相关关系.一般地,身高越高,体重越重,是相关的.]
例2 解 作出散点图进行分析.散点图如下:
从散点图可以看出施化肥量x和水稻产量y的 ( http: / / www.21cnjy.com )确存在一定相关关系,大体上随着施化肥量的增加,水稻的产量也在增加.可见散点图能直观形象地反映两个变量的相关程度.
变式迁移2 解 以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如图所示:
由散点图可知,两者之间具有相关关系.
例3 解 (1)列表:
i 1 2 3 4 5
xi 2 3 4 5 6
yi 2.2 3.8 5.5 6.5 7.0
xiyi 4.4 11.4 22.0 32.5 42.0
x 4 9 16 25 36
=4,=5,=90,iyi=112.3
于是===1.23;
=-=5-1.23×4=0.08.
(2)线性回归直线方程是=1.23x+0.08,
当x=10(年)时,=1.23×10+0.08=12.38(万元),
即估计使用10年时,支出总费用是12.38万元.
变式迁移3 解 (1)散点图如下:
(2)=29.375,=497,
x=6 909.5,y=1 976 494,
xiyi=116 744.
∴===-8,
=497-(-8)×29.375=732,
∴ =-8x+732.
(3)当x=25时, =-8×25+732=532(万元/千件).
课时作业
1.C [球的表面积与体积是函数关系.]
2.D
3.C
4.B
5.A
6.②⑤
7.11.69
8.0.880 9
解析 =30,=93.6,
x=7 900,
xiyi=17 035,
所以回归直线的斜率
==
≈0.880 9.
9.解 (1)散点图如下图所示:
可见,身高与右手长之间的总体趋势成一条直线,即它们线性相关.
(2)设回归直线方程是 = + x.
根据以上数据可由计算器计算得
=174.8,=21.7,
x=305 730,xiyi=37 986.
∴ =
=≈0.303,
=- ≈-31.264.
∴回归直线方程为 =0.303x-31.264.
(3)当x=185时, =0.303×185-31.264
=24.791.
故该同学的右手长可估测为24.8 cm.2.1.2 系统抽样
自主学习
学习目标
1.理解系统抽样的概念、特点.
2.掌握系统抽样的方法和操作步骤,会用系统抽样法进行抽样.
自学导引
1.系统抽样的概念
将总体分成________的若干部分 ( http: / / www.21cnjy.com ),然后按照预先制定的规则,从每一部分抽取________个体,得到所需要的样本,这种抽样的方法叫做系统抽样.在抽样过程中,由于抽样的间隔________,因此系统抽样也称作________抽样.
2.适用的条件
总体中个体差异不大并且总体的容量________.
3.系统抽样的步骤
一般地,假设要从容量为N的总体中抽取容量为n的样本,可以按下列步骤进行系统抽样.
(1)先将总体的N个个体________.有时可直接利用个体自身所带的号码,如学号,准考证号,门牌号等;
(2)确定分段间隔k对编号进行分段,当(n是样本容量)是整数时,取k=________;
(3)在第一段用____________确定一个个体编号s(s≤k);
(4)按照一定的规则抽取样本.通常是将 ( http: / / www.21cnjy.com )s加上间隔k得到第2个个体编号________,再加k得到第3个个体编号________,依次进行下去,直到得到容量为n的样本.
对点讲练
知识点一 系统抽样的概念
例1 下列抽样中,最适宜用系统抽样法的是(  )
A.从某厂生产的20 000个电子元件中随机抽取6个做样本
B.从某厂生产的2 000个电子元件中随机抽取5个做样本
C.从某厂生产的2 000个电子元件中随机抽取200个做样本
D.从某厂生产的20个电子元件中随机抽取7个做样本
点评 解决该类问题的关键是掌握系统抽样的特点及适用范围.
变式迁移1 某学校附近的一家 ( http: / / www.21cnjy.com )小型超市为了了解一年的客流情况,决定用系统抽样从一年中抽出52天作为样本实施调查(即从每周抽取1天,一年恰好有52个星期),你觉得这样的选择合适吗?为什么?
知识点二 系统抽样的应用
例2 为了解参加某种知识竞赛的1 000名学生的成绩,从中抽取一个容量为50的样本,那么采用什么抽样方法比较恰当?简述抽样过程.
点评 (1)解决系统抽样问题中两个关键的步骤为:
①分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本.
②起始编号的确定应用随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.
(2)当总体中的个体数不能被样本容量整除时,需要在总体中剔除一些个体.
变式迁移2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施.
知识点三 系统抽样的综合应用
例3 某工厂有工人1 021人,其中高级工程师20人,现抽取普通工人40人,高级工程师4人组成代表队参加某项活动,怎样抽样?
点评 (1)当问题比较复杂时,可以考虑在一个问题中交叉使用多种方法,面对实际问题,准确合理地选择抽样方法,对初学者来说是至关重要的.
(2)选择抽样方法的规律
①当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法.
②当总体容量较大,样本容量较小时,可采用随机数表法.
③当总体容量较大,样本容量也较大时,适合用系统抽样法.
变式迁移3 某单位在岗职工 ( http: / / www.21cnjy.com )共有624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?
系统抽样的理解
(1)系统抽样的本质是“等距抽样”,要取多 ( http: / / www.21cnjy.com )少个样本就将总体分成多少组,每组中取一个;(2)若总体个数不能被样本个数整除,则先从总体中剔除若干个个体达到整除状态,重新编号,并根据样本个数进行分组;(3)剔除个体及第一段抽样都用简单随机抽样;(4)系统抽样是等可能抽样,每个个体被抽到的可能性都是;(5)系统抽样适用于总体容量较大,且分布均衡(即个体间无明显的差异)的情况.
注意:如果总体中个体数N正好被样本容量n整除 ( http: / / www.21cnjy.com ),则每个个体被入样的可能性是,若N不能被n整除,需要剔除m个个体,m=N-n·(这里表示不超过的最大整数),此时每个个体入样的可能性仍是,而不是.
课时作业
一、选择题
1.为调查某产品的销售情况,销售部门从下属的 ( http: / / www.21cnjy.com )92家销售连锁店中抽取30家了解情况.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为(  )
A.3,2 B.2,3 C.2,30 D.30,2
2.从2 008名学生中选取 ( http: / / www.21cnjy.com )50名学生组成参观团,若采用下面的方法选取:先用简单随机抽样方法从2 008人中剔除8人,剩余的2 000人再按系统抽样的方法进行,则每人入选的机会(  )
A.不全相等 B.均不相等
C.都相等 D.无法确定
3.要从已经编号(1~50)的5 ( http: / / www.21cnjy.com )0枚最新研制的某种型号的导弹中随机抽取5枚来进行发射试验,用系统抽样方法确定所选取的5枚导弹的编号可能是(  )
A.5,10,15,20,25 B.3,13,23,33,43
C.1,2,3,4,5 D.2,4,8,16,32
4.从N个编号中要抽取n个号码入样,若采用系统抽样方法抽取,则分段间隔应为([]表示的整数部分)(  )
A. B.n C.[] D.[]+1
5.下列抽样中,不是系统抽样的是(  )
A.从标有1~15的15个球中,任选3个作 ( http: / / www.21cnjy.com )样本,按从小到大的顺序排序,随机选起点i0,以后i0+5,i0+10(超过15则再重新选i0)号入样
B.工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品进行检验
C.搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到规定的人数为止
D.电影院调查观众的某一指标,通知每排(每排人数相等)座号为14的观众留下来座谈
二、填空题
6.若总体中含有1 645个个体,现在 ( http: / / www.21cnjy.com )要采用系统抽样,从中抽取一个容量为35的样本,编号后应均分为________段,每段有________个个体.
7.某商场想通过检查发票上的销售额 ( http: / / www.21cnjy.com )的方式来快速估计每月的销售总额.采取如下方法:从某本发票的存根中随机抽一张,如15号,然后按序往后将65号,115号,165号,…,发票上的销售额组成一个调查样本.这种抽取样本的方法是________________.
8.用系统抽样的方法从个体数为1 003的总体中抽取一个容量为50的样本,在整个抽样过程中每个个体被抽到的可能性是________.
三、解答题
9.某学校三年级共有36个班,每 ( http: / / www.21cnjy.com )班50人,学号为1~50,有一次学校对学生进行问卷调查,了解学生对教学工作的意见,需选取36名学生,怎样的抽样方法较为合理?
10.从2 004名同学中,抽取一个容量为20的样本.试叙述系统抽样的步骤.
2.1.2 系统抽样
自学导引
1.均衡 一个 相等 等距
2.很大
3.(1)编号 (2) (3)简单随机抽样 (4)s+k s+2k
对点讲练
例1 C [A、B中抽取样本容量太小,不适宜.D中总体元素较少,不适宜.C中总体容量和样本容量都较大,适于用系统抽样.故选C.]
变式迁移1 解 不合适,因为这家超市位 ( http: / / www.21cnjy.com )于学校附近,其顾客多为学生,其客流量受到学生作息时间的影响,周末的客流量与平时明显不同,如用系统抽样来抽取样本,当起始点抽到星期天时,这样所抽取的样本就全是星期天,样本代表的客流量就与实际情况出入较大,另外寒暑假也会影响超市的客流量.
例2 解 适宜选用系统抽样,抽样过程如下:
(1)随机地将这1 000名学生编号为1,2,3,…,1000.
(2)将总体按编号顺序均分成50部分,每部分包括20个个体.
(3)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码l.
(4)以l为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:l,l+20,l+40,… ,l+980.
变式迁移2 解 (1)将每个人编一个号,由0001至1003.
(2)利用随机数表法找到3个号将这3名工人剔除.
(3)将剩余的1 000名工人重新编号0001至1000.
(4)分段,取间隔k==100,将总体均分为10组,每组100个工人.
(5)从第一段即0001号到0100号中随机抽取一个号l.
(6)按编号将l,100+l,200+l,…,900+l共10个号选出.
这10个号所对应的工人组成样本.
例3 解 普通工人1 001人抽取40人,适宜用系统抽样法;高级工程师20人抽取4人,适宜用抽签法.
(1)将1 001名职工用随机方式编号.
(2)从总体中剔除1人(剔除方法可 ( http: / / www.21cnjy.com )用随机数表法),将剩下的1 000名职工重新编号(分别为0001,0002,…,1000),并平均分成40段,其中每一段包含=25(个)个体.
(3)在第一段0001,0002,…,0025这25个编号中用简单随机抽样法抽出一个(如0003)作为起始号码.
(4)将编号为0003,0028,0053,…,0978的个体抽出.
(5)将20名高级工程师用随机方式编号,编号为01,02,…,20.
(6)将这20个号码分别写在一个小纸条上,揉成小球,制成号签.
(7)将得到的号签放入一个容器中,充分搅拌.
(8)从容器中逐个抽取4个号签,并记录上面的编号.
(9)从总体中将与所抽号签的编号相一致的个体取出.
以上方法得到的所有个体便是代表队成员.
变式迁移3 解 采用系统抽样获取样本的操作过程如下:
(1)将624名职工用随机方式编号;
(2)从总体中剔除4人(剔除方法可用随机数表法),将剩下的620名职工重新编号(分别是000,001,002,…,619),并分成62段;
(3)在第1段000,001,…,009这十个编号中,用简单随机抽样抽取一个号码(如002)作为起始号码;
(4)将编号为002,012,022,…,612的个体抽出,即可组成样本.
课时作业
1.A [应先剔除2家,间隔k==3.]
2.C
3.B
4.C
5.C
6.35 47
解析 因为=47,故采用系统抽样法时,编号后分成35组,每组47个个体.
7.系统抽样
8.
解析 每个个体被抽到的可能性为=.
9.解 采用系统抽样较合理.设每班一 ( http: / / www.21cnjy.com )组,共36组,编号为1~36组,先在第一组用简单随机抽样抽出一名学生,再将其他各组与此学生学号相同的学生全部抽出.
10.解 第一步:采用随机的方式给个体编号:0001,0002,…,2004;
第二步:利用随机数表法剔除4个个体.
第三步:分段,由于20∶2 000=1∶100,故将总体分为20组,其中每组含100个个体,即间隔k=100;
第四步:在第一组中随机抽取一个号码,比如0066号;
第五步:“起始号”+“间隔”确定样本中的各个个体,如166,266,…,1966.
这20个号所对应的学生组成样本.