苏教版高中数学必修3统计--教学案

文档属性

名称 苏教版高中数学必修3统计--教学案
格式 rar
文件大小 1.9MB
资源类型 教案
版本资源 苏教版
科目 数学
更新时间 2009-09-17 10:53:00

文档简介

第6章 统计
一、知识结构
二、重点难点
重点:
三种常见抽样方法;总体分布的估计;总体特征数的估计;线性回归。
难点:
三种常见抽样方法的区别和特点;频率分布表;频率分布直方图、频率分布折线图、茎叶图的制作方法;平均数、方差、标准差的计算;变量之间的相关关系及线性回归方程的求法。
6.1 抽样方法
第16课时6.1.1 简单随机抽样
【学习导航】
知识网络
学习要求
1.明白样本、总体、样本容量等基本概念;
2.体会简单随机抽样的的概念及抽签法的基本步骤;
3.体会随机数表法也是等可能性抽样,感受用随机数表法进行抽样的基本步骤,并能熟运用。
【课堂互动】
自学评价
1. 基本概念:总体、个体、样本、样本的容量、总体平均数、样本平均数
在统计学里,我们把 叫做总体,其中的每一个考察对象叫做个体,从总体中所抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本的容量. 叫做总体平均数,
叫做样本平均数.
2.统计学的基本思想方法:
统计学的基本思想方法是 ,即 .因此,样本的抽取是否得当,对于研究总体来说就十分关键.究竟怎样从总体中抽取样本?怎样抽取的样本更能充分地反映总体的情况?下面,我们就通过案例来学习一种常用的基本的抽样:简单随机抽样.
案例1 为了了解高一(1)班50名学生的视力状况,从中抽取10名学生进行检查.如何抽取呢
【分析】
在这个案例中,总体容量较小,显然可以用同学们最常见的抽签法来抽取样本.关键问题在于:抽签法能使每一个人被抽到的机会均等吗?对每一个人都公平吗?
好吧,让我们一起实践一次抽签的过程。在实践中思考抽签法需要哪些必要的步骤。
3. 抽签法
用抽签法从个体个数为N的总体中抽取一个容量为k的样本的步骤为:
(1)将总体中的所有个体编号(号码可以从1到N);
(2) ;
(3) ;
(4)
;
(5)从总体中将与的签的编号相一致的个体取出。
注意:对个体编号时,也可以利用已有的编号,如从全班学生中抽取样本时,利用学生的学号作为编号;对某场电影的观众进行抽样调查时,利用观众的座位号用为编号等。
【小结】用抽签法抽取样本过程中,每一个剩余个体被抽到的机会是 的,这也是一个样本是否具有良好的代表性的关键前提.没有每个个体机会均等,就没有样本的公平性和科学性.当然,抽签法简单易行,适用于 的情形.
在案例1中,还可以用另一种方法 ——随机数表法来抽取样本,它可以有效地简化抽签法的过程。
先让我们一起体会一下随机数表法抽取样本的过程,再完成下面的空格。
4.随机数表法(random number table)
随机数表中的每个数都是用 产生的(称为 )。
按一定规则到随机数表中选取号码,从而获得样本的方法就称为随机数表法
随机数表的制作方法有抽签法、抛掷骰子法、计算机生成法等等。
用随机数表法抽取样本的步骤:
(1)对总体中的个体进行编号(每个号码位数一致);
(2) ;
(3)

(4)根据选定的号码抽取样本。
5.简单随机抽样
从个体数为N的总体中 地取出n个个体作为样本(n被取到,这样的抽样方法叫简单随机抽样。 和 都是简单随机抽样(simple random sampling)
【经典范例】
例1 某班共有60个班级,为了调查班级中男女学生所占比例情况,试抽取8个班级组成的一个样本。
【解】
例2 总体有8个个体,请用随机数表法从中抽取一个容量为5的样本。如何操作(随机数表参见教科书41页)
【解】
例3 某学校的高一年级共有200名学生,为了调查这些学生的某项身体素质达标状况,请使用随机数表法从总体中抽取一个容量为15的样本
【解】(完成空格)
第一步,将所有学生编号 :000,001,002,…,198,199。
第二步,选定随机数表中第一个数1作为开始。
第三步,从选定的数1开始按三个数字一组向右读下去,一行读完时按下一行自左向右继续读,将超过199或重复的三位数去掉,保留下来的三位数直到取足15个为止。得所要抽取的样本号码是

点评:1、在随机数表中,每一个位置上出现某一数字是等可能的,这就决定了从总体中抽到任何一个个体的号码也是等可能的。可见随机数表法属于简单随机抽样。
2、该题在用随机数表选号时,需要剔除大量不在个体编号范围内的号码数,这样挑号码不太方便,能否避免呢?
(可以规定所取的三位数中,凡在200~399者,均减200,凡400~599者,均减400…,使所有数组都小于200)
例4 假设一个总体有5个元素,分别记为a,b,c,d,e,从中采用不重复抽取样本的方法,抽取一个容量为2的样本,样本共有多少个?写出全部可能的样本。
【解】
追踪训练
1.某次考试有10000名学生参加,为了了解这10000名考生的数学成绩,从中抽取1000名考生的数学成绩进行统计分析,在这个问题中,有以下四种说法:(1)1000名考生是总体的一个样本;(2)1000名考生数学成绩的平均数是总体平均数;(3)10000名考生是总体;(4)样本容量是1000,其中正确的说法有( )
A.1种  B.2种 C.3种 D.4种
2.关于简单的随机抽样,有下列说法:
(1)它要求被抽样本的总体的个数有限,以便对其中各个个体被抽取的可能性进行分析;
(2)它是从总体中逐个地进行抽取,以便在抽样实践中进行操作;
(3)它是一种不放回抽样;
(4)它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种方法抽样的公平性.其中正确的命题有( )
A.(1)(2)(3) B.(1)(2)(4)
C.(1)(3)(4) D.(1)(2)(3)(4)
3.从100件电子产品中抽取一个容量为25的样本进行检测,试用随机数表法抽取样本。
【解】
4.为了分析某次考试情况,需要从2000份试卷中抽取100份作为样本,如何用随机数表法进行抽取?
【解】
统 计
抽样方法方法
总体分布的估计
总体特征数的估计
变量之间的关系
简单随机抽样
系统抽样方法
分层抽样方法
抽签法方法
随机数表法方法
频率分布表方法
频率分布直方图方法
折线图方法
茎叶图方法
平均数及其估计方法
方差方法
标准差方法
函数关系方法
相关关系方法
线性回归方法
线性回归方程方法
相关性检验与相关系数
简单随机抽样
随机数表法
抽签法第18课时 分层抽样
【学习导航】
学习要求
1.体会分层抽样的的概念及如何用分层抽样获取样本;
2.感受分层抽样也是等可能性抽样,它适用于总体由差异明显的几部分组成的;
3.简单随机抽样、系统抽样、分层抽样的特点及适用范围。
【课堂互动】
自学评价
案例 某校高一、高二和高三年级分别有学生1000,800和700名,为了了解全校学生的视力情况,欲从中抽取容量为100的样本,怎样抽样较为合理.
【分析】如果在2500名学生中随机抽取100名学生作为样本,或者在三个年级中平均抽取学生组成样本,这样的样本是否合理?能否反映总体情况?
由于不同年级的学生视力状况有一定的差异,为准确反映客观实际,不仅要使每个个体被抽到的机会均等,而且要注意总体中个体的层次性,从而使抽取的样本具有良好的代表性. 对于这种容量较大、个体差异较大且明显分成几部分的总体,就考虑用分层抽样来抽取样本.
1.分层抽样
分层抽样的概念:当总体由
组成时,为了使样本
,我们常常____________
________________ ____________________
_______________________________,然后 ,这样的抽样方法称为分层抽样(stratified sampling)
分层抽样的步骤为:
(1) ;
(2) ;
(3)

(4)

【小结】①分层抽样适用于总体由差异比较明显的几个部分组成的情况,是等可能抽样,它也是客观的、公平的;
②分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时可以根据情况采用不同的抽样方法,因此在实践中有着非常广泛的应用.
2.三种抽样方法的比较(如表):
类别 特点 相互联系 适用范围 共同点
简单随机抽样 从总体中逐个抽取 总体中的个体数较少 抽样过程中每个个体被抽到的可能性相同
系统抽样 将总体平均分成几部分,按事先确定的规则分别在各部分中抽取 在起始部分抽样时,采用简单随机抽样 总体中的个体数较多
分层抽样 将总体分成几层,按各层个体数之比抽取 各层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成
【经典范例】
例1 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取。
【解】
例2 某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示:
很喜爱 喜爱 一般 不喜爱
2435 4567 3926 1072
电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应怎样进行抽样?
分析:因为总体中人数较多,所以不宜采用简单随机抽样,又由于持不同态度的人数差异较大,故也不宜用系统抽样方法,而以分层抽样为妥。
【解】
例3 某所学校有小学部、初中部和高中部,在校小学生、初中生和高中生之比为5:2:3,且已知初中生有800人,现要从这所学校中抽取一个容量为80的样本以了解他们对某一问题的看法,应采用什么抽样方法?从小学部、初中部及高中部各抽取多少名?总体上看,平均多少名学生中抽取到一名学生?
【解】
例4 下列问题中,采用怎样的抽样方法较为合理?
(1)从10台冰箱中抽取3台进行质量检查;
(2)某电影院有32排座位,每排有40个座位,座位号为1~40。有一次报告会坐满了听众,报告会结束以后为听取意见,需留下32名听众进行座谈;
(3)某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本。
分析:(1)用抽签法或随机数表法。
(2)总体容量比较大,用抽签法或随机数表法比较麻烦。由于人员没有明显差异,且刚好32排,每排人数相同,可用系统抽样。
(3)由于学校各类人员对这一问题的看法可能差异较大,故应采用分层抽样方法。
【解】
追踪训练
1.某公司生产三种型号的轿车,产量分别为1200辆、6000辆、2000辆。为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车应分别抽取___ ____、___ ___和____ __辆。
2.某商场想通过检查发票及销售记录的2%来快速估计每月的销售总额,采取如下方法:从某本50张的发票存根中随机抽取一张,如15号,然后按顺序往后将65号、115号、165号、…发票上的销售额组成一个调查样本。这种抽取样本的方法是 ( )
(A)抽签法 (B)系统抽样
(C)分层抽样 (D)随机数表法
3.某班有50名学生,(其中有30名男生,20名女生)现调查平均身高,准备抽取10%,问应如何抽样?如果已知男女身高有显著不同,又应如何抽样?
解:(1)
4.某单位有2000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:
人数 管理 技术开发 营销 生产 小计
老年 40 40 40 80 200
中年 80 120 160 240 600
青年 40 160 280 720 1200
小计 160 320 480 1040 2000
(1)若要抽取40人调查身体情况,则应该怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对北京奥运会筹备情况的了解,则应怎样抽样?
【解】第14课时6.5复习课3
分层训练
1. 右图是2006年中央电视台举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数为( )
A. 83 B.84 C.85 D.86
2.有一个容量为45的样本数据,分组后各组的频数如下:
(12.5,15,5),3;(15.5,18.5),8;(18.5,21.5),9;(21.5.24.5),11;(24.5,27.5),10;(27.5,30.5),4;估计不大于27.5数据约为总体的( )
A.91% B.92% C.95% D.30%
3.将一个容量为100的样本数据,按照从小到大的顺序分为8个组,如下表:
组号 1 2 3 4 5 6 7 8
频数 10 16 18 15 11 9
若第6组的频率是第3组频率的2倍,则第6组的频率是_________.
4. 观察新生婴儿的体重,其频率分布直方图如图:
则新生婴儿体重在(2700,3000)的频率为______________________
5.采用简单随机抽样从含10个个体的总体中抽取一个容量为4的样本,则个体a前两次未被抽到,第三次被抽到的概率为_____________________
思考运用
6.从两个班中各随机的抽取名学生进行跳绳比赛,他们的每分钟跳绳次数如下:
甲班 76 74 83 96 66 77 78 72 52 65
乙班 86 84 64 76 78 92 82 74 88 85
画出茎叶图并分析两个班学生的每分钟跳绳情况. ( http: / / wxc. / )
解:
7.下面是一个病人的体温记录折线图,回答下列问题:
(1)护士每隔几小时给病人量一次体温?
(2)这个病人的体温最高是多少摄氏度?最低是多少摄氏度?
(3)他在4月8日12时的体温是多少摄氏度?
(4)他的体温在哪段时间里下降得最快?哪段时间里比较稳定?
(5)从体温看,这个病人的病情是在恶化还是在好转?
解:
8.从两个班级各抽5名学生测量身高,数据如下(单位:cm)
甲班:160,162,159,160,159;
乙班:180,160,150,150,160。
试估计哪个班级学生身高波动小?
本节学习疑点:
学生质疑
教师答复
7
8
9
9
44647
3线性回归方程
第26课时
【学习导航】
学习要求
1.进一步了解非确定性关系中两个变量的统计方法;
2.进一步掌握回归直线方程的求解方法.
【课堂互动】
自学评价
1.相关关系: .
2.回归分析: .
3. 求线性回归方程的步骤:
(4)将上述有关结果代入公式,求,写出回归直线方程.
【经典范例】
例1一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:
x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07
y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50
(1)画出散点图;(2)求月总成本y与月产量x之间的回归直线方程.
【解】
i 1 2 3 4 5 6 7 8 9 10 11 12
xi 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07
yi 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50
xiyi 2.43 2.264 2.856 3.264 3.590 4.07 4.643 5.090 5.652 6.096 6.653 7.245
=,==2.8475,=29.808,=99.2081,=54.243
1)画出散点图:
2)设回归直线方程,
例2 已知10只狗的血球体积及红血球数的测量值如下:
45 42 46 48 42 35 58 40 39 50
6.53 6.30 9.52 7.50 6.99 5.90 9.49 6.20 6.59 8.72
(血球体积),(红血球数,百万)
(1)画出上表的散点图;(2)求出回归直线度且画出图形.
【解】
追踪训练
1、以下是收集到的新房屋销售价格与房屋的大小的数据:
房屋大小() 80 105 110 115 135
销售价格(万元) 18.4 22 21.6 24.8 29.2
(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程,并在散点图中加上回归直线.
【解】第28课时6.5实习作业
【学习导航】
学习要求
1. 能运用简单随机抽样、分层抽样的方法抽取样本;
2. 能通过对样本的频率分布估计总体分布;
3. 培养学生动手能力和解决实际问题能力.
课堂互动】
【精典范例】
例1 某中学高中部共有16个班级,其中一年级6个班,二年级6个班,三年级4个班.每个班的人数均在46人左右(44人-49人),各班的男女学生数均基本各占一半.现要调查这所学校学生的周体育活动时间,它是指学生在一周中参加早锻炼、课间操、课外体育活动、体育比赛等时间的总和(体育课、上学和放学路上的活动时间不计在内).为使所得数据更加可靠,应在所定抽样的“周”之后的两天内完成抽样工作. 此外还有以下具体要求:
(1)分别对男、女学生抽取一个容量相同的样本,样本容量可在40-50之间选择.
(2)写出实习报告,其中含:全部样本数据;相应于男生样本的与,相应于女生的与,相应于男、女全体的样本的;对上面计算结果作出分析.
【解】(1)由于各个年级的学生参加体育活动的时间存在差异,应采用分层抽样;又由于各班的学生数相差不多,且每班的男女学生人数也基本各占一半,为便于操作,分层抽样时可以班级为单位.关于抽取人数,如果从每班中抽取男、女学生各3人,样本容量各为48(3×16),符合对样本容量的要求.
(2)实习报告如表所示:
题目 调查本校学生周体育活动的时间
对抽取样本的要求 1.周体育活动时间,指一周中(包括双休日)参加早锻炼、课间操、课外体育活动、体育比赛等时间的总和(体育课和上学、放学路上的活动时间不计在内).2.在所定抽样的“周”之后的两天内完成抽样工作.3.男、女学生的两个样本的容量相同,并在40-50之间选择.
确定抽样方法和样本容量 采用分层抽样,以班为单位,从每班中抽取男、女学生各3人,两个样本的容量均为48,在各班抽取时,采用随机数表法.
样本数据(单位:分) 男生 女生
一年级 380 500 245 450 145 620 480 420 520 280 550 660 350 500 330 600 180 520 230 460 600 110 420 105 580 400 420 380 180 500 140 450 600 400 125 540
二年级 420 580 510 175 280 630 400 150 450 360 450 330 400 420 300 500 580 400 280 380 530 95 100 570 300 220 320 250 300 350 400 360 130 450 590 230
三年级 380 420 235 125 400 470 330 200 420 280 300 410 200 460 165 400 75 430 300 220 250 130 270 340
计算结果 男生          ,女生          ,男、女生全体    
计算结果分析 从计算结果看到,在周体育活动时间方面,可以估计男生比女生略多,且波动程度略小,这所学校高中学生的周体育活动时间平均约为   分.
追踪训练
1 . 在本班范围内,就每名学生所在家庭的月人均用水量进行调查.调查的具体要求是:先查得在同一月份内各家的用水量(单位以计),然后将它除以家庭人中数,结果保留到小数点后第2位);再将所得数据进行整理、计算和分析,完成下列实习报告.
题目 调查本班每名学生所在家庭的月人均用水量
对获取数据的要求 这里的用水量是指同一月份内各学生所在家庭的人均用水量(下月第1天的水表数与本月第1天的水表数之差),数据单位为,结果保留到小数点后第2位.
样本数据(单位:)
频率分布表
频率分布直方图
样本平均数
统计结果的分析 要求讨论:通过对本问题的调查统计分析,可对全班同学所在地区的家庭月人均用水量作出何种估计?
备注 1.为了在所要求的时间内获取数据,调查任务就提前布置.2.实习报告可由部分同学完成,然后向全班同学报告并进行讨论.第6章 统计
一、知识结构
二、重点难点
重点:
三种常见抽样方法;总体分布的估计;总体特征数的估计;线性回归。
难点:
三种常见抽样方法的区别和特点;频率分布表;频率分布直方图、频率分布折线图、茎叶图的制作方法;平均数、方差、标准差的计算;变量之间的相关关系及线性回归方程的求法。
6.1 抽样方法
第16课时6.1.1 简单随机抽样
【学习导航】
知识网络
学习要求
1.明白样本、总体、样本容量等基本概念;
2.体会简单随机抽样的的概念及抽签法的基本步骤;
3.体会随机数表法也是等可能性抽样,感受用随机数表法进行抽样的基本步骤,并能熟运用。
【课堂互动】
自学评价
1. 基本概念:总体、个体、样本、样本的容量、总体平均数、样本平均数。
在统计学里,我们把所要考察对象的全体叫做总体,其中的每一个考察对象叫做个体,从总体中所抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本的容量.总体中所有个体的平均数叫做总体平均数,样本中所有个体的平均数叫做样本平均数.
2.统计学的基本思想方法:
统计学的基本思想方法是用样本估计总体,即通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.因此,样本的抽取是否得当,对于研究总体来说就十分关键.究竟怎样从总体中抽取样本?怎样抽取的样本更能充分地反映总体的情况?下面,我们就通过案例来学习一种常用的基本的抽样:简单随机抽样.
案例1 为了了解高一(1)班50名学生的视力状况,从中抽取10名学生进行检查.如何抽取呢
【分析】
在这个案例中,总体容量较小,显然可以用同学们最常见的抽签法来抽取样本.关键问题在于:抽签法能使每一个人被抽到的机会均等吗?对每一个人都公平吗?
好吧,让我们一起实践一次抽签的过程。在实践中思考抽签法需要哪些必要的步骤。
3. 抽签法
用抽签法从个体个数为N的总体中抽取一个容量为k的样本的步骤为:
(1)将总体中的所有个体编号(号码可以从1到N);
(2)将1到N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作;
(3)将号签放在同一箱中,并搅拌均匀;
(4)从箱中每次抽出1个号签,并记录其编号,连续抽取k次;
(5)从总体中将与抽得的签的编号相一致的个体取出。
注意:对个体编号时,也可以利用已有的编号,如从全班学生中抽取样本时,利用学生的学号作为编号;对某场电影的观众进行抽样调查时,利用观众的座位号作为编号等。
【小结】用抽签法抽取样本过程中,每一个剩余个体被抽到的机会是均等的,这也是一个样本是否具有良好的代表性的关键前提.没有每个个体机会均等,就没有样本的公平性和科学性.当然,抽签法简单易行,适用于总体中的个体数不多的情形.
在案例1中,还可以用另一种方法 ——随机数表法来抽取样本,它可以有效地简化抽签法的过程。
先让我们一起体会一下随机数表法抽取样本的过程,再完成下面的空格。
4.随机数表法(random number table)
随机数表中的每个数都是 用随机方法产生的(称为 随机数 )。
按一定规则到随机数表中选取号码,从而获得样本的方法就称为随机数表法
随机数表的制作方法有抽签法、抛掷骰子法、计算机生成法等等。
用随机数表法抽取样本的步骤:
(1)对总体中的个体进行编号(每个号码位数一致);
(2)在随机数表中任选一个数作为开始;
(3)从选定的数开始按一定的方向读下去,得到的数码若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满为止;
(4)根据选定的号码抽取样本。
5.简单随机抽样
从个体数为N的总体中逐个不放回地取出n个个体作为样本(n【经典范例】
例1 某校共有60个班级,为了调查各班级中男、女学生所占比例情况,试抽取8个班级组成的一个样本。
【解】按一定的次序将全校所有班级编号:1,2,3…,60,在60张相同的纸片上分别写上上述号码,号码向内将纸片叠制成统一形状的号签,将号签放入纸盒搅匀,每次一张,从中随机抽取8个纸签获得所需样本(如:2,13,44,14,50,6,37,27)
例2 总体有8个个体,请用随机数表法从中抽取一个容量为5的样本。如何操作(随机数表参见教科书41页)
【解】
第一步,将全部个体编号,可以1,2,3,4,5,6,7,8。
第二步,在随机数表中任意选择一个数,比如从第一行第25列的数9作为开始
第三步,从选定的数9开始向下读下去,9不在号码范围内,将它去掉,继续向下读,得到3,将它取出,再向下读,取出2,再往下又是3,前面已经取得,将它去掉,再往下取得7,再往下又取得8,再往下又是8、7和3,都在前面已经取得,去掉,再往下又取得5,于是抽取的样本号码是3,2,7,8,5
例3 某学校的高一年级共有200名学生,为了调查这些学生的某项身体素质达标状况,请使用随机数表法从总体中抽取一个容量为15的样本
【解】
第一步,将所有学生编号 :000,001,002,…,198,199。
第二步,选定随机数表中第一个数1作为开始。
第三步,从选定的数1开始按三个数字一组向右读下去,一行读完时按下一行自左向右继续读,将超过199或重复的三位数去掉,保留下来的三位数直到取足15个为止。得所要抽取的样本号码是162,175,068,047,176,025,067,016,
050,074,112,155,100,134,094
点评:1、在随机数表中,每一个位置上出现某一数字是等可能的,这就决定了从总体中抽到任何一个个体的号码也是等可能的。可见随机数表法属于简单随机抽样。
2、该题在用随机数表选号时,需要剔除大量不在个体编号范围内的号码数,这样挑号码不太方便,能否避免呢?
(可以规定所取的三位数中,凡在200~399者,均减200,凡400~599者,均减400…,使所有数组都小于200)
例4 假设一个总体有5个元素,分别记为a,b,c,d,e,从中采用不重复抽取样本的方法,抽取一个容量为2的样本,样本共有多少个?写出全部可能的样本。
【解】共有10种样本:a,b; a,c; a,d; a,e; b,c; b,d; b,e; c,d; c,e; d,e.
追踪训练
1.某次考试有10 000名学生参加,为了了解这10 000名考生的数学成绩,从中抽取1 000名考生的数学成绩进行统计分析,在这个问题中,有以下四种说法:(1)1 000名考生是总体的一个样本;(2)1 000名考生数学成绩的平均数是总体平均数;(3)10 000名考生是总体;(4)样本容量是1 000,其中正确的说法有( B )
A.1种  B.2种 C.3种 D.4种
2.关于简单的随机抽样,有下列说法:
(1)它要求被抽样本的总体的个数有限,以便对其中各个个体被抽取的可能性进行分析;
(2)它是从总体中逐个地进行抽取,以便在抽样实践中进行操作;
(3)它是一种不放回抽样;
(4)它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种方法抽样的公平性.其中正确的命题有( D )
A.(1)(2)(3) B.(1)(2)(4)
C.(1)(3)(4) D.(1)(2)(3)(4)
3.从100件电子产品中抽取一个容量为25的样本进行检测,试用随机数表法抽取样本。
【解】
第一步,将所有电子产品编号 :00,01,02,…,98,99。
第二步,选定随机数表中第一个数1作为开始。
第三步,从选定的数1开始按二个数字一组向右读下去,一行读完时按下一行自左向右继续读,将重复的二位数去掉,保留下来的二位数直到取足25个为止。
4.为了分析某次考试情况,需要从2 000份试卷中抽取100份作为样本,如何用随机数表法进行抽取?
【解】
第一步,将所有试卷编号 :0000,0001,0002,…,1998,1999。
第二步,选定随机数表中第一个数1作为开始。
第三步,从选定的数1开始按四个数字一组向右读下去,一行读完时按下一行自左向右继续读,将超过1999或重复的四位数去掉,保留下来的四位数直到取足100个为止。
统 计
抽样方法方法
总体分布的估计
总体特征数的估计
变量之间的关系
简单随机抽样
系统抽样方法
分层抽样方法
抽签法方法
随机数表法方法
频率分布表方法
频率分布直方图方法
折线图方法
茎叶图方法
平均数及其估计方法
方差方法
标准差方法
函数关系方法
相关关系方法
线性回归方法
线性回归方程方法
相关性检验与相关系数
简单随机抽样
随机数表法
抽签法第11课时线性回归方程(2)
分层训练
1.设有一个直线回归方程为 ,则变量x 增加一个单位时( )
A. y 平均增加 1.5 个单位
B. y 平均增加 2 个单位
C. y 平均减少 1.5 个单位
D. y 平均减少 2 个单位
2.已知关于某设备的使用年限与所支出的维修费用(万元),有如下统计资料:
使用年限 2 3 4 5 6
维修费用 2.2 3.8 5.5 6.5 7.0
设对呈线性相关关系.试求:(1)线性回归方程的回归系数;
(2)估计使用年限为10年时,维修费用为多少?
拓展延伸
3.在10年期间,一城市居民的年收入与某种商品的销售额之间的关系如下数据:
第几年 城市居民收入x(亿元) 某商品销售额y(万元)
1 32.3 25.0
2 32.1 30.0
3 32.9 34.0
4 35.8 37.0
5 37.1 39.0
6 38.0 41.0
7 39.0 42.0
8 43.0 44.0
9 44.6 48.0
10 46.0 51.0
(1)画出散点图;
(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的线性回归方程。
本节学习疑点:
学生质疑
教师答复第22课时 复习课1
【自学评价】
1.对总数为N的一批零件,抽取一个容量为30的样本,若每个零件被抽取的概率均为,则N的值为( C )
A.150 B.200 C.120 D.100
2.某中学组织春游,为了确定春游地点,打算从校学号为0034~2037的所有学生中,采用系统抽样抽取50名进行调查,学号为2003的同学被抽到的可能性为 ( D )
A. B. C. D.
3.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( B )
A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法
【精典范例】
例1 下列抽取样本的方式是否属于简单随机抽样?试说明道理.
(1)从无限多个个体中抽取100个个体作为样本;
(2)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后,再把它放回盒子里.
【解】 (1)不是,因为样本容量是无限的,而不是有限的.(2)不是,因为它是放回抽样.
例2 假设某地区有高中生2400人,初中生10900人,小学生11000人。此地区教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区中中小学生中抽取1%的学生进行调查,你认为应该怎样抽取样本?
【解】该问题中总体是由差异明显的几个部分组成,为了提高样本的代表性,考虑用分层抽样的方法来抽取样本.步骤如下:
①样本容量与总体中的个体数的比是
②样本中包含的高、初、小三类学生的个体数分别是:
,,
采用简单随机抽样或系统抽样从2400个高中生中抽取24个人,从10900个初中生中抽取109个人,从11000个小学生中抽取110个人,组成243个人的样本。
例3 为了比较甲、乙两位划艇运动员的成绩,在相同的条件下对他们进行了6次测验,测得他们的平均速度()分别如下:
甲:2.7 3.8 3.0 3.7 3.5 3.1
乙:2.3 3.9 3.8 3.4 3.6 2.8
(1)作出两运动员成绩的茎叶图;
(2)试根据以上数据,判断他们谁更优秀.
【解】 (1)茎叶图如下(中间为茎,两侧为叶):
(2)甲乙两人平均成绩均为3.3,从茎叶图看,甲的成绩集中,所以甲更优秀.
例4 为了了解长虹、创维、海尔、海信、厦华五种国内品牌背投电视机的市场占有率,A市场研究公司在某国美电器连锁店随机记录了72名顾客购买背投电视的品牌.下表是记录的原始数据:
长虹 长虹 厦华 海信 创维 海尔 海信 海尔 长虹 厦华 创维 创维 厦华 长虹 海尔 厦华 创维 长虹 长虹 创维 长虹 海信 海尔 长虹 创维 海信 海信 长虹 海信 厦华 海尔 海尔 厦华 长虹 长虹 长虹 海尔 创维 海尔 长虹 海尔 创维 创维 海尔 厦华 海尔 创维 厦华 创维 长虹 海尔 长虹 厦华 长虹 厦华 厦华 海尔 厦华 海尔 厦华 创维 厦华 海尔 长虹 海信 海尔 海信 海信 海尔 创维 海尔 创维
(1) 根据上述资料,编制频数分布表;
(2) 绘制频率分布直方图,以反映背投电视的消费分布.
【解】 (1) 频数分布表
分组 频数累计 频数 频率
长虹 17 17 0.236111
创维 31 14 0.194444
厦华 45 14 0.194444
海信 54 9 0.125
海尔 72 18 0.25
(2)
【追踪训练】
1. 某公司的职工由管理人员、后勤人员、业务人员三部分组成,其中管理人员20人,后勤人员与业务人员之比为3:16,为了了解职工的文化生活状况,要从中抽取一个容量为21的样本,其中后勤人员入样3人,则该公司的职工共有____210____人.
2.一个总体中编号为1,2,3, ...,100的100个个体,平均分在10个小组,组号依次为0,1,2, ...,9.要用系统抽样的方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为,那么在第组抽取的号码的个位数为或(如果)
.当时,写出所抽取的全部样本号码.
【解】 按系统抽样的规定,所抽样本依次是7,18,29,30,41,52,63,74,85,96.
3.为了解高中学生的体能情况,抽了100名学生进行引体向上次数测试,将所得数据整理后,画出频率分布直方图(如右图所示),图中从左到右依次为第1,2,3,4,5组.
(1)第1组的频率为____0.1______,频数为___10 _______.
(2)若次数在5次(含5次)以上为达标,则达标率为____65%____ .
4. 为了了解中学生的身高情况,对某中学同龄的50名男学生的身体进行了测量,结果如下:(单位:cm)
175 168 170 176 167 181 162 173 171 177 171 171 174 173 174 175 177 166 163 160 166 166 163 169 174 165 175 165 170 158 167 174 172 166 172 167 172 175 161 173 170 172 165 157 172 173 166 177 169 181
列出样本的频率分布表,画出频率分布直方图.
解: 频率分布表如下:
分组 频数 频率
156.5~160.5 3 0.06
160.5~164.5 4 0.08
164.5~168.5 12 0.24
168.5~172.5 13 0.26
172.5~176.5 13 0.26
176.5~180.5 3 0.06
180.5~184.5 2 0.04
合计 50 1.00
频率分布直方图:
2
3


7
01578
38
4689线性回归方程
第26课时
【学习导航】
学习要求
1.进一步了解非确定性关系中两个变量的统计方法;
2.进一步掌握回归直线方程的求解方法.
【课堂互动】
自学评价
1.相关关系: 当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系 .
2.回归分析: 对具有相关关系的两个变量进行统计分析的方法 .
3. 求线性回归方程的步骤:
(4)将上述有关结果代入公式,求,写出回归直线方程.
【精典范例】
例1一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:
x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07
y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50
(1)画出散点图;(2)求月总成本y与月产量x之间的回归直线方程.
【解】
i 1 2 3 4 5 6 7 8 9 10 11 12
xi 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07
yi 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50
xiyi 2.43 2.264 2.856 3.264 3.590 4.07 4.643 5.090 5.652 6.096 6.653 7.245
=,==2.8475,=29.808,=99.2081,=54.243
1)画出散点图:
2)设回归直线方程,
利用,计算a,b,得b≈1.215, a=≈0.974,
∴回归直线方程为:
例2 已知10只狗的血球体积及红血球数的测量值如下:
45 42 46 48 42 35 58 40 39 50
6.53 6.30 9.52 7.50 6.99 5.90 9.49 6.20 6.59 8.72
(血球体积),(红血球数,百万)
(1)画出上表的散点图;(2)求出回归直线度且画出图形.
【解】(1)图略
(2)
=
设回归直线方程为,则,=
所以所求回归直线的方程为
追踪训练
1、以下是收集到的新房屋销售价格与房屋的大小的数据:
房屋大小() 80 105 110 115 135
销售价格(万元) 18.4 22 21.6 24.8 29.2
(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程,并在散点图中加上回归直线.
【解】(1)散点图(略)
(2)
所以,线性回归方程为.
2、一个工厂在某年里每月产品的总成本y(单位:万元)与月产量x( 单位:万件)之间有如下一组数据:
x 1.08 1.12 1.19 1.28 1.36 1.48
y 2.25 2.37 2.40 2.55 2.64 2.75
x 1.59 1.68 1.80 1.87 1.98 2.07
y 2.92 3.03 3.14 3.26 3.36 3.50
(1) 画出散点图;
(2) 求出月总成本与月产量x 之间的线性回归方程。
解:散点图:
(2) 所求的回归直线方程是:
=1.216 x+0.9728.第7课时复习课1
分层训练
1.为了了解所加工的一批零件的长度,抽测了200个零件的长度,在这个问题中,200个零件的长度是 ( )
A.总体 B. 个体 C. 总体的一个样本 D. 样本容量
2. 在一个个体数目为1003的总体中,要利用系统抽样抽取一个容量为50的样本,那么总体中每个个体被抽到的概率是 ( )
A. B. C. D.
3. 为了了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔k为 ( )
A.40 B. 30 C. 20 D. 12
4. 一批热水器共偶98台,其中甲厂生产的有56台,乙厂生产的有42台,用分层抽样从中抽出一个容量为14的样本,那么甲、乙两厂各抽得的热水器的台数是 ( )
A.甲厂9台,乙厂5台 B. 甲厂8台,乙厂6台
C. 甲厂10台,乙厂4台 D. 甲厂7台,乙厂7台
5. 某工厂有3条流水线生产同一种产品.在每条流水线上,每生产若干产品就要抽取1件产品进行检验.某日共检验150件产品.已知第1、2、3三条流水线上所生产的产品数之比为2:3:5,则这一天在第2条流水线上共检验了_______件产品.
6.在某次学生考试的成绩中随机抽取若干学生的成绩,分组与各组的频数如下:[40,50),4;[50,60),1;[60,70),10;[70,80),11;[80,90),18;[90,100),6,估计本次考试的及格率为___________
思考运用
7.某中学高一年级有x个学生,高二年级共有900个学生,高三年级有y个学生,采用分层抽样抽一个容量为370人样本,高一年级抽取120人,高三年级抽取100人,则全校高中部共有多少个学生?
解:
8.如图,是某单位职工年龄(取正整数)的频数分布图,根据图形提供的信息,回答下列问题(直接写出答案)
注:每组可含最低值,不含最高值
(1)该单位职工共有多少人?
(2)不小于38岁但小于44岁的职工人数占职工总人数的百分比是多少?
(3)如果42岁的职工有4人,那么年龄在42岁以上的职工有几人?
解:
9.如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:
(1)79.5---89.5这一组的频数、频率分别是多少?
(2)估计这次环保知识竞赛的及格率(60分及以上为及格)
解:
10.为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:
组 别 频数 频率
145. ( http: / / wxc. / )5~149. ( http: / / wxc. / )5 1 0.02
149. ( http: / / wxc. / )5~153. ( http: / / wxc. / )5 4 0.08
153. ( http: / / wxc. / )5~157. ( http: / / wxc. / )5 20 0.40
157. ( http: / / wxc. / )5~161. ( http: / / wxc. / )5 15 0. ( http: / / wxc. / )30
161. ( http: / / wxc. / )5~165. ( http: / / wxc. / )5 8 0. ( http: / / wxc. / )16
165.5~169.5 m n
合 计 M N
(1)求出表中所表示的数分别是多少?
(2)画出频率分布直方图. ( http: / / wxc. / )
(3)全体女生中身高在哪组范围内的人数最多?
解:
本节学习疑点:
学生质疑
教师答复第2课时6.1.2系统抽样
分层训练
1.为了解高三学生身体状况,某学校将高三每个班学号的个位数为1的学生选作代表进行调查体检,这种抽样方法称为 ( )
(A)系统抽样 (B)抽签法
(C)简单随机抽样 (D)随机数表法
2.系统抽样适用的范围是 ( )
(A)总体中个数较少 (B)总体中个数较多 (C)总体由差异明显的几部分组成
(D)以上均可以
3.要从已编号(1~50)的50辆新生产的赛车中随机抽取5辆进行检验,用系统抽样方法确定所选取的5辆赛车的编号可能是 ( )
(A)5,10,15,20,25 (B)3,13,23,33,43,
(C)5,8,11,14,17 (D)4,8,12,16,20
4.从2321个产品中选取一个容量为30的样本,那么总体中应随机剔除的个体数目是( )
(A)1 (B)11 (C)21 (D)31
5.下列抽样是系统抽样的是____________
A:从标有1~15号的15个球中,任选三个作为样本,按从小号到大号排序,随机选起点k,以后k+5,k+10(超过15则从1再数起)号入样。
B:工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔5分钟抽一件产品进行检验。
C:搞某一市场调查,规定在商场门口随机抽一个人进行询问调查,直到调查到事先规定调查人数为止。
D:报告厅对与会听众进行进行调查,通知每排(每排人数相等)座位号为14的观众留下来座谈。
6.某中学组织春游,为了确定春游地点,打算从该校学号为0034~2037的所有学生中,采用系统抽样选50名进行调查,则学号为2003的同学被选中的可能性为__________
7.某工厂有103名工人,从中抽取10人参加体检,试采用简单随机抽样和系统抽样两种方法进行抽样.
8.简述系统抽样与简单随机抽样之间的联系与区别。
思考运用
9.某年的有奖邮政明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式,确定号码后四位为2709的获得三等奖。这是运用什么方法来确定三等奖号码的?共有多少个三等奖号码?
10.一批产品中,有一级品100个,二级品60个,三级品40个,分别用系统抽样法和抽签法,从这批产品中抽取一个容量为20的样本
本节学习疑点:
学生质疑
教师答复第20课时 频率分布直方图和折线图
【学习导航】
知识网络
学习要求
1.频率分布直方图的作法,频率分布直方图更加直观形象地反映出总体分布的情况;
2.频率分布折线图的作法,优点是反映了数据的变化趋势,如果样本容量足够大,分组的组距足够小,则这条折线将趋于一条曲线,称为总体分布的密度曲线。
【课堂互动】
自学评价
案例1 下表是某学校一个星期中收交来的失物件数,请将5天中收交来的失物数用条形图表示.
星 期 一 二 三 四 五
件 数 6 2 3 5 1
累 计 6 8 11 16 17
解 用EXCEL作条形图:
(1)在EXCEL工作表中输入数据,光标停留在数据区中;
(2)选择“插入/图表”,在弹出的对话框中点击“柱形图”;
(3)点击“完成”,即可看到如下频数条形图.
案例2 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm)。试作出该样本的频率分布直方图和折线图.
168 165 171 167 170 165 170 152 175 174
165 170 168 169 171 166 164 155 164 158
170 155 166 158 155 160 160 164 156 162
160 170 168 164 174 171 165 179 163 172
180 174 173 159 163 172 167 160 164 169
151 168 158 168 176 155 165 165 169 162
177 158 175 165 169 151 163 166 163 167
178 165 158 170 169 159 155 163 153 155
167 163 164 158 168 167 161 162 167 168
161 165 174 156 167 166 162 161 164 166
【解】上一课时中,已经制作好频率分布表,在此基础上, 我们绘制频率分布直方图.
(1)作直角坐标系,以横轴表示身高,纵轴表示;
(2)在横轴上标上150.5,153.5,156.5,…,180.5表示的点。(为方便起见,起始点150.5可适当前移);
(3)在上面标出的各点中,分别以连结相邻两点的线段为底作矩形,高等于该组的
至此,就得到了这组数据的频率分布直方图,如下图
0.08
0.06
0.04
0.02
150.5 153.5 156.5 159.5 162.5 165.5 168.5 171.5 174.5 177.5 180.8
同样可以得到这组数据的折线图.
0.08
0.06
0.04
0.02
150.5 153.5 156.5 159.5 162.5 165.5 168.5 171.5 174.5 177.5 180.8
【小结】
1.利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图(frequency histogram),简称频率直方图。
2. 频率直方图比频率分布表更

3.如果将频率分布直方图中相邻的矩形的 ,就得到一条折线,我们称这条折线为本组数据的频率折线图(frequency polygon)
4.频率分布折线图的的首、尾两端如何处理:


5.如果将样本容量取得 ,分组的组距取得 ,则这条折线趋于 , 称为总体分布的密度曲线。
6. 频率分布表的优点在于数据明显,利于对总体相应数据的计算或说明;频率分布折线图的优点在于数据的变化趋势直观,易于观察数据分布特征,且与总体分布的密度曲线关系密切;频率分布直方图则两者兼顾但两者皆不足.所以三种分布方法各有优劣,应需要而运用.
【经典范例】
例为了了解一大片经济林的生长情况,随机测量其中的100株的底部周长,得到如下数据表(长度单位:cm)
135 98 102 110 99 121 110 96 100 103
125 97 117 113 110 92 102 109 104 112
109 124 87 131 97 102 123 104 104 128
105 123 111 103 105 92 114 108 104 102
129 126 97 100 115 111 106 117 104 109
111 89 110 121 80 120 121 104 108 118
129 99 90 99 121 123 107 111 91 100
99 101 116 97 102 108 101 95 107 101
102 108 117 99 118 106 119 97 126 108
123 119 98 121 101 113 102 103 104 108
(1) 编制频率分布表;
(2) 绘制频率分布直方图;
(3) 估计该片经济林中底部周长小于100cm 的树木约占多少,周长不小于120cm的树木约占多少。
【解】(完成空格和表格)
(1)从表中可以看出,这组数据的最大值为 ,最小值为 ,故全距为 ,可将其分为11组,组距为 。
 从第一组开始,将各组的频数,频率和填入表中
分 组 频 数 频 率
1
2
4
14
24
12
9
11
2
合计 100
(2)绘制频率分布直方图:
(3)
追踪训练
1. 在调查某产品尺寸过程中,将其尺寸分成若干组,是其中的一组.已知该组的频率为,该组的直方图的高为,则等于 ( )
A. B. C. D.
2.有一个容量为50的样本,数据分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5),4.
(1)列出样本频率分布图表;
(2)画出频率分布直方图;
(3)画出数据频率折线图.
解: (1)频率分布表为:
(2)频率分布直方图为:
(3)数据频率折线图为:
3.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.
根据条形图可得这50名学生这一天平均每天的
课外阅读时间为( )
A.0.6小时 B.0.9小时
C.1.0小时 D.1.5小时
频率分布表方法
频率分布直方图方法
茎叶图方法
总体分总体分布的估计布的估计
折线图第12课时复习课2
分层训练
1.三点(3,10),(7,20),(11,24)的线性回归方程是 ( )
A. B.
C. D.
2.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4 8.4 9.4 9.9 9.6 9.4 9.7 ,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 ( )
A.9.4,0.484 B.9.4,0.016 C.9.5,0.04 D.9.5, 0.016
3.根据1994~2004年统计数据,全国营业税税收总额(亿元)与全国社会消费品零售总额(亿元)之间有如下线性回归方程,则全国社会消费品零售总额每增加1亿元时,全国营业税税收总额( )
A.平均增加7.658百万元 B.平均减少705.01亿元
C.增加7.658百万元 D.减少705.01亿元
4.回归直线方程中的是预测值,与实际中的关系为 ( )
A.越小,说明回归偏差越小
B.越大,说明回归偏差越小
C.越小,说明回归偏差越小
D.越小,说明回归偏差越小
5.两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2. 那么样本甲和样本乙的波动大小情况是 ( )
A.甲、乙波动大小一样 B. 甲的波动比乙的波动大
C. 乙的波动比甲的波动大 C. 甲、乙的波动大小无法比较
思考运用
6.某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量,分别记录抽查数据如下:
甲:102,101,99,98,103,98,99;
乙:110,115,90,85,75,115,110.
(1)这种抽样方法是哪一种方法?
(2)试计算甲、乙两个车间产品重量的平均数与方差,并说明哪个车间产品较稳定?
解:
7.某工厂有经理1人,另有6名管理人员,5名高级技工,10名工人和1名学徒.现在需要增加一名新工人,小张前来应聘,经理说:“我公司报酬不错,平均工资每周300元.”小张几天后找到经理说:“你欺骗了我,我问过其他工人,没有一个工人的周工资超过200元.平均工资怎么可能是300元呢?”经理拿出如下的工资表说:“你看,平均工资就是300元.”
人 员 经 理 管理人员 高级技工 工 人 学 徒 合 计
周工资(元) 2200 250 220 200 100
人 数 1 6 5 10 1 23
合 计 2200 1500 1100 2000 100 6900
小张通过计算发现本题中总体平均数恰为(2200×1+250×6+220×5+200×10+100×1)÷23=300,并没有错.这个问题中,总体平均数能客观反映工人的工资水平吗 为什么
解:
8.养鱼场对放养一年的某种鱼的生长状况进行调查,并随机捞取该类鱼的40尾称量出它们的体重作为样本,获得的数据如下(单位:g)
1020 1130 1200 980 1010
1290 1100 1170 1160 1080
1100 1210 1180 1020 1090
1000 1200 1210 1280 1040
1310 1200 1200 1080 1290
1050 1000 1040 1150 1150
1070 1160 1140 1300 1030
1060 1090 1130 1170 1170
估计总体的算术平均数。
【解】
本节学习疑点:
学生质疑
教师答复第18课时分层抽样
【学习导航】
学习要求
1.体会分层抽样的的概念及如何用分层抽样获取样本;
2.感受分层抽样也是等可能性抽样,它适用于总体由差异明显的几部分组成的;
3.简单随机抽样、系统抽样、分层抽样的特点及适用范围。
【课堂互动】
自学评价
案例1 某校高一、高二和高三年级分别有学生1000,800和700名,为了了解全校学生的视力情况,欲从中抽取容量为100的样本,怎样抽样较为合理.
【分析】如果在2500名学生中随机抽取100名学生作为样本,或者在三个年级中平均抽取学生组成样本,这样的样本是否合理?能否反映总体情况?
由于不同年级的学生视力状况有一定的差异,为准确反映客观实际,不仅要使每个个体被抽到的机会均等,而且要注意总体中个体的层次性,从而使抽取的样本具有良好的代表性. 对于这种容量较大、个体差异较大且明显分成几部分的总体,就考虑用分层抽样来抽取样本.
1.分层抽样
分层抽样的概念:当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这样的抽样方法称为分层抽样(stratified sampling)
分层抽样的步骤为:
(1)将总体按一定标准分层;
(2)计算各层的个体数与总体的个体数的比;
(3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量;
(4)在每一层进行抽样(可用简单随机抽样或系统抽样)。
【小结】①分层抽样适用于总体由差异比较明显的几个部分组成的情况,是等可能抽样,它也是客观的、公平的;
②分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时可以根据情况采用不同的抽样方法,因此在实践中有着非常广泛的应用.
2.三种抽样方法的比较
类别 特点 相互联系 适用范围 共同点
简单随机抽样 从总体中逐个抽取 总体中的个体数较少 抽样过程中每个个体被抽到的可能性相同
系统抽样 将总体平均分成几部分,按事先确定的规则分别在各部分中抽取 在起始部分抽样时,采用简单随机抽样 总体中的个体数较多
分层抽样 将总体分成几层,按各层个体数之比抽取 各层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成
【精典范例】
例1 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取。
【解】
因为机构改革关系到各种人的不同利益,故采用分层抽样方法为妥。
所以从副处以上干部中抽取2人,从一般干部中抽取14人,从工作中抽取4人。
例2 某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示:
很喜爱 喜爱 一般 不喜爱
2435 4567 3926 1072
电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应怎样进行抽样?
分析:因为总体中人数较多,所以不宜采用简单随机抽样,又由于持不同态度的人数差异较大,故也不宜用系统抽样方法,而以分层抽样为妥。
【解】
可用分层抽样方法,其总体容量为12000,
“很喜爱”占,应取人
“喜爱” 占,应取人
“一般” 占,应取人
“不喜爱”占,应取人
因此,采用分层抽样的方法在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2435人、4567人、3926人和1072人中分别抽取12人、23人、20人和5人。
例3 某所学校有小学部、初中部和高中部,在校小学生、初中生和高中生之比为5:2:3,且已知初中生有800人,现要从这所学校中抽取一个容量为80的样本以了解他们对某一问题的看法,应采用什么抽样方法?从小学部、初中部及高中部各抽取多少名?总体上看,平均多少名学生中抽取到一名学生?
【解】
因为总体由三类差异明显的个体构成,所以应采用分层抽样的方法进行抽取。
由于样本容量为80,小学生、初中生、高中生之比为5:2:3,
所以就抽取
小学生为(人),
初中生为(人)
高中生为(人)
800名初中生抽取16人,,所以平均50名学生中抽取一名学生。
例4 下列问题中,采用怎样的抽样方法较为合理?
(1)从10台冰箱中抽取3台进行质量检查;
(2)某电影院有32排座位,每排有40个座位,座位号为1~40。有一次报告会坐满了听众,报告会结束以后为听取意见,需留下32名听众进行座谈;
(3)某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本。
分析:(1)用抽签法或随机数表法。
(2)总体容量比较大,用抽签法或随机数表法比较麻烦。由于人员没有明显差异,且刚好32排,每排人数相同,可用系统抽样。
(3)由于学校各类人员对这一问题的看法可能差异较大,故应采用分层抽样方法。
【解】
(1) 用抽签法或随机数表法。
(2)将每排的40个人组成一组,共32组,从第一排至第32排分别为第1~32组,先在第一排用简单随机抽样法抽出一名听众,再将其各排与此听众座位号相同的听众全部取出。
(3)总体容量为160,故样本中
教师人数应为名,
行政人员人数为
后勤人员人数为
追踪训练一
1.某公司生产三种型号的轿车,产量分别为1200辆、6000辆、2000辆。为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车应分别抽取__6_____、___30___和____10__辆。
2.某商场想通过检查发票及销售记录的2%来快速估计每月的销售总额,采取如下方法:从某本50张的发票存根中随机抽取一张,如15号,然后按顺序往后将65号、115号、165号、…发票上的销售额组成一个调查样本。这种抽取样本的方法是 ( B )
(A)抽签法 (B)系统抽样
(C)分层抽样 (D)随机数表法
3.某班有50名学生,(其中有30名男生,20名女生)现调查平均身高,准备抽取10%,问应如何抽样?如果已知男女身高有显著不同,又应如何抽样?
解:(1)可用系统抽样的方法:
第一步 先将这50名学生从00到49随机编号,并分成5段;
第二步 在第一段00、01、02、03、…、09这十个编号中用简单随机抽样确定起始号码,比如03
第三步 将003逐次加上部分的“长度”(第一部分中个体的个数)的0倍、1倍、2倍、…、9倍得到样本:
03、13、23、33、43
(2) 因为总体由两类差异明显的个体构成,所以应采用分层抽样的方法进行抽取:其中男生抽三名,女生抽两名。
4.某单位有2000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:
人数 管理 技术开发 营销 生产 小计
老年 40 40 40 80 200
中年 80 120 160 240 600
青年 40 160 280 720 1200
小计 160 320 480 1040 2000
(1)若要抽取40人调查身体情况,则应该怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对北京奥运会筹备情况的了解,则应怎样抽样?
【解】
(1)因为身体状况主要与年龄有关,所以应按老年、中年、青年分层抽样法进行抽样,要抽取40人,可以在老年、中年、青年职工中分别抽取4,12,24人.
(2)因为出席这样的座谈会的人员应该代表各个部门,所以可用按部门分层抽样的方法进行抽样.要抽取25人,可以在管理、技术开发、营销、生产各部门的职工中分别随机抽取2,4,6,13人.
(3)对北京奥运会筹备情况的了解与年龄、部门关系不大,可以用系统抽样或简单随机抽样进行.第24课时 方差与标准差
【学习导航】
学习要求
1.体会方差与标准差也是对调查数据的一种简明的描述,要求熟练记忆公式,并能用于生产实际和科学实验中;
2.体会方差与标准差对数据描述中的异同。
【课堂互动】
自学评价
案例 有甲乙两种钢筋现从中各抽取一个样本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.
甲 110 120 130 125 120
125 135 125 135 125
乙 115 100 125 130 115
125 125 145 125 145
哪种钢筋的质量较好
【分析】
在平均数相同的情况下,观察上述数据表,发现乙样本的最小值100低于甲样本的最小值110,最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.
在平均数相同的情况下,比较两组数据的极差能大概判断它们的稳定程度.
极差: 我们把一组数据的最大值与最小值的差称为极差.
从数据表上可以看出,乙的极差较大,数据较分散;甲的极差小,数据较集中,这就说明甲比乙稳定.
运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.这时,我们考虑用更为精确的方法——方差.
在上一课时中,学习了总体平均数的估计,其中提到平均数是“最理想”近似值的缘由.同样我们可以考虑每一抗拉强度与平均抗拉强度的离差,离差越小,稳定性就越高.
那么,怎样来刻画一组数据的稳定程度呢?
在上一课时中,设n个实验值(=1,2,…,n)的近似值为,那么它与这n个实验值(=1,2,…,n)的离差分别为,,…,.由于上述离差有正有负,故不宜直接相加.可以考虑将各个离差的绝对值相加,研究||+||+…+||取最小值时的值.但由于含绝对值,运算不太方便,所以考虑离差的平方和,即()2+()2+…+()2,当此和最小时,对应的的值作为近似值,因为
()2+()2+…+()2
=,
所以当时离差的平方和最小,故可用作为表示这个物理量的理想近似值,称其为这n个数据,,…,的平均数或均值,一般记为 .
在上述过程中,可以发现,一组数据与其平均数的离差的平方和最小,考虑用与其平均数的离差的平方和来刻画一组数据的稳定程度是可行的.即本案例中,可用各次抗拉强度与平均抗拉强度的差的平方和表示.由于比较的两组数据的容量可能不同,因此应将上述平方和除以数据的个数,我们把由此所得的值称为这组数据的方差.
因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们将方差开方后的值称为这组数据的标准差.标准差也可以刻画数据的稳定程度.
一般地,设一组样本数据,其平均数为,则称
为这个样本的方差,其算术平方根 为样本的标准差,分别简称样本方差,样本标准差.
根据上述方差计算公式可算得甲、乙两个样本的方差分别为50和165,故可认为甲种钢筋的质量好于乙种钢筋.
【精典范例】
例1 甲、乙两种冬水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2), 试根据这组数据估计哪一种水稻品种的产量比较稳定:
品 种 第1年 第2年 第3年 第4年 第5年
甲 9.8 9.9 10.1 10 10.2
乙 9.4 10.3 10.8 9.7 9.8
【解】
甲品种的样本平均数为10,样本方差为
=0.02
乙品种的样本平均数也为10,样本方差为
=0.24
例2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换。已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差
天 数 151~180 181~210 211~240 241~270 271~300 301~330 331~360 361~390
灯泡数 1 11 18 20 25 16 7 2
【分析】用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命。
【解】
各组中值分别为165,195,225,255,285,315,
345,375,由此算得平均数约为
=267.9
将各组中值对于此平均数求方差得
=2128.60(天2)
故标准差约为
答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天。
例3(1)求下列各组数据的方差与标准差(结果精确到0.1):
甲 1 2 3 4 5 6 7 8 9
乙 11 12 13 14 15 16 17 18 19
丙 10 20 30 40 50 60 70 80 90
丁 3 5 7 9 11 13 15 17 19
(2)比较计算结果,各组方差和标准差的关系是什么?
【解】
(1) 甲:6.7,2.6; 乙:6.7,2.6
丙:666.7,25.8 丁:26.7,5.2
(2) 乙的方差与标准差分别与甲的相同;
丙的方差是甲的方差的100倍,标准差是甲的10倍;
丁的方差是甲的方差的4倍,标准差是甲的2倍
例4某市共有50万户居民,城市调查队按千分之一的比例进行入户调查,抽样调查的结果如下
家庭人均月收入(元) 工作人员数 管理人员数
20 5
60 10
200 50
80 20
40 15
合 计 400 100
(1)一般工作人员家庭人均月收入的估计及其方差的估计;
(2)管理人员家庭人均月收入的估计及其方差的估计
(3)平均数的估计及总体方差的估计
【解】分组数据用组中值作为本组数据的代表。
(1) =995, =83475
(2) =1040, =90900
(3) =1004 =85284
追踪训练
1.若样本,,,...,的平均数,方差,则样本,,,...,的平均数=______20_____ ,=____0.4_____.
2.若,…,的方差为3,则,,…,的方差为12。
3.计算下列两组数据的平均数和标准差.
甲 9.9 10.3 9.8 10.1
10.4 10.0 9.8 9.7
乙 10.2 10.0 9.5 10.3
10.5 9.6 9.8 10.1
解:
甲的平均数为:0.66
标准差:0.21
乙的平均数为:10
标准差:0.92第13课时6.5实习作业
探索思考
两位同学各取一副52张的花色牌,每张牌都标有从1到13之间的一个正整数(其中A表示1,J表示11,Q表示12,K表示13).从这副牌中任抽1张,记下这张牌上的数,再将这张牌放回,然后再从中任抽1张,记下牌上的数后,将这张牌放回.如此重复100次,得到100个数.求其平均数、方差及标准差,各自列出自己的频率分布表,绘出频率分布直方图,对比两人得出的结果,体会随机抽样的特点及内涵,写出实验报告.
题目 随机抽样的特点及内涵
对抽样的要求 从52张花色牌有放回地任抽一张
样本数据
样本平均数
样本方差
样本标准差
频率分布表
频率分布直方图
计算结果分析第6课时6.2.3茎叶图
分层训练
1.对两名学生一周的睡眠情况调查研究发现:甲同学每晚的睡觉时间为19时、21时、21时、24时、02时、01时和20时;乙同学每晚的睡觉时间为22时、21时、21时、22时、23时、24时、和19时。请作出两名学生睡觉时间的茎叶图,并比较分析,能得出什么结论?
2.用茎叶图表示数据,有哪些优缺点?
3.某中学高三期中模拟考试的数学成绩数据如下:
77 66 88 72 76 54 41 96 69
97 60 63 84 83 90 95 82 76
88 97 87 95 87 74 79 85 83
80 42 54 53 79 88 69 67 85
作出这个班数学成绩的茎叶图,并算出最高和最低分,及班级平均分。
4.非典期间某医院的发热门诊部对一天接待的16名病人的体温进行了测量,得到以下数据:
37.5 38.0 39.2 38.5
39.5 37.8 39.1 38.2
37.6 39.2 38.1 39.5
37.5 38.5 38.7 39.3
请作出当天病人体温数据的茎叶图,并计算出病人的平均体温。
5.为了分析某校英语四级考试情况,今抽查了100份英语试卷,成绩如下(单位:分):
64 55 47 78 12 18 62 73 49 58
57 84 67 46 26 86 49 68 10 63
97 27 76 60 51 53 71 37 90 69
55 64 84 72 67 56 67 59 54 48
62 53 51 66 80 53 79 64 54 77
76 37 50 42 33 52 83 95 89 68
58 66 70 21 65 63 48 68 33 46
75 58 86 93 20 68 56 61 67 79
52 57 40 35 75 69 70 63 65 71
79 34 67 86 15 80 25 54 60 63
列出样本的茎叶图。
思考运用
6.有一个容量为50的样本,其数据的茎叶图表示如下:
1 34566678888999
2 0000112222233334455566667778889
3 01123
将其分成7组并要求
(1) 列出样本的频率分布表:
(2) 画出频率分布直方图。
本节学习疑时:
学生质疑
教师答复第1课时6.1.1简单随机抽样
分层训练
1.某校有40个班,每班50人,每班选派3人参加活动,样本容量是    ( )
(A)40 (B)50 (C)120 (D)150
2.在简单随机抽样中,某一个个体被抽到的可能性 ( )
(A) 与第几次抽样有关,最后一次抽到的可能性最大
(B) 与第几次抽样有关,第一次抽到的可能性最小
(C) 与第几次抽样无关,每次抽到的可能性相等
(D) 与第几次抽样无关,每次都是等可能的概率,但各次抽取的可能性不一样
3.为了了解某地1200名国家公务员的英语水平状况,从中抽取100名公务员的考试成绩进行统计分析。在这个问题中,1200名国家公务员的成绩的全体是 ( )
(A)总体 (B)个体
(C)一个样本 (D)样本的容量
4.简单随机抽样的常用方法有______和_______.当随机地选定随机数表读数,选定开始读数的数后,读数的方法可以是___________
5. 采用简单随机抽样,从含有6个个体的总体中抽取一个容量为3的样本,每个个体被抽到的可能性为____________.
6.为了了解某班同学会考的及格率,要从该班60个同学中抽取30个进行考查分析,则在这次考查中的总体数为__________,样本容量为________
7.用简单随机抽样从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽到的可能性相等吗?是多少
8.从某班48名学生中随机选取10名学生调查他们的上网情况,试用随机数表法抽取样本(随机数表参见教科书41).
思考运用
9.下列抽取样本的方式是否属于简单随机抽样?说明道理。
(1)从无限多个个体中抽取100个个体作样本;
(2)盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里。
拓展延伸
10.上海某中学从40名学生中选1人作为上海男篮拉拉队成员,采用下面两种选法:
选法一:将这40名学生从1~40进行编号,相应的制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽1个号签,与这个号签编号一致的学生幸运入选;
选法二:将39个白球与一个红球混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为拉拉队成员。
试问这两种选法是否都是抽签法?为什么?这两种选法有何异同?
本节学习疑点:
学生质疑
教师答复第3课时6.1.3分层抽样
分层训练
1.高一、高二、高三学生共3200名,其中高三800名,如果通过分层抽样的方法从全体学生中抽取一个160人的样本,那么应当从高三年级的学生中抽取的人数是 ( )
(A)160 (B)40 (C)80 (D)320
2.某年级有10个班,每个班同学按1~ 50编号,为了了解班上某方面情况,要求每班编号为10号的同学去开一个座谈会,这里运用的抽样方法是 ( )
(A)分层抽样 (B) 系统抽样
(C)简单随机抽样 (D)抽签法
3.某校共有2500名学生,其中男生1300名,女生1200名,用分层抽样法抽取一个容量为200的样本,则男生应抽取____________名.
4.一个公司有N个员工,下设一些部门,现采用分层抽样方法从全体员工中抽取一个容量为n的样本(N是n的倍数)。已知某部门被抽取m个员工,那么这一部门的员工数是____________.
5.某校高中部有学生950人,其中高一年级学生350人,高二年级学生400人,其余为高三年级学生,若采用分层抽样从高中部所有学生中抽取一个容量为190的样本,则每个年级应该抽取多少人?高一_______,高二_____.
6.某年的有奖邮政明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式,确定号码后四位为2709的获得三等奖。这是运用什么方法来确定三等奖号码的?共有多少个三等奖号码?
7.系统抽样法,分层抽样法适用的范围分别是_______________________________________和____________________________________
8.某工厂中共有职工3000人,其中,中、青、老职工的比例为5:3:2,从所有职工中抽取一个容量为400的样本,应采取哪种抽样方法较合理?且中、青、老年职工应分别抽取多少人?
思考运用
9.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本;
某学校高一年级有12名女排运动员,要从中抽取人调查学习负担情况。
试讨论上述两个抽样分别采取何种方式为佳
10.某家电商场根据2005年彩电市调查显示:“康佳”、“长虹”、“TCL”、“海信”、“熊猫”彩电分别占市场份额的19%、18%、17%、8%、3%.商场根据以上数据进“康佳”、“海信”、“熊猫”三种品牌的彩电共3000台,现欲从这三种品牌的彩电中随机抽取60台进行售后服务跟踪调查,请你设计一个抽样方案,并简述其步骤。若商场进的是“康佳”、“长虹”、“TCL”三种品牌的彩电3000台,该抽样方案该如何调整?
本节学习疑点:
学生质疑
教师答复第27课时 复习课2
【自学评价】
1.已知,之间的一组数据:
0 1 2 3
1 3 5 7
则与的线性回归方程必过 ( )
A.(2,2)点 B.(1.5,0)点 C.(1,2)点 D.(1.5,4)点
2. 已知样本99,100,101,x,y的平均数是100,方差是2,则xy=____________
3. 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图所示:
则甲得分的方差为__________,乙得分的方差为____________.从而你得出的结论是______________________.
【经典范例】
例1 某风景区对5个旅游景点的门票价格进行了调整,据统计,调整前后各景点的游客人数基本不变,有关数据如下表所示:
景点 A B C D E
原价(元) 10 10 15 20 25
现价(元) 5 5 15 25 30
平均日人数(千人) 1 1 2 3 2
(1) 该景区称调整前后这5个景点门票的平均收费不变,平均总收入持平,问风景区是怎样计算的?
(2) 另一方面,游客认为调价后风景区的平均日收入相对于调价前,实际上增加了9.4%,问游客是怎样计算的?
(3) 你认为风景区和游客哪一方的说法能反映整体实际?
解:
例2 某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上,每隔30分抽一包样品,称其质量是否合格,分别记录抽查数据如下:
甲车间:102,101,99,103,98,99,98;
乙车间:110,115,90,85,75,115,110.
(1) 这种抽样方法是何种抽样方法?
(2) 估计甲、乙两车间产品重量的均值和方差,并说明哪个车间产品较稳定?
解:
例3 在某次有奖销售中,每10万份奖券中有一个头奖(奖金10000元) ,2个二等奖(奖金5000元),500个三等奖(奖金100元),10000个四等奖(奖金5元) .试求每张奖券平均获利多少?(假设所有奖券全部卖完,每张奖券面值3元.)
解:
例4 给出施化肥量对水稻产量影响的试验数据:
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
(1)画出上表的散点图;(2)求出回归直线.
解:(完成解答)
(1)散点图:
(2)表中的数据进行具体计算,列成以下表格
i 1 2 3 4 5 6 7
xi 15 20 25 30 35 40 45
yi 330 345 365 405 445 450 455
xiyi 4950 6900 9125 12150 15575 18000 20475
,
故可得到:
从而得回归直线方程是:
【追踪训练】
1.下列说法中,正确的是(   )
A.频率分布直方图中各小长方形的面积不等于相应各组的频率
B.一组数据的标准差是这组数据的方差的平方
C.数据2,3,4,5的方差是数据4,6,8,10的方差的一半
D.一组数据的方差越大,说明这组数据的波动越大
2.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( )
A.=1.23x+4 B. =1.23x+5
C. =1.23x+0.08 D. =0.08x+1.23
3. 数据 平均数为6,标准差为2,则数据 的平均数为 ,方差为 .第10课时线性回归方程(1)
分层训练
1.长方形的面积一定时,长和宽具有( )                  
(A)不确定性关系   (B)相关关系 
(C)函数关系   (D)无任何关系
2.三点(3,10),(7,20),(11,24)的线性回归方程是       ( )
(A) (B) (C) (D)
3.已知线性回归方程为:,则x=25时,y 的估计值为________
4.一家保险公司调查其总公司营业部的加班效果,收集了10周中每周加班时间y(小时)与签发新保单数目x的数据如下表:
x 825 215 1070 550 480
y 3.5 1.0 4.0 2.0 1,0
x 920 1350 325 670 1215
y 3.0 4.5 1.5 3.0 5.0
则y关于x估计的线性回归方程为____________________(保留四位有效数字)
5.炼铝厂测得所产铸模用的铝的硬度x与抗张强度y的数据如下:
x 63 53 70 84 60
y 288 293 349 343 290
x 72 51 83 70 64
y 354 283 324 340 286
求y与x的线性回归方程。(小数点后保留两位有效数字)
思考运用
6.在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x之间相应的一组观察值如下表:
x(s) 5 10 15 20 30 40
Y(um) 6 10 10 13 16 17
x(s) 50 60 70 90 120
Y(um) 19 23 25 29 46
求腐蚀深度y对腐蚀时间x的线性回归方程。
7.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
使用年限x 2 3 4 5 6
维修费用y 2.2 3.8 5.5 6.5 7.0
若由资料知y对x呈线性相关关系。
试求:(1)线性回归方程的回归系数, ;
(2)估计使用年限为10年时,维修费用是多少?
本节学习疑点:
学生质疑
教师答复第17课时 系统抽样
【学习导航】
学习要求
1.体会系统抽样的的概念及如何用系统抽样获取样本;
2.感受系统抽样也是等可能性抽样,是否需要用系统抽样,主要是看总体个数的多少.
【课堂互动】
自学评价
案例 某校高一年级有20个班,每班有50名学生.为了了解高一学生的视力状况,从这1000人中抽取一个容量为100的样本进行检查,应该怎样抽样
【解析】
这个案例的总体中个体数较多,生活中还有容量大的多的总体,面对这样的总体,采用抽签或随机数表等简单随机抽样方法是不科学的.抽取样本最关键的就是要保证抽样过程的 ,要保证总体中每个个体被抽到的 .在这样的前提下,我们可以寻求更好的抽样方法.
系统抽样以简单随机抽样为基础,通过将较大容量的总体分组,只需在某一个组内用简单随机抽样方式来获取一个个体,然后在一定规则下就能抽取出全部样本.
1.系统抽样
系统抽样的概念:
,这样的抽样方法称为系统抽样(systematic sampling)
系统抽样的步骤为:
(1)采用随机的方式将总体中的个体编号;
(2)

(3)在第一段中用 确定起始的个体编号L;
(4)将编号为 的个体抽出.
【小结】系统抽样是以简单随机抽样为基础的一种抽样方法,对于容量较大、个体差异不明显的总体通常采用这种抽样方法,在保证公平客观的前提下简化抽样过程.在用系统抽样方法抽取样本时,如果总体个数不能被样本容量整除,可以
.
【经典范例】
例1 在1000个有机会中奖的号码(编号为000~999)中,在公证部门监督下随机抽取的方法确定后两位数为88的号码为中奖号码,这是运用哪种抽样方法来确定中奖号码的?依次写出这10个中奖号码?
【解】
例2 某单位在岗职工共624人,为了调查工人用于上班途中的时间,决定抽取10%的工人进行调查.试采用系统抽样方法抽取所需的样本.
【分析】 因为624的10%约为62,624不能被62整除,为了保证“等距”分段,应剔除4人.
【解】
例3 某制罐厂每小时生产易拉罐10000个,每天生产时间为12小时,为了保证产品的合格率,每隔一段时间要抽取一个易拉罐送检,工厂规定每天共抽取1200个进行检测,请你设计一个抽样方案。
【解】
例4 现要从999名报名者中随机选取100名参加某活动,请你用系统抽样法设计一种方案,叙述其步骤。你能找到另外的抽样方案吗?比较两种方案的合理性和易操作性
【解】
追踪训练
1.为了了解参加一次知识竞赛的1252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除个体的数目是       (   )
(A)2      (B)3      
(C)4      (D)5
2.全班有50位同学,需要从中选取7人,若采用系统抽样的方法来选取,则每位同学能被选取的可能性是 。
3.一个总体中有100个个体,随机编号为0,1,2, ...,99,依编号顺序平均分成10个小组,组号依次为1,2,3, ...,10.现用系统抽样的方法抽取一个容量为10的样本,规定如果在第一组随机抽取的号码为,那么在第组中抽取的号码个位数字与的个位数字相同.若,则在第7组中抽取的号码是____ ________.
4. 要从1003名学生中选取一个容量为20的样本,试叙述系统抽样的步骤。
【解】(完成空格)
第一步 将1003名学生有随机方式进行编号;
第二步 从总体中剔除3人(剔除方法可用随机数表法),将剩下的1000名学生重新编号并分成20段;
第三步 在第一段000、001、002、003、…、049这十个编号中用简单随机抽样确定起始号码,比如013
第四步 将013逐次加上部分的“长度”(第一部分中个体的个数)的0倍、1倍、2倍、…、19倍得到样本:
.第29课时6.5 复习课3
【自学评价】
1.为了保证分层抽样时,每个个体等可能抽取,必须( D )
A.每层的个体数相等
B.每层中抽的个体数相等
C.不同的层中,每个个体被抽到的可能性不相等
D.每层等可能抽取的样本个数可能一样,也可能不一样,但每层被抽取的个体数与这一层中个体数的比等于样本容量与总体个数的比
2.一个容量为20的样本数据,分组后组据与频数如下:
[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70),2.则样本在区间上的频率为( D )
A.5% B.25% C.50% D.70%
3.对甲、乙两所学校2005年的高考数学成绩进行统计分析,得到的样本的平均分为,,样本的方差为,,由此可知两校考生中成绩较为均衡的是  甲   校.
【精典范例】
例1 某单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的某种情况,要从中抽取一个容量为20的样本.试用三种方法分别解答.
解: (1)随机抽样法:将160人从1~160编上号,并用相同质量的材料制成160个大小完全相同的签,放进箱中搅拌,然后从中抽20个签,与签号相同的20人被选出即中.
(2)系统抽样法:将160人从1~160编上号,按编号顺序平均分成20组(1~8号,9~16号,.
..,153~160号),先从第一组中用抽签法抽出第号(),其余组的号()亦被抽样,即得20人的一个样本.
(3)分层抽样法:按20:160=1:8的比例,从业务人员、管理人员、后勤服务人员中分别用抽签的方式依次抽取12人、5人、3人,把他们合在一起得到20人的一个样本.
例2 从高三学生中抽取50名同学参加知识竞赛,成绩分组及各组的频数如下:(单位:分)[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8
(1)列出样本频率分布表(含累积频率);
(2)画出频率分布直方图;
(3)估计成绩在[60,90)内学生的频率;
解: (1)频率分布表如下:
成绩分组 频数 频率 累计频率
[40,50) 2 0.04 0.04
[50,60) 3 0.06 0.10
[60,70) 10 0.20 0.30
[70,80) 15 0.30 0.60
[80,90) 12 0.24 0.84
[90,100) 8 0.16 1.00
合计 50 1.00
(2)频率直方图如下:
(3)成绩在[60,90)内的学生比例为74%;
例3 为检查一批钢筋抗拉强度,抽样得到该指标的一个容量为20的样本:
110,120,120,125,125,125,125,130,135,135,
100,115,120,125,125,125,125,130,145,145.
(1)计算平均抗拉强度系数和标准差;
(2)估计这批钢筋有多少落入平均数与2倍标准差的范围内.
解: (1)由题意可得,=125.25,s=10.182.
(2)落入即(104.88, 145.62)范围内的数据为95%.
例4 一台机器由于使用时间较长,生产的零件有一些会有缺损.按不同转速生产出来的零件有缺损的统计数据如下:
转速(转/s) 16 14 12 8
每小时生产有缺损零件数(件) 11 9 8 5
(1)作出散点图;
(2)如果与线性相关,求线性回归方程;
(3) 如果实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么机器运转速度应控制在什么范围内?
解: (1)散点图如下:
(2)设线性回归方程为.由题意可得,,,,.
所以,
..
(3)令,得,故机器运转速度控制在15转/s范围内.
【追踪训练】
1.把一个容量为100的样本分成若干组,已知某组的频率为0.3,那么该组的频数为_____30___
2.经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”态度的多人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的位“喜欢”摄影的同学、位“不喜欢”摄影的同学和位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多 3 人.
(提示: 位执“一般”对应位“不喜欢”,即“一般”是“不喜欢”的倍,而他们的差为人,即“一般”有人,“不喜欢”的有人,且“喜欢”是“不喜欢”的倍,即人,全班有人,)
10111213 780222366677800122344667880234
3. 已知某工厂工人某天加工的零件个数的茎叶图如右图所示,(以零件个数的前两位为茎,后一位为叶),那么工人生产零件的平均个数及生产的零件个数超过130的比例分别是( B )
A. 116.5与13.3% B. 120.5与10%
C. 120.5与13.3% D. 126.5与10%线性回归方程
第25课时
【学习导航】
学习要求
1.理解线性回归的基本思想和方法,体会变量之间的相关关系。线性回归方程的求法。
2.会画出一组数据的散点图,并会通过散点图判断出这组数据是否具有线性关系。
【课堂互动】
自学评价
在实际问题中,变量之间的常见关系有两类:一类是
,另一类是

2.
,这样的图称为散点图(scatter diagram)
3.在散点图中如果点散布在一条直线的附近,可用线性函数近似地表示x和y 之间的关系。选择怎样的直线我们有下列思考方案:
(1) ;
(2)

(3)

4.用方程为的直线拟合散点图中的点,应使得该直线与 。用最小二乘法来求、的原理和方法
见教科书P72
5. 相关关系叫做线性相关关系(linear correlation)
6.设有(x,y)的n对观察数据如下:



时,就称为拟合这n对数据的线性回归方程(linear regression equation),将该方程所表示的直线称为回归直线。
6.用书上的方法3,可求得线性回归方程中的系数:
= (*)
7.用回归直线进行拟合的一般步骤为:
(1) ;
(2)

【经典范例】
例1 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否具有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由。
机动车辆数x/千台 95 110 112 120 129 135 150 180
交通事故数y/千件 6.2 7.5 7.7 8.5 8.7 9.8 10.2 13
【解】
例2 一个车间为了规定工时定额,需要确定加工零件所花费的时间 ,为此进行了10次试验,测得数据如下:
零件数x(个) 10 20 30 40 50
加工时间y(分) 62 68 75 81 89
零件数x(个) 60 70 80 90 100
加工时间y(分) 95 102 108 115 122
(1)画出散点图;
(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的线性回归方程。
【解】
追踪训练
1.下列两个变量之间的关系哪个不是函数关系(    )
A.角度和它的余弦值
B.正方形边长和面积
C.正n边形的边数和它的内角和
D.人的年龄和身高
2.下面是我国居民生活污水排放量的一组数据(单位:t),试分别估计1996年和2004年我国居民生活污水排放量。
年 份 1995 1996 1997 1998
排放量 151 189.1 194.8
年 份 1999 2000 2001 2002
排放量 203.8 220.9 227.7 232.3
解:第22课时 复习课1
【自学评价】
1.对总数为N的一批零件,抽取一个容量为30的样本,若每个零件被抽取的概率均为,则N的值为( )
A.150 B.200 C.120 D.100
2.某中学组织春游,为了确定春游地点,打算从校学号为0034~2037的所有学生中,采用系统抽样抽取50名进行调查,学号为2003的同学被抽到的可能性为 ( )
A. B. C. D.
3.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )
A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法
【经典范例】
例1 下列抽取样本的方式是否属于简单随机抽样?试说明道理.
(1)从无限多个个体中抽取100个个体作为样本;
(2)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后,再把它放回盒子里.
【解】
例2 假设某地区有高中生2400人,初中生10900人,小学生11000人。此地区教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区中中小学生中抽取1%的学生进行调查,你认为应该怎样抽取样本?
【解】
例3 为了比较甲、乙两位划艇运动员的成绩,在相同的条件下对他们进行了6次测验,测得他们的平均速度()分别如下:
甲:2.7 3.8 3.0 3.7 3.5 3.1
乙:2.3 3.9 3.8 3.4 3.6 2.8
(1)作出两运动员成绩的茎叶图;
(2)试根据以上数据,判断他们谁更优秀.
【解】
例4 为了了解长虹、创维、海尔、海信、厦华五种国内品牌背投电视机的市场占有率,A市场研究公司在某国美电器连锁店随机记录了72名顾客购买背投电视的品牌.下表是记录的原始数据:
长虹 长虹 厦华 海信 创维 海尔 海信 海尔 长虹 厦华 创维 创维 厦华 长虹 海尔 厦华 创维 长虹 长虹 创维 长虹 海信 海尔 长虹 创维 海信 海信 长虹 海信 厦华 海尔 海尔 厦华 长虹 长虹 长虹 海尔 创维 海尔 长虹 海尔 创维 创维 海尔 厦华 海尔 创维 厦华 创维 长虹 海尔 长虹 厦华 长虹 厦华 厦华 海尔 厦华 海尔 厦华 创维 厦华 海尔 长虹 海信 海尔 海信 海信 海尔 创维 海尔 创维
(1) 根据上述资料,编制频数分布表;
(2) 绘制频率分布直方图,以反映背投电视的消费分布.
【解】 (1) 频数分布表
分组 频数累计 频数 频率
长虹
创维
厦华
海信
海尔
(2)
【追踪训练】
1. 某公司的职工由管理人员、后勤人员、业务人员三部分组成,其中管理人员20人,后勤人员与业务人员之比为3:16,为了了解职工的文化生活状况,要从中抽取一个容量为21的样本,其中后勤人员有3人,则该公司的职工共有________人.
2.一个总体中编号为1,2,3, ...,100的100个个体,平均分在10个小组,组号依次为0,1,2, ...,9.要用系统抽样的方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为,那么在第组抽取的号码的个位数为或(如果)
.当时,写出所抽取的全部样本号码.
【解】
3.为了解高中学生的体能情况,抽了100名学生进行引体向上次数测试,将所得数据整理后,画出频率分布直方图(如右图所示),图中从左到右依次为第1,2,3,4,5组.
(1)第1组的频率为__________,频数为__________.
(2)若次数在5次(含5次)以上为达标,则达标率为_______ .
4. 为了了解中学生的身高情况,对某中学同龄的50名男学生的身体进行了测量,结果如下:(单位:cm)
175 168 170 176 167 181 162 173 171 177 171 171 174 173 174 175 177 166 163 160 166 166 163 169 174 165 175 165 170 158 167 174 172 166 172 167 172 175 161 173 170 172 165 157 172 173 166 177 169 181
列出样本的频率分布表,画出频率分布直方图.
解: 频率分布表如下:
分组 频数 频率
156.5~160.5
160.5~164.5
164.5~168.5
168.5~172.5
172.5~176.5
176.5~180.5
180.5~184.5
合计
频率分布直方图:必修3 第6章 统计 参考答案
6.1.1 简单随机抽样
1.C 2.C 3.A 4.抽签法,随机数表法,向上、向下、向左、向右
5.  6.60,30  7.相等,  8.略
9.(1)不是简单随机抽样,由于被抽取样本的总体的个数是无限的而不是有限的。
 (2)不是简单随机抽样,由于它是放回抽样
10.选法二不是抽签法,因为抽签法要求所有的签编号互不相同,而选法二中39个白球无法相互区分。这两种选法相同之处在于每名学生被选中的概率都相等,等于。
6.1.2 系统抽样
1.A 2.B 3.B 4.B 5.A、B、D  6.   
7.(一)简单随机抽样
(1) 将每一个人编一个号由0001至1003;
(2) 制作大小相同的号签并写上号码;
(3) 放入一个大容器,均匀搅拌;
(4) 依次抽取10个号签
具有这十个编号的人组成一个样本。
(二)系统抽样
(1) 将每一个人编一个号由0001至1003;
(2) 选用随机数表法找3个号,将这3个人排除;
(3) 重新编号0001至1000;
(4) 在编号为0001至0100中用简单随机抽样法抽得一个号L;
(5) 按编号将:L,100+L,…,900+L共10个号选出。
这10个号所对应的人组成样本。
8.系统抽样适用于总体中的个体数较多的情况;系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段进行抽样时,采用的是简单随机抽样;与简单随机抽样相同的是,系统抽样也属于等可能抽样。
9.是用系统抽样的方法确定的三等奖号码的,共有100个。
10.略(参考第7小题)
6.1.3 分层抽样
1.B 2.B 3.104 4.
5.70,80  6.系统抽样,100个  
7.总体中的个体个数较多,差异不明显;
总体由差异明显的几部分组成  
中年:200人;青年:120人;老年:80人
8.分层抽样,简单随机抽样
9.因为总体共有彩电3000台,数量较大,所以不宜采用简单随机抽样,又由于三种彩电的进货数量差异较大,故也不宜用系统方法,而以分层抽样为妥。康佳:38台;海信:16台;熊猫:6台。其中抽取康佳,海信,熊猫彩电的时候可用系统抽样的方法
如果商场进的货是“康佳”“长虹”和“TCL”彩电,因为三者所占的市场分额差异不大,因此可以采用系统抽样法,具体方法略。
6.2.1 频率分布表
1.C 2.C 3.A 4.5 5.120 6.0.4 7.0.14 8.略
9.频率分布表为:
分 组 累计频数 频数 频率
田 径 13 13 0.13
体 操 23 10 0.10
乒乓球 34 11 0.11
足 球 58 24 0.24
篮 球 85 27 0.27
排 球 100 15 0.15
合 计 100 1.00
10.0.91
6.2.2 频率分布直方图
1.C 2.B 3.B 4.D 5.1 6.60
7.频率分布折线图 8.密度曲线
9.最大值与最小值的差为227-185=42克,若取组距为9,则由于,分成5组,组距合适,分布表及频率直方图略
10(1)略
(2)略
(3) 0 .56
6.2.3 茎叶图
1. 甲 乙
21 0
9 1 9
4110 2 112234
从以上茎叶图中,我们发现乙同学的睡眠习惯比甲同学有规律
2.用茎叶图刻画数据有两个优点,一是所有的 数据信息都可以从这个茎叶图中一目了然地看到,比较直观;二是茎叶图便于记录和表示。
茎叶图的缺点在于只有两层,即茎和叶,对于三位数以上的数据,或者有三个层次的数据表示起来就不够方便。
3.茎叶图为
4 12
5 344
6 036799
7 2466799
8 023345577888
9 055677
班级最高分为97,最低分为41,平均成绩为76.7
4.当天病人体温的茎叶图为:
37 5688
38 012557
39 122355
病人的平均体温为38.53125
5.茎叶图:
1 0258
2 01567
3 334577
4 026678899
5 011223334445566778889
6 001223333444556677777888899
7 001123556678999
8 003446669
9 0357
6.略
6.2.4复习课1
1. C 2.D 3.B 4.B 5. 45 6.90%
7. 由题意得
解得 x=720,y=600
所以高中部共有学生2200人.
8.(1)该单位有职工50人
(2)38--44岁之间的职工人数占职工总人数的60%
(3)年龄在42岁以上的职工有15人
9.(1)频率为:0.025×10=0.25,频数:60×0.25=15
(2)0.015×10+0.025×10+0.03×10+0.005×10=0.75
10.(1)
(2)图略
(3)在153. ( http: / / wxc. / )5~157. ( http: / / wxc. / )5范围内最多
6.3.1 平均数及其估计
1.C 2.1.75 3.2.18 4.11.67
5.甲好 6.5.39  
7.左边=
=右边
8. 1 ,1
样本均值可以估计总体均值
9.
10.(1)平均工资
(2)计算出的该平均工资不能反映打工人员这个月的收入水平,可以看出,打工人员的工资都低于该平均工资,因为7个值中有一个异常值李某的工资特别高,所以他的工资对总的平均工资的影响较大,同时他也不是打工人员。
(3)去掉李某的平均工资为375元,该平均工资能代表一般打工人没当月的收入水平。
6.3.2 方差与标准差
1.C 2.B 3.D 4.
5.9.25,5.4 6.9996  
7.(1)这将使平均数增大70美元,但不影响标准差  (2)这将使月薪的平均数和标准差都增大5%
8.(1) ,
(2) ,故乙更稳定。
9. ,
所以从交货天数的平均值来看,甲供货商的供货天数短一些;从方差来看,甲供货商的交货天数较稳定,因此甲是较具一致性与可靠性的厂商
10.,
6.4.1 线性回归方程(1)
1.C 2.D 3.11.69 4.
5. 
6. 
7.(1) , 
(2) 线性回归方程是
当x=10时,
即估计使用10年时的维修费用是12.38万元
6.4.2 线性回归方程(2)
1. C
2.;(2)12.38
3. (2)
4.(1),,,,
于是回归系数,;
(2)线性回归方程是,当年时,(万),即估计使用10年时,维修费用是12.38万元.
6.4.3 复习课2
1.D 2.D 3.A 4.C 5.C
6.(1)采用的方法是:系统抽样;
(2);



∴ 故甲车间产品比较稳定.
7.显然,所计算出的总体平均数并不能客观反映工人的工资水平.从数据分布来看,2200与其它数据偏差较大,虽然只有一个数据,但在总体容量不大的情况下,对整体平均水平产生较大影响.本题中,可去掉2200这个数据后再求平均数,就能较好地反映工人的工资水平了. 工资水平约为每周(250×6+220×5+200×10+100×1)÷22≈214元.
8.由于我们无法直接获得总体的平均数,所以只有求得样本的平均数来推断总体。
通过计算可得这组数据的平均数为1131.5
所以,该类鱼的体重平均约1131.5g
6.6复习课3
1.C 2. A 3. 0.14 4. 0.3 5.
6. 茎叶图如下图,可以得乙班总体每分钟跳绳成绩优于甲班.
7.(1)6小时
(2)最高温度39.5℃,最低是36.8℃
(3)4月8日12时的体温是37.5℃
(4)在4月7日6点到12点的体温下降得最快,4月9日12点到18点比较稳定
(5)好转
8.甲的平均身高为:160, 方差为1.2
乙的平均身高为:160,方差为120
第6章 单元测试
1.A 2.B 3.B 4.A  5.A  6.C 7.B  8.B 9.D 10.A  
11.6,30,10     12.1  13.甲的方差比乙的方差大,乙
14. 15.2,8 16.650kg
17.总体人数:952人,因为等于5余2,故应剔除2人,高一、高二、高三分别抽取80人,60人,50人。
18.(1)是系统抽样;(2)甲均值为100,方差为3.43;乙均值为100,方差为228.57,甲车间产品包装质量较稳定。
19.失败的原因有:(1)抽样不是从总体—全体美国选民中抽样;因为1936年时,美国有私人电话和参加俱乐部的家庭是比较富裕的家庭,以电话簿和俱乐部名单发信,样本偏离了总体。(2)回收率较低,问卷的回收率也是一次调查成败的重要因素。
20.频率分布表及频率分布直方图略
(3)起始月薪低于2000元的频率为0.94,故起始月薪低于2000元的可能性为0.94
(4)起始月薪的平均数的估计是16 .48(百元)
21.设回归直线方程为


4
468
24568
2

5
6
7
8
9

2
65
87642
3
6第4课时6.2.1频率分布表
分层训练
1.在10人中,有4个学生,2个干部,3个工人,1个农民,数0.4是学生占总( )
(A)频数 (B)概率 (C)频率 (D)累积频率
2.在用样本频率估计总体分布的过程中,下列正确的是 ( )
(A) 总体容量越大,估计越精确
(B) 总体容量越小,估计越精确
(C) 样本容量越大,估计越精确
(D) 样本容量越小,估计越精确
3.一个容量为20的数据样本,分组与频数为 则样本数据的可能性为55%的区间是( )
(A) (B)
(C) (D)
4.一个容量为20的样本,已知某组的频率为,则该组的频数为___________
5.一个容量为n的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n=___________.
6.已知样本7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,12,那么这组数据落在8.5~11.5内的频率为________
7.将一个容量为100的样本数据,按照从小到大的顺序分为8个组,如下表.
组 号 1 2 3 4 5 6 7 8
频 数 10 16 18 15 11 9
并且知道第6组的频率是第3组频率的两倍,问第6组的频率是多少?
8.列出下列数据的频率分布表。
14.1 14.4 13.9 12.1 12.3
13.0 13.1 14.0 13.8 13.2
12.9 13.2 13.6 13.4 13.1
13.8 12.7 12.5 13.7 12.6
13.5 12.8 12.6 13.5 13.2
13.3 13.4 13.6 14.2 13.6
思考运用
9.某中学为了参加全国中学生运动会,打算组织100名学生组成校运动队,限制每名学生只参加一个运动项目,其中有13人报名参加了田径,10人进入了体操队,11选择了乒乓球队,另外参加三大球足球、篮球和排球的各有24人、27人和15人,请列出学生参加各运动队的频率分布表
10.有一个容量为45的样本数据,分组后各组的频数如下,根据累积频率分布,估计小于27.5的数据约为总体的多少。
本节学习疑点:
学生质疑
教师答复第27课时 复习课2
【自学评价】
1.已知,之间的一组数据:
0 1 2 3
1 3 5 7
则与的线性回归方程必过 (B )
A.(2,2)点 B.(1.5,0)点 C.(1,2)点 D.(1.5,4)点
2. 已知样本99,100,101,x,y的平均数是100,方差是2,则xy=_____996________
3. 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图所示:
则甲得分的方差为_____4_____,乙得分的方差为_____0.8________.从而你得出的结论是_______乙的成绩较稳定,甲的成绩在不断提高,而乙的成绩则无明显提高._______________.
【精典范例】
例1 某风景区对5个旅游景点的门票价格进行了调整,据统计,调整前后各景点的游客人数基本不变,有关数据如下表所示:
景点 A B C D E
原价(元) 10 10 15 20 25
现价(元) 5 5 15 25 30
平均日人数(千人) 1 1 2 3 2
(1) 该景区称调整前后这5个景点门票的平均收费不变,平均总收入持平,问风景区是怎样计算的?
(2) 另一方面,游客认为调价后风景区的平均日收入相对于调价前,实际上增加了9.4%,问游客是怎样计算的?
(3) 你认为风景区和游客哪一方的说法能反映整体实际?
解: (1)风景区是这样计算的:调整前的平均价格:元,调整后的平均价格:元.因为调整前后的平均价格不变,平均日人数不变,所以平均日收入持平.
(2)游客是这样计算的:原平均日总收入:(千元) ,现平均日总收入:(千元),所以平均日总收入增加了:.
(3)游客的说法较能反映整体实际.
例2 某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上,每隔30分抽一包样品,称其质量是否合格,分别记录抽查数据如下:
甲车间:102,101,99,103,98,99,98;
乙车间:110,115,90,85,75,115,110.
(1) 这种抽样方法是何种抽样方法?
(2) 估计甲、乙两车间产品重量的均值和方差,并说明哪个车间产品较稳定?
解: (1)根据系统抽样方法的定义,可知这种方法是系统抽样.
(2),


由于,,故甲车间产品较乙车间产品稳定.
例3 在某次有奖销售中,每10万份奖券中有一个头奖(奖金10000元) ,2个二等奖(奖金5000元),500个三等奖(奖金100元),10000个四等奖(奖金5元) .试求每张奖券平均获利多少?(假设所有奖券全部卖完,每张奖券面值3元.)
解:设每张奖券的奖金为T,则T的频率分布为
T 10000 5000 100 5 0
P
平均付利=
,每张奖券获利3-1.2=1.8元.
例4 给出施化肥量对水稻产量影响的试验数据:
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
(1)画出上表的散点图;(2)求出回归直线.
解:(1)散点图(略).
(2)表中的数据进行具体计算,列成以下表格
i 1 2 3 4 5 6 7
xi 15 20 25 30 35 40 45
yi 330 345 365 405 445 450 455
xiyi 4950 6900 9125 12150 15575 18000 20475
,
故可得到
从而得回归直线方程是=4.75 x+257.
【追踪训练】
1.下列说法中,正确的是( D  )
A.频率分布直方图中各小长方形的面积不等于相应各组的频率
B.一组数据的标准差是这组数据的方差的平方
C.数据2,3,4,5的方差是数据4,6,8,10的方差的一半
D.一组数据的方差越大,说明这组数据的波动越大
2.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( C )
A.=1.23x+4 B. =1.23x+5
C. =1.23x+0.08 D. =0.08x+1.23
3. 数据 平均数为6,标准差为2,则数据 的平均数为 6 ,方差为 16 .第20课时 频率分布直方图和折线图
【学习导航】
知识网络
学习要求
1.频率分布直方图的作法,频率分布直方图更加直观形象地反映出总体分布的情况;
2.频率分布折线图的作法,优点是反映了数据的变化趋势,如果样本容量足够大,分组的组距足够小,则这条折线将趋于一条曲线,称为总体分布的密度曲线。
【课堂互动】
自学评价
案例1 下表是某学校一个星期中收交来的失物件数,请将5天中收交来的失物数用条形图表示.
星 期 一 二 三 四 五
件 数 6 2 3 5 1
累 计 6 8 11 16 17
解 用EXCEL作条形图:
(1)在EXCEL工作表中输入数据,光标停留在数据区中;
(2)选择“插入/图表”,在弹出的对话框中点击“柱形图”;
(3)点击“完成”,即可看到如下频数条形图.
案例2 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm)。试作出该样本的频率分布直方图和折线图.
168 165 171 167 170 165 170 152 175 174
165 170 168 169 171 166 164 155 164 158
170 155 166 158 155 160 160 164 156 162
160 170 168 164 174 171 165 179 163 172
180 174 173 159 163 172 167 160 164 169
151 168 158 168 176 155 165 165 169 162
177 158 175 165 169 151 163 166 163 167
178 165 158 170 169 159 155 163 153 155
167 163 164 158 168 167 161 162 167 168
161 165 174 156 167 166 162 161 164 166
【解】上一课时中,已经制作好频率分布表,在此基础上, 我们绘制频率分布直方图.
(1)作直角坐标系,以横轴表示身高,纵轴表示;
(2)在横轴上标上150.5,153.5,156.5,…,180.5表示的点。(为方便起见,起始点150.5可适当前移);
(3)在上面标出的各点中,分别以连结相邻两点的线段为底作矩形,高等于该组的
至此,就得到了这组数据的频率分布直方图,如下图
0.08
0.06
0.04
0.02
150.5 153.5 156.5 159.5 162.5 165.5 168.5 171.5 174.5 177.5 180.8
同样可以得到这组数据的折线图.
0.08
0.06
0.04
0.02
150.5 153.5 156.5 159.5 162.5 165.5 168.5 171.5 174.5 177.5 180.8
【小结】
1.利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图(frequency histogram),简称频率直方图。
2. 频率直方图比频率分布表更直观、形象地反映了样本的分布规律。
3.如果将频率分布直方图中相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图(frequency polygon)
4.频率分布折线图的的首、尾两端如何处理: 取值区间两端点须分别向外延伸半个组距,并取此组距上的x轴上的点与折线的首、尾分别相连
5.如果将样本容量取得足够大,分组的组距取得足够小,则这条折线趋于一条曲线,这一曲线称为总体分布的密度曲线。
6. 频率分布表的优点在于数据明显,利于对总体相应数据的计算或说明;频率分布折线图的优点在于数据的变化趋势直观,易于观察数据分布特征,且与总体分布的密度曲线关系密切;频率分布直方图则两者兼顾但两者皆不足.所以三种分布方法各有优劣,应需要而运用.
【精典范例】
例1 为了了解一大片经济林的生长情况,随机测量其中的100株的底部周长,得到如下数据表(长度单位:cm)
135 98 102 110 99 121 110 96 100 103
125 97 117 113 110 92 102 109 104 112
109 124 87 131 97 102 123 104 104 128
105 123 111 103 105 92 114 108 104 102
129 126 97 100 115 111 106 117 104 109
111 89 110 121 80 120 121 104 108 118
129 99 90 99 121 123 107 111 91 100
99 101 116 97 102 108 101 95 107 101
102 108 117 99 118 106 119 97 126 108
123 119 98 121 101 113 102 103 104 108
(1)
(2) 编制频率分布表;
(3) 绘制频率分布直方图;
(4) 估计该片经济林中底部周长小于100cm 的树木约占多少,周长不小于120cm的树木约占多少。
【解】
(1)从表中可以看出,这组数据的最大值为135,最小值为80,故全距为55,可将其分为11组,组距为5。
 从第一组开始,将各组的频数,频率和填入表中
分 组 频 数 频 率
1 0.01 0.002
2 0.02 0.004
4 0.04 0.008
14 0.14 0.028
24 0.24 0.048
15 0.15 0.030
12 0.12 0.024
9 0.09 0.018
11 0.11 0.022
6 0.06 0.012
2 0.02 0.004
合计 100 1 0.2
(2)绘制频率分布直方图:
0.05
0.04
0.03
0.02
0.01
80 85 90 95 100 105 110 115 120 125
(3)从频率分布表可以看出,该样本中
小于100的频率为:
0.01+0.02+0.04+0.14=0.21,
不小于120的频率为:
0.11+0.06+0.02=0.19
故可估计该片经济树林中底部周长小于100cm的树木约占21%,周长不小于120cm的树木约占19%
追踪训练
1. 在调查某产品尺寸过程中,将其尺寸分成若干组,是其中的一组.已知该组的频率为,该组的直方图的高为,则等于 ( C )
A. B. C. D.
2.有一个容量为50的样本,数据分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5),4.
(1)列出样本频率分布图表;
(2)画出频率分布直方图;
(3)画出数据频率折线图.
解: (1)频率分布表为:
分组 累计频数 频数 频率
[12.5,15.5) 3 3 0.06
[15.5,18.5) 11 8 0.16
[18.5,21.5) 20 9 0.18
[21.5,24.5) 31 11 0.22
[24.5,27.5) 41 10 0.20
[27.5,30.5) 46 5 0.10
[30.5,33.5) 50 4 0.08
合计 50 1.00
(2)频率分布直方图为:
(3)数据频率折线图为:
3.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.
根据条形图可得这50名学生这一天平均每天的
课外阅读时间为( B )
A.0.6小时 B.0.9小时
C.1.0小时 D.1.5小时
频率分布表方法
频率分布直方图方法
茎叶图方法
总体分总体分布的估计布的估计
折线图第23课时 平均数及其估计
【学习导航】
学习要求
1. 知道平均数是对调查数据的一种简明的描述,它表示变量一切可能值的算术平均值,从而实现对总体可靠度的估计,学习时仔细体会它的实际意义。
2. 熟练掌握平均数的计算公式。
【课堂互动】
自学评价
案例 某校高一(1)班同学在老师的布置下,用单摆进行测试,以检验重力加速度.全班同学两人一组,在相同的条件下进行测试,得到下列实验数据(单位:m/s2):
9.62 9.54 9.78 9.94 10.01 9.66 9.88 9.68 10.32
9.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.94
9.65 9.79 9.42 9.68 9.70 9.84 9.90
怎样利用这些数据对重力加速度进行估计?
【解析】
我们常用算术平均数(其中(=1,2,…,n) 为n个实验数据)作为重力加速度的“最理想”的近似值.它的依据是什么?
处理实验数据的原则是使这个近似值与实验数据之间的离差最小.
设这个近似值为,那么它与n个实验值(=1,2,…,n)的离差分别为,,…,.由于上述离差有正有负,故不宜直接相加.可以考虑将各个离差的绝对值相加,研究||+||+…+||取最小值时的值.但由于含绝对值,运算不太方便,所以考虑离差的平方和,即()2+()2+…+()2,当此和最小时,对应的的值作为近似值,因为
()2+()2+…+()2 =

所以当时离差的平方和最小,故可用作为表示这个物理量的理想近似值,称其为这n个数据,,…,的平均数或均值,一般记为 .
用计算器操作,验证:求得重力加速度的最佳近似值为 m/s2.
【小结】
1. 个实数的和简记为

2.已知个实数,则称
为这个数据的平均数(average)或均值(mean)
3.若取值为的频率分别为,则其平均数为

【经典范例】
例1 某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150),试确定这次考试中,哪个班的语文成绩更好一些。
甲班
112 86 106 84 100
87 112 94 94 99
108 100 96 115 111
104 107 119 107 93
92 102 93 84 94
105 98 102 94 107
90 120 98 95 119
104 95 108 111 105
102 98 112 112 99
94 100 90 84 114
乙班
116 95 109 96 106
94 98 105 101 115
108 100 110 98 107
107 106 111 121 97
107 111 114 106 104
98 108 99 110 103
104 112 101 113 96
87 108 106 103 97
107 114 122 101 107
104 95 111 111 110
【分析】我们可用一组数据的平均数衡量这组数据的水平,因此,分别求得甲、乙两个班级的平均分即可。
【解】
例2 下面是某校学生日睡眠时间的抽样频率分布表(单位:h),试估计该学生的日平均睡眠时间。
   
睡眠时间 人 数 频 率
5 0.05
17 0.17
33 0.33
37 0.37
6 0.06
2 0.02
100 1
【分析】要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示。
【解】
例3 某单位年收入在10000到15000、15000到20000、20000到25000、25000到30000、30000到35000、35000到40000及40000到50000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入。
【分析】上述比就是各组的频率
【解】
例4学校对王老师与张老师的工作态度、教学成绩及业务学习三个方面做了一个初步的评估,成绩如下表:
工作态度 教学成绩 业务学习
王老师 98 95 96
张老师 90 99 98
(1)如果以工作态度、教学成绩及业务学习三个方面的平均分来计算他们的成绩,作为评优的依据,你认为谁会被评为优秀?
(2)如果三项成绩的比例依次为20%、60%、20%来计算他们的成绩,结果又会如何?
【解】
追踪训练
1.期中考试之后,班长算出了全班40个人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N,那么为( )
A. B.1 C. D.2
2.从某校全体高考考生的数学成绩中任意抽取20名考生的成绩(单位:分,总分:150分)为102,105,131,95,83,121,140,100,97,96,
95,121,124,135,106,109,110,101,98,97,试估计该校全体考生数学平均成绩。
解:
3.某教师出了一份共3道题的测试卷,每道题1分,全班得3分、2分、1分和0分的学生所占比例分别为30%,50%,10%,10%。  
(1) 若全班共10人,则平均分是多少?
(2) 若全班共20人,则平均分是多少?
(3) 如果该班人数未知,能求出该班的平均分吗?
解:6.2 总体分布的估计
第19课时 频率分布表
【学习导航】
学习要求
1.感受如何用样本频率分布表去估计总体分布;
2.自己亲自体验制作频率分布表的过程,注意分组合理并确定恰当的组距;
【课堂互动】
自学评价
案例1 为了了解7月25日至8月24日北京地区的气温分布状况,我们对往年份这段时间的日最高气温进行抽样,并对得到的数据进行分析.我们随机抽取近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:℃):
7月25日至8月10日 41.9 37.5 35.7 35.4 37.2 38.1
34.7 33.7 33.3 32.5 34.6 33.0
30.8 31.0 28.6 31.5 28.8
8月8日至8月24日 28.6 31.5 28.8 33.2 32.5 30.3
30.2 29.8 33.1 32.8 29.4 25.6
24.7 30.0 30.1 29.5 30.3
怎样通过上表中的数据,分析比较两时间段的高温(≥33℃)状况呢
【分析】
要比较两时间段的高温状况,最直接的方法就是分别统计这两时间段中高温天数.如果天数差距明显,则结论显然,若天数差距不明显,可结合其它因素再综合考虑.上面两样本中的高温天数的频率用下表表示:
时间 总天数 高温天数(频数) 频率
7月25日至8月10日 17 11 0.647
8月8日至8月24日 17 2 0.118
由此表可以发现,近年来,北京地区7月25日至8月10日的高温天气的频率明显高于8月8日至8月24日.
上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.
案例2 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm)。试作出该样本的样本的频率分布表。
168 165 171 167 170 165 170 152 175 174
165 170 168 169 171 166 164 155 164 158
170 155 166 158 155 160 160 164 156 162
160 170 168 164 174 171 165 179 163 172
180 174 173 159 163 172 167 160 164 169
151 168 158 168 176 155 165 165 169 162
177 158 175 165 169 151 163 166 163 167
178 165 158 170 169 159 155 163 153 155
167 163 164 158 168 167 161 162 167 168
161 165 174 156 167 166 162 161 164 166
【分析】该组数据中最小值为151,最大值为180,它们相差29,可取区间[150.5,180.5],并将此区间分成10个小区间,每个小区间长度为3,再统计出每个区间内的频数并计算相应的频率,我们将整个取值区间的长度称为全距,分成的区间的长度称为组距。
【解】
(1)在全部数据中找出最大值180和最小值151,则两者之差为29,确定全距为30,决定以组距3将区间[150.5,180.5]分成10个组;
(2)从第一组开始,分别统计各组中的频数,再计算各组的频率,并将结果填入下表:
分 组 频数累计 频数 频率
4 4 0.04
12 8 0.08
20 8 0.08
31 11 0.11
53 22 0.22
72 19 0.19
86 14 0.14
93 7 0.07
97 4 0.04
100 3 0.03
合 计 100 1
【小结】编制频率分布表的步骤如下:
(1)求全距,决定组数和组距,组距=全距/组数;
(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
(3)登记频数,计算频率,列出频率分布表.
在分组时,为了容易看出规律,一般分组使每组的长度相等,组数不宜太多也不宜太少.一般地,称区间的左端点为 为下组限,右端点 为上组限。我们可以采用下组限在内而上组限不在内的分组方法,也可采用下组限不在内而上组限在内 的分组方法。如果取全距时不利于分组(如不能被组数整除),如何处理可适当增大全距,如在左、右两端各增加适当范围(尽量使两端增加的量相同.
精典范例
例1 某铸件厂从规定尺寸为25.40mm的一堆零件中任取100件,测得它们的实际尺寸如下:
25.39 25.36 25.34 25.42 25.45 25.38 25.39
25.41 25.43 25.44 25.48 25.45 25.43 25.46
25.40 25.39 25.41 25.36 25.38 25.31 25.56
25.37 25.44 25.33 25.46 25.40 25.49 25.34
25.35 25.32 25.45 25.40 25.27 25.43 25.54
25.40 25.43 25.44 25.41 25.53 25.37 25.38
25.36 25.42 25.39 25.46 25.38 25.35 25.31
25.41 25.32 25.38 25.42 25.40 25.33 25.37
25.47 25.34 25.30 25.39 25.36 25.46 25.29
25.40 25.35 25.41 25.37 25.47 25.39 25.42
25.42 25.24 25.47 25.35 25.45 25.43 25.37
25.40 25.34 25.51 25.45 25.44 25.40 25.38
25.43 25.41 25.40 25.38 25.40 25.36 25.33
25.42 25.40 25.50 25.37 25.49 25.35 25.39
25.39 25.47
1)这100件零件尺寸的全距是多少?
2)如果将这100个数据分为11组,则如何分组?组距为多少?
3)画出以上数据的频率分布表。
4)如果规定尺寸在之间的零件为合格产品抽样检查,合格品率大于85%,这批零件才能通过检验,则这批产品能通过检验吗?
【解】
1)该组数据中最小值为25.24,最大值为25.56,它们相差0.32,故可取区间
[25.235,25.565],并将此区间等分成11个区间,这100个零件尺寸的全距为
25.235 - 25.565=0.33
2)组距为
3)
分 组 频数累计 频 数 频 率
1 1 0.01
3 2 0.02
8 5 0.05
20 12 0.12
38 18 0.18
63 25 0.25
79 16 0.16
92 13 0.13
96 4 0.04
98 2 02
100 2 0.02
合 计 100 1
4)尺寸在之间的零件的累计频率为0.12+0.18+0.25+0.16+0.13=0.84<0.85
故这批零件不能通过抽样检验。
追踪训练一
1.一个容量为20的数据样本,分组与频数为:,,,,,,则样本数据在区间上的可能性为( D )
(A)5% (B)25% (C)50% (D)70%
2.下面是不同厂家生产的手提式电脑的重量(单位:kg),试列出其频率分布表
1.9 2.0 2.1 2.4 2.4
2.6 1.9 2.4 2.2 1.6
2.8 3.2 2.3 1.5 2.6
1.7 1.7 1.8 1.8 3.0
分析:全距 3.2-1.5=1.7 故可取区间[1.45,3.25] 并将此区间分成6个小区间
分 组 频数累计 频 数 频 率
4 4 0.20
9 5 0.25
12 3 0.15
17 5 0.25
18 1 0.05
20 2 0.10
合 计 20 1
3.一本书中,分组统计100个句子中的字数,得出下列结果:字数1~5个的15句,字数6~10个的27句,字数11~15个的32句,字数16~20个的15字,字数21~25个的8句,字数26~30个的3句,请作出字数的频率分布表,并利用组中值对该书中平均每个句子包含的字数作出估计。
分 组 频数累计 频数 频率
1~5 15 15 0.15
6~10 42 27 0.27
11~15 74 32 0.32
16~20 89 15 0.15
21~25 97 8 0.08
26~30 100 3 0.03
合 计 100 1
可以估计,该书中平均每个句子子包含字数为:
3×0.15+8×0.27+13×0.32+18×0.15+23×0.08+28×0.03≈12个.
4.李老师为了分析一次数学考试情况,全校抽了50人,将分数分成5组,第一组到第三组的频数10,23,11,第四组的频率为0.08,那么落在第五组(89.5~99.5分)的频数是多少?频率是多少?全校300人中分数在89.5~99.5中的约有多少人?
解: 频率是每一小组的频数与数据总数的比值,第四组的频率是0.08,则第四组的频数是4,从而可求出第五组的频数、频率,并由样本估计出全校300人中分数在89.5~99.5之间的人数.第四组的频数为,第五组的频数为50-10-23-11-4=2,频率为,所以全校在89.5~99.5之间的约有人.第9课时方差与标准差
分层训练
1.以下可以描述总体稳定性的统计量是( )                 
(A)样本均值 (B)样本中位数 
(C)样本方差 (D)样本最大值x(n)
2.已知两个样本数据如下
甲 9.9 10.2 9.8 10.1 9.8 10 10.2
乙 10.1 9.6 10 10.4 9.7 9.9 10.3
则下列选项正确的是    ( )                            
(A) (B)
(C) (D)
3.设一组数据的方差是,将这组数据的每个数据都乘10,所得到的一组新数据的方差是
( )                              
(A)0.1 (B) (C)10 (D)100
4.已知…,的方差为2,则2+3, 2+3,…,2+3的标准差是___________
5.某医院急诊中心关于其病人等待急诊的时间记录如下:
等待时间(分钟) [0,5)
频  数 4 8 5 3
用上述分组资料计算得病人平均等待时间的估计值=_______,病人等待时间标准差的估计值s=___________
6.已知样本99,100,101,x ,y的平均数是100,方差是2,则=________
7.(1)美国加利福尼亚州州长提出给所有的州政府雇员月薪增加70美元。这对于州政府雇员的平均月薪将会有何影响?对于月薪的标准差呢?
 (2)整个政府部门的月薪递增5%将对平均月薪有何影响?对于月薪的标准差呢?
8.甲、乙两机床同时加工直径为100mm的零件,为检验质量,从中抽取6件测量数据为
甲 99 100 98 100 100 103
乙 99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算说明哪台机床加工零件的质量更稳定。
拓展延伸
9.假定以下数据是甲、乙两个供货商的交货天数:
甲 10 9 10 10 11 11 9 11 10 10
乙 8 8 14 10 11 10 7 15 12 10
估计两个供货商的交货情况,并问哪个供货商交货时间短一些,哪个供货商交货时间比较具有一致性与可靠性。
10.已知样本90, 83, 86, 85, 83, 78, 74, 73, 71, 70的方差为 ,且关于的方程的两根的平方和恰好是,求的值。
本节学习疑点:
学生质疑
教师答复线性回归方程
第25课时
【学习导航】
学习要求
1.理解线性回归的基本思想和方法,体会变量之间的相关关系。线性回归方程的求法。
2.会画出一组数据的散点图,并会通过散点图判断出这组数据是否具有线性关系。
【课堂互动】
自学评价
在实际问题中,变量之间的常见关系有两类:一类是确定性函数关系,变量之间的关系可以用函数表示,另一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达
2.建立平面直角坐标系,将数据构成的数对所表示的点在坐标系内标出,这样的图称为散点图(scatter diagram)
3.在散点图中如果点散布在一条直线的附近,可用线性函数近似地表示x和y 之间的关系。选择怎样的直线我们有下列思考方案:
(1) 选择能反映直线变化的两个点
(2)取一条直线,使得位于该直线一侧和另一侧点的个数基本相同
(3)多取几组点,确定几条直线方程,再分别 算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距
4.用方程为的直线拟合散点图中的点,应使得该直线与散点图中的点最接近。用最小二乘法来求、的原理和方法
见教科书P72
5.能用直线方程近似表示的相关关系叫做线性相关关系(linear correlation)
6.设有(x,y)的n对观察数据如下:


当a,b使
取得最小值时,就称为拟合这n对数据的线性回归方程(linear regression equation),将该方程所表示的直线称为回归直线。
6.用书上的方法3,可求得线性回归方程中的系数:
= (*)
7.用回归直线进行拟合的一般步骤为:
(1)作出散点图,判断散点是否在一条直线附近
(2)如果散点在一条直线附近,用上面的公式求出a,b,并写出线性回归方程
【精典范例】
例1 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否具有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由。
机动车辆数x/千台 95 110 112 120 129 135 150 180
交通事故数y/千件 6.2 7.5 7.7 8.5 8.7 9.8 10.2 13
【解】
在直角坐标系中描出数据的散点图,直观判断散点在一直线附近,故具有线性相关关系,计算相应的数据之和:

将它们代入(*)式计算得
,,
所以,所求线性回归方程为
例2 一个车间为了规定工时定额,需要确定加工零件所花费的时间 ,为此进行了10次试验,测得数据如下:
零件数x(个) 10 20 30 40 50
加工时间y(分) 62 68 75 81 89
零件数x(个) 60 70 80 90 100
加工时间y(分) 95 102 108 115 122
(1)画出散点图;
(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的线性回归方程。
【解】
(1)
(2)由表中数据 ,可以求得:
,,

将它们代入(*)式计算得
,
因此所求的回归直线方程是
追踪训练
1、下列两个变量之间的关系哪个不是函数关系( D  )
A.角度和它的余弦值
B.正方形边长和面积
C.正n边形的边数和它的内角和
D.人的年龄和身高
2、下面是我国居民生活污水排放量的一组数据(单位:t),试分别估计1996年和2004年我国居民生活污水排放量。
年 份 1995 1996 1997 1998
排放量 151 189.1 194.8
年 份 1999 2000 2001 2002
排放量 203.8 220.9 227.7 232.3
解:通过散点图(如下图,EXCEL制作)可以发现年份与污水排放量之间具有线性相关关系,用公式可求得线性回归方程为:
=11.447 x-22678
所以,当x=1996时,y=170.2(108t);
当x=2004时,y=261.8(108t).第24课时 方差与标准差
【学习导航】
学习要求
1.体会方差与标准差也是对调查数据的一种简明的描述,要求熟练记忆公式,并能用于生产实际和科学实验中;
2.体会方差与标准差对数据描述中的异同。
【课堂互动】
自学评价
案例 有甲乙两种钢筋现从中各抽取一个样本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.
甲 110 120 130 125 120
125 135 125 135 125
乙 115 100 125 130 115
125 125 145 125 145
哪种钢筋的质量较好
【分析】
在平均数相同的情况下,观察上述数据表,发现乙样本的最小值100低于甲样本的最小值110,最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.
在平均数相同的情况下,比较两组数据的极差能大概判断它们的稳定程度.
极差:

从数据表上可以看出,乙的极差较大,数据较分散;甲的极差小,数据较集中,这就说明甲比乙稳定.
运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.这时,我们考虑用更为精确的方法——方差.
在上一课时中,学习了总体平均数的估计,其中提到平均数是“最理想”近似值的缘由.同样我们可以考虑每一抗拉强度与平均抗拉强度的离差,离差越小,稳定性就越高.
那么,怎样来刻画一组数据的稳定程度呢?
在上一课时中,设n个实验值(=1,2,…,n)的近似值为,那么它与这n个实验值(=1,2,…,n)的离差分别为,,…,.由于上述离差有正有负,故不宜直接相加.可以考虑将各个离差的绝对值相加,研究||+||+…+||取最小值时的值.但由于含绝对值,运算不太方便,所以考虑离差的平方和,即()2+()2+…+()2,当此和最小时,对应的的值作为近似值,因为
()2+()2+…+()2
=,
所以当时离差的平方和最小,故可用作为表示这个物理量的理想近似值,称其为这n个数据,,…,的平均数或均值,一般记为 .
在上述过程中,可以发现,
最小,考虑用与其平均数的离差的平方和来刻画一组数据的稳定程度是可行的.即本案例中,可用各次抗拉强度与平均抗拉强度的差的平方和表示.由于比较的两组数据的容量可能不同,因此应将上述平方和除以数据的个数,我们把由此所得的值称为这组数据的方差.
因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们将方差开方后的值称为这组数据的标准差.标准差也可以刻画数据的稳定程度.
一般地,设一组样本数据,其平均数为,则称
为这个样本的方差,其算术平方根
为样本的标准差,分别简称样本方差,样本标准差.
根据上述方差计算公式可算得甲、乙两个样本的方差分别为50和165,故可认为甲种钢筋的质量好于乙种钢筋.
【经典范例】
例1 甲、乙两种冬水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2), 试根据这组数据估计哪一种水稻品种的产量比较稳
品 种 第1年 第2年 第3年 第4年 第5年
甲 9.8 9.9 10.1 10 10.2
乙 9.4 10.3 10.8 9.7 9.8
【解】
例2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换。已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.
天 数 151~180 181~210 211~240 241~270 271~300 301~330 331~360 361~390
灯泡数 1 11 18 20 25 16 7 2
【分析】用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命。
【解】
例3(1)求下列各组数据的方差与标准差(结果精确到0.1):
甲 1 2 3 4 5 6 7 8 9
乙 11 12 13 14 15 16 17 18 19
丙 10 20 30 40 50 60 70 80 90
丁 3 5 7 9 11 13 15 17 19
(2)比较计算结果,各组方差和标准差的关系是什么?
【解】
例4某市共有50万户居民,城市调查队按千分之一的比例进行入户调查,抽样调查的结果如下
家庭人均月收入(元) 工作人员数 管理人员数
20 5
60 10
200 50
80 20
40 15
合 计 400 100
(1)一般工作人员家庭人均月收入的估计及其方差的估计;
(2)管理人员家庭人均月收入的估计及其方差的估计
(3)平均数的估计及总体方差的估计
【解】
追踪训练
1.若样本,,,...,的平均数,方差,则样本,,,...,的平均数=___________ ,=_________.
2.若,…,的方差为3,则,,…,的方差为 。
3.计算下列两组数据的平均数和标准差.
甲 9.9 10.3 9.8 10.1
10.4 10.0 9.8 9.7
乙 10.2 10.0 9.5 10.3
10.5 9.6 9.8 10.1
解:6.2 总体分布的估计
第19课时 频率分布表
【学习导航】
学习要求
1.感受如何用样本频率分布表去估计总体分布;
2.自己亲自体验制作频率分布表的过程,注意分组合理并确定恰当的组距;
【课堂互动】
自学评价
案例1 为了了解7月25日至8月24日北京地区的气温分布状况,我们对往年份这段时间的日最高气温进行抽样,并对得到的数据进行分析.我们随机抽取近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:℃):
7月25日至8月10日 41.9 37.5 35.7 35.4 37.2 38.1
34.7 33.7 33.3 32.5 34.6 33.0
30.8 31.0 28.6 31.5 28.8
8月8日至8月24日 28.6 31.5 28.8 33.2 32.5 30.3
30.2 29.8 33.1 32.8 29.4 25.6
24.7 30.0 30.1 29.5 30.3
怎样通过上表中的数据,分析比较两时间段的高温(≥33℃)状况呢
【分析】
要比较两时间段的高温状况,最直接的方法就是分别统计这两时间段中高温天数.若天数差距明显,则结论显然,若天数差距不明显,可结合其他因素再综合考虑.上面两样本中的高温天数的频率用下表表示:
时间 总天数 高温天数(频数) 频率
7月25日至8月10日 17 11 0.647
8月8日至8月24日 17 2 0.118
由此表可以发现,近年来,北京地区7月25日至8月10日的高温天气的频率明显高于8月8日至8月24日.
上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.
案例2 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm)。试作出该样本的样本的频率分布表。
168 165 171 167 170 165 170 152 175 174
165 170 168 169 171 166 164 155 164 158
170 155 166 158 155 160 160 164 156 162
160 170 168 164 174 171 165 179 163 172
180 174 173 159 163 172 167 160 164 169
151 168 158 168 176 155 165 165 169 162
177 158 175 165 169 151 163 166 163 167
178 165 158 170 169 159 155 163 153 155
167 163 164 158 168 167 161 162 167 168
161 165 174 156 167 166 162 161 164 166
【分析】该组数据中最小值为151,最大值为180,它们相差29,可取区间[150.5,180.5],并将此区间分成10个小区间,每个小区间长度为3,再统计出每个区间内的频数并计算相应的频率,我们将整个取值区间的长度称为全距,分成的区间的长度称为组距。
【解】(完成空格和表格)
(1)在全部数据中找出最大值 和最小值 ,则两者之差为 ,确定全距为30,决定以组距3将区间[150.5,180.5]分成 个组;
(2)从第一组开始,分别统计各组中的频数,再计算各组的频率,并将结果填入下表:
分 组 频数累计 频数 频率
4
8
11
22
14
4
3
合 计 100 1
【小结】编制频率分布表的步骤如下:
(1)求全距,决定组数和组距,组距=全距/组数;
(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
(3)登记频数,计算频率,列出频率分布表.
在分组时,为了容易看出规律,一般分组使每组的长度相等,组数不宜太多也不宜太少.一般地,称区间的左端点为下组限,右端点为上组限。我们可以采用下组限在内而上组限不在内的分组方法,也可采用下组限不在内而上组限在内 的分组方法。如果取全距时不利于分组(如不能被组数整除),如何处理可适当增大全距,如在左、右两端各增加适当范围(尽量使两端增加的量相同.
经营有术典范例
例 某铸件厂从规定尺寸为25.40mm的一堆零件中任取100件,测得它们的实际尺寸如下:
25.39 25.36 25.34 25.42 25.45 25.38 25.39
25.41 25.43 25.44 25.48 25.45 25.43 25.46
25.40 25.39 25.41 25.36 25.38 25.31 25.56
25.37 25.44 25.33 25.46 25.40 25.49 25.34
25.35 25.32 25.45 25.40 25.27 25.43 25.54
25.40 25.43 25.44 25.41 25.53 25.37 25.38
25.36 25.42 25.39 25.46 25.38 25.35 25.31
25.41 25.32 25.38 25.42 25.40 25.33 25.37
25.47 25.34 25.30 25.39 25.36 25.46 25.29
25.40 25.35 25.41 25.37 25.47 25.39 25.42
25.42 25.24 25.47 25.35 25.45 25.43 25.37
25.40 25.34 25.51 25.45 25.44 25.40 25.38
25.43 25.41 25.40 25.38 25.40 25.36 25.33
25.42 25.40 25.50 25.37 25.49 25.35 25.39
25.39 25.47
1)这100件零件尺寸的全距是多少?
2)如果将这100个数据分为11组,则如何分组?组距为多少?
3)画出以上数据的频率分布表。
4)如果规定尺寸在之间的零件为合格产品抽样检查,合格品率大于85%,这批零件才能通过检验,则这批产品能通过检验吗?
【解】(完成空格和表格)
1)该组数据中最小值为 ,最大值为 ,它们相差 ,故可取区间[25.235,25.565],并将此区间等分成11个区间,这100个零件尺寸的全距为
25.235 - 25.565=0.33
2)组距为 。
3)
分 组 频数累计 频 数 频 率
1
2
12
18
25
13
4
2
2
合 计 100
4)尺寸在之间的零件的累计频率为 ,
故这批零件 通过抽样检验。
追踪训练
1.一个容量为20的数据样本,分组与频数为:,,,,,,则样本数据在区间上的可能性为( )
(A)5% (B)25% (C)50% (D)70%
2.下面是不同厂家生产的手提式电脑的重量(单位:kg),试列出其频率分布表
1.9 2.0 2.1 2.4 2.4
2.6 1.9 2.4 2.2 1.6
2.8 3.2 2.3 1.5 2.6
1.7 1.7 1.8 1.8 3.0
解:
分 组 频数累计 频 数 频 率
3.一本书中,分组统计100个句子中的字数,得出下列结果:字数1~5个的15句,字数6~10个的27句,字数11~15个的32句,字数16~20个的15字,字数21~25个的8句,字数26~30个的3句,请作出字数的频率分布表,并利用组中值对该书中平均每个句子包含的字数作出估计。
解:(完成表格,计算结果)
分 组 频数累计 频数 频率
1~5
6~10
11~15
16~20
21~25
26~30
合 计
可以估计,该书中平均每个句子子包含字数为:
4.李老师为了分析一次数学考试情况,全校抽了50人,将分数分成5组,第一组到第三组的频数10,23,11,第四组的频率为0.08,那么落在第五组(89.5~99.5分)的频数是多少?频率是多少?全校300人中分数在89.5~99.5中的约有多少人?
解:第21课时 茎叶图
【学习导航】
学习要求
1.体会茎叶图的制作方法,一组数据中的的每个数,何为茎,何为叶?主要的数字为茎,次要的数字为叶,因此对于两位数而言,十位数字为茎,个位数字为叶,;
2.要能够通过茎叶图,分析单组数据,以及比较两组数据的差异。;
【课堂互动】
自学评价
案例 某篮球运动员在某赛季各场比赛的得分情况如下:
12,15,24,25,31,31,36,36,37,39,44,49,50.
如何分析该运动员的整体水平及发挥的稳定程度.
【分析】
初中统计部分曾学习过用平均数、众数和中位数反映总体的水平,用方差考察稳定程度.我们还有一种简易的方法,就是将这些数据有条理地列出来,从中观察数据的分布情况.这种方法就是画出该运动员得分的茎叶图.
制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.
【解】茎叶图除了课本中示例外,还有其它的形式,常见如下四种形式:
(1) (2)
(3) (4)
从茎叶图可以粗略地看出,该运动员平均得分及中位数、众数都在20到40之间,且分布较对称,集中程度高,说明其发挥比较稳定。
【小结】
1.讨论分析,上面四种茎叶图中,哪些能更有益于观察数据?茎叶图有什么优点 又有什么缺陷
如,第一种茎叶图能很方便地从小到大来还原所有的原始数据;第二种茎叶图能让数据重心更倾向茎叶分界线;第三种和第四种在两组数据的比较中有作用.
2.茎叶图的优点在于保持 的情况下较为直观地反映数据分布特征,对两位数(或只有末两位不同的多位数)的数据表示很方便,缺点在于多位数的表示不太方便、直观.
3.茎叶图可用于展示原始数据的分布,同时还保留原始数据在图形里面,相当直观.从茎叶图中,可直接看出数据是否对称、是否有极端值以及数据的 趋势和 趋势.
4.茎叶图可以分析单组数据,也能对两组数据进行比较,
,左侧的叶按 顺序写,右侧的叶按
顺序写,相同的得分要 ,

【经典范例】
例1 甲、乙两篮球运动员上赛季每场比赛的得分如下,试比较这两位运动员的得分水平
甲:12,15,24,25,31,31,36,36,37,39,44,49,50
乙:8,13,14,16,23,26,28,33,38,39,51
【解】
例2 有两个班级,每班各自按学号随机选出10名学生,测验铅球成绩,以考查体育达标程度,测验成绩如下:单位(米)
两个班相比较,哪个班整体实力强一些?
序号 1 2 3 4 5
甲 9.1 7.9 8.4 6.9 5.2
乙 8.8 8.5 7.3 7.1 6.7
序号 6 7 8 9 10
甲 7.2 8.0 8.1 6.7 4.9
乙 8.4 9.8 8.7 6.8 5.9
【解】
例3 某学校的操行等第分为优秀、良好、中等、及格、和不及格5种,某班级操行为优秀的男同学3名,女同学2名;良好的男同学15人,女同学18人;中等的男同学5人,女同学2人;还有2名男生2名女生操行等第为及格;一名男生不及格。请用茎叶图表示以上数据
【解】
追踪训练
1. 一球员在NBA某些场次的比赛所得篮板球数分别为
16 6 3 5 12
19 14 9 7 10
12 14 8 6 10
10 10 7 6 11
10 12 9 15 15
8 13 6 10 3
10 9 11 6 11
11 13 9 10 5
12 17 4 12 8
12 13 18 8 16
请制作这些数据的茎叶图
【解】
2.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图:
甲   乙
  0  8        
50 1 247
32 2 199
875421 3 36
944 4
1 5 2
(1)甲、乙两名队员的最高得分各是多少?
(2)哪名运动员的成绩好一些?
【解】第21课时 茎叶图
【学习导航】
学习要求
1.体会茎叶图的制作方法,一组数据中的的每个数,何为茎,何为叶?主要的数字为茎,次要的数字为叶,因此对于两位数而言,十位数字为茎,个位数字为叶,;
2.要能够通过茎叶图,分析单组数据,以及比较两组数据的差异。;
【课堂互动】
自学评价
案例 某篮球运动员在某赛季各场比赛的得分情况如下:
12,15,24,25,31,31,36,36,37,39,44,49,50.
如何分析该运动员的整体水平及发挥的稳定程度.
【分析】
初中统计部分曾学习过用平均数、众数和中位数反映总体的水平,用方差考察稳定程度.我们还有一种简易的方法,就是将这些数据有条理地列出来,从中观察数据的分布情况.这种方法就是画出该运动员得分的茎叶图.
制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.
【解】茎叶图除了课本中示例外,还有其它的形式,常见如下四种形式:
(1) (2)
(3) (4)
从茎叶图可以粗略地看出,该运动员平均得分及中位数、众数都在20到40之间,且分布较对称,集中程度高,说明其发挥比较稳定。
【小结】
1.讨论分析,上面四种茎叶图中,哪些能更有益于观察数据?茎叶图有什么优点 又有什么缺陷
如,第一种茎叶图能很方便地从小到大来还原所有的原始数据;第二种茎叶图能让数据重心更倾向茎叶分界线;第三种和第四种在两组数据的比较中有作用.
2.茎叶图的优点在于保持数据无损的情况下较为直观地反映数据分布特征,对两位数(或只有末两位不同的多位数)的数据表示很方便,缺点在于多位数的表示不太方便、直观.
3.茎叶图可用于展示原始数据的分布,同时还保留原始数据在图形里面,相当直观.从茎叶图中,可直接看出数据是否对称、是否有极端值以及数据的集中趋势和离中趋势.
4.茎叶图可以分析单组数据,也能对两组数据进行比较,画出两组数据的茎叶图,可将茎放在中间共用,叶分列左、右两侧,左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的得分要重复记录,不能遗漏
【精典范例】
例1 甲、乙两篮球运动员上赛季每场比赛的得分如下,试比较这两位运动员的得分水平
甲:12,15,24,25,31,31,36,36,37,39,44,49,50
乙:8,13,14,16,23,26,28,33,38,39,51
【解】画出两人得分的茎叶图,为便于对比分 析,可将茎放在中间共用,叶分别列左、右两侧:
          甲  乙
0 8
52 1 346
54 2 368
976611 3 389
94 4
0 5 1
(第二行表示甲得分为15分、12分、乙得分为13分、14分、16分。其他各行与此类同。左侧的按从小到大的顺序写,相同的得分要重复记录,不能遗漏)
  从这个茎叶图可以看出,甲运动员的得分大致对称,平均得分、众数及中位数都是30多分。乙运动员的得分除一个51分外,也大致对称,平均得分、众数及中位数都是20多分,因此甲运动员发挥比较稳定,总体得分情况比乙好。
例2 有两个班级,每班各自按学号随机选出10名学生,测验铅球成绩,以考查体育达标程度,测验成绩如下:单位(米)
两个班相比较,哪个班整体实力强一些?
序号 1 2 3 4 5
甲 9.1 7.9 8.4 6.9 5.2
乙 8.8 8.5 7.3 7.1 6.7
序号 6 7 8 9 10
甲 7.2 8.0 8.1 6.7 4.9
乙 8.4 9.8 8.7 6.8 5.9
【解】作茎叶图比较:
       甲    乙
       9  4
       2  5   9
       97  6 78
92 7 13
410 8 4578
1 9 8
从茎叶图可以看出,乙班数据分布相对集中,因此稳定性比甲班好;同时,乙班的数据平均值也大于甲,故乙班实力高于甲班实力。
例3 某学校的操行等第分为优秀、良好、中等、及格、和不及格5种,某班级操行为优秀的男同学3名,女同学2名;良好的男同学15人,女同学18人;中等的男同学5人,女同学2人;还有2名男生2名女生操行等第为及格;一名男生不及格。请用茎叶图表示以上数据
【解】对于操作等第,设1表示操行等第为优秀的,2表示良好,3表示中等,4表示及格,5表示不及格,对于性别,0表示女生,1表示男生,学生操行等第茎叶图表示为:
1 00111
2 000000000000000000111111111111111
3 0011111
4 0011
5 1
追踪训练
1. 一球员在NBA某些场次的比赛所得篮板球数分别为
16 6 3 5 12
19 14 9 7 10
12 14 8 6 10
10 10 7 6 11
10 12 9 15 15
8 13 6 10 3
10 9 11 6 11
11 13 9 10 5
12 17 4 12 8
12 13 18 8 16
请制作这些数据的茎叶图
【解】
0 33455666667788889999
1 000000001111222222333445566789
2.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图:
甲   乙
  0  8        
50 1 247
32 2 199
875421 3 36
944 4
1 5 2
(1)甲、乙两名队员的最高得分各是多少?
(2)哪名运动员的成绩好一些?
【解】
(1)甲的最高分为51分,乙的最高分为52分
(2)甲的成绩好一些第6章统计 单元测试
一、选择题:
1.为了解某校毕业会考情况,要从该校879名参加会考的学生中抽取120名进行数据分析,这次考查中,879和120分别表示 ( )
(A)总体数,样本容量 (B)总体,样本容量
(C)总体数,样本 (D)总体,样本
2.用传送带将产品送入包装车间之前,质检员每隔5分钟从传送带某一位置取一件产品进行检测,则这种抽样方法是 ( )
(A) 简单随机抽样 (B)系统抽样
(C)分层抽样 (D)放回抽样
3.有一个容量为50的样本数据分组,及各组的频数如下,根据累计频率分布,估计小于30.5的数据大约占: ( )
3 8
9 11
10 5
4
(A)10% (B)92% (C)5% (D)30%
4.与总体单位不一致的是    (   )
(A)(B)(C)(D)三者都不一致
5. 将容量为100的样本数据分为8个组,
组号 1 2 3 4 5 6 7 8
频数 10 13 14 15 13 12 9
则第3组的频率为(   )
(A)0.14 (B)0.03 (C)0.07 (D)0.21
6.在抽查某产品的尺寸过程中,将其尺寸分成若干组,是其中一组,抽查出的个体数在该组上频率为m,该组上的直方图的高为h,则||= ( )
(A) (B) (C) (D)与m,n无关
7.从湖中打一网鱼,共M条,做上记号再放入湖中,数天后再打一网鱼共有n条,其中k条有记号,估计湖中有鱼(   )条
(A)       (B)
(C)      (D)无法估计   
8.甲、乙、丙、丁四名选手在选拔赛中所得的平均环数及其方差如下表所示,则选送决赛的最佳人选应是 ( )
甲 乙 丙 丁
7 8 8 6
6.3 6.3 7 8.7
(A)甲 (B)乙 (C)丙 (D)丁
9.变量y与x之间的回归方程 ( )
(A) 表示y 与x之间的函数关系
(B) 表示y 与x之间的不确定性关系
(C) 反映y 与x之间真实关系的形式
(D) 反映y 与x之间的真实关系达到最大限度的吻合
10.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积的和的四分之一,且样本容量为160,则中间一组的频数为(   )
(A)32  (B)0.2 (C) 40 (D)0.25
二、填空题:
11.某公司生产三种型号的轿车,产量分别为1200辆、6000辆和2000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应取_______辆、_________辆、_________辆。
12.在频率分布直方图中,所有矩形的面积和为____________
13.甲、乙两名学生某门课程的5次测试成绩依次为60,80,70,90,70和80,65,70,80,75,因为___________,所以学生________成绩稳定。
14.全班有50位同学,需要从中选取7人,若采用系统抽样的方法来选取,则每位同学能被选取的可能性是__________
15.如果一组数据的方差是2,那么另一组数据
的方差是_________
的方差是_________
16.若施肥量x 与水稻产量y的线性回归方程为,当施肥量为80kg时,预计的水稻产量为_____________
三、解答题:
17.某中学有高一学生400人,高二学生302人,高三学生250人,现在按年级分层抽样方法从所有学生中抽取一个容量为190人的样本,求应剔除多少人?每年级分别应抽取多少人?
18.某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量,分别记录抽查数据如下:
甲:102 101 99 98 103 98 99
乙:110 115 90 85 75 115 110
(1) 这种抽样方法是哪一种?
(2) 估计甲乙两个车间的平均值、方差,并说明哪个车间产品包装质量较稳定?
19.1936年,美国一著名杂志为了预测总统候选人罗斯福与兰登两人谁能当选,他们以电话簿上的地址和俱乐部成员名单上的地址发出1000万封信,收回回信200万封,在调查史上是少有的容量,花费了大量的人力、物力,杂志社相信自己的调查结果――兰登将以57%对43%的比例获胜,并进行大力宣传。最后选举的结果却是罗斯福以62%对38%的巨大优势获胜。试分析这次调查失败的原因。
20.有一个容量为100的某校毕业生起始月薪的样本,数据的分组及各组的频数如下:
起始月薪(百元)
频 数 7 11 26 23
起始月薪(百元)
频 数 15 8 4 6
(1) 列出样本的频率分布表;
(2) 画出频率分布直方图;
(3) 根据频率分布估计该校毕业生的起始月薪低于2000的可能性
(4) 估计起始月薪的平均数
21.下面是一周内某地申请领结婚证的新郎与新娘的年龄,记作(新郎年龄y, 新娘年龄x):
(37,30),(30,27),(65,56),(45,40),(32,30),(28,26),(45,31),(29,24),(26,23),(28,25),(42,29),(36,33),(32,29),(24,22),(32,33),
(21,29),(37,46),(28,25),(33,34),(21,23),(24,23),(49,44),(28,29),(30,30),(24,25),(22,23),(68,60),(25,25),(32,27),(42,37),
(24,24),(24,22),(28,27),(36,31),(23,24),(30,26)
对于上面的实际年龄写出回归直线,从这条回归直线,你对新郎和新娘的年龄模型可得出什么结论?第8课时平均数及其估计
分层训练
1.某运动员参加体操比赛,当评委亮分后,其成绩往往是先去掉一个最高分、去掉一个最低分,再计算剩下分数的平均值,这是因为
( )               
(A)减少计算量 (B)避免故障 
(C)剔除异常值 (D)活跃赛场气氛
2.某房间中10个人平均身高为1.74米,身高为1.85米的第11人进入房间后,求11个人的平均身高。
3.如上题,某房间中10个人平均身高为1.74米,求第11人身高为多少时,使得房间中所有11人的平均身高达到1.78米。
4.从1,2,3,4,5,6这6个数中任取2个,求所有这样的两数之积的平均数。
5.用甲、乙两台半自动车床加工同一型号的产品,各生产1000只产品中次品数分别用x和y表示。经过一段时间的观察,发现x和y的频率分布如下表,问:哪一台车床生产的产品质量较好?
x 0 1 2 3
p 0.7 0.1 0.1 0.1
y 0 1 2 3
p 0.5 0.3 0.2 0
6.某工厂一个月(30天)中的日产值如下:
日产值(万元) 5.1 5.2 5.3 5.4 5.5 5.6 5.7
天数 2 3 6 8 7 3 1
试计算该厂这个月的平均日产值。
7.证明:.
8.为了检验某自来水消毒设备的效果,现从消毒后的水中随机抽取50升,化验每升水中大肠杆菌的个数,结果如下:
大肠杆菌个数/升 0 1 2 3 4
频 数 17 20 10 2 1
则所取50升水中平均含有大肠杆菌_____个/升
估计全部消毒过的自来水中平均每升水的大肠杆菌的含量为_______个。
拓展延伸
9.有一个容量为100的某校毕业生起始月薪的样本,数据的分组及各组的频数如下 :
起始月薪(百元)
频 数 7 11 26 23
起始月薪(百元)
频 数 15 8 4 6
估计这100名毕业生起始月薪的平均值
10.个体户李某经营一家快餐店,下面是快餐店所有工作人员8月份的工资表:
李某 大厨 二厨 采购员 杂工 服务生 会计
3000 450 350 400 320 320 410
(1) 计算所有人员8月份的平均工资
(2) 计算出的平均工资能否反映打工人员这个月收入的一般水平?为什么?
(3) 去掉李某的工资后,再计算平均工资,这能代表打工人员当月的收入水平吗?
本节学习疑点:
学生质疑
教师答复第17课时系统抽样
【学习导航】
学习要求
1.体会系统抽样的的概念及如何用系统抽样获取样本;
2.感受系统抽样也是等可能性抽样,是否需要用系统抽样,主要是看总体个数的多少.
【课堂互动】
自学评价
案例1 某校高一年级有20个班,每班有50名学生.为了了解高一学生的视力状况,从这1000人中抽取一个容量为100的样本进行检查,应该怎样抽样
【分析】
这个案例的总体中个体数较多,生活中还有容量大的多的总体,面对这样的总体,采用抽签或随机数表等简单随机抽样方法是不科学的.抽取样本最关键的就是要保证抽样过程的公平性,要保证总体中每个个体被抽到的机会均等.在这样的前提下,我们可以寻求更好的抽样方法.
系统抽样以简单随机抽样为基础,通过将较大容量的总体分组,只需在某一个组内用简单随机抽样方式来获取一个个体,然后在一定规则下就能抽取出全部样本.
1.系统抽样
系统抽样的概念: 将总体平均分成几个部分,然后按照一定的规则,从每个部分中抽取一个个体作为样本,这样的抽样方法称为系统抽样(systematic sampling)
系统抽样的步骤为:
(1)采用随机的方式将总体中的个体编号;
(2)将整个的编号按一定的间隔(设为k)分段,当N/n (N为总体中的个体数,n为样本容量)是整数时,k=N/n;当N/n不是整数时,从总体中剔除一些个体 ,使剩下的总体中个体的个数N’能被n整除,这时,k=N’/n并将剩下的总体重新编号;
(3)在第一段中用简单随机抽样确定起始的个体编号L;
(4)将编号为L,L+k,L+2k,…,L+(n-1)k的个体抽出.
【小结】系统抽样是以简单随机抽样为基础的一种抽样方法,对于容量较大、个体差异不明显的总体通常采用这种抽样方法,在保证公平客观的前提下简化抽样过程.在用系统抽样方法抽取样本时,如果总体个数不能被样本容量整除,可以从总体中剔除一些个体,使剩下的总体中的个体的个数能被样本容量整除.
【经典范例】
例1 在1 000个有机会中奖的号码(编号为000~999)中,在公证部门监督下随机抽取的方法确定后两位数为88的号码为中奖号码,这是运用哪种抽样方法来确定中奖号码的?依次写出这10个中奖号码?
【解】
本题中是运用了系统抽样的方法来确定中奖号码的,中奖号码依次为:088,188,288,388,488,588,688,788,888,988
例2 某单位在岗职工共624人,为了调查工人用于上班途中的时间,决定抽取10%的工人进行调查.试采用系统抽样方法抽取所需的样本.
【分析】 因为624的10%约为62,624不能被62整除,为了保证“等距”分段,应剔除4人.
【解】 第一步 将624名职工用随机方式进行编号;
第二步 从总体中剔除4人(剔除方法可用随机数表法),将剩下的620名职工重新编号(分别为000,001,002,……,619),并分成62段;
第三步 在第一段000,……,009这十个编号中用简单随机抽样确定起始号码i0;
第四步 将编号为i0,i0+10,……,i0+610的个体抽出,组成样本.
例3 某制罐厂每小时生产易拉罐10 000个,每天生产时间为12h,为了保证产品的合格率,每隔一段时间要抽取一个易拉罐送检,工厂规定每天共抽取1 200个进行检测,请你设计一个抽样方案。
【解】
每天共生产易拉罐120 000个,共抽取1200个,所以分1200组,每组100个,然后采用简单随机抽样法从001~100中随机选出一个编号,例如选出的是013号,则从第13个易拉罐开始,每隔100个,拿出一个送检,或者根据每小时生产10 000个,每隔s拿出一个易拉罐送检。
例4 现要从999名报名者中随机选取100名参加某活动,请你用系统抽样法设计一种方案,叙述其步骤。你能找到另外的抽样方案吗?比较两种方案的合理性和易操作性
【解】按系统抽样法,因为100不能整除999,所以首先将999人编号,采用随机数表法剔除99名,再将剩下的900名报名者重新编号001~900,从001号顺次下去每9人一组,等分成100组,利用抽签法或随机数表法,从1~9个数中随机选出一个数,新编号为该数字加上9的倍数的报名者入选。例如选出的随机数为3,则新编号为003,012,021,…,894共100人入选。
还可以采取以下抽样方法:首先将999名报名者编号为001~999,因为111可以整除999,将这999个编号从001开始顺次每9个一组,然后选用简单随机抽样法从1~9的9个数字中随机地抽出一个数字,编号为该数字加上9的倍数的共111名报名者先挑选出来,例如:随机抽到的是7,则编号为007,016,025,…,988,997共111名,最后,再利用随机数表从111名中随机抽取11名剔除。
点评:此方法较之系统抽样法更易操作,因为虽然999不能被100整除,但余数99非常大,接近于除数100,而且采用随机数表法从999个数字中随机抽出 99个数剔除的工作量也较大。后一种方法先通过系统抽样,随机抽取111名,再利用随机数表法,从111个数字中随机抽出11个来剔除,操作起来要相对方便得多。
追踪训练
1.为了了解参加一次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除个体的数目是       ( A )
(A)2      (B)3      
(C)4      (D)5
2.全班有50位同学,需要从中选取7人,若采用系统抽样的方法来选取,则每位同学能被选取的可能性是
3.一个总体中有100个个体,随机编号为0,1,2, ...,99,依编号顺序平均分成10个小组,组号依次为1,2,3, ...,10.现用系统抽样的方法抽取一个容量为10的样本,规定如果在第一组随机抽取的号码为,那么在第组中抽取的号码个位数字与的个位数字相同.若,则在第7组中抽取的号码是______63_______.
4. 要从1003名学生中选取一个容量为20的样本,试叙述系统抽样的步骤。
【解】
第一步 将1003名学生有随机方式进行编号;
第二步 从总体中剔除3人(剔除方法可用随机数表法),将剩下的1000名学生重新编号并分成20段;
第三步 在第一段000、001、002、003、…、049这十个编号中用简单随机抽样确定起始号码,比如013
第四步 将013逐次加上部分的“长度”(第一部分中个体的个数)的0倍、1倍、2倍、…、19倍得到样本:013、063、113、163、…963.第29课时6.5 复习课3
【自学评价】
1.为了保证分层抽样时,每个个体等可能抽取,必须( )
A.每层的个体数相等
B.每层中抽的个体数相等
C.不同的层中,每个个体被抽到的可能性不相等
D.每层等可能抽取的样本个数可能一样,也可能不一样,但每层被抽取的个体数与这一层中个体数的比等于样本容量与总体个数的比
2.一个容量为20的样本数据,分组后组据与频数如下:
[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70),2.则样本在区间上的频率为( )
A.5% B.25% C.50% D.70%
3.对甲、乙两所学校2005年的高考数学成绩进行统计分析,得到的样本的平均分为,,样本的方差为,,由此可知两校考生中成绩较为均衡的是     校.
【经典范例】
例1 某单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的某种情况,要从中抽取一个容量为20的样本.试用三种方法分别解答.
解:
例2 从高三学生中抽取50名同学参加知识竞赛,成绩分组及各组的频数如下:(单位:分)[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8
(1)列出样本频率分布表(含累积频率);
(2)画出频率分布直方图;
(3)估计成绩在[60,90)内学生的频率;
解:
例3 为检查一批钢筋抗拉强度,抽样得到该指标的一个容量为20的样本:
110,120,120,125,125,125,125,130,135,135,
100,115,120,125,125,125,125,130,145,145.
(1)计算平均抗拉强度系数和标准差;
(2)估计这批钢筋有多少落入平均数与2倍标准差的范围内.
解:
例4 一台机器由于使用时间较长,生产的零件有一些会有缺损.按不同转速生产出来的零件有缺损的统计数据如下:
转速(转/s) 16 14 12 8
每小时生产有缺损零件数(件) 11 9 8 5
(1)作出散点图;
(2)如果与线性相关,求线性回归方程;
(3) 如果实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么机器运转速度应控制在什么范围内?
解:
【追踪训练】
1.把一个容量为100的样本分成若干组,已知某组的频率为0.3,那么该组的频数为________
2.经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”态度的多人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的位“喜欢”摄影的同学、位“不喜欢”摄影的同学和位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多 人.
10111213 780222366677800122344667880234
3. 已知某工厂工人某天加工的零件个数的茎叶图如右图所示,(以零件个数的前两位为茎,后一位为叶),那么工人生产零件的平均个数及生产的零件个数超过130的比例分别是( )
A. 116.5与13.3% B. 120.5与10%
C. 120.5与13.3% D. 126.5与10%第23课时 平均数及其估计
【学习导航】
学习要求
1. 知道平均数是对调查数据的一种简明的描述,它表示变量一切可能值的算术平均值,从而实现对总体可靠度的估计,学习时仔细体会它的实际意义。
2. 熟练掌握平均数的计算公式。
【课堂互动】
自学评价
案例 某校高一(1)班同学在老师的布置下,用单摆进行测试,以检验重力加速度.全班同学两人一组,在相同的条件下进行测试,得到下列实验数据(单位:m/s2):
9.62 9.54 9.78 9.94 10.01 9.66 9.88 9.68 10.32
9.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.94
9.65 9.79 9.42 9.68 9.70 9.84 9.90
怎样利用这些数据对重力加速度进行估计?
【分析】
我们常用算术平均数(其中(=1,2,…,n) 为n个实验数据)作为重力加速度的“最理想”的近似值.它的依据是什么?
处理实验数据的原则是使这个近似值与实验数据之间的离差最小.
设这个近似值为,那么它与n个实验值(=1,2,…,n)的离差分别为,,…,.由于上述离差有正有负,故不宜直接相加.可以考虑将各个离差的绝对值相加,研究||+||+…+||取最小值时的值.但由于含绝对值,运算不太方便,所以考虑离差的平方和,即()2+()2+…+()2,当此和最小时,对应的的值作为近似值,因为
()2+()2+…+()2 =

所以当时离差的平方和最小,故可用作为表示这个物理量的理想近似值,称其为这n个数据,,…,的平均数或均值,一般记为 .
用计算器操作,验证:求得重力加速度的最佳近似值为 m/s2.
【小结】
1. 个实数的和简记为
2.已知个实数,则称为这个数据的平均数(average)或均值(mean)
3.若取值为的频率分别为,则其平均数为
【精典范例】
例1 某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150),试确定这次考试中,哪个班的语文成绩更好一些。
甲班
112 86 106 84 100
87 112 94 94 99
108 100 96 115 111
104 107 119 107 93
92 102 93 84 94
105 98 102 94 107
90 120 98 95 119
104 95 108 111 105
102 98 112 112 99
94 100 90 84 114
乙班
116 95 109 96 106
94 98 105 101 115
108 100 110 98 107
107 106 111 121 97
107 111 114 106 104
98 108 99 110 103
104 112 101 113 96
87 108 106 103 97
107 114 122 101 107
104 95 111 111 110
【分析】我们可用一组数据的平均数衡量这组数据的水平,因此,分别求得甲、乙两个班级的平均分即可。
【解】用科学计算器分别求得甲班的平均分为101.1,乙班的平均分为105.4 ,故这次考试乙班成绩要好于甲班。
例2 下面是某校学生日睡眠时间的抽样频率分布表(单位:h),试估计该学生的日平均睡眠时间。
   睡眠时间 人 数 频 率
5 0.05
17 0.17
33 0.33
37 0.37
6 0.06
2 0.02
100 1
【分析】要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示。
【解】解法1 总睡眠时间约为
故平均睡眠时间约为7.39h
解法2 求组中值与对应频率之积的和
答 估计该校学生的日平均睡眠时间约为7.39h
例3 某单位年收入在10000到15000、15000到20000、20000到25000、25000到30000、30000到35000、35000到40000及40000到50000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入。
【分析】上述比就是各组的频率
【解】:估计该单位职工的平均年收入为
=26125(元)
答:估计该单位人均年收入约为2125元。
例4学校对王老师与张老师的工作态度、教学成绩及业务学习三个方面做了一个初步的评估,成绩如下表:
工作态度 教学成绩 业务学习
王老师 98 95 96
张老师 90 99 98
(1)如果以工作态度、教学成绩及业务学习三个方面的平均分来计算他们的成绩,作为评优的依据,你认为谁会被评为优秀?
(2)如果三项成绩的比例依次为20%、60%、20%来计算他们的成绩,结果又会如何?
【解】 (1)王老师的平均分是.张老师的均分是:.王老师的平均分较高,评王老师为优秀.
(2)王老师的平均分是

张老师的平均分为

张老师的得分高,评张老师为优秀.
追踪训练
1.期中考试之后,班长算出了全班40个人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N,那么为( )
A. B.1 C. D.2
2.从某校全体高考考生的数学成绩中任意抽取20名考生的成绩(单位:分,总分:150分)为102,105,131,95,83,121,140,100,97,96,
95,121,124,135,106,109,110,101,98,97,试估计该校全体考生数学平均成绩。
解:
样本的平均数为108.3
估计该校全体考生数学平均成绩为108分
3.某教师出了一份共3道题的测试卷,每道题1分,全班得3分、2分、1分和0分的学生所占比例分别为30%,50%,10%,10%。  
(1) 若全班共10人,则平均分是多少?
(2) 若全班共20人,则平均分是多少?
(3) 如果该班人数未知,能求出该班的平均分吗?
解:(1) =2
(2) =2
(3)可以第28课时6.5实习作业
【学习导航】
学习要求
1. 能运用简单随机抽样、分层抽样的方法抽取样本;
2. 能通过对样本的频率分布估计总体分布;
3. 培养学生动手能力和解决实际问题能力.
课堂互动】
【经典范例】
例某中学高中部共有16个班级,其中高一年级6个班,高二年级6个班,高三年级4个班.每个班的人数均在46人左右(44人-49人),各班的男女学生数均基本各占一半.现要调查这所学校学生的周体育活动时间,它是指学生在一周中参加早锻炼、课间操、课外体育活动、体育比赛等时间的总和(体育课、上学和放学路上的活动时间不计在内).为使所得数据更加可靠,应在所定抽样的“周”之后的两天内完成抽样工作. 此外还有以下具体要求:
(1)分别对男、女学生抽取一个容量相同的样本,样本容量可在40-50之间选择.
(2)写出实习报告,其中含:全部样本数据;相应于男生样本的与,相应于女生的与,相应于男、女全体的样本的;对上面计算结果作出分析.
【解】(1)由于各个年级的学生参加体育活动的时间存在差异,应采用分层抽样;又由于各班的学生数相差不多,且每班的男女学生人数也基本各占一半,为便于操作,分层抽样时可以班级为单位.关于抽取人数,如果从每班中抽取男、女学生各3人,样本容量各为48(3×16),符合对样本容量的要求.
(2)实习报告如表所示:
题目 调查本校学生周体育活动的时间
对抽取样本的要求 1.周体育活动时间,指一周中(包括双休日)参加早锻炼、课间操、课外体育活动、体育比赛等时间的总和(体育课和上学、放学路上的活动时间不计在内).2.在所定抽样的“周”之后的两天内完成抽样工作.3.男、女学生的两个样本的容量相同,并在40-50之间选择.
确定抽样方法和样本容量 采用分层抽样,以班为单位,从每班中抽取男、女学生各3人,两个样本的容量均为48,在各班抽取时,采用随机数表法.
样本数据(单位:分) 男生 女生
一年级 380 500 245 450 145 620 480 420 520 280 550 660 350 500 330 600 180 520 230 460 600 110 420 105 580 400 420 380 180 500 140 450 600 400 125 540
二年级 420 580 510 175 280 630 400 150 450 360 450 330 400 420 300 500 580 400 280 380 530 95 100 570 300 220 320 250 300 350 400 360 130 450 590 230
三年级 380 420 235 125 400 470 330 200 420 280 300 410 200 460 165 400 75 430 300 220 250 130 270 340
计算结果 男生          ,女生          ,男、女生全体    
计算结果分析 从计算结果看到,在周体育活动时间方面,可以估计男生比女生略多,且波动程度略小,这所学校高中学生的周体育活动时间平均约为   分.
追踪训练
在本班范围内,就每名学生所在家庭的月人均用水量进行调查.调查的具体要求是:先查得在同一月份内各家的用水量(单位以计),然后将它除以家庭人中数(结果保留到小数点后第2位);再将所得数据进行整理、计算和分析,完成下列实习报告.
题目 调查本班每名学生所在家庭的月人均用水量
对获取数据的要求 这里的用水量是指同一月份内各学生所在家庭的人均用水量(下月第1天的水表数与本月第1天的水表数之差),数据单位为,结果保留到小数点后第2位.
样本数据(单位:)
频率分布表
频率分布直方图
样本平均数
统计结果的分析 要求讨论:通过对本问题的调查统计分析,可对全班同学所在地区的家庭月人均用水量作出何种估计?
备注 1.为了在所要求的时间内获取数据,调查任务就提前布置.2.实习报告可由部分同学完成,然后向全班同学报告并进行讨论.第5课时6.2.2频率分布直方图和折线图
分层训练
1.下列说法正确的是      ( )                   
(A) 直方图的高表示取某数的频数
(B) 直方图的高表示该组个体在样本中出现的频率
(C) 直方图的高表示该组个体在样本中出现的频率与组距的比
2.在频率分布直方图中,各个小长方形的面积表示 ( )
(A) 落在相应各组的数据的频数
(B) 相应各组的频率
(C) 该样本所分成的组数
(D) 该样本的样本容量
3.在100个人中,有40个学生,21个干部,29个工人,10个农民,则0.29是工人的( )                               
(A)频数 (B)频率 (C)累计频率 (D)累计频数
4.对于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是  (   )
(A)频率分布折线图与总体密度曲线无关
(B)频率分布折线图就是总体密度曲线
(C)样本容量很大的频率分布折线图就是总体密度曲线
(D)如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线。
5.在频率分布直方图中,所有矩形的面积和为_____________
6.200辆汽车通过某一段公路的时速如下图所示,则时速在的汽车大约有______辆
频率
0.4
0.3
0.2
0.1
0 40 50 60 70 80 时速(km)
7.如果将频率分布直方图中各相邻矩形的上底边的中点顺次连接起来,得到的折线,我们称之为这组数据的____________________
8.如果将样本容量取得足够大,分组的组距足够小,那么频率折线将趋于一条曲线,我们称这条曲线为总体分布的______________________
思考运用
9.测得20个毛坯重量(单位:克)如下表:
重量 185 187 192 200 202
频数 1 1 1 2 2
重量 205 206 207 208 210
频数 1 1 2 1 1
重量 214 215 216 218 227
频数 1 2 1 2 1
(1)列出样本频率分布表(含累计频率);
(2)画出频率分布直方图
10.有一个容量为50的样本,数据的分组及各组的频数如下:
3 8
9 11
10 5
4
(1)列出样本的频率分布表;
(2)画出频率分布直方图
(3)根据频率分布直方图估计,数据落在的可能性约是多少?
本节学习疑点:
学生质疑
教师答复