课件47张PPT。简单随机抽样主讲教师: 申东 简单随机抽样课件86张PPT。2.1.2系统抽样主讲教师: 申东 2.1.3分层抽样课件60张PPT。2.2 用样本估计总体第一课时 主讲教师 申 东 频率分布表和
频率分布直方图知识探究(一):频率分布表 【问题】 我国是世界上严重缺水的国家
之一,城市缺水问题较为突出,某市政
府为了节约生活用水,计划在本市试行
居民 生活用水定额管理,即确定一个居
民月用水量标准a,用水量不超过a的部
分按平价收费,超出a的部分按议价收费.
通过抽样调查,获得100位居民2007年的
月均用水量如下表(单位:t):知识探究(一):频率分布表 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6
3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4
3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8
3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1
3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3
3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0
2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3
2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4
2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4
2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2知识探究(一):频率分布表 思考1:上述100个数据中的最大值和最小
值分别是什么?由此说明样本数据的变化
范围是什么?知识探究(一):频率分布表 思考1:上述100个数据中的最大值和最小
值分别是什么?由此说明样本数据的变化
范围是什么?0.2~4.3知识探究(一):频率分布表 思考1:上述100个数据中的最大值和最小
值分别是什么?由此说明样本数据的变化
范围是什么?思考2:样本数据中的最大值和最小值的
差称为极差.如果将上述100个数据按组距
为0.5进行分组,那么这些数据共分为多
少组? 0.2~4.3知识探究(一):频率分布表 思考1:上述100个数据中的最大值和最小
值分别是什么?由此说明样本数据的变化
范围是什么?思考2:样本数据中的最大值和最小值的
差称为极差.如果将上述100个数据按组距
为0.5进行分组,那么这些数据共分为多
少组? 0.2~4.3(4.3-0.2)÷0.5=8.2知识探究(一):频率分布表 思考3:以组距为0.5进行分组,上述100个
数据共分为9组,各组数据的取值范围可以
如何设定?知识探究(一):频率分布表 思考3:以组距为0.5进行分组,上述100个
数据共分为9组,各组数据的取值范围可以
如何设定?[0,0.5),[0.5,1),[1,1.5),
…,[4,4.5].知识探究(一):频率分布表 思考4:如何统计上述100个数据在各组中
的频数?如何计算样本数据在各组中的频
率?你能将这些数据用表格反映出来吗?知识探究(一):频率分布表 知识探究(一):频率分布表 知识探究(一):频率分布表 思考5:上表称为样本数据的频率分布表,
由此可以推测该市全体居民月均用水量分
布的大致情况,给市政府确定居民月用水
量标准提供参考依据,这里体现了一种什
么统计思想?知识探究(一):频率分布表 思考5:上表称为样本数据的频率分布表,
由此可以推测该市全体居民月均用水量分
布的大致情况,给市政府确定居民月用水
量标准提供参考依据,这里体现了一种什
么统计思想?用样本的频率分布估计总体分布.知识探究(一):频率分布表 思考6:如果市政府希望85%左右的居民每
月的用水量不超过标准,根据上述频率分
布表,你对制定居民月用水量标准(即a的
取值)有何建议?知识探究(一):频率分布表 思考6:如果市政府希望85%左右的居民每
月的用水量不超过标准,根据上述频率分
布表,你对制定居民月用水量标准(即a的
取值)有何建议? 88%的居民月用水量在3t以下,可建
议取a=3. 知识探究(一):频率分布表 思考7:在实际中,取a=3t一定能保证85%
以上的居民用水不超标吗?哪些环节可能
会导致结论出现偏差?知识探究(一):频率分布表 思考7:在实际中,取a=3t一定能保证85%
以上的居民用水不超标吗?哪些环节可能
会导致结论出现偏差? 分组时,组距的大小可能会导致结论
出现偏差,实践中,对统计结论是需要进
行评价的. 知识探究(一):频率分布表 思考8:对样本数据进行分组,其组数是由
哪些因素确定的?知识探究(一):频率分布表 思考8:对样本数据进行分组,其组数是由
哪些因素确定的?思考9:对样本数据进行分组,组距的确定
没有固定的标准,组数太多或太少,都会
影响我们了解数据的分布情况.数据分组的
组数与样本容量有关,一般样本容量越大,
所分组数越多. 知识探究(一):频率分布表 思考10:一般地,列出一组样本数据的频
率分布表可以分哪几个步骤进行?知识探究(一):频率分布表 思考10:一般地,列出一组样本数据的频
率分布表可以分哪几个步骤进行?第一步,求极差.知识探究(一):频率分布表 思考10:一般地,列出一组样本数据的频
率分布表可以分哪几个步骤进行?第一步,求极差.第二步,决定组距与组数.知识探究(一):频率分布表 思考10:一般地,列出一组样本数据的频
率分布表可以分哪几个步骤进行?第一步,求极差.第二步,决定组距与组数.第三步,确定分点,将数据分组.知识探究(一):频率分布表 思考10:一般地,列出一组样本数据的频
率分布表可以分哪几个步骤进行?第一步,求极差.第二步,决定组距与组数.第三步,确定分点,将数据分组.第四步,列频率分布表.知识探究(二):频率分布直方图 思考1:为了直观反映样本数据在各组中的
分布情况,我们将上述频率分布表中的有
关信息用下面的图形表示: 月均用水量/t频率
组距0.5
0.4
0.3
0.2
0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(二):频率分布直方图 思考1:为了直观反映样本数据在各组中的
分布情况,我们将上述频率分布表中的有
关信息用下面的图形表示: 月均用水量/t频率
组距0.5
0.4
0.3
0.2
0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(二):频率分布直方图 思考1:为了直观反映样本数据在各组中的
分布情况,我们将上述频率分布表中的有
关信息用下面的图形表示: 月均用水量/t频率
组距0.5
0.4
0.3
0.2
0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(二):频率分布直方图 思考1:为了直观反映样本数据在各组中的
分布情况,我们将上述频率分布表中的有
关信息用下面的图形表示: 月均用水量/t频率
组距0.5
0.4
0.3
0.2
0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(二):频率分布直方图 思考1:为了直观反映样本数据在各组中的
分布情况,我们将上述频率分布表中的有
关信息用下面的图形表示: 月均用水量/t频率
组距0.5
0.4
0.3
0.2
0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(二):频率分布直方图 思考1:为了直观反映样本数据在各组中的
分布情况,我们将上述频率分布表中的有
关信息用下面的图形表示: 月均用水量/t频率
组距0.5
0.4
0.3
0.2
0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(二):频率分布直方图 思考1:为了直观反映样本数据在各组中的
分布情况,我们将上述频率分布表中的有
关信息用下面的图形表示: 月均用水量/t频率
组距0.5
0.4
0.3
0.2
0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(二):频率分布直方图 思考1:为了直观反映样本数据在各组中的
分布情况,我们将上述频率分布表中的有
关信息用下面的图形表示: 月均用水量/t频率
组距0.5
0.4
0.3
0.2
0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(二):频率分布直方图 思考1:为了直观反映样本数据在各组中的
分布情况,我们将上述频率分布表中的有
关信息用下面的图形表示: 月均用水量/t频率
组距0.5
0.4
0.3
0.2
0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(二):频率分布直方图 思考1:为了直观反映样本数据在各组中的
分布情况,我们将上述频率分布表中的有
关信息用下面的图形表示: 月均用水量/t频率
组距0.5
0.4
0.3
0.2
0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(二):频率分布直方图 思考2:频率分布直方图中小长方形的面积表示什么?所有小长方形的面积和=?知识探究(二):频率分布直方图 思考2:频率分布直方图中小长方形的面积表示什么?所有小长方形的面积和=?小长方形的面积表示该组的频率.知识探究(二):频率分布直方图 思考2:频率分布直方图中小长方形的面积表示什么?所有小长方形的面积和=?小长方形的面积表示该组的频率.所有小长方形的面积和=1.知识探究(二):频率分布直方图 思考3:频率分布直方图非常直观地表明了样本
数据的分布情况,使我们能够看到频率分布表中
看不太清楚的数据模式,但原始数据不能在图中
表示出来.你能根据上述频率分布直方图指出居民
月均用水量的一些数据特点吗?知识探究(二):频率分布直方图 知识探究(二):频率分布直方图 (1)居民月均用水量的分布是“山峰”状的,而且
是“单峰”的;知识探究(二):频率分布直方图 (1)居民月均用水量的分布是“山峰”状的,而且
是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值
附近,只有少数居民的月均用水量很多或很少;知识探究(二):频率分布直方图 (1)居民月均用水量的分布是“山峰”状的,而且
是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值
附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.知识探究(二):频率分布直方图 思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布
直方图的作图步骤如何?知识探究(二):频率分布直方图 思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布
直方图的作图步骤如何? 第一步,画平面直角坐标系. 知识探究(二):频率分布直方图 思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布
直方图的作图步骤如何? 第一步,画平面直角坐标系. 第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.知识探究(二):频率分布直方图 思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布
直方图的作图步骤如何? 第一步,画平面直角坐标系. 第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.课堂练习 1. 有一个容量为50的样本数据的分组
及各组的频数如下:
[12.5, 15.5) 3 [24.5, 27.5) 10
[15.5, 18.5) 8 [27.5, 30.5) 5
[18.5, 21.5) 9 [30.5, 33.5) 4
[21.5, 24.5) 11
⑴列出样本的频率分布表和画出频率
分布直方图;
⑵根据样本的频率分布估计,小于30.5
的数据约占多少? 课堂练习2.(2006年全国卷II)一个社会调查机构就某地居民
的月收入调查了10 000人,并根据所得数据画了样
本的频率分布直方图(如下图).为了分析居民的收入
与年龄、学历、职业等方面的关系,要从这10 000
人中再用分层抽样方法抽出100人作进一步调查,
则在[2500,3000](元)月收入段应抽出_______人.0.00010.00020.00030.00040.00051000 1500 2000 2500 3000 3500 4000月收入(元)频率/组距课堂练习2.(2006年全国卷II)一个社会调查机构就某地居民
的月收入调查了10 000人,并根据所得数据画了样
本的频率分布直方图(如下图).为了分析居民的收入
与年龄、学历、职业等方面的关系,要从这10 000
人中再用分层抽样方法抽出100人作进一步调查,
则在[2500,3000](元)月收入段应抽出_______人.0.00010.00020.00030.00040.0005月收入(元)频率/组距251000 1500 2000 2500 3000 3500 4000课堂练习3.某班50名学生在一次百米测试中,成绩全部介于13
秒与19秒之间,将测试结果按如下方式分成六组:第
一组,成绩大于等于13秒且小于14秒;第二组,成绩
大于等于14秒且小于15秒;……
第六组,成绩大于等于18秒且小
于等于19秒.右图是按上述分组
方法得到的频率分布直方图.设
成绩小于17秒的学生人数占全班
总人数的百分比为x,成绩大于等
于15秒且小于17秒的学生人数为y,
则从频率分布直方图中可分析出x
和y分别为( )A.0.9,35 B.0.9,45
C.0.1,35 D.0.1,45课堂练习3.某班50名学生在一次百米测试中,成绩全部介于13
秒与19秒之间,将测试结果按如下方式分成六组:第
一组,成绩大于等于13秒且小于14秒;第二组,成绩
大于等于14秒且小于15秒;……
第六组,成绩大于等于18秒且小
于等于19秒.右图是按上述分组
方法得到的频率分布直方图.设
成绩小于17秒的学生人数占全班
总人数的百分比为x,成绩大于等
于15秒且小于17秒的学生人数为y,
则从频率分布直方图中可分析出x
和y分别为( )A.0.9,35 B.0.9,45
C.0.1,35 D.0.1,45A课堂练习4. (2006年重庆卷)为了了解某地区高三学生的
身体发育情况,抽查了该地区100名年龄为17.5
岁-18岁的男生体重(kg) ,得到频率分布直方图
如下:根据上图可得这100名学生中体重在[56.5,64.5]的
学生人数是( )
A. 20 B. 30 C. 40 D. 500.030.050.0754.5 58.5 62.5 66.5 70.5 74.5 课堂练习4. (2006年重庆卷)为了了解某地区高三学生的
身体发育情况,抽查了该地区100名年龄为17.5
岁-18岁的男生体重(kg) ,得到频率分布直方图
如下:根据上图可得这100名学生中体重在[56.5,64.5]的
学生人数是( )
A. 20 B. 30 C. 40 D. 50C0.030.050.0754.5 58.5 62.5 66.5 70.5 74.5 课堂练习5.(广东文7、艺术理6)下面左图是某县参加2007年高考的学生
身高条形统计图,从左到右的各条形表示的学生人数依次记为
A1、A2、…、A10(如A2表示身高(单位:cm)(150,155)内的学生
人数).右图是统计左图中身高在一定范围内学生人数的一个算
法流程图.现要统计身高在160~180cm(含160cm,不含180cm)的
学生人数,那么在流程图中的判断框内应填写的条件是( )
A.i<9 B. i<8 C. i<7 D. i<6输入A1,A2,…,Ana=0
i=4输出s是否开始结束课堂练习5.(广东文7、艺术理6)下面左图是某县参加2007年高考的学生
身高条形统计图,从左到右的各条形表示的学生人数依次记为
A1、A2、…、A10(如A2表示身高(单位:cm)(150,155)内的学生
人数).右图是统计左图中身高在一定范围内学生人数的一个算
法流程图.现要统计身高在160~180cm(含160cm,不含180cm)的
学生人数,那么在流程图中的判断框内应填写的条件是( )
A.i<9 B. i<8 C. i<7 D. i<6B输入A1,A2,…,Ana=0
i=4输出s是否开始结束6.为了解某校高三学生的视力情况,随机地抽
查了该校100名高三学生的视力情况,得到频率
分布直方图,如右,由于不慎将部分数据丢失,
但知道前4组的频数成等比数列,后6组的频数成
等差数列,设最大频率为a,视力在4.6到5.0之间
的学生数为b,则a, b的值分别为( )课堂练习A. 0.27,78
B. 0.27,83
C. 2.7,78
D. 2.7,836.为了解某校高三学生的视力情况,随机地抽
查了该校100名高三学生的视力情况,得到频率
分布直方图,如右,由于不慎将部分数据丢失,
但知道前4组的频数成等比数列,后6组的频数成
等差数列,设最大频率为a,视力在4.6到5.0之间
的学生数为b,则a, b的值分别为( )课堂练习A. 0.27,78
B. 0.27,83
C. 2.7,78
D. 2.7,83A作业:
《习案》作业十八课件42张PPT。2.2 用样本估计总体第二课时 主讲教师 申 东 频率分布
折线图和茎叶图月均用水量/t频率
组距0.5
0.4
0.3
0.2
0.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O【问题】 某赛季甲、乙两名篮球运动员每场
比赛的得分情况如下:
甲运动员得分:13,51,23,8,26,38,16,
33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.【问题】 某赛季甲、乙两名篮球运动员每场
比赛的得分情况如下:
甲运动员得分:13,51,23,8,26,38,16,
33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39. 甲运动员得分:13,51,23,8,26,38,16,
33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.0123480 50 5 71 1 531. 下面是甲、乙两名运动员某赛季一些场次得分
的茎叶图:
(1)甲、乙两名运动员的最高得分各是多少?
(2)哪名运动员的成绩好一些?作业:
《习案》作业十九课件45张PPT。2.2 用样本估计总体第三课时 主讲教师 申 东 作业:
《习案》作业二十
作业二十一课件19张PPT。主讲教师 申 东 习题讲评0.080.081500.0815088%151515CAA.0.9,35 B.0.9,45
C.0.1,35 D.0.1,455.某班50名学生在一次百米测试中,成绩全部介于13
秒与19秒之间,将测试结果按如下方式分成六组:第
一组,成绩大于等于13秒且小于14秒;第二组,成绩
大于等于14秒且小于15秒;……
第六组,成绩大于等于18秒且小
于等于19秒.右图是按上述分组
方法得到的频率分布直方图.设
成绩小于17秒的学生人数占全班
总人数的百分比为x,成绩大于等
于15秒且小于17秒的学生人数为y,
则从频率分布直方图中可分析出x
和y分别为( )5.某班50名学生在一次百米测试中,成绩全部介于13
秒与19秒之间,将测试结果按如下方式分成六组:第
一组,成绩大于等于13秒且小于14秒;第二组,成绩
大于等于14秒且小于15秒;……
第六组,成绩大于等于18秒且小
于等于19秒.右图是按上述分组
方法得到的频率分布直方图.设
成绩小于17秒的学生人数占全班
总人数的百分比为x,成绩大于等
于15秒且小于17秒的学生人数为y,
则从频率分布直方图中可分析出x
和y分别为( )A.0.9,35 B.0.9,45
C.0.1,35 D.0.1,45A根据上图可得这100名学生中体重在[56.5,64.5]
的学生人数是( )
A. 20 B. 30 C. 40 D. 500.030.050.0754.5 58.5 62.5 66.5 70.5 74.5 6.(2006年重庆卷)为了了解某地区高三学生的
身体发育情况,抽查了该地区100名年龄为17.5
岁-18岁的男生体重(kg) ,得到频率分布直方图
如下:6.(2006年重庆卷)为了了解某地区高三学生的
身体发育情况,抽查了该地区100名年龄为17.5
岁-18岁的男生体重(kg) ,得到频率分布直方图
如下:C0.030.050.0754.5 58.5 62.5 66.5 70.5 74.5 根据上图可得这100名学生中体重在[56.5,64.5]
的学生人数是( )
A. 20 B. 30 C. 40 D. 50输入A1,A2,…,Ana=0
i=4输出s是否开始结束输入A1,A2,…,Ana=0
i=4输出s是否开始结束BA. 0.27,78
B. 0.27,83
C. 2.7,78
D. 2.7,83AA. 0.27,78
B. 0.27,83
C. 2.7,78
D. 2.7,83课件45张PPT。2.2 用样本估计总体第四课时 主讲教师 申 东 1.如何根据样本频率分布直方图,分别估
计总体的众数、中位数和平均数?1.如何根据样本频率分布直方图,分别估
计总体的众数、中位数和平均数?(1)众数:最高矩形下端中点的横坐标.1.如何根据样本频率分布直方图,分别估
计总体的众数、中位数和平均数?(1)众数:最高矩形下端中点的横坐标.(2)中位数:直方图面积平分线与横轴交
点的横坐标.1.如何根据样本频率分布直方图,分别估
计总体的众数、中位数和平均数?(1)众数:最高矩形下端中点的横坐标.(2)中位数:直方图面积平分线与横轴交
点的横坐标.(3)平均数:每个小矩形的面积与小矩形
底边中点的横坐标的乘积之和. 2. 对于样本数据x1,x2,…,xn,其标准
差如何计算?2. 对于样本数据x1,x2,…,xn,其标准
差如何计算?样本数字特征例题分析1.标准差的平方s2称为方差,有时用方差
代替标准差测量样本数据的离散度.方差
与标准差的测量效果是一致的,在实际
应用中一般多采用标准差.1.标准差的平方s2称为方差,有时用方差
代替标准差测量样本数据的离散度.方差
与标准差的测量效果是一致的,在实际
应用中一般多采用标准差.2.现实中的总体所包含的个体数往往很
多,总体的平均数与标准差是未知的,
我们通常用样本的平均数和标准差去估
计总体的平均数与标准差,但要求样本
有较好的代表性.3.对于城市居民月均用水量样本数据,其
平均数 ,标准差s=0.868.
在这100个数据中,
落在区间 =[1.105,2.841]外
的有28个;
落在区间 =[0.237,3.709]
外的只有4个;
落在区间 =[-0.631,4.577]
外的有0个. 一般地,对于一个正态总体,数据
落在区间 、 、
内的百分比分别为68.3%、
95.4%、99.7%,这个原理在产品质量控
制中有着广泛的应用(参考教材P79“阅
读与思考”). 例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;O频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 (1)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;O频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 (1)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;O频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 (1)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;O频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 (1)O频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 (2)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;O频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 (1)O频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 (2)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;O频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 (1)O频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 (2)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;O频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 (1)O频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 (2)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;O频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 (1)O频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 (2)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(3)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(3)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(3)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(3)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(3)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(3)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(3)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(3)频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(4)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(3)频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(4)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(3)频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(4)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(3)频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(4)例1 画出下列四组样本数据的条形图,
说明他们的异同点.
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(3)频率1.0
0.8
0.6
0.4
0.21 2 3 4 5 6 7 8 O(4)例2 甲、乙两人同时生产内径为25.40mm的一
种零件,为了对两人的生产质量进行评比,从
他们生产的零件中各随机抽取20件,量得其内
径尺寸如下(单位:mm):甲 :
25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45
25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40
25.42 25.35 25.41 25.39乙:
25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49
26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31
25.32 25.32 25.32 25.48 从生产零件内径的尺寸看,谁生产的零件
质量较高? 甲生产的零件内径更接近内径标准,且稳
定程度较高,故甲生产的零件质量较高. 甲生产的零件内径更接近内径标准,且稳
定程度较高,故甲生产的零件质量较高. 说明:1.生产质量可以从总体的平均数与标准
差两个角度来衡量,但甲、乙两个总体的平均
数与标准差都是不知道的,我们就用样本的平
均数与标准差估计总体的平均数与标准差.
2.问题中25.40mm是内径的标准值,而不是
总体的平均数.例3 以往招生统计显示,某所大学录取的
新生高考总分的中位数基本稳定在550分,
若某同学今年高考得了520分,他想报考
这所大学还需收集哪些信息?例3 以往招生统计显示,某所大学录取的
新生高考总分的中位数基本稳定在550分,
若某同学今年高考得了520分,他想报考
这所大学还需收集哪些信息?要点:
(1)查往年录取的新生的平均分数.若平均数
小于中位数很多,说明最低录取线较低,可以
报考;
(2)查往年录取的新生高考总分的标准差.若
标准差较大,说明新生的录取分数较分散,最
低录取线可能较低,可以考虑报考.(宁夏理11文12).甲、乙、丙三名射箭运动员
在某次测试中各射箭20次,三人的测试成绩如
下表:s1,s2,s3分别表示甲、
乙、丙三名运动员这次
测试成绩的标准差,则
有( )A. s3>s1>s2
B. s2>s1>s3
C. s1>s2>s3
D. s2>s3>s1(宁夏理11文12).甲、乙、丙三名射箭运动员
在某次测试中各射箭20次,三人的测试成绩如
下表:s1,s2,s3分别表示甲、
乙、丙三名运动员这次
测试成绩的标准差,则
有( )A. s3>s1>s2
B. s2>s1>s3
C. s1>s2>s3
D. s2>s3>s1B1.对同一个总体,可以抽取不同的样本,
相应的平均数与标准差都会发生改变.如
果样本的代表性差,则对总体所作的估
计就会产生偏差;如果样本没有代表性,
则对总体作出错误估计的可能性就非常
大,由此可见抽样方法的重要性.2.在抽样过程中,抽取的样本是具有随机
性的,如从一个包含6个个体的总体中抽
取一个容量为3的样本就有20中可能抽样,
因此样本的数字特征也有随机性. 用样本
的数字特征估计总体的数字特征,是一
种统计思想,没有惟一答案.3.在实际应用中,调查统计是一个探究性
学习过程,需要做一系列工作,我们可以
把学到的知识应用到自主研究性课题中去.课件66张PPT。2.3 变量间的相关关系高二数学主讲:申东① ② ③ 使用Excel501005101520253035售价0面积150练习2. 今有一组试验数据如下表所示:
现准备用下列函数中的一个近似地表示
这些数据满足的规律,其中最接近的一
个是( )A. y=log2x B. y=2x
C. D. y=2x-2练习2. 今有一组试验数据如下表所示:
现准备用下列函数中的一个近似地表示
这些数据满足的规律,其中最接近的一
个是( )A. y=log2x B. y=2x
C. D. y=2x-2C回归直线及其方程年龄 3. F表提供了某厂节能降耗技术改造后生产甲产
品过程中记录的产量x(吨)与相应的生产能耗y(吨
标准煤)的几组对照数据(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,崩最小二乘法求出y
关于x的线性回归方程y=bx+a;
(3)已知该厂技改前100吨甲产品的生产能耗为90
吨标准煤.试根据(2)求出的线性同归方程,预测
生产100吨甲产品的生产能耗比技改前降低多少
吨标准煤?课件28张PPT。2.3 两变量间的相关关系高二数学主讲:申东高二文科复习小测试教师用稿 选修3 统计
一.选择题(40分)
1.某学校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( D )
(A)简单随机抽样法 (B)抽签法 (C)随机数表法 (D)分层抽样法
2.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,
方差为2,则|x-y|的值为( D )
(A)1 (B)2 (C)3 (D)4
3.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如右:根据上图可得这100名学生中体重在[56.5,64.5的学生人数是 ( C )
(A)20
(B)30
(C)40
(D)50
分数
5
4
3
2
1
人数
20
10
30
30
10
4.从某项综合能力测试中抽取100人的成绩,统计如表,
则此100人成绩的标准差为( B )
(A) (B) (C)3 (D)
5.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测。若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( C ) (A)4 (B)5 (C)6 (D)7
6.一组数据为:151,152,153,149,148,146,151,150,152,147.其中位数是( B )
(A) 150 (B) 150.5 (C) 151 (D)151.5
7.已知一个线性回归方程为=-2x+5,当变量x增加一个单位时,y的变化规律是( C )
A 增加2个单位 B 增加5个单位 C 减少2个单位 D 减少5个单位
8.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如图2).从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是( C )
A.48米 B.49米 C.50米 D.51米
二.填空题(20分)
9.一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为
10.数据的离散程度可由下列哪些量来描述___(3)、(4)、(5)_________,
(1)中位数,(2)众数,(3)极差,(4)方差,(5)标准差.
(注意:请把正确选项的序号写在横线上,多选,少选都计0分)
12、从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:
甲品种:
271
273
280
285
285
287
292
294
295
301
303
303
307
308
310
314
319
323
325
325
328
331
334
337
352
乙品种:
284
292
295
304
306
307
312
313
315
315
316
318
318
320
322
322
324
327
329
331
333
336
337
343
356
由以上数据设计了如下茎叶图:
甲
乙
3
1
27
7
5
5
0
28
4
5
4
2
29
2
5
8
7
3
3
1
30
4
6
7
9
4
0
31
2
3
5
5
6
8
8
8
5
5
3
32
0
2
2
4
7
9
7
4
1
33
1
3
6
7
34
3
2
35
6
根据以上茎叶图,对甲乙两品种棉花的纤维长度作比较,写出两个统计结论:
①_乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度 .
②甲品种棉花的纤维长度比乙品种棉花的纤维长度更分散 .
③甲品种中位数307mm,乙品种中位数318mm. .
④乙品种基本对称,且大多集中在中间,甲品种除一个特殊组(3 52)外,也大致对称、分布均匀.
参考公式:
样本数据,,,的标准差 ,
最小二乘法求回归方程的公式:,
其中为标本平均数.
三.解答题(40分)
13.在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)
分组
频数
频率
0.04
0.25
0.30
0.29
0.10
0.02
合计
共有100个数据,将数据分组如右表:
(I)完成频率分布表,并在给定的坐标系中画出频率分布直方图;
(II)估计纤度落在中的概率及纤度小于的概率是多少?
(III)统计方法中,同一组数据常用该组区间的中点值(例如区间的中点值是)作为代表.据此,估计纤度的众数,平均值,中位数.
(要求:结果精确到0.01)
解:(Ⅰ)
(Ⅱ)纤度落在中的概率约为,纤度小于1.40的概率约为.
(Ⅲ)众数:1.40,平均值=1.32×0.04+1.36×0.25+1.40×0.30+1.44×0.29+1.48×0.1+1.52×0.02=1.41
中位数:0.04+0.25+0.30=0.59,中位数在区间内,设横轴上中位数到1.38的距离为x,
则1-0.04-0.25=0.21,第三个矩形的高为0.30÷0.04=7.5,所以x=0.21÷7.5=0.03,故中位数=1.41
14.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生
产能耗 (吨标准煤)的几组对照数据
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性
回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:)
解:(1)如图
(2)由对照数据,计算得: ;
所求的回归方程为
(3) , 吨,
预测生产100吨甲产品的生产能耗比技改前降低(吨)
2.1.1 简单随机抽样
教学目标:
1、知识与技能:
(1)正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤;
2、过程与方法:
(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;
(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本。
3、情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性。
4、重点与难点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本。
教学过程
【问题提出】
1. 我们生活在一个数字化时代,时刻都在和数据打交道,例如,产品的合格率,农作物的产量,商品的销售量,电视台的收视率等.这些数据常常是通过抽样调查而获得的,如何从总体中抽取具有代表性的样本,是我们需要研究的课题.
2. 要判断一锅汤的味道需要把整锅汤都喝完吗?应该怎样判断?
3. 将锅里的汤“搅拌均匀”,品尝一小勺就知道汤的味道,这是一个简单随机抽样问题,对这种抽样方法,我们从理论上作些分析
知识探究(一):简单随机抽样的基本思想
思考
1. 从5件产品中任意抽取一件,则每一件产品被抽到的概率是多少?一般地,从N个个体中任意抽取一个,则每一个个体被抽到的概率是多少?
2. 从6件产品中随机抽取一个容量为3的样本,可以分三次进行,每次从中随机抽取一件,抽取的产品不放回,这叫做逐个不放回抽取.在这个抽样中,某一件产品被抽到的概率是多少?
3. 一般地,从N个个体中随机抽取n个个体作为样本,则每一个个体被抽到的概率是多少?
4. 食品卫生工作人员,要对校园食品店的一批小包装饼干进行卫生达标检验,打算从中抽取一定数量的饼干作为检验的样本.其抽样方法是,将这批小包装饼干放在一个麻袋中搅拌均匀,然后逐个不放回抽取若干包,这种抽样方法就是简单随机抽样.那么简单随机抽样的含义如何?
简单随即抽样的含义
一般地,设一个总体有N个个体, 从中逐个不放回地抽取n个个体作为样本(n≤N), 如果每次抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.
思考
5. 根据你的理解,简单随机抽样有哪些主要特点?
(1)总体的个体数有限;
(2)样本的抽取是逐个进行的,每次只抽取一个个体;
(3)抽取的样本不放回,样本中无重复个体;
(4)每个个体被抽到的机会都相等,抽样具有公平性.
6. 在1936年美国总统选举前,一份颇有名气的杂志的工作人员对兰顿和罗斯福两位候选人做了一次民意测验.调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表.调查结果表明,兰顿当选的可能性大(57%),但实际选举结果正好相反,最后罗斯福当选(62%).你认为预测结果出错的原因是什么?
知识探究(二):简单随机抽样的方法
思考:
1. 假设要在我们班选派5个人去参加某项活动,为了体现选派的公平性,你有什么办法确定具体人选?
2. 用抽签法(抓阄法)确定人选,具体如何操作?
用小纸条把每个同学的学号写下来放在盒子里,并搅拌均匀,然后随机从中逐个抽出5个学号,被抽到学号的同学即为参加活动的人选.
3. 一般地,抽签法的操作步骤如何?
第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.
第二步,将号签放在一个容器中,并搅拌均匀
第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
4. 你认为抽签法有哪些优点和缺点?
优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.
5. 假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时应如何操作?
第一步,将800袋牛奶编号为000,001,…
第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7为起始数).
第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.
6. 如果从100个个体中抽取一个容量为10的样本,你认为对这100个个体进行怎样编号为宜?
7. 一般地,利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何?
第一步,将总体中的所有个体编号.
第二步,在随机数表中任选一个数作为起始数.
第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.
【例题精析】
例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?
[分析] 简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样。
例2:某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?
[分析] 简单随机抽样一般采用两种方法:抽签法和随机数表法。
解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径。
解法2:(随机数表法)将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本。
【课堂练习】
1、P57面1、2、3、4
2、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是( D )
A.总体是240 B、个体是每一个学生
C、样本是40名学生 D、样本容量是40
3、为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是 ( C )
A、总体 B、个体 C、总体的一个样本 D、样本容量
4、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是 1/10 .
5、从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是 1/10 .
【课堂小结】
1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.
2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型.
3、简单随机抽样每个个体入样的可能性都相等,均为n/N,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的可能性这三种情况区分开来,避免在解题中出现错误.
作业:《习案》作业十三及作业十四.
2.1.2系统抽样
教学目标:
1、知识与技能:
(1)正确理解系统抽样的概念;
(2)掌握系统抽样的一般步骤;
(3)正确理解系统抽样与简单随机抽样的关系;
2、过程与方法:通过对实际问题的探究,归纳应用数学知识解决实际问题的方法,理解分类讨论的数学方法.
3、情感态度与价值观:通过数学活动,感受数学对实际生活的需要,体会现实世界和数学知识的联系.
4、重点与难点:正确理解系统抽样的概念,能够灵活应用系统抽样的方法解决统计问题.
知识探究(一):系统抽样的基本思想
思考
1. 某中学高一年级有12个班,每班50人,为了了解高一年级学生对老师教学的意见,教务处打算从年级600名学生中抽取60名进行问卷调查,那么年级每个同学被抽到的概率是多少?
2. 你能用简单随机抽样对上述问题进行抽样吗?具体如何操作?
3. 如果从600件产品中抽取60件进行质量检查,按照上述思路抽样应如何操作?
第一步,将这600件产品编号为1,2,3,…,600.
第二步,将总体平均分成60部分,每一部分含10个个体.
第三步,在第1部分中用简单随机抽样抽取一个号码(如8号).
第四步,从该号码起,每隔10个号码取一个号码,就得到一个容量为60的样本.(如8,18,28,…,598)
系统抽样的定义:
一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.
由系统抽样的定义可知系统抽样有以下特征:
(1)当总体容量N较大时,采用系统抽样。
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k=[ ].
(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.
思考.下列抽样中不是系统抽样的是 ( C )
A、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样
B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验
C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止
D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
知识探究(二):系统抽样的一般步骤
思考1:用系统抽样从总体中抽取样本时,首先要做的工作是什么?
将总体中的所有个体编号.
思考2:如果用系统抽样从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,对此应如何处理?
先从总体中随机剔除5个个体,再均衡分成60部分.
思考3:用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,要平均分成多少段,每段各有多少个号码?
思考4:如果N不能被n整除怎么办?
思考5:将含有N个个体的总体平均分成n段,每段的号码个数称为分段间隔,那么分段间隔k的值如何确定?
总体中的个体数N除以样本容量n所得的商.
思考6:用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?
用简单随机抽样抽取第1段的个体编号.在抽取第1段的号码之前,自定义规则确定以后各段的个体编号,通常是将第1段抽取的号码依次累加间隔k.
思考7:一般地,用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,其操作步骤如何?
第一步,将总体的N个个体编号.
第二步,确定分段间隔k,对编号进行分段.
第三步,在第1段用简单随机抽样确定起始个体编号l.
第四步,按照一定的规则抽取样本.
思考8:系统抽样适合在哪种情况下使用?与简单随机抽样比较,哪种抽样方法更使样本具有代表性?
总体中个体数比较多;系统抽样更使样本具有代表性.
思考9:在数字化时代,各种各样的统计数字和图表充斥着媒体,由于数字给人的印象直观、具体,所以让数据说话是许多广告的常用手法.下列广告中的数据可靠吗?
“……瘦体减肥灵真的灵,其减肥的有效率为75%.”
“现代研究证明,99%以上的人皮肤感染有螨虫…….”
“……美丽润肤膏,含有多种中药成分,可以彻底清除脸部皱纹,只需10天,就能让你的肌肤得到改善.”
例题精析
例1、从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是
A.5,10,15,20,25 B、3,13,23,33,43
C.1,2,3,4,5 D、2,4,6,16,32
[分析]用系统抽样的方法抽取至的导弹编号应该k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k是1到10中用简单随机抽样方法得到的数,因此只有选项B满足要求,故选B。
2.1.3分层抽样
知识探究(三):分层抽样的基本思想
思考1:某地区有高中生2400人,初中生10800人,小学生11100人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?
样本容量与总体个数的比例为1:100,则高中应抽取人数为2400*1/100=24人,初中应抽取人数为10800*1/100=108人,小学应抽取人数为11100*1/100=111人.
思考2:具体在三类学生中抽取样本时(如在10800名初中生中抽取108人),可以用哪种抽样方法进行抽样?
思考3:在上述抽样过程中,每个学生被抽到的概率相等吗?
归纳:
1.分层抽样:
若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本.
分层抽样又称类型抽样
2. 应用分层抽样应遵循以下要求:
(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。
知识探究(四):分层抽样的操作步骤
某单位有职工500人,其中35岁以下的有125人,35岁~49岁的有280人,50岁以上的有95人.为了调查职工的身体状况,要从中抽取一个容量为100的样本.
思考1:该项调查应采用哪种抽样方法进行?
思考2:按比例,三个年龄层次的职工分别抽取多少人?
35岁以下25人,35岁~49岁56人,50岁以上19人.
思考3:在各年龄段具体如何抽样?怎样获得所需样本?
思考4:一般地,分层抽样的操作步骤如何?
第一步,计算样本容量与总体的个体数之比.
第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.
第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.
第四步,将各层抽取的个体合在一起,就得到所取样本.
思考5:在分层抽样中,如果总体的个体数为N,样本容量为n,第i层的个体数为k,则在第i层应抽取的个体数如何算?
思考6:样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数该如何处理?
调节样本容量,剔除个体.
探究交流
分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若 干个体构成样本,所以分层抽样为保证每 个个体等可能入样,必须进行 (C )
A、每层等可能抽样
B、每层不等可能抽样
C、所有层按同一抽样比等可能抽样
思考7:简单随机抽样、系统抽样和分层抽样既有其共性,又有其个性,根据下表,你能对三种抽样方法作一个比较吗?
理论迁移
例1 某公司共有1000名员工,下设若干部门,现用分层抽样法,从全体员工中抽取一个容量为80的样本,已知策划部被抽取4个员工,求策划部的员工人数是多少?
50人.
例2 某中学有180名教职员工,其中教学人员144人,管理人员12人,后勤服务人员24人,设计一个抽样方案,从中选取15人去参观旅游.
用分层抽样,抽取教学人员12人,管理人员1人,后勤服务人员2人.
例3 某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品的销售情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②,完成这两项调查宜分别采用什么方法?
①用分层抽样,②用简单随机抽样.
小结作业
1.分层抽样利用了调查者对调查对象事先掌握的各种信息,考虑了保持样本结构与总体结构的一致性,从而使样本更具有代表性,在实际调查中被广泛应用.
2.分层抽样是按比例分别对各层进行抽样,再将各个子样本合并在一起构成所需样本.其中正确计算各层应抽取的个体数,是分层抽样过程中的重要环节.
3.简单随机抽样是基础,系统抽样与分层抽样是补充和发展,三者相辅相成,对立统一.
4、在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为:
(1)采用随机的方法将总体中个体编号;
(2)将整体编号进行分段,确定分段间隔k(k∈N);
(3)在第一段内采用简单随机抽样的方法确定起始个体编号L;
(4)按照事先预定的规则抽取样本。
5、在确定分段间隔k时应注意:分段间隔k为整数,当不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。
课堂练习
P59 练习1. 2. 3.
课后作业
《习案》作业十五、十六、十七.
2.2.1用样本估计总体(一)
知识探究(一):频率分布表
【问题】 我国是世界上严重缺水的国家 之一,城市缺水问题较为突出,某市政 府为了节约生活用水,计划在本市试行 居民 生活用水定额管理,即确定一个居 民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的 月均用水量如下表(单位:t):
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6
3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4
3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8
3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1
3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3
3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0
2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3
2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4
2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4
2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么? 0.2~4.3
思考2:样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组? (4.3-0.2)÷0.5=8.2
思考3:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].
思考4:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?
思考5:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?
用样本的频率分布估计总体分布.
思考6:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?
88%的居民月用水量在3t以下,可建议取a=3.
思考7:在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?
分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的.
思考8:对样本数据进行分组,其组数是由哪些因素确定的?
思考9:对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.
思考10:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?
第一步,求极差.
第二步,决定组距与组数.
第三步,确定分点,将数据分组.
第四步,列频率分布表.
知识探究(二):频率分布直方图
思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:
思考2:
频率分布直方图中
小长方形的面积表示什么?小长方形的面积表示该组的频率.
所有小长方形的面积和=?所有小长方形的面积和=1.
思考3:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?
(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;
(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布
直方图的作图步骤如何?
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.
第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.
课堂练习
1. 有一个容量为50的样本数据的分组及各组的频数如下:
[12.5, 15.5) 3 [24.5, 27.5) 10
[15.5, 18.5) 8 [27.5, 30.5) 5
[18.5, 21.5) 9 [30.5, 33.5) 4
[21.5, 24.5) 11
⑴列出样本的频率分布表和画出频率分布直方图;
⑵根据样本的频率分布估计,小于30.5的数据约占多少?
2.(2006年全国卷II)一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000](元)月收入段应抽出 25 人
3.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于等于19秒.右图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为,成绩大于等于15秒且小于17秒的学生人数为,则从频率分布直方图中可分析出和分别为( )
A.0.9,35 B.0.9,45
C.0.1,35 D.0.1,45
4. ( 2006年重庆卷)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:
根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是 ( C)
(A)20 (B)30 (C)40 (D)50
5.(广东文7、艺术理6)下面左图是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1、A2、…、A10(如A2表示身高(单位:cm)(150,155)内的学生人数).右图是统计左图中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm(含160cm,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是(B)
A.i<9 B. i<8 C. i<7 D. i<6
6.为了解某校高三学生的视力情况,随机地抽查了该
校100名高三学生的视力情况,得到频率分布直方图,
如右,由于不慎将部分数据丢失,但知道前4组的频
数成等比数列,后6组的频数成等差数列,设最大频
率为a,视力在4.6到5.0之间的学生数为b,则a, b
的值分别为( A )
A.0,27,78 B.0,27,83
C.2.7,78 D.2.7,83
小结作业
1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律.我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式.用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚的看到整个样本数据的频率分布情况,并由此估计总体的分布情况.
作业:习案、学案 十八.
2.2.1用样本估计总体(二)
频率分布直线图和茎线图
问题提出:
列出一组样本数据的频率分布表可以分哪几个步骤进行?
第一步,求极差.
第二步,决定组距与组数.
第三步,确定分点,将数据分组.
第四步,统计频数,计算频率,制成表格.
频率分布直方图是在平面直角坐标系中画若干个依次相邻的小长方形,这些小长方形的宽、高和面积在数量上分别表示什么?
3. 我们可以用样本数据的频率分布表和频率分布直方图估计总体的频率分布,当总体中的个体数较多或较少时,统计中用什么方法提取样本数据的相关信息,我们将进一步作些探究.
频率分布折线图和茎叶图
探究1:频率分布折线图与总体密度曲线
思考1:在城市居民月均用水量样本数据的频率分布直方图中,各组数据的平均值大致是哪些数?
思考2:在频率分布直方图中,依次连接各小长方形上端的中点,就得到一条折线,这条折线称为频率分布折线图. 你认为频率分布折线图能大致反映样本数据的频率分布吗?
思考3:当总体中的个体数很多时(如抽样调查全国城市居民月均用水量),随着样本容量的增加,作图时所分的组数增多,组距减少,你能想象出相应的频率分布折线图会发生什么变化吗?
思考4:在上述背景下,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.那么图中阴影部分的面积有何实际意义?
思考5:当总体中的个体数比较少或样本数据不密集时,是否存在总体密度曲线?为什么?
不存在,因为组距不能任意缩小
思考6:对于一个总体,能否通过样本数据准确地画出总体密度曲线?
探究1:茎叶图
频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的分布情况.
【问题】 某赛季甲、乙两名篮球运动员每场 比赛的得分情况如下:
甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
思考1:你能理解这个图是如何记录这些数据的吗?你能通过该图说明哪个运动员的发挥更稳定吗?
思考2:在统计中,上图叫做茎叶图,它也是表示样本数据分布情况的一种方法,其中“茎”指的是哪些数,“叶”指的是哪些数?
思考3:对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0,4.3,2.7,3.1,3.5,用茎叶图如何表示?
思考4:一般地,画出一组样本数据的茎叶图的步骤如何?
第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;
第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;
第三步,将各个数据的叶按大小次序写在茎右(左)侧.
思考5:用茎叶图表示数据的分布情况是一种好方法,你认为茎叶图有哪些优点?
(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改.
思考6:比较茎叶图和频率分布表,茎叶图中“茎”和“叶”的数目分别与频率分布表中哪些数目相当?
思考7:对任意一组样本数据,是否都适合用茎叶图表示?为什么?
不适合样本容量很大或茎、叶不分明的样本数据.
课堂小结
1. 用样本的频率分布估计总体分布,当总体中的个体数取值很少时,可用茎叶图估计总体分布;当总体中的个体数取值较多时,可将样本数据适当分组,用频率分布表或频率分布直方图估计总体分布.
2. 总体密度曲线可看成是函数的图象,对一些特殊的密度曲线,其函数解析式是可求的.
茎叶图中数据的茎和叶的划分,可根据样本数据的特点灵活决定.
练习
为了了解高一学生的体能情况,某校随机抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出了频率分布直方图.图中从左到右各小长方形的面积之比为2:4:17:15:9:3,第二小组的频数为12.
(1)第二小组的频率是多少?
(2)样本容量是多少?
(3)若次数在110以上(含110次)为达
标,试估计该校全体高一学生的达标率约
是多少?
某班级共有学生54人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本.已知2号,28号,41号同学在样本中,那么样本中还有一个同学的学号是 .
在抽取某产品的尺寸过程中,将其尺寸分成若干组,[a,b]是其中一组,抽查出的个体数在该组上的频率为m,该组上的直方图的高为h,则| a-b |等于
在一个样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形和的 ,且样本容量为160,则中间一组的频数为 ( )
A. 32 B. 0.2 C. 40 D. 0.25
作业:
《习案》作业十九
2.2用样本估计总体(三)
问题提出
1. 对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?
频率分布直方图、频率分布表、频率分布折线图、茎叶图
2. 美国NBA在2006——2007年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:
甲运动员得分:12,15,20,25,31,30, 36,36,37,39,44,49.
乙运动员得分:8,13,14,16,23,26, 28,38,39,51,31,39.
如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计总体的数字特征.
知识探究(一):众数、中位数和平均数
思考1:以上两组样本数据如何求它们的众数、中位数和平均数?
思考2:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?
思考3:中位数左右两侧的直方图的面积应有什么关系?
思考4:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么?
0.5-0.04-0.08-0.15-0.22=0.01,0.5×0.01÷0.25=0.02,中位数是2.02.
思考5:平均数是频率分布直方图的“重心”,从直方图估计总体在各组数据内的平均数分别为多少?
0.25,0.75,1.25,1.75,2.25, 2.75,3.25,3.75,4.25.
思考6:将频率分布直方图中每个小矩形的 面积与小矩形底边中点的横坐标之积相加, 就是样本数据的估值平均数. 由此估计总体的平均数是什么?
0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×06+3.75×0.04+4.25×0.02=2.02(t).
平均数是2.02.
思考7:从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?
频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关.
注: 在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.
思考8 (1)一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?
如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位可能收入较低.
(2)样本数据的平均数大于(或小于)中位数说明什么问题?
平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值.
(3)你怎样理解“我们单位的收入水平比别的单位高”这句话的含义?
这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数.
样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.
平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.
知识探究(二):标准差
思考1:在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
甲、乙两人本次射击的平均成绩分别为多少环?
思考2:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?
甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定.
思考3:对于样本数据x1,x2,…,xn,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?
思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s表示.假设样本数据x1,x2,…,xn的平均数为,则标准差的计算公式是:
那么标准差的取值范围是什么?标准差为0的样本数据有何特点?
s≥0,标准差为0的样本数据都相等.
思考5:对于一个容量为2的样本:x1,x2(x1标准差越大离散程度越大,数据较分散;
标准差越小离散程度越小,数据较集中在平均数周围.
知识迁移
计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性.
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
课堂小结
用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据.
2. 平均数对数据有“取齐”的作用,代表一组数据的平均水平.
3. 标准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策.
作业:
《习案》作业二十、作业二十一
2.2用样本估计总体(四)
知识回顾
1.如何根据样本频率分布直方图,分别估计总体的众数、中位数和平均数?
(1)众数:最高矩形下端中点的横坐标.
(2)中位数:直方图面积平分线与横轴交点的横坐标.
(3)平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和.
2. 对于样本数据x1,x2,…,xn,其标准差如何计算?
知识补充
1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.
2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.
3.对于城市居民月均用水量样本数据,其平均数 ,标准差s=0.868.在这100个数据中,落在区间 =[1.105,2.841]外的有28个;落在区间=[0.237,3.709]外的只有4个;落在区间 =[-0.631,4.577]外的有0个.
一般地,对于一个正态总体,数据落在区间 、 、
内的百分比分别为68.3%、95.4%、99.7%,这个原理在产品质量控制中有着广泛的应用(参考教材P79“阅
读与思考”).
例题分析
例1 画出下列四组样本数据的条形图,说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6;
(3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.
例2 甲、乙两人同时生产内径为25.40mm的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各随机抽取20件,量得其内径尺寸如下(单位:mm):
甲 :
25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39
乙:
25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48
从生产零件内径的尺寸看,谁生产的零件质量较高?
甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高.
说明:1.生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差.
2.问题中25.40mm是内径的标准值,而不是总体的平均数.
例3 以往招生统计显示,某所大学录取的新生高考总分的中位数基本稳定在550分,若某同学今年高考得了520分,他想报考这所大学还需收集哪些信息?
要点:
(1)查往年录取的新生的平均分数.若平均数小于中位数很多,说明最低录取线较低,可以报考;
(2)查往年录取的新生高考总分的标准差.若标准差较大,说明新生的录取分数较分散,最低录取线可能较低,可以考虑报考.
练习
5、(宁夏理11文12).甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表
甲的成绩
环数
7
8
9
10
频数
5
5
5
5
乙的成绩
环数
7
8
9
10
频数
6
4
4
6
丙的成绩
环数
7
8
9
10
频数
4
6
6
4
分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( B )
A. B. C. D.
课堂小结
1.对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.
2.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性. 用样本的数字特征估计总体的数字特征,是一
种统计思想,没有惟一答案.
3.在实际应用中,调查统计是一个探究性学习过程,需要做一系列工作,我们可以把学到的知识应用到自主研究性课题中去.
2.3变量间的相互关系(一)、(二)
问题提出
1. 函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系.
2. 在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?
3. 这两个变量是有一定关系的,它们之间是一种不确定性的关系.类似于这样的两个变量之间的关系,有必要从理论上作些探讨,如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义.
知识探究(一):变量之间的相关关系
思考1:考察下列问题中两个变量之间的关系,想一想这些问题中两个变量之间的关系是函数关系吗?
(1)商品销售收入与广告支出经费;
(2)粮食产量与施肥量;
(3)人体内的脂肪含量与年龄.
思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?
你能举出类似的描述生活中两个变量之间的这种关系的成语吗?
思考3:上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?
自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.
思考4:函数关系与相关关系之间的区别与联系.
函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.
函数关系是一种因果关系而相关关系不一定是因果关系,也可能是伴随关系.
3. 函数关系与相关关系之间有着密切联系,在一定条件下可以互相转化.
例1 在下列两个变量的关系中,哪些是相关关系?
①正方形边长与面积之间的关系;
②作文水平与课外阅读量之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
练习1.已知下列变量,它们之间的关系是函数关系的有 ① ,是相关关系的有 ②③ .
①已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式△=b2-4ac;
②光照时间和果树亩产量;
③每亩施用肥料量和粮食产量.
知识探究(二):散点图
【问题】在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:
其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.
思考1:观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?
思考2:以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?
思考3:上图叫做散点图,你能描述一下散点图的含义吗?
在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.
思考4:观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?
思考5:在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?
思考6:如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?
一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域
思考7:你能列举一些生活中的变量成正相关或负相关的实例吗?
例2 以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:
画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.
练习2. 今有一组试验数据如下表所示:现准备用下列函数中的一个近似地表示这些数据满足的规律,其中最接近的一个是( C )
A. y=log2x B. y=2x C. y=(x2-1)/2 D. y=2x-2
问题提出
1. 两个变量之间的相关关系的含义如何?成正相关和负相关的两个相关变量的散点图分别有什么特点?
自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系.
正相关的散点图中的点散布在从左下角到右上角的区域,负相关的散点图中的点散布在从左上角到右下角的区域
2. 观察人体的脂肪含量百分比和年龄的样本数据的散点图,这两个相关变量成正相关.我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?对此,我们从理论上作些研究.
知识探究(三):回归直线
思考1:一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?它一定是散点图中的点吗?
思考2:在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?
这些点大致分布在一条直线附近.
思考3:对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?
思考4:在样本数据的散点图中,能否用直尺准确画出回归直线?借助计算机怎样画出回归直线?
知识探究(四):回归方程
在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计.
思考1:回归直线与散点图中各点的位置应具有怎样的关系?
整体上最接近
思考2:对于求回归直线方程,你有哪些想法?
思考3:对一组具有线性相关关系的样本数据:(x1,y1),(x2,y2),…,(xn,yn),设其回归方程为可以用哪些数量关系来刻画各样本点与回归直线的接近程度?
思考4:为了从整体上反映n个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?
思考5:根据有关数学原理分析,当
时,总体偏差 为最小,这样就得到了回归方程,这种求回归方程的方法叫做最小二乘法.回归方程中,a,b的几何意义分别是什么?
思考6:利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程为 ,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的回归值.若某人37岁,则其体内脂肪含量的百分比约为多少?
20.9%
练习 3.F表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗Y(吨标准煤)的几组对照数据
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,崩最小二乘法求出Y关于x的线性回归方程Y=bx+a;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性
同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
解:(1)如图
(2)由对照数据,计算得: ;
所求的回归方程为
(3) , 吨,
预测生产100吨甲产品的生产能耗比技改前降低(吨)
课堂小结
求样本数据的线性回归方程,可按下列步骤进行:
第一步,计算平均数
第二步,求和
第三步,计算
第四步,写出回归方程
2. 回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.
3. 对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.
课后作业 《习案》作业:二十三. 、二十四.
2.3变量间的相互关系(三)
一、复习
(1)两个变量间由函数关系时,数据点位于某曲线上.
(2)两个变量间的关系是相关关系时,数据点位于某曲线附近.
(3)两个变量间的关系为线性相关时,数据点位于某直线附近.
该直线叫回归直线,对应的方程叫回归方程,该直线作为两个变量有线性相关关系的代表
(4)求回归方程的一般步骤:
第一步,计算平均数
第二步,求和
第三步,计算
第四步,写出回归方程
练习1.
由一组10个数据(xi,yi)算得 则b= ,a= ,
回归方程为 .
二、新授
1. 两个变量是否有相关关系可以先作出散点图进行判断.
2. 两个变量间是否有相关关系也可以通过求相关函数来判断.
其中
三、习题讲解
高二文科数学第1周(09月01日-09月06日)周教学计划
星期
节次
教学内容
主要手段
备注
一
第5节
1.3.3秦九韶算法
讲授
第6节
入学考试卷讲评
讲授
二
第3节
2.1.1随机抽样,简单随机抽样
讲授
第4节
作业讲评
讲授
三
第4节
2.1.2系统抽样
讲授
四
第8节
2.2.用样本估计总体(一)
讲授
五
第5节
2.2.用样本估计总体(二)
讲授
六
第1节
2.2.用样本估计总体(三)
讲授
第2节
作业讲评
讲授
说明
主要手段栏:主要填写讲授、讨论、实验及课前、课中、课后的练习情况;
备注栏:主要填写考试安排、课程调动情况及其它教学活动安排
高二文科数学第2周(09月08日-09月13日)周教学计划
星期
节次
教学内容
主要手段
备注
一
第5节
2.2用样本估计总体(四)
讲授
第6节
习题讲评
讲授
二
第3节
2.3变量之间的相互关系(一)
讲授
第4节
2.3变量之间的相互关系(二)
讲授
三
第4节
2.3变量之间的相互关系(三)
讲授
四
第8节
2.3变量之间的相互关系(四)
讲授
五
第5节
小结与复习
讲授
六
第1节
3.1随机事件的概率(一)
讲授
第2节
习题讲评
讲授
说明
主要手段栏:主要填写讲授、讨论、实验及课前、课中、课后的练习情况;
备注栏:主要填写考试安排、课程调动情况及其它教学活动安排