导学案
§2.2.1用样本的频率分布估计总体分布
【学习目标】
(1)通过实例体会分布的意义和作用
(3)体会不同的组距与分组对频率分布直方图的影响
(2)学会列频率分布表,画频率分布直方图
【重点】会列频率分布表,画频率分布直方图
【难点】能通过样本的频率分布估计总体的分布。
【自主学习】自学课本65~68页内容,发现疑惑并回答下列问题:
在频率分布直方图中,纵轴表示 ,数据落在各小组内的频率用 表示,各小长方形的面积之和等于
知识探究】探究:频率分布直方图:
频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为(以100位居民的月均用水量为例):
(1)计算一组数据中______与_____的差,即求极差 。
(2)决定组距与组数:若样本容量为n,确定分组k应该在(1+log2n)附近选。当样本容量不超过100时,按照数据的多少,常分成5~12组.
取组距0.5,那么组数=极差/组距=4.1/0.5=8.2
因此可以将数据分成9组,这个组数是较合适的,于是取组距为0.5,组数为9.
(3)确定分点,将数据分组.
以组距为0.5将数据分组,可以分以下9组:[0,0.5),[0.5,1),[1,1.5),…,[4,4.5]
(4)统计频数,计算频率,制成频率分布表. (频数=样本数据落在各小组内的个数,频率=频数÷样本容量) 注分组时,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间
列频率分布表:100位居民月均用水量的频率分布表
分组 计数 频数 频率 累积频率
[0, 0. 5 )
[0.5, 1 )
[1, 1. 5 )
[1.5, 2 )
[2, 2, 5 )
[2.5, 3 )
[3, 3.5)
[3.5, 4)
[4, 4.5]
合 计
(5)画频率分布直方图:
频率分布直方图的特征:
①横坐标为样本数据尺寸,纵坐标为频率/组距
②从频率分布直方图可以清楚的看出数据分布的总体趋势。
③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
④直方图是用小长方形面积的大小来表示在各个区间内取值的频率,总面积为1.
【范例研讨】
例1:为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下(单位:kg)
56.5 69.5 65 61.5 64.5 66.5 64 64.5 76 58.5
72 73.5 56 67 70 57.5 65.5 68 71 75
62 68.5 62.5 66 59.5 63.5 64.5 67.5 73 68
55 72 66.5 74 63 60 55.5 70 64.5 58
64 70.5 57 62.5 65 69 71.5 73 62 58
76 71 66 63.5 56 59.5 63.5 65 70 74.5
68.5 64 55.5 72.5 66.5 68 76 57.5 60 71.5
57 69.5 74 64.5 59 61.5 67 68 63.5 58
59 65.5 62.5 69.5 72 64.5 75.5 68.5 64 62
65.5 58.5 67.5 70.5 65 66 66.5 70 63 59.5
试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计
解:(1)求最大值与最小值的差.最大值是____,最小值是____,极差____
(2)确定组距与组数.如果将组距定为____,那么由21÷2=10.5,组数为______,这个组数适合的.于是组距为_____,组数为_______
(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.
(4)列频率分布表
分组 计数 频数 频率 累积频率
[54.5,56.5)
[56.5,58.5)
[58.5,60.5)
[60.5,62.5)
[62.5,64.5)
[64.5,66.5)
[66.5,68.5)
[68.5,70.5)
[70.5,72.5)
[72.5,74.5)
[74.5,76.5)
合计
(5)绘制频率分布直方图.频率分布直方图如图所示
点评:由于图中各小长方形的面积等于相应各组的频率,这个图形的面积反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分布表比较准确,频率分布直方图比较直观,它们起着相互补充的作用.
【课堂练习】
1、在频率分布直方图中,小矩形的高表示 ( )
A、频率/样本容量 B、组距×频率 C、频率 D、频率/组距
2、频率分布直方图中,小长方形的面积等于 ( )
A、相应各组的频数 B、相应各组的频率 C、组数 D、组距
3、一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为( )
A、2 B、 4 C、 6 D、8
4、有一个数据为50的样本,数据分组的频数如下:[12.5,15.5) 3; [15.5,18.5) 8;[18.5,21.5) 9; [21.5,24.5) 11; 24.5,27.5) 10; [27.5,30.5) 5; [30.5,33.5) 4.
根据频率分布,估计在[18.5,27.5)之间的数据大约占 ( )
A、60% B、92% C、5% D、65%
5、某中学举行的电脑知识竞赛,满分100分,80分以上为优良,现将高一两个班参赛学生的成绩进行整理后分成5组,绘制如右的频率分布直方图(如图).已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30、0.15、0.10、0.05.第二小组的频数是40,则参赛的人数和成绩优良的频率分别是( )
A.100,0.15 B.100,0.30 C.80,0.15 D.80,0.30
课堂小结:
频率直方图的意义;
绘制频率分布直方图的步骤;
频率分布直方图的特征。
学习反思:天天练
§2.2.1用样本的频率分布估计总体分布
1、如图所示是一容量为100的样本的频率分布直方图,
则由图形中的数据,样本落在[15,20]内的频数( )
A、20 B、30
C、40 D、50
2、一个容量为n的样本分成若干组,已知某组的频数和频率分别是80和0.125,则n的值为( )
A、800 B、1250 C、1000 D、640
3、将容量为100的样本数据按由小到大排列分成8组如下,则第3组的频率和累积频率分别为( )
组号 1 2 3 4 5 6 7 8
频数 10 13 14 14 15 13 12 9
A、0.14和0.37 B、和 C、0.03和 0.06 D、和
4、如下图所示是从一批产品中抽样得到的数据的频率分布直方图,由图形可以看出数据所落在范围的概率最大的是 ( )
A、(8.1,8.3) B、(8.2,8.4) C、.(8.4,8.5) D、(8.5,8.7)
5、上面左图是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1、A2、…、A10(如A2表示身高(单位:cm)(150,155)内的学生人数).右图是统计左图中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm(含160cm,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是( )
A、i<6 B、 i<7 C、i<8 D、 i<9
6、就某地居民的月收入调查了10000人,并画了频率分布直方图(如右下).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000)(元)段应抽出 人
7、在生产过程中,测得维尼纶的纤度(表示纤维粗细的一种量)有如下的100个数据:
1.36 1.49 1.43 1.41 1.37 1.40 1.30 1.42 1.47 1.39
分组 个数累计 频数 频率
[1.265, 1.305)
[1.305, 1.345)
[1.345, 1.385)
[1.385, 1.425)
[1.425, 1.465)
[1.465, 1.505)
[1.505, 1.545)
[1.545, 1.585)
合计 100 1.00
1.41 1.36 1.40 1.34 1.42 1.42 1.45 1.35 1.42 1.39
1.44 1.42 1.39 1.42 1.42 1.30 1.34 1.42 1.37 1.36
1.37 1.34 1.37 1.37 1.44 1.45 1.32 1.48 1.40 1.45
1.39 1.46 1.39 1.53 1.36 1.48 1.40 1.39 1.38 1.40
1.36 1.45 1.50 1.43 1.38 1.43 1.41 1.48 1.39 1.45
1.37 1.37 1.39 1.45 1.31 1.41 1.44 1.44 1.42 1.47
1.35 1.36 1.39 1.40 1.38 1.35 1.42 1.43 1.42 1.42
1.42 1.40 1.41 1.37 1.46 1.36 1.37 1.27 1.37 1.38
1.42 1.34 1.43 1.42 1.41 1.41 1.44 1.48 1.55 1.37
(1)列出频率分布表
(2)画出样本的频率分布直方图;
(3)根据上述结果估计,位于[1.385, 1.465)的数据所占的百分比约是多少?
(4)统计方法中,同一组数据常用该组区间的中点值作为代表.据此,估计纤度的平均值
8、某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:
第一组,成绩大于等于13秒且小于14秒;
第二组,成绩大于等于14秒且小于15秒;
第六组,成绩大于等于18秒且小于等于19秒.
右图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为,成绩大于等于15秒且小于17秒的学生人数为,
则从频率分布直方图中可分析出和分别为( )
A、0.9,35 B、0.9,45 C、0.1,35 D、0.1,45
6.如下图,样本容量为的四组数据,它们的平均数都是,频率条形图如下,则标准差最大的一组是
A. B. C. D.
17.(本大题满分12分)
某班级共有60名学生.先用抽签法从中抽取部分学生调查他们的学习情况,若每名学生被抽到的概率为。
(I)求从中抽取的学生数,
(Ⅱ)若抽查结果如下表
每周学习时间(小时)
人数 2 4 1
先确定x,再完成频率分布直方图;
(III)估计该班学生每周学习时间的平均数(同一组中的数据用该组区间的中点值作代表)
3.某个容量为50的样本的频率分布直方图如下,则在区间上的数据的频数为( )
A.10 B.15 C.20 D. 25
数
0.0001
0.0002
0.0003
0.0004
0.0005
1000 1500 2000 2500 3000 3500 4000
月收入(元)
频率/组距
-----------------------------------------------------------------------------------------------------------------------------------
小结与反思:
0
13
14
15
16
17
18
19
秒
频率/组距
0.36
0.34
0.18
0.06
0.04
0.02
频率
1.0
5
数据
频率
5
数据
4
6
0.3
1.0
5
数据
频率
5
数据
2
8
3
4
6
7
0.2
0.4
1.0
1.0
0.1
0.1
频率
第一组
第二组
第三组
第四组天天练
§2.2.1用样本的频率分布估计总体分布2
1、某篮球运动员在一个赛季的40场比赛中的得分的茎叶图如左下图所示:
则中位数与众数分别为 ( )
A、3与3 B、23与3 C、3与23 D、23与23
2、如图所示茎叶统计图表示一台自动售货机的销售情况,则这组数据的极差是 ( )
A、9 B、39 C、41 D、59
3、下面说法:
①如果一组数据的众数是5,那么这组数据中出现次数最多的数是5;
②如果一组数据的平均数是0,那么这组数据的中位数为0;
③如果一组数据1,2,,4的中位数是3,那么;
④如果一组数据的平均数是正数,那么这组数据都是正数。
其中错误的个数是 ( )
A、1 B、2 C、3 D、4
4、从某批零件中抽取50个,然后再从50个中抽出40个进行合格检查,发现合格品有36个,则该批产品的合格率为 ( )
A、36% B、72% C、90% D、25%
5、在10张奖券中,有两张中奖,现有10个人先后随机地从中各抽一张,那么第7个人中奖的概率是
A、 B、 C、 D、
6、下图是七位评委为某民族舞蹈打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( ).
A、, B、, C、, D、,
7、下列说法错误的( )
A、在统计里,把所需考察对象的全体叫作总体
B、一组数据的平均数一定大于这组数据中的每个数据
C、平均数、众数与中位数从不同的角度描述了一组数据的集中趋势
D、一组数据的方差越大,说明这组数据的波动越大
8、
9、
10、某篮球学校的甲、乙两名运动员练习罚球,
每人练习10组,每组罚球40个.命中个数的
茎叶图如右.则罚球命中率较高的是 .
11、某人5次上班途中所花的时间(单位:分钟)分别为:
x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|=
12、某校共有5000名学生,该校学生每月课外读物方面的
支出总体上在20—60元之间其频率分布直方图如右图所示,
为具体了解同学们购买课外读物的具体情况,按支出的情
况进行分层抽样,抽出一个容量为100的样本进行分析,
其中支出在元的同学应抽取 人。
13、为了了解各自受欢迎的程度,甲乙两个网站分别随机选取了14天,记录了商务8:00~10:00之间各自的点击量:
甲:73,24,58,72,64,38,6670,20,41,55,67,8,25
乙:12,37,21,5,54,42,61,45,19,6,19,36,42,14
试比较两网站的受欢迎程度。
14、为检测学生的体温状况, 随机抽取甲,乙两个班级各10名同学,测量他们的体温(单位0.1摄氏度)获得体温数据的茎叶图,如图所示.
(Ⅰ)根据茎叶图判断哪个班级的平均体温较高;
(Ⅱ)计算乙班的样本平均数,方差;
(Ⅲ)现在从甲班中随机抽取两名体温不低于36.4摄氏度的同学,求体温为37.1摄氏度的同学被抽到的概率
7.为调查某市中学生平均每人每天参加体育锻炼时间(单位:分钟),按锻炼时间分下列四种情况统计:①0~10分钟;②11~20分钟;③21~30分钟;④30分钟以上.有10000名中学生参加了此项活动,下图是此次调查中某一项的流程图,其输出的结果是6200,则平均每天参加体育锻炼时间在0~20分钟内的学生的频率是 ( )
A.62003800 B.
C. 3800 D.
3、已知甲、乙两名篮球运动员某十场比赛得分的茎叶图如图所示,则甲、乙两人在这十场比赛中得分的平均数与方差的大小关系为( )
A. B.
C. D.
11.右图是2010届高三某学生9次考试政治科成绩茎叶统计图,
去掉一个最高分和一个最低分后,所剩数据的中位数为 .
13.某校举行2010年元旦汇演,七位评委为某班的小品打出的分数如下茎叶统计图(满分100分),去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为 , .
为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如下:
据此可估计该校上学期200名教师中,使用多媒
体进行教学次数在内的人数为 ▲ .
4.在某五场篮球比赛中,甲、乙两名运动员得分的茎叶图如右.
下列说法正确的是( )。
A.在这五场比赛中,甲的平均得分比乙好,且甲比乙稳定
B.在这五场比赛中,甲的平均得分比乙好,但乙比甲稳定
C.在这五场比赛中,乙的平均得分比甲好,且乙比甲稳定
D.在这五场比赛中,乙的平均得分比甲好,但甲比乙稳定
10.如图是篮球联赛中,甲乙两名运动员某
赛季一些场次得分的茎叶图,则平均得分高的运
动员是 .
8.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如下.则下面结论中错误的一个是( )
(A) 甲的极差是29 (B)乙的众数是21
(C) 甲罚球命中率比乙高 (D) 甲的中位数是24
(第8题)
19.(本小题满分12分)
甲、乙两种鱼的身体吸收汞,当汞的含量超过体重的1.00ppm(即百万分之一)时,就会对人体产生危害。质检部门对市场中出售的一批鱼进行检测,在分别抽取的10条鱼的样本中,测得汞含量与鱼体重的百分比如下:
甲种鱼1.31 1.55 1.42 1.35 1.27 1.44 1.28 1.37 1.36 1.14
乙种鱼1.01 1.35 0.95 1.16 1.24 1.08 1.17 1.03 0.60 1.11
(Ⅰ)用前两位数做茎,画出样本数据的茎叶图,并回答下面两个问题:
(ⅰ)写出甲、乙两种鱼关于汞分布的一个统计结论.
(ⅱ)经过调查,市场上出售汞超标的鱼的原因是这些鱼在出售前没有经过检验,可否得出每批这两种鱼的平均汞含量都超过1.00ppm?
(Ⅱ)如果在样本中选择甲、乙两种鱼各一条做一道菜,(在烹饪过程中汞含量不会发生改变)
(ⅰ)如果20条鱼中的每条鱼的重量都相同,那么这道菜对人体产生危害的概率是多少?
(ⅱ)根据算出的结论,你对政府监管部门有什么建议?(提出一条建议即可)
7. 一位同学种了甲、乙两种树苗各1株,分别观察了9次、10次后,
得到树苗高度的数据
的茎叶图如图(单位:厘米),则甲乙两种树苗
的高度的数据的中位数之和是
A. 44
B. 54
C. 50
D. 52
元
频率
组距
20
30
40
50
60
0.01
0.036
0.024
-----------------------------------------------------------------------------------------------------------------------------------
小结与反思:
开始
输入
输出
结束
否
是
是
否
乙
甲
8 6 4 3
1 5
8 6 3
2 4 5
8 3
9 4
5 0
1
3 1 6 7 9
6
4 4 4 6 7
1 3 4
第13题
甲
乙
1
2
3
4
0 4 0
6 4
0
4 6 6 7
9
4 3 1 0
1 2 3 7导学案
§2.2.1用样本的频率分布估计总体分布2
【学习目标】(1)在表示样本数据的过程中,学会画频率折线图和茎叶图
(2)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计
(3)复习一组数据的众数、中位数、平均数、方差、标准差
【重点】会画频率折线图和茎叶图。
【难点】能通过样本的频率分布估计总体的分布。
【新知探究】
新知1:连接频率分布直方图中各小长方形__________________,就得到_____________________。
如图:可以大致反映样本数据的变化。
新知2:总体密度曲线:
随着样本容量的增加,作频率分布直方图时,组数增加,组距减小,相应的频率分布折线图会随着怎么变化?
随着 的增加,作图时,所分的______在增加,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它能够更加精细的反映出________________________ .
思考:可以用样本的频率分布折线图得到准确的总体密度曲线吗?
讨论:对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确的画出来?
当样本数据较少时,用茎叶图表示数据的效果较好.它不但可以____________,而且_____________,给数据的_____和________都带来了方便.
新知3:茎叶图又称“枝叶图”,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
【例题分析】
例1、为了了解一大片经济林生长情况,随机测量其中的40株的底部 周长,得到如下数据表(单位:cm)
135 98 102 110 99 121 110 96 100 103
125 97 117 113 110 92 102 109 104 112
109 124 87 131 97 102 123 104 104 128
129 126 97 100 80 111 106 117 104 109
(1)编制频率分布表;(2)画出茎叶图;(3)估计该片经济林中底部周长小于100cm的树木约占多少,周长不小于120cm的树木约占多少.
例2、甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平.
甲 12,15,24,25,31,31,36,36,37,39,44,49,50.
乙 8,13,14,16,23,26,28,33,38,39,51
【说明】
1、主干(茎)中的数应从大到小或从小到大排列;
2、叶上的数相同的必须重复写
3、茎叶图是一个与直方图相类似的特殊工具,但又与直方图不同,茎叶图保留原始资料的资讯,直方图则失去原始资料的讯息。将茎叶图茎和叶逆时针方向旋转9O度,实际上就是一个直方图。可以从中统计出次数,计算出各数据段的频率或百分比。
茎叶图的优缺点
1、用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
2、茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两组记录那么直观、清晰。
【课堂练习】
1、某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比
赛得分的情况用如右图所示的茎叶图表示,则甲、乙两名运动员
的中位数分别为( )
A.19、13 B.13、19
C.20、18 D.18、20
2、从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:
甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352
乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318
320 322 322 324 327 329 331 333 336 337 343 356
由以上数据设计了如下茎叶图
根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个结论:
① ;
② .
3、五个数1,2,3,4,的平均数是3,则
这五个数的标准差是 。
4、 下面一组数据是某生产车间30名工人某日加工零件的个数,请设计适当的茎叶图表示这组数据,并由图出发说明一下这个车间此日的生产情况。
134 112 117 126 128 124 122 116 113 107
116 132 127 128 126 121 120 118 108 110
133 130 124 116 117 123 122 120 112 112
5、我校高一某班甲、乙两名学生历次数学考试成绩情况如下:
甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107
乙的得分:83,86,93,99,88,103,98,114,98,79,101,97,102
作出两人数学成绩的茎叶图,并根据茎叶图对两人成绩进行比较。
课堂小结:
学习反思:
频率/组距
0.50
0.40
0.30
0.20
0.10
O
1
月均用水量/t
0.5
1.5
2
2.5
3
3.5
4
4.5
0
1
2
3
4
1
1
2
0
1
0
3
5
0
8
7
8
9
7
5
6
4
3
2
9
6
1
甲
乙
3 1 27
7 5 5 0 28 4
5 4 2 29 2 5
8 7 3 3 1 30 4 6 7
9 4 0 31 2 3 5 5 6 8 8
8 5 5 3 32 0 2 2 4 7 9
7 4 1 33 1 3 6 7
34 3
2 35 6
甲
乙