课件38张PPT。第二章 统计
2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布(一)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.基础梳理1.极差:最大值与最小值的差.
例如:一组数据8,13,13,16,23,26,28的极差是多少?
2.组距:为了避免对数据逐一考察的麻烦,将数据分成若干组,一般情况要使组数为5~12组.
3.组数:不小于极差/组距的最小整数.中学学习的问题一般分为5~12组.答案:20例如:极差为15,组距为2,应该分为几组?
4.频数:每个(类)对象出现的次数称为频数.各个(类)对象的频数之和等于数据总数.
例如:某班有50人,一次数学考试90~100分的同学有10人,90~100分的频数为________.105.频率:每个(类)对象出现的频数与总数的比值称为频率.各个(类)对象的频率之和等于1.
6.频率分布表:
例如:200辆汽车通过某一段公路时的时速在40到80公里之间,40~50公里的有20辆,50~60公里的有60辆,60~70公里的有80辆,70~80公里的有40辆,共分四组,组距为10,列出频率分布表.解析:频率分布表为:
7.频率分布直方图:频率分布表用图形表示出来的一种形式.画频率分布直方图一般步骤为:
(1)计算一组数据中最大值与最小值的差,即求极差.
(2)决定组距与组数.
(3)将数据分组.
(4)列出频率分布表.
(5)画频率分布直方图.注意:频率分布直方图中,各小长方形面积之和等于1,各小长方形的面积等于相应各组的频率,各小长方形的高与该组频率成正比但不是频率,实际上是“频率/组距”.自测自评1.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n等于________.
2.一个容量为100的样本,其数据的分组与各组的频数如下:60则样本数据落在(10,40]上的频率为( )
A.0.13 B.0.39 C.0.52 D.0.643.
从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如右图).由图中数据可知a=________.若要从身高在[ 120 , 130),[130 ,140) , [140 , 150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140 ,150]内的学生中选取的人数应为________.C0.03034.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则在其抽测的100根中,有________根棉花纤维的长度小于20 mm.30题型一 认识频率分布直方图例1 200辆汽车通过某一段公路时的时速在40到80公里之间,40~50公里的有20辆,50~60公里的有60辆,60~70公里的有80辆,70~80公里的有40辆,以速度为x轴,分别以频数、频率、频率/组距为纵坐标画出直方图,指出哪个是频率分布直方图.解析:所求的直方图如下:跟 踪训 练1.
某路段检查站监控录像显示,在某时段内,有1 000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为如右图所示的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90 km/h的约有( )
A.100辆 B.200辆 C.300辆 D.400辆C题型二 列频率分布表,画频率分布直方图例2 某班50名同学参加数学测验,成绩的分组及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8;
(1)列出样本的频率分布表;
(2)画出频率分布直方图.解析:(1)样本的频率分布表如下:(2)频率分布直方图如下:点评:1.在列频率分布表时,极差、组距、组数有如下关系:
(1)若为整数,则=组数.
(2)若不为整数,则的整数部分+1=组数.2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.跟 踪训 练2.某中学同年级40名男生的体重数据如下(单位:kg):
61 60 59 59 59 58 58 57 57 57 57 56 56 56 56 56
56 56 55 55 55 55 54 54 54 54 53 53 52 52 52 52
52 51 51 51 50 50 49 48
列出样本的频率分布表,绘出频率分布直方图.解析:(1)计算最大值与最小值的差:61-48=13;
(2)决定组距与组数,取组距为2,故共分成7组.
(3)决定分点,使分点比数据多一位小数,并把第1小组的分点减小0.5,即分成如下7组:
47.5~49.5,49.5~51.5,51.5~53.5,53.5~55.5,55.5~57.5,57.5~59.5,59.5~61.5.(4)列出频率分布表如下:(5)绘出频率分布直方图如下: 题型三 日常生活中的数据处理 例3 为了了解中学生的身高情况,对广东某中学同龄的50名男学生的身高进行了测量,结果如下(单位:cm):
175 168 180 176 167 181 162 173 171 177
171 171 174 173 174 175 177 166 163 160
166 166 163 169 174 165 175 165 170 158
174 172 166 172 167 172 175 161 173 167
170 172 165 157 172 173 166 177 169 181
列出样本的频率分布表,画出频率分布直方图.解析:在这个样本中,最大值为181,最小值为157,它们的差是24,可以取组距为4,分成7组,根据题意列出样本的频率分布表如下:频率分布直方图如下:点评:频率分布直方图的性质.
(1)因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3)频数/相应的频率=样本容量.跟 踪训 练3.某人在同一条件下射靶50次,其中射中6环5次,射中7环9次,射中8环21次,射中9环11次,射中10环4次.
(1)列出频率分布表;
(2)画出表示频率分布条形图.解析:(1)频率分布表如下:(2)频率分布的条形图如下:题型四 用茎叶图提取有用数据进行分析例4 甲、乙两个小组各10名学生的英语口语测试成绩(单位:分)如下:
甲组:76 90 84 86 81 87 86 82 85 83;
乙组:82 84 85 89 79 80 91 89 79 74.
用茎叶图表示两个小组的成绩,并判断哪个小组的成绩更整齐一些.分析:题中数据是首位分别为7,8,9的两位数,选择7,8,9为茎,绘制茎叶图.
解析:茎叶图如下图所示(中间的茎为十位上的数字):点评:画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数.要先确定中间的数取数据的哪几位,填写数据时边读边填.比较数据时从数据分布的对称性、中位数、稳定性等几方面来比较.绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.跟 踪训 练4.某中学高三(21)班甲、乙两名同学自高中以来每场数学考试成绩如下:
甲:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙:83,86,93,99,88,130,98,114,98,79,101.
画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较.解析:两人数学成绩茎叶图如下:从这个茎叶图上可看出,甲同学的得分情况是大致对称的,中位数是88;乙同学的得分情况除一个特殊得分外,也大致对称,中位数是98.因此乙同学发挥比较稳定,总体得分情况乙比甲好.数学·必修3(人教A版)
2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布(一)
1.一个容量为20的样本数据,分组后组距为10,区间与频数分布如下:
,2;,3;,4;,5;,4;,2.
则样本在上的频率为( )
A. B. C. D.
答案:D
2.一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为( )
A.2 B.4 C.6 D.8
答案:B
3.关于频率分布直方图中的有关数据,下面说法正确的是( )
A.直方图的高表示该组上个体在样本中出现的频率
B.直方图的高表示取某数的频率
C.直方图的高表示在该组上的个体数与组距的比值
D.直方图的高表示在该组上个体在样本中出现的频率与组距的比值
答案:D
4.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方图,如图,据图可得这100名学生中体重在[56.5,64.5) kg的学生人数是( )
A.20 B.30 C.40D.50
答案:C
5.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为( )
A.10组 B.9组
C.8组 D.7组
答案:B
6.下面哪种统计图没有信息的损失,所有的原始数据都可从该图中得到( )
A.条形统计图 B.频率分布直方图
C.折线统计图 D.茎叶统计图
答案:D
7.下面是200辆汽车通过某一段公路时的时速频率分布直方图,则时速在[50,70)的汽车大约有________辆.
答案:140
8.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:
组号
1
2
3
4
5
6
7
8
频数
10
13
14
14
15
13
12
9
第3组的频率和累积频率为( )
A.0.14和0.37 B.和
C.0.03和0.06 D.和
答案:A
9.某市2010年4月1日至4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
解析:(1)频率分布表:
分组
频数
频率
[41,51)
2
[51,61)
1
[61,71)
4
[71,81)
6
[81,91)
10
[91,101)
5
[101,111)
2
合计
30
1
(2)频率分布直方图:
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的,有26天处于良的水平,占当月天数的,处于优或良的天数共有28天,占当月天数的.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善.
1.频率分布直方图的特征.
从频率分布直方图可以清楚地看出数据分布的总体趋势,从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
2.茎叶图的特征.
用茎叶图表示数据有两个优点:一是从统计图上看原始数据信息没有损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示,但是茎叶图只便于表示两位有效数字的数据,而且只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰.
课件36张PPT。第二章 统计
2.2 用样本估计总体
2.2.2 用样本的频率分布估计总体分布(二)(习题课)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.基础梳理1.频率分布折线图:将频率分布直方图中各相邻矩形的上底边中点顺次连接起来就得到一条折线,这条折线称为本组数据的频率折线图.
2.总体密度曲线:样本容量越大,所分组数越多,各组的频率就接近于总体在相应各组的取值概率.设想样本容量无限大,分组的组距无限缩小,频率分布的折线图就会接近于一条曲线,它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积.下面是一个总体密度曲线示意图:3.茎叶图:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.自测自评1.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重大于70.5公斤的人数为( )BA.300 B.360 C.420 D.450C3.一容量为100的样本,数据分组和各组的一些相关信息如下表所示,请完成表格中的空格.答案:填写后的表格如下:4.绘制频率分布直方图时,由于分组时一部分样本数据恰好为分点,难以确定将这样的分点归入哪一组,为了解决这个问题,便采用________________________的方法.分点比数据多取一位小数题型一 频率分布直方图的应用例1 某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按下列方式分成六组:第一组,成绩大于等于13秒但小于14秒;第二组,成绩大于等于14秒但小于15秒;第三组,成绩大于等于15秒但小于16秒;第四组,成绩大于等于16秒但小于17秒;第五组,成绩大于等于17秒但小于18秒;第六组,成绩大于等于18秒但小于等于19秒.下图是按上述分组方法得到的频率分布直方图,设成绩大于等于15秒且小于16秒的频率为x,成绩大于等于14秒且小于17秒的学生人数为y,则从频率分布直方图可分析出x和y分别为( )A.0.46,45 B.0.45,44 C.0.36,44 D.0.35,35解析:成绩在15~16秒的频率为1-0.64=0.36,14~17秒频率是0.88,人数是0.88×50=44(人).
答案:C跟 踪训 练1.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出______人.25题型二 频率分布条形图的应用例2 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下边的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )A.0.6小时 B.0.9小时
C.1.0小时 D.1.5小时解析:50名学生阅读总时间为5×0+20×0.5+10×1+10×1.5+5×2=45小时,人均=0.9(小时).
答案:B跟 踪训 练2.某中学号召学生在暑假期间至少参加一次社会公益活动(以下简称活动).该校文学社共有100名学生,他们参加活动的次数统计如右图所示.则从文学社中任意选1名学生,他参加活动次数为3的概率是__________,该文学社学生参加活动的人均次数为__________.2.2题型三 利用样本频率分布直方图描述整体分布情况例3 青少年视力水平的下降已经引起全社会的关注,某校为了了解高二年级500名学生的视力情况,从中抽查了一部分学生视力,通过数据处理,得到如下频率分布表和频率分布直方图:请你根据给出的图表回答:
(1)填写频率分布表中未完成部分的数据.
(2)在这个问题中,总体是______,样本容量是______.
(3)在频率分布直方图中梯形ABCD的面积是________.
(4)请问:用样本估计总体,可以得到哪些信息(写一条即可)________.解析:(1)第二列从上至下两空分别填15、50;第三列从上至下两空分别填0.5、0.3.
(2)总体是500名学生的视力情况,样本容量是50.
(3)在频率分布直方图中梯形ABCD的面积是0.8.
(4)本题有多个结论,只要是根据频率分布表或频率分布直方图的有关信息,并且用样本估计总体所反映的结论都是合理的即可.例如,该校高二年级学生视力在[4.55,4.85)内的人数最多,约250人;该校高二年级学生视力在5.15以上的与视力在4.25以下的人数基本相等,各有20人左右等.点评:本题主要考查学生对于频率分布表和频率分布直方图的掌握情况,考查识图、读图的能力,以及灵活运用图、表解决实际问题的能力.跟 踪训 练3.对某电子元件进行寿命追踪调查,情况如下.(1)列出频率分布表;
(2)画出频率分布直方图;
(3)估计元件寿命在100~400 h以内的在总体中占的比例;
(4)估计电子元件寿命在400 h以上的在总体中占的比例.解析:(1)样本频率分布表如下:跟 踪训 练(2)频率分布直方图如下:(3)元件寿命在100~400 h以内的在总体中占的比例为0.65.
(4)电子元件寿命在400 h以上的在总体中占的比例为0.35.跟 踪训 练题型四 各种图表的综合应用例4 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表和频率分布直方图,解答下列问题:(1)填充频率分布表的空格(将答案直接填在表格内).
(2)补全频率分布直方图,并绘制频率分布折线图.
(3)在该问题中,总体、个体、样本和样本容量各是什么?
(4)全体参赛学生中,竞赛成绩落在哪组范围内的人数最多?
(5)若成绩在90分以上(不含90分)为优秀,则该校成绩优秀的约为多少人?解析:(1)频率分布表如下:(2)频率分布直方图与折线图如下:(3)在该问题中,总体是900名学生的成绩,个体是每个学生的成绩,样本是被抽取的50个学生的成绩,样本容量为50.
(4)全体参赛学生中,竞赛成绩落在80.5~90.5分范围内的人数最多.
(5)若成绩在90分以上(不含90分)为优秀,则该校成绩优秀的约为216人.跟 踪训 练4.某公司为了设计新产品,需要对已制造出售的电视机安全无故障运行时间进行抽样调查,使设计更有针对性,调查情况如下表所示:(1)列出频率分布表;
(2)画出频率分布直方图和频率折线图;
(3)估计电视机无故障运行时间10 000小时以内的频率.解析:(1)频率分布表如下:跟 踪训 练(2)下图为频率分布直方图和频率分布折线图.(3)从频率分布直方图可看出,无故障运行时间小于10 000的频率估计为0.671.跟 踪训 练数学·必修3(人教A版)
2.2 用样本估计总体
2.2.2 用样本的频率分布估计总体分布(二)(习题课)
1.在频率分布直方图中,小矩形的高表示( )
A.频率/样本容量 B.组距×频率
C.频率 D.频率/组距
答案:D
2.在用样本频率分布估计总体分布的过程中,下列说法正确的是( )
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
答案:C
3.频率分布直方图中,各个小长方形的面积表示( )
A.相应各组的频数 B.相应各组的频率
C.组数 D.组距
答案:B
4.某班学生体检后进行体重统计,其频率分布直方图如下图所示,则体重在[45,55)的频率为( )
A.0.043 B.0.43
C.0.215 D.0.021 5
答案:C
5.下面给出4个茎叶图
则数据6,23,12,13,27,35,37,38,51可以由图________表示.
答案:A
6.在某路段检测点,对200辆汽车的车速进行检测,检测结果表示为如下图所示的频率分布直方图,则车速不小于90 km/h的汽车有( )
A.20辆 B.40辆 C.60辆 D.90辆
答案:C
7.观察新生婴儿的体重,其频率分布直方图如下图所示,则新生婴儿体重在的频率为( )
A.0.001 B.0.1 C.0.2 D.0.3
答案:D
8.一组数据的最大值与最小值之差为80,若取组距为9,则分成的组数应是( )
A.7 B.8 C.9 D.10
答案:C
9.对某班50名学生在一次数学测验中的成绩进行统计分析,各分数段的人数频率分布直方图如下图所示(分数取正整数),问80分以上的优秀学生有多少人?
解析:80分以上的优秀学生的频率为0.024×10+0.032×10=0.56,所以80分以上的优秀学生有28人.
10.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48.
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
解析:(1)以4为组距,列表如下:
年龄分组
频数
频率
[41.5,45.5)
2
0.045 5
[45.5,49.5)
7
0.159 1
[49.5,53.5)
8
0.181 8
[53.5,57.5)
16
0.363 6
[57.5,61.5)
5
0.113 6
[61.5,65.5)
4
0.090 9
[65.5,69.5]
2
0.045 5
合计
44
1.00
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.
1.看图要特别注意纵坐标代表的内容,一般分频数、频率、频率/组距.
2.分组没有具体要求几组时可以有所不同,但一般分为5~7组为宜.
3.频数和为样本数,频率和为1,频数/样本数=频率.
4.注意区分频率和累积频率.
5.画频率分布直方图一般要先求各组的“频率/组距”.