第二章 2.2 2.2.1
A级 基础巩固
一、选择题
1.下列关于频率分布直方图的说法正确的是( D )
A.直方图的高表示取某数的频率
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取该组上的个体在样本中出现的频数与组距的比值
D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值
[解析] 要注意频率直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.
2.有一个容量为200的样本,其频率分布直方图如图所示,则样本数据在[8,10)内的频数为( C )
A.38 B.57
C.76 D.95
[解析] 样本数据在[8,10)外的频率为(0.02+0.05+0.09+0.15)×2=0.62,所以样本数据在[8,10)内的频率为1-0.62=0.38,所以样本数据在[8,10)内的频数为0.38×200=76,故选C.
3.在中秋的促销活动中,某商场对9月14日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知12时到14时的销售额为7万元,则10时到11时的销售额为( C )
A.1万元 B.2万元
C.3万元 D.4万元
[解析] 由频率分布直方图可知,12时到14时的销售额所占频率为0.25+0.1=0.35,10时到11时的销售额所占频率为1-0.1-0.4-0.25-0.1=0.15.
∵12时到14时的销售额为7万元,∴10时到11时的销售额为=3(万元),故选C.
4.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( B )
A.0.2 B.0.4
C.0.5 D.0.6
[解析] 利用频率及茎叶图的知识直接运算求解.由题意知,这10个数据落在区间[22,30)内的有22、22、27、29,共4个,所以其频率为=0.4,故选B.
二、填空题
5.今年5月海淀区教育网开通了网上教学,某校高一年级(8)班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息,这一天上网学习时间在100~119分钟之间的学生人数是__14__人,如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?__不合理__(填“合理”或“不合理”)
[解析] 由频数=样本容量×频率=40×0.35=14(人)
因为该样本的选取只在高一(8)班,不具有代表性,所以这样推断不合理.
6.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图(如下图所示)表示,据此可估计该校上学期200名教师中,使用多媒体进行教学的次数在[15,25)内的人数为__60__.
[解析] 由茎叶图可得使用多媒体进行教学的次数在[15,25)内的频率为=,于是可估计200名教师中,使用多媒体进行教学的次数在[15,25)内的人数为200×=60.
三、解答题
7.某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
[解析] 甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,大多集中在80~100之间,中位数是98分.
甲同学的得分情况除一个特殊得分外,也大致对称,多集中在70~90之间,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.
8.为了解某校高一年级学生的体能情况,抽取部分学生进行一分钟跳绳测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2︰4︰17︰15︰9︰3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110)为达标,则该校全体高一年级学生的达标率是多少?
[解析] (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小,
因此第二小组的频率为=0.08.
又因为第二小组的频率=,故样本容量===150.
(2)由频率分布直方图估计,
该校高一年级学生的达标率为
×100%=88%.
B级 素养提升
一、选择题
1.某校高一(1)班一次阶段考试数学成绩的茎叶图和频率分布直方图的可见部分如图所示,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为( C )
A.20,2 B.24,4
C.25,2 D.25,4
[解析] 由频率分布直方图,可知分数在[90,100]内的频率和在[50,60)内的频率相同,所以分数在[90,100]内的人数为2,总人数为=25.故选C.
2.某高校调查了200名学生每周的自习时间(单位:h),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5 h的人数是( D )
A.56 B.60
C.120 D.140
[解析] 由频率分布直方图可知,这200名学生每周的自习时间不少于22.5 h的频率为(0.16+0.08+0.04)×2.5=0.7,故这200名学生中每周的自习时间不少于22.5 h的人数为200×0.7=140.故选D.
二、填空题
3.某校开展“爱我海西,爱我家乡”摄影比赛,9位评委给参赛作品A打出的分数如茎叶图所示,记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是__1__.
[解析] 若x≤4,则由平均分为91知总分应为91×7=637.故637=89+89+92+93+92+91+90+x,得x=1;若x>4,637≠89+89+92+93+92+91+94=640不合题意.
4.某校100名学生的数学测试成绩频率分布直方图如图所示,分数不低于a(a为整数)即为优秀,如果优秀的人数为20人,则a的估计值是__133__.
[解析] 由已知可以判断a∈(130,140),∴[(140-a)×0.015+0.01×10]×100=20,
解得a≈133.
三、解答题
5.某市2019年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
[解析] (1)频率分布表:
分组
频数
频率
[41,51)
2
[51,61)
1
[61,71)
4
[71,81)
6
[81,91)
10
[91,101)
5
[101,111)
2
(2)频率分布直方图,如图所示.
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的,有26天处于良的水平,占当月天数的,处于优或良的天数共有28天,占当月天数的.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善.
6.某电视台为宣传本省,随机对本省内15~65岁的人群抽取了n人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示.
组号
分组
回答正确的人数
回答正确的人数占本组的频率
第1组
[15,25)
a
0.5
第2组
[25,35)
18
x
第3组
[35,45)
b
0.9
第4组
[45,55)
9
0.36
第5组
[55,65]
3
y
(1)分别求出a、b、x、y的值;
(2)从第2、3、4组回答正确的人中用分层抽样的方法抽取6人,求第2、3、4组每组各抽取多少人?
[解析] (1)由频率表中第4组数据可知,第4组总人数为=25,再结合频率分布直方图可知
n==100,
∴a=100×0.01×10×0.5=5,
b=100×0.03×10×0.9=27,
x==0.9,y==0.2.
(2)第2、3、4组回答正确的共有54人.
∴利用分层抽样在54人中抽取6人,每组分别抽取的人数为:第2组:×6=2(人);第3组:×6=3(人);第4组:×6=1(人).
7.(2018·全国卷Ⅲ文,18)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任
务的工作时间(单位:min)绘制了如下茎叶图:
根据茎叶图判断哪种生产方式的效率更高?并说明理由.
[解析] 第二种生产方式的效率更高.
理由如下:
(1)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80 min,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79 min.因此第二种生产方式的效率更高.
(2)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高.
(3)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80 min;用第二种生产方式的工人完成生产任务平均所需时间低于80 min.因此第二种生产方式的效率更高.
(4)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.
以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.
课件42张PPT。第二章统计2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布自主预习学案数据被收集后,必须从中寻找所包含的信息,以使我们通过样本估计总体.由于数据多而杂乱,我们往往无法直接从原始数据中理解它们的含义.因此,必须通过图、表、计算来分析数据,帮我们找出数据中的规律,使数据所包含的信息转化成直观的容易理解的形式.1.分析数据的方法
(1)借助于图形.
用图将各个数据画出来,作图可以达到两个目的,
一是从数据中____________;二是利用图形____________.
(2)借助于表格.
用紧凑的表格改变数据的________方式,为我们提供________数据的新方式.提取信息 传递信息 构成 解释 2.作频率分布直方图的步骤
(1)求极差:即一组数据中__________和__________的差.
(2)决定组距与组数:将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.这时应注意:①一般样本容量越大,所分组数________;②为方便起见,组距的选择应力求“取整”;③当样本容量不超过100时,按照数据的多少,通常分成5~12组.
(3)将数据分组:按组距将数据________,分组时,各组均为左闭右开区间,最后一组是闭区间.最大值 最小值 越多 分组 列频率分布表 频率/组距 3.频率分布折线图和总体密度曲线
(1)类似于频数分布折线图,连接频率分布直方图中各个小长方形上端的________,就得到频率分布折线图.
(2)在样本频率分布直方图中,当样本容量逐渐增加,作图时所分的组数增加,________减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体
密度曲线.总体密度曲线反映了总体在各个范围内取值的__________.
4.茎叶图
将所有两位数的十位数字作为______,个位数字作为______,茎相同者共用一个茎,茎按从__________的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).中点 组距 百分比 茎 叶 小到大 1.一个容量为100的样本,已知某组的频率为0.3,则该组的频数为( )
A.3 B.7
C.30 D.70
[解析] 由题意可知,该组的频数为100×0.3=30.C 2.如图所示的茎叶图表示的是一台自动售货机的销售情况,则茎叶图中9表示的销售额为( )
A.9 B.49
C.29 D.1 349
[解析] 分开茎、叶的竖线左侧仅有一列表示茎,右侧有多列,表示叶,故9表示的销售额为29.C 3.某班的全体学生参加英语测试,成绩的频率分布直方图如图.数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )
A.45
B.50
C.55
D.60B 48 5.甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如图所示,则罚球命中率较高的是______.
[解析] 由茎叶图知,甲命中的个数明显比乙命中的个数多,所以甲的命中率较高.甲 互动探究学案 为调查某校高一年级男生的身高,随机抽取40名高一男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168
165 171 169 167 169 151 168 170 168
160 174 165 168 174 158 167 156 157
164 169 180 176 157 162 161 158 164
163 163 167 161
(1)作出频率分布表;
(2)画出频率分布直方图.命题方向1 ?绘制频率分布直方图典例 1 [思路分析] 找出此组数据的最大值和最小值,确定分组的组距和组数,先列出频数分布表,再由频率分布表绘制频率分布直方图.
[解析] (1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;
确定组距为4,组数为8,频率分布表:(2)频率分布直方图如下.『规律总结』 绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.〔跟踪练习1〕 有一个容量为50的样本,数据分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5],4.
(1)列出样本频率分布表;
(2)画出频率分布直方图.[解析] (1)频率分布表如下:(2)频率分布直方图如下: 甲、乙两个小组各10名学生的英语口语测试成绩(单位:分)如下:
用茎叶图表示两个小组的成绩,并判断哪个小组的成绩更整齐一些.
[解析] 茎叶图如图所示(中间的茎为十位上的数字).
由茎叶图容易看出甲组的成绩更整齐一些.命题方向2 ?茎叶图的画法及应用典例 2 『规律总结』 当数据个数较少时,用茎叶图可精确地记录每个数据.如果数据是两位数,那么茎表示十位数,叶表示个位数,如果数据是三位数,那么茎表示百位数和十位数,叶表示个位数.
(2)茎叶图的绘制需注意“叶”的位置的数字位数只有一位,而“茎”的位置的数字位数一般不需要统一.
(3)通过茎叶图可以确定数据的中位数,判断数据大致集中在哪个茎,是否分布均匀等.
(4)数据分布一般是茎从上到下由小到大,叶从茎侧向外按从小到大排列.〔跟踪练习2〕 在某电脑杂志的一篇文章中,每个句子的字数如下
10,28,31,17,23,27,18,15,26,24,20,
19,36,27,14,25,15,22,11,24,27,17.
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,
12,36,41,27,13,22,23,18,46,32,22.
(1)画出两组数据的茎叶图;
(2)比较分析两组数据,能得出什么结论?[解析] (1)依题意,画出茎叶图如下图所示:
(2)电脑杂志文章中每个句子的字数集中在10~30之间,中位数为22.5,而报纸文章中每个句子的字数集中在20~40之间,中位数为27.5.还可以看出,电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.这与电脑杂志作为科普读物需要简明、通俗易懂的要求相吻合. 中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如右图所示.从左至右五个小组的频率之比依次是5︰7︰12︰10︰6,则全市高一学生视力在[3.95,4.25)范围内的学生约有多少人?频率分布直方图理解不正确 典例 3 某学校随机抽取20个班,调查各班中有网购经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )茎叶图与频率分布直方图的综合应用 典例 4 A 观察各选择项的频率分布直方图知选A. 1.如果想用统计图来反映各数据的变化趋势,比较合适的统计图是( )
A.条形图 B.折线图
C.扇形图 D.其他图形
[解析] 能反映各数据的变化趋势的统计图是折线图.B 2.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )
A.20
B.30
C.40
D.50
[解析] 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.B 3.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)内的频率为( )
A.0.001
B.0.1
C.0.3
D.0.03
[解析] 由频率分布直方图可知,新生儿体重在[2 700,3 000)内的频率为0.001×300=0.3.C 4.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图所示),由图中数据可知a=______________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为______.0.030 3 5.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8︰00~10︰00间各自的点击量,得如图所示的茎叶图,根据茎叶图回答下列问题.
(1)甲、乙两个网站点击量的极差分别是多少?
(2)甲网站点击量在[10,40]间的频率是多少?
(3)甲、乙两网站哪个更受欢迎?并说明理由.课时作业学案