高一数学人教版(2019)必修第二册 
 【9.2用样本估计总体】 
【学习目标】熟练掌握对平均数、中位数、众数的了解 
【难点突破】 
知识点1:1.求极差 
极差式一组数据中最大值与最小值的差 
2.决定组距与组数 
合适的组距与组数对发现数据分布规律有重要意义.组数太多或太少,都会影响我们了解数据的分布情况组距与组数的确定没有固定的标准,常常需要-一个尝试和选择的过?程。数据分组的组数与数据的个数有关,:一般数据的个数越多,所分组数也越多. 
3.将数据分组 
4.列频率分布表 
5.画频率分布直方图 
小长方形的面积=组距×false 
知识点2:总体集中趋势的估计 
(1)平均数:如果给定的一组数是 , ,… ,则这组数的平均数为 
false即false 
(2)中位数:如果一组数有奇数个数,且按照从小到大排列后为false则称false为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为false则称false为这组数的中位数 
(3)众数:一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数,若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数 
【例题分析】 
例1.如图所示的四组数据,标准差最小的是(? ) 
A.??????????????????????B.? 
C.??????????????????????D.?| 
【答案】 A 
【解析】】对A, x=116(2×10+6×20+6×30+2×40)=25 , 
s=116[2×(10?25)2+6×(20?25)2+6×(30?25)2+2×(40?25)2]=53 , 
对B, x=116(6×10+2×20+2×30+6×40)=25 , 
s=116[6×(10?25)2+2×(20?25)2+2×(30?25)2+6×(40?25)2]=57 , 
对C, x=116(3×10+5×20+5×30+3×40)=25 , 
s=116[3×(10?25)2+5×(20?25)2+5×(30?25)2+3×(40?25)2]=10 , 
对D, x=116(5×10+3×20+3×30+5×40)=25 , 
s=116[5×(10?25)2+3×(20?25)2+3×(30?25)2+5×(40?25)2]=56 , 
所以标准差最小的是A. 
故答案为:A. 
例2.受新冠疫情的影响,全国各地学校都推迟了2020年的春季开学时间,某学校“停课不停学”,利用云课平台提供免费线上课程该学校为了了解学生对线上课程的满意程度,随机抽取了100名学生对该线上课程进行评分.其频率分布直方图如图. 
(1)求图中a的值; 
(2)以频率当作概率,若采用分层抽样的方法,从样本评分在 [60,70) 和 [90,100] 内的学生中共抽取5人进行测试来检验他们的网课学习效果,再从中选取2人进行跟踪分析,求这2人中至少一人评分在 [60,70) 内的概率. 
【答案】 (1)解:由题意,得 10×(a+0.030+0.015+0.010+0.005)=1 , 
解得 a=0.040 
(2)解:在 [60,70) 内抽取 5×0.10.1+0.15=2 (人),则在 [90,100] 抽取3人. 
记这5人中在 [90,100] 的3人分别为a,b,c,在 [60,70) 的2人分别为e,f, 
则5人中抽2人的情况有: (a,b) , (a,c) , (a,e) , (a,f) , (b,c) , (b,e) , (b,f) , (c,e) , (c,f) , (e,f) ,共10种. 
其中这2人中至少一人评分在 [60,70) 的有 (a,e) , (a,f) , (b,e) , (b,f) , (c,e) , (c,f) , (e,f) ,共7种. 
∴所求事件的概率是 P=710 
【解析】【分析】(1)利用频率分布直方图结合已知条件,再利用各小组的矩形面积等于各小组的频率,再结合频率之和等于1,进而求出a的值。 
 (2)利用已知条件结合分层抽样的方法,得出在 [60,70) 内抽取 2 (人),则在 [90,100] 抽取3人.,再利用古典概型求概率公式,进而求出这2人中至少一人评分在 [60,70) 内的概率。 
【小题演练】 
1.某工厂从一批产品中抽取一个容量为 n 的样本,根据样本数据分成 [2,4) , [4,6) , [6,8) , [8,10) , [10,12] 五组,得到频率分布直方图如图所示.若样本数据落在 [6,10) 内的个数是66,则 n= (??? ) 
A.?150?????????????????????????????????????B.?300?????????????????????????????????????C.?600?????????????????????????????????????D.?1200 
2.已知某企业有职工80000人,其职工年龄情况和绿色出行情况分别如图1和图2所示,则下列说法正确的是(??? ) 
A.?该企业老年职工绿色出行的人数最多 
B.?该企业青年职工绿色出行的人数最多 
C.?该企业老年职工绿色出行的人数和青年职工绿色出行的人数之和与中年职工绿色出行的人数相等 
D.?该企业绿色出行的人数占总人数的80% 
3.如图,是统计某样本数据得到的频率分布直方图,已知该样本容量为300,则样本数据落在 [6,14) 内的频数为(??? ) 
A.?68???????????????????????????????????????B.?170???????????????????????????????????????C.?204???????????????????????????????????????D.?240 
4.在“我爱你,中国”为主题的演讲比赛中,七位评委对甲参赛选手的评分如图茎叶图所示,去掉一个最高分和一个最低分,所剩数据的方差为(??? ) 
A.?65??????????????????????????????????????????B.?75??????????????????????????????????????????C.?85??????????????????????????????????????????D.?95 
5.为了了解初中生的身体素质,某地区随机抽取了 n 名学生进行跳绳测试,根据所得数据画样本的频率分布直方图如图所示,且从左到右第一小组的频数是100,则 n= ________ . 
6.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为 a ,最大频率为0.32,则 a 的值为________. 
【参考答案】 
1.【答案】 A 
【解析】】由图可知样本数据落在 [6,10) 内的频率为 (0.12+0.10)×2=0.44 ,则 n=66÷0.44=150 . 
故答案为:A 
2.【答案】 D 
【解析】】由图可知该企业老年职工绿色出行的人数是 8000×30%×90%=2160 ,中年职工绿色出行的人数是 8000×40%×80%=2560 ,青年职工绿色出行的人数是 8000×30%×70%=1680 ,则该企业职工绿色出行的人数占总人数的比例为 2160+2560+16808000=80% ,A,B,C不符合题意,D符合题意. 
故答案为:D 
 3.【答案】 C 
【解析】】样本数据落在 [6,14) 内的频率为 (0.08+0.09)×4=0.68 , 
所以样本数据落在 [6,14) 内的频数为 300×0.68=204 , 
故答案为:C 
4.【答案】 C 
【解析】】由茎叶图可知评委打出的最低分78,最高分94, 
其余得分为85,85,85,87,88, 
故平均分为 (85+85+85+87+88)÷5=86 , 
方差为 
15[3×(85?86)2+(87?86)2+(88?86)2]=85 , 
故答案为:C。 
5.【答案】 1000 
【解析】】由频率分布直方图知,从左到右第一小组的频率为 0.004×25=0.1 ,且从左到右第一小组的频数是100,所以 n=1000.1=1000 . 
故答案为:1000 
6.【答案】 54 
【解析】】前两组中的频数为 100×(0.5+1.1)×0.1=16 , 
因为后五组频数和为62,所以前三组频数和为38, 
第三组频数为 38?16=22 ,又最大频率为0.32,所以最大频数即第四组频数为 0.32×100=32 ,所以 a=22+32=54 . 
故答案为:54