数学人教A版必修3第二章 统 计(课件+练习)

文档属性

名称 数学人教A版必修3第二章 统 计(课件+练习)
格式 zip
文件大小 11.0MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2019-05-21 07:44:06

文档简介

章末检测试卷(二)
(时间:120分钟 满分:150分)
一、选择题(本大题共12小题,每小题5分,共60分)
1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是(  )
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
答案 B
解析 标准差能反映一组数据的稳定程度.
2.①某学校高二年级共有526人,为了调查学生每天用于休息的时间,决定抽取10%的学生进行调查;②一次数学考试中,某班有10人的成绩在100分以上,32人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关情况;③运动会的工作人员为参加4×100 m接力赛的6支队伍安排跑道.针对这三件事,恰当的抽样方法分别为(  )
A.分层抽样,分层抽样,简单随机抽样
B.系统抽样,系统抽样,简单随机抽样
C.分层抽样,简单随机抽样,简单随机抽样
D.系统抽样,分层抽样,简单随机抽样
答案 D
解析 ①中,总体容量较大,抽取的样本容量较大,用系统抽样比较恰当;②中,考试成绩在不同分数段之间的同学有明显的差异,用分层抽样比较恰当;③中,总体包含的个体较少,用简单随机抽样比较恰当.
3.某校高二年级有50人参加2017“希望杯”数学竞赛,他们竞赛的成绩制成了如下的频率分布表,根据该表估计该校学生数学竞赛成绩的平均分为(  )
分组
[60,70)
[70,80)
[80,90)
[90,100]
频率
0.2
0.4
0.3
0.1
A.70 B.73 C.78 D.81.5
答案 C
解析 估计该校学生数学竞赛成绩的平均分=65×0.2+75×0.4+85×0.3+95×0.1=78,故选C.
4.一个容量为200的样本,其数据的分组与各组的频数如下表:
组别
[0,10)
[10,20)
[20,30)
[30,40)
[40,50)
频数
15
15
20
30
35
组别
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
25
20
15
15
10
则样本数据落在[20,60)上的频率为(  )
A.0.11 B.0.5 C.0.45 D.0.55
答案 D
解析 由题中表格可知样本数据落在[20,60)上的频数为20+30+35+25=110,故其频率为=0.55.
5.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是(  )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
答案 A
解析 将这组数据从小到大排列,得87,89,90,91,92,93,94,96.故中位数为=91.5.平均数为=91+=91.5.
6.为了检验某种产品的质量,从编号为01,02,…,19,20的20件产品中,利用下面的随机数表选取5件进行质量分析,选取方法是从随机表第1行的第5列数字开始,由左到右依次选取两个数字,则选出的第5个个体的编号为(  )
5816 6172 0803 6314 0703 4369 9728 1198
3504 9324 4635 8200 3623 4869 6938 7481
A.14 B.04
C.11 D.03
答案 C
解析 从随机数表第1行的第5列数字开始,由左到右依次选取两个数字,选出的编号依次为08,03,14,07,11,因此选出的第5个个体的编号为11.故选C.
7.如图为某个容量为100的样本的频率分布直方图,分组为[96,98),[98,100),[100,102),[102,104),[104,106],则在区间[98,100)上的频数为(  )
A.10 B.30 C.20 D.40
答案 C
解析 区间[98,100)上小矩形的面积为0.100×2=0.200,所以区间[98,100)上的频数为100×0.200=20,故选C.
8.若数据x1,x2,…,xn的平均数为,方差为s2,则3x1+5,3x2+5,…,3xn+5的平均数和标准差分别为(  )
A.,s B.3+5,s
C.3+5,3s D.3+5,
答案 C
解析 ∵x1,x2,…,xn的平均数为,
∴3x1+5,3x2+5,…,3xn+5的平均数为3+5,
s′2=[(3x1+5-3-5)2+…+(3xn+5-3-5)2]
=×32[(x1-)2+…+(xn-)2]=9s2.∴s′=3s.
9.一名小学生的年龄(单位:岁)和身高(单位:cm)的数据如下表.由散点图可知,身高y与年龄x之间的线性回归方程为=8.8x+,预测该学生10岁时的身高为(  )
年龄x
6
7
8
9
身高y
118
126
136
144
A.154 cm B.153 cm C.152 cm D.151 cm
答案 B
解析 由表中数据,得==7.5,==131,代入=8.8x+,得=65,即=8.8x+65,
所以预测该学生10岁时的身高为153 cm.故选B.
10.某校为了对初三学生的体重进行摸底调查,随机抽取了50名学生的体重(kg),将所得数据整理后,画出了频率分布直方图,如图所示 ,体重在[45,50)内适合跑步训练,体重在[50,55)内适合跳远训练,体重在[55,60]内适合投掷相关方面训练,估计该校初三学生适合参加跑步、跳远、投掷三项训练的集训人数之比为(  )
A.4∶3∶1 B.5∶3∶1
C.5∶3∶2 D.3∶2∶1
答案 B
解析 体重在[45,50)内的频率为0.1×5=0.5,体重在[50,55)内的频率为0.06×5=0.30,体重在[55,60]内的频率为0.02×5=0.1,
∵0.5∶0.3∶0.1=5∶3∶1,
∴可估计该校初三学生适合参加跑步、跳远、投掷三项训练的集训人数之比为5∶3∶1,故选B.
11.如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为106,乙组数据的平均数为105.4,则x,y的值分别为(  )
A.5,7 B.6,8 C.6,9 D.8,8
答案 B
解析 ∵甲组数据的中位数为106,
∴x=6.
又∵乙组数据的平均数为105.4,
∴=105.4,
解得y=8.
综上,x,y的值分别为6,8.故选B.
12.下列关于线性回归的判断,正确的个数为(  )
①若散点图中所有的点都在一条直线附近,则这条直线为回归直线;
②散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的点A,B,C;
③已知回归方程=0.50x-0.81,则当x=25时,y的估计值为11.69;
④回归方程的意义是它反映了样本整体的变化趋势.
A.0 B.1 C.2 D.3
答案 D
解析 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义,知只有按最小二乘法求得回归系数,,得到的直线=x+才是回归直线,所以①不对;②正确;将x=25代入=0.50x-0.81,解得=11.69,所以③正确;④正确,所以选D.
二、填空题(本大题共4小题,每小题5分,共20分)
13.从甲、乙、丙三个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下:
甲:3,4,5,6,8,8,8,10;
乙:4,6,6,6,8,9,12,13;
丙:3,3,4,7,9,10,11,12.
三个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:甲________,乙________,丙________.
答案 众数 平均数 中位数
解析 甲、乙、丙三个厂家从不同角度描述了一组数据的特征.甲:该组数据8出现的次数最多;乙:该组数据的平均数==8;丙:该组数据的中位数是=8.
14.某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人):
篮球组
书画组
乐器组
高一
45
30
a
高二
15
10
20
学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.
答案 30
解析 由题意知,=,解得a=30.
15.从一堆苹果中任取20个,并得到它们的质量(单位:克)数据分布如下:
分组
[90,100)
[100,110)
[110,120)
[120,130)
[130,140)
[140,150]
频数
1
2
3
10
3
1
则这堆苹果中,质量不少于120克的苹果数约占苹果总数的________%.
答案 70
解析 ∵质量不少于120克的频数为14,
∴频率为×100%=70%.
16.某电子商务公司对10 000名网络购物者在2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
答案 (1)3 (2)6 000
解析 由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.所以消费金额在区间[0.5,0.9]内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.
三、解答题(本大题共6小题,共70分)
17.(10分)某市化工厂三个车间共有工人1 000名,各车间男、女工人数如下表:
第一车间
第二车间
第三车间
女工
173
100
y
男工
177
x
z
已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是0.15.
(1)求x的值;
(2)现用分层抽样的方法在全厂抽取50名工人,则应在第三车间抽取多少名工人?
解 (1)依题意有=0.15,解得x=150.
(2)∵第一车间的工人数是173+177=350,第二车间的工人数是100+150=250,
∴第三车间的工人数是1 000-350-250=400.
设应从第三车间抽取m名工人,则有=,
解得m=20,∴应在第三车间抽取20名工人.
18.(12分)某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上,每隔30分钟抽一包产品,称其重量是否合格,分别记录抽查数据如下(单位:千克):
甲车间:102,101,99,98,103,98,99.
乙车间:110,115,90,85,75,115,110.
(1)这种抽样方法是何种抽样方法?
(2)试根据这组数据说明哪个车间产品较稳定.
解 (1)这种抽样方法是系统抽样.
(2)甲=(102+101+99+98+103+98+99)=100,
乙=(110+115+90+85+75+115+110)=100,
s=[(102-100)2+(101-100)2+…+(99-100)2]≈3.428 6,
s=[(110-100)2+(115-100)2+…+(110-100)2]≈228.571 4.
∵甲=乙,s<s,
∴甲车间产品较稳定.
19.(12分)已知一组数据:
125 121 123 125 127 129 125 128 130 129
126 124 125 127 126 122 124 125 126 128
(1)填写下面的频率分布表:
分组
频数
频率
[121,123)
[123,125)
[125,127)
[127,129)
[129,131]
合计
(2)作出频率分布直方图;
(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.
解 (1)频率分布表如下:
分组
频数
频率
[121,123)
2
0.10
[123,125)
3
0.15
[125,127)
8
0.40
[127,129)
4
0.20
[129,131]
3
0.15
合计
20
1.00
(2)频率分布直方图如下:
(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的精确值为125.图中虚线对应的数据是125+2×=126.25,
事实上中位数为125.5.使用“组中值”求平均数:
=122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,
平均数的精确值为=125.75.
20.(12分)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5
2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4
1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据完成下面的茎叶图,从茎叶图看,哪种药的疗效更好?
解 (1)设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得,
=(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,
=(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.
由以上计算结果可得,>,因此可以看出A药的疗效更好.
(2)由观测结果可绘制茎叶图如图.
从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎“2.”,“3.”上,而B药疗效的试验结果有的叶集中在茎“0.”,“1.”上,由此可看出A药的疗效更好.
21.(12分)某市2017年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
解 (1)频率分布表:
分组
频数
频率
[41,51)
2

[51,61)
1

[61,71)
4

[71,81)
6

[81,91)
10

[91,101)
5

[101,111]
2

(2)频率分布直方图如图所示.
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月的天数的,说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的;污染指数在80以上的接近轻微污染的天数为15,加上处于轻微污染的天数,共17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善.
22.(12分)某地区2011年至2017年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份
2011
2012
2013
2014
2015
2016
2017
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)已知两变量线性相关,求y关于t的回归方程;
(2)利用(1)中的回归方程,分析2011年至2017年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2019年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=-.
解 (1)由所给数据计算得
=(1+2+3+4+5+6+7)=4,
=(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-)2=9+4+1+0+1+4+9=28,
(ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,
===0.5,
=-=4.3-0.5×4=2.3,
故所求回归方程为=0.5t+2.3.
(2)由(1)知,=0.5>0,故2011年至2017年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2019年的年份代号t=9代入(1)中的回归方程,
得=0.5×9+2.3=6.8,
故预测该地区2019年农村居民家庭人均纯收入为6.8千元.

§2.1 随机抽样
2.1.1 简单随机抽样
学习目标 1.了解随机抽样的必要性和重要性.2.理解随机抽样的目的和基本要求.3.掌握简单随机抽样中的抽签法、随机数法的一般步骤.
知识点一 统计的基本概念
(1)总体:一般把所考察对象的某一数值指标的全体构成的集合看成总体.
(2)个体:构成总体的每一个元素作为个体.
(3)样本:从总体中抽出若干个个体所组成的集合叫样本.
(4)样本容量:样本中个体的数目叫样本容量.
思考 样本与样本容量有什么区别?
答案 样本与样本容量是两个不同的概念.样本是从总体中抽取的个体组成的集合,是对象;样本容量是样本中个体的数目,是一个数.
知识点二 简单随机抽样
(1)设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
(2)简单随机抽样的四个特点
①它要求被抽取样本的总体的个数有限,这样便于通过随机抽取的样本对总体进行分析.
②它是从总体中逐个抽取,这样便于在抽样实践中进行操作.
③它是一种不放回抽样,由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.
④它是一种等机会抽样,不仅每次从总体中抽取一个个体时,各个个体被抽到的机会相等,而且在整个抽样的过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性.
知识点三 抽签法和随机数法
1.抽签法(抓阄法):把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
2.随机数法:随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.
3.利用随机数法抽取个体时的注意事项
①定起点:事先应确定以表中的哪个数(哪行哪列)作为起点.
②定方向:读数的方向(向左、向右、向上或向下都可以).
③读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复或大于总体中编号最大数则跳过,直到取满所需的样本个体数.
思考 采用抽签法抽取样本时,为什么将编号写在形状、大小相同的号签上,并且将号签放在同一个箱子里搅拌均匀?
答案 为了使每个号签被抽取的可能性相等,保证抽样的公平性.
1.简单随机抽样也可以是有放回的抽样.( × )
2.简单随机抽样中每个个体被抽到的机会相等.( √ )
3.采用随机数法抽取样本时,个体编号的位数必须相同.( √ )
题型一 对简单随机抽样的理解
例1 (1)下列4个抽样中,简单随机抽样的个数是(  )
①从无数个个体中抽取50个个体作为样本;
②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;
③一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地逐个抽出6个号签;
④箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出1个零件进行质量检验后,再把它放回箱子里.
A.0 B.1
C.2 D.3
(2)下列问题中,最适合用简单随机抽样方法抽样的是(  )
A.某电影院有32排座位,每排有40个座位,座位号是1~40,有一次报告会坐满了听众,报告会结束后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检查
C.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人,教育部门为了解在编人员对学校机构改革的意见,要从中抽取一个容量为20的样本
D.某乡农田有:山地800公顷,丘陵1 200公顷,平地2 400公顷,洼地400公顷,现抽取农田48公顷估计全乡农田平均每公顷产量
答案 (1)B (2)B
解析 (1)根据简单随机抽样的特点逐个判断.①不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.②不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.③是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.④不是简单随机抽样,因为它是有放回抽样.综上,只有③是简单随机抽样.
(2)A的总体容量较大,用简单随机抽样法比较麻烦;B的总体容量较少,用简单随机抽样法比较方便;C由于学校各类人员对这一问题的看法可能差异很大,不宜采用简单随机抽样法;D总体容量大,且各类田地的差别很大,也不宜采用简单随机抽样法.
反思感悟 简单随机抽样必须具备下列特点
(1)被抽取样本的总体中的个体数N是有限的;
(2)抽取的样本是从总体中逐个抽取的;
(3)简单随机抽样是一种不放回抽样;
(4)简单随机抽样是一种等可能的抽样.
如果四个特征有一个不满足,就不是简单随机抽样.
跟踪训练1 在简单随机抽样中,某一个体被抽到的可能性(  )
A.与第几次抽样有关,第一次抽到的可能性大一些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽到的可能性要大些
D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不一定相等
答案 B
解析 在简单随机抽样中,每一个个体被抽到的可能性都相等,与第几次抽样无关,故A,C,D不正确,B正确.
题型二 简单随机抽样等可能性应用
例2 一个布袋中有10个同样质地的小球,从中不放回地依次抽取3个小球,则某一特定小球被抽到的可能性是________,第三次抽取时,剩余每个小球被抽到的可能性是________.
答案  
解析 因为简单随机抽样过程中每个个体被抽到的可能性均为,所以第一个空填.因为本题中的抽样是不放回抽样,所以第一次抽取时,每个小球被抽到的可能性为,第二次抽取时,剩余9个小球,每个小球被抽到的可能性为,第三次抽取时,剩余8个小球,每个小球被抽到的可能性为.
反思感悟 简单随机抽样,每次抽取时,总体中各个个体被抽到的可能性相同,在整个抽样过程中各个个体被抽到的机会也都相等.
跟踪训练2 从总体容量为N的一批零件中,抽取一个容量为30的样本,若每个零件被抽到的可能性为0.25,则N的值为(  )
A.120 B.200
C.150 D.100
答案 A
解析 因为从含有N个个体的总体中抽取一个容量为30的样本时,在每次抽取一个个体的过程中任意一个个体被抽到的可能性为,在整个抽样过程中每个个体被抽到的可能性为,所以=0.25,从而有N=120.
故选A.
题型三 抽签法与随机数法及应用
命题角度1 抽签法
例3 某卫生单位为了支援抗震救灾,要在18名志愿者中选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.
解 方案如下:
第一步,将18名志愿者编号,号码为01,02,03,…,18.
第二步,将号码分别写在相同的纸条上,揉成团,制成号签.
第三步,将得到的号签放到一个不透明的盒子中,充分搅匀.
第四步,从盒子中依次不放回地取出6个号签,并记录上面的编号.
第五步,与所得号码对应的志愿者就是医疗小组成员.
反思感悟 一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.
跟踪训练3 (1)上海某中学从40名学生中选1人作为上海男篮啦啦队的成员,采用下面两种选法,则抽签法的序号是________.
①将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;
②将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为啦啦队成员.
答案 ①
解析 ①满足抽签法的特征,是抽签法;②不是抽签法,因为抽签法要求所有的号签编号互不相同,而②中39个白球无法相互区分.
(2)在社区公益活动中,某单位共有50名志愿者参与了报名,现要从中随机抽取6人参加一项活动,请用抽签法进行抽样,并写出过程.
解 第一步,将50名志愿者编号,号码为1,2,3,…,50.
第二步,将号码分别写在大小、形状、质地都相同的纸条上,揉成团,制成号签.
第三步,将所有号签放入一个不透明的箱子中,搅拌均匀.
第四步,一次取出1个号签,连取6次(不放回抽取),并记录其编号.
第五步,将对应编号的志愿者选出即可.
命题角度2 随机数法
例4 从一个含有40个个体的总体中抽取一个容量为7的样本,将个体依次随机编号为01,02,…,40,从随机数表的第6行第8列开始,依次向右,到最后一列转下一行最左一列开始,直到取足样本,则获取的第4个样本编号为________.
(下面节选了随机数表第6行和第7行)
第6行 84 42 17 56 31 07 23 55 06
82 77 04 74 43 59 76 30 63 50 25
83 92 12 06
第7行 63 01 63 78 59 16 95 56 67
19 98 10 50 71 75 12 86 73 58 07
44 39 52 38
答案 06
解析 找到第6行第8列的数开始向右读,第一个数是63,不成立,
第二个数10,成立,第三个数72,不成立,
第四个数35,成立,第五个数50,不成立,
这样依次接着往下读出结果,68,27,70,47,44,35,97,63,06,合适的数是27,35,06,
其中35前面已经出现,应舍掉,
故第四个数是06.
引申探究
本例中,利用随机数法抽取样本,若从随机数表的第6行第13列开始,求获取的前4个样本的编号.
解 从第6行第13列开始,获取的前4个样本的编号为23,06,04,30.
反思感悟 随机数法抽样的3个步骤
(1)编号:这里的所谓编号,实际上是新编数字号码.
(2)确定读数方向:为了保证选取数字的随机性,应在面对随机数表之前就指出开始数字的纵横位置,然后确定读数方向.
(3)获取样本:读数在总体编号内的取出,而读数不在总体编号内的和已取出的不算,依次下去,直至得到容量为n的样本.
跟踪训练4 总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法:从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为(  )
7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
A.08 B.07 C.02 D.01
答案 D
解析 从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字开始向右读,第一个数为65,不符合条件,第二个数为72,不符合条件,第三个数为08,符合条件,以下符合条件的数字依次为02,14,07,01,故第5个数为01.故选D.
随机数法的应用
典例1 现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验,如何用随机数法设计抽样方案?
解 第一步,将元件的编号调整为010,011,012,…,099,100,…,600.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7个数9.
第三步,从数9开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263.
第四步,以上这6个号码所对应的6个元件就是所要抽取的对象.(答案不唯一)
典例2 假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,应如何操作?
解 第一步,将800袋牛奶编号为000,001,…,799.
第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7).
第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.
[素养评析] (1)抽签法和随机数法对个体的编号是不同的,抽签法可以利用个体已有的编号.随机数法对个体的编号要看总体的个数,总体数为100,通常为00,01,…,99.总体数大于100小于1 000,从000开始编起,然后是001,002,….
(2)随机数法是抽取样本的一种重要方法,抽取样本就是收集数据,是整理数据,提取信息的基础,是数据分析的重要步骤,所以,本题充分体现数据分析的核心素养.
1.下面抽样方法是简单随机抽样的是(  )
A.从平面直角坐标系中抽取5个点作为样本
B.可口可乐公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查
C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动
D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编好号,对编号随机抽取)
答案 D
解析 A中,平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;B中,一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;C中,50名战士是最优秀的,不符合简单随机抽样的等可能性,故错误.
2.抽签法确保样本代表性的关键是(  )
A.制签 B.搅拌均匀
C.逐一抽取 D.抽取不放回
答案 B
解析 若样本具有很好的代表性,则每一个个体被抽取的机会相等,故需要对号签搅拌均匀.
3.使用简单随机抽样从1 000件产品中抽出50件进行某项检查,合适的抽样方法是(  )
A.抽签法 B.随机数法
C.随机抽样法 D.以上都不对
答案 B
解析 由于总体相对较大,样本容量较小,故采用随机数法较为合适.
4.已知下列抽取样本的方式:
①从无限多个个体中抽取100个个体作为样本;
②盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里;
③从20件玩具中一次性抽取3件进行质量检验;
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.其中,不是简单随机抽样的是________(填序号).
答案 ①②③④
解析 ①不是简单随机抽样,因为被抽取的总体的个数是无限的,而不是有限的;②不是简单随机抽样,因为它是放回抽样;③不是简单随机抽样,因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样,因为指定个子最高的5名同学是56名同学中特指的,不存在随机性,不是等可能抽样.
5.某地有2 000人参加自学考试,为了了解他们的成绩,从中抽取一个样本,若每个考生被抽到的概率都是0.04,则这个样本的容量是________.
答案 80
解析 设样本容量为n,根据简单随机抽样,得=0.04,解得n=80.
1.简单随机抽样是一种简单、基本、不放回的抽样方法,常用的简单随机抽样方法有抽签法和随机数法.
2.抽签法的优点是简单易行,缺点是当总体的容量大时,费时、费力,并且标号的签不易搅拌均匀,这样会导致抽样不公平;随机数法的优点也是简单易行,缺点是当总体容量大时,编号不方便.两种方法只适合总体容量较少的抽样类型.
3.简单随机抽样每个个体入样的可能性都相等,均为,但要将每个个体入样的可能性与第n次抽取时每个个体入样的可能性区分开,避免在解题中出现错误.
一、选择题
1.从某年级的500名学生中抽取60名学生进行体重的统计分析,下列说法正确的是(  )
A.500名学生是总体
B.每个学生是个体
C.抽取的60名学生的体重是一个样本
D.抽取的60名学生的体重是样本容量
答案 C
解析 由题意可知在此简单随机抽样中,总体是500名学生的体重,A错;个体是每个学生的体重,B错;样本容量为60,D错.
2.下列抽样方法是简单随机抽样的是(  )
A.从50个零件中一次性抽取5个做质量检验
B.从50个零件中有放回地抽取5个做质量检验
C.从实数集中随机抽取10个分析奇偶性
D.运动员从8个跑道中随机选取一个跑道
答案 D
解析 A不是,因为“一次性”抽取与“逐个”抽取含义不同;B不是,因为是有放回抽样;C不是,因为实数集是无限集.
3.下列抽样实验中,适合用抽签法的有(  )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
答案 B
解析 个体数和样本容量较小时适合用抽签法,排除A,D;C中甲、乙两厂生产的两箱产品质量可能差别较大,也不适用,故选B.
4.某学校为了解高一800名新入学同学的数学学习水平,从中随机抽取100名同学的中考数学成绩进行分析,在这个问题中,下列说法正确的是(  )
A.800名同学是总体
B.100名同学是样本
C.每名同学是个体
D.样本容量是100
答案 D
解析 据题意,总体是指800名新入学同学的中考数学成绩,样本是指抽取的100名同学的中考数学成绩,个体是指每名同学的中考数学成绩,样本容量是100,故只有D正确.
5.用简单随机抽样法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是(  )
A., B., C., D.,
答案 A
解析 简单随机抽样中每个个体被抽取的机会均等,都为.
6.某工厂的质检人员对生产的100件产品,采用随机数法抽取10件检查,对100件产品采用下面的编号方法①1,2,3,…,100;②001,002,…,100;③00,01,02,…,99;④01,02,03,…,100.
其中正确的序号是(  )
A.②③④ B.③④ C.②③ D.①②
答案 C
解析 根据随机数法的步骤可知,①④编号位数不统一,②③正确.
7.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是(  )
A.总体?
B.个体?
C.样本的容量?
D.从总体中抽取的一个样本
答案 A
解析 由题目条件知,5 000名居民的阅读时间的全体是总体;其中1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.
8.某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性都为0.2,用随机数法在该中学抽取容量为n的样本,则n等于(  )
A.80 B.160 C.200 D.280
答案 C
解析 由题意可知,=0.2,解得n=200.
9.已知总体容量为108,若用随机数法抽取一个容量为10的样本,下列对总体的编号正确的是(  )
A.1,2,…,108 B.01,02,…,108
C.00,01,…,107 D.001,002,…,108
答案 D
解析 用随机数法选取样本时,样本的编号位数要一致.故选D.
二、填空题
10.用随机数法从100名学生(男生25人)中抽选20人进行评教,某男学生被抽到的可能性是________.
答案 0.2
解析 因为样本容量为20,总体容量为100,所以总体中每个个体被抽到的可能性都为=0.2.
11.关于简单随机抽样,有下列说法:
①它要求被抽取样本的总体的个数有限;
②它是从总体中逐个地进行抽取;
③它是一种不放回抽样;
④它是一种等可能抽样,每次从总体中抽取一个个体时,不仅各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.
其中正确的有________.(请把你认为正确的所有序号都写上)
答案 ①②③④
解析 由简单随机抽样的特征可知.
12.为了了解参加运动会的2 000名运动员的年龄情况,从中抽取20名运动员的年龄进行统计分析.就这个问题,下列说法中正确的有________.(填序号)
①2 000名运动员是总体;
②每个运动员是个体;
③所抽取的20名运动员是一个样本;
④样本容量为20;
⑤每个运动员被抽到的机会相等.
答案 ④⑤
解析 ①2 000名运动员不是总体,2 000名运动员的年龄才是总体;②每个运动员的年龄是个体;③20名运动员的年龄是一个样本.故①②③均错误,正确说法是④⑤.
三、解答题
13.设某校共有100名教师,为了支援西部教育事业,现要从中随机抽出12名教师组成暑期西部讲师团,请写出利用随机数法抽取该样本的步骤.
解 第一步,将100名教师进行编号:00,01,02,…,99.
第二步,在随机数表(教材P103)中任取一数,如第12行第9列的数7.
第三步,从选定的数7开始向右读,每次读取两位,凡不在00~99中的数跳过去不读,前面已经读过的也跳过去不读,依次可得75,84,16,07,44,99,83,11,46,32,24,20.
第四步,以上这12个编号所对应的教师即是要抽取的对象.
14.从一群做游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续做游戏.过了一会儿,再从中任取m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为(  )
A. B.k+m-n
C. D.不能估计
答案 C
解析 设参加游戏的小孩有x人,则=,x=.
15.某电视台举行颁奖典礼,邀请20名港台、内地艺人演出,其中从30名内地艺人中随机挑选10人,从18名香港艺人中随机挑选6人,从10名台湾艺人中随机挑选4人.试用抽签法确定选中的艺人,并确定他们的表演顺序.
解 第一步:先确定艺人:(1)将30名内地艺人从01到30编号,然后用相同的纸条做成30个号签,在每个号签上写上这些编号,然后放入一个不透明小筒中摇匀,从中抽出10个号签,则相应编号的艺人参加演出;(2)运用相同的办法分别从10名台湾艺人中抽取4人,从18名香港艺人中抽取6人.
第二步:确定演出顺序:确定了演出人员后,再用相同的纸条做成20个号签,上面写上1到20这20个数字,代表演出的顺序,让每个演员抽一张,每人抽到的号签上的数字就是这位演员的演出顺序,再汇总即可.
课件41张PPT。2.1.1 简单随机抽样第二章 §2.1 随机抽样学习目标XUEXIMUBIAO1.了解随机抽样的必要性和重要性.
2.理解随机抽样的目的和基本要求.
3.掌握简单随机抽样中的抽签法、随机数法的一般步骤.NEIRONGSUOYIN内容索引自主学习题型探究达标检测1自主学习PART ONE知识点一 统计的基本概念
(1)总体:一般把所考察对象的某一数值指标的 构成的集合看成总体.
(2)个体:构成总体的每一个元素作为个体.
(3)样本:从总体中抽出 所组成的集合叫样本.
(4)样本容量:样本中 的数目叫样本容量.全体若干个个体个体思考 样本与样本容量有什么区别?答案 样本与样本容量是两个不同的概念.样本是从总体中抽取的个体组成的集合,是对象;样本容量是样本中个体的数目,是一个数.知识点二 简单随机抽样
(1)设一个总体含有N个个体,从中逐个 地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都 ,就把这种抽样方法叫做 .
(2)简单随机抽样的四个特点
①它要求被抽取样本的总体的个数有限,这样便于通过随机抽取的样本对总体进行分析.
②它是从总体中逐个抽取,这样便于在抽样实践中进行操作.不放回相等简单随机抽样③它是一种不放回抽样,由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.
④它是一种等机会抽样,不仅每次从总体中抽取一个个体时,各个个体被抽到的机会相等,而且在整个抽样的过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性.知识点三 抽签法和随机数法
1.抽签法(抓阄法):把总体中的N个个体 ,把 写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取 号签,连续抽取n次,就得到一个容量为n的样本.
2.随机数法:随机抽样中,另一个经常被采用的方法是随机数法,即利用____
、 或 产生的随机数进行抽样.
3.利用随机数法抽取个体时的注意事项
①定起点:事先应确定以表中的哪个数(哪行哪列)作为起点.
②定方向:读数的方向(向左、向右、向上或向下都可以).
③读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复或大于总体中编号最大数则跳过,直到取满所需的样本个体数.编号号码一个随机数表随机数骰子计算机思考 采用抽签法抽取样本时,为什么将编号写在形状、大小相同的号签上,并且将号签放在同一个箱子里搅拌均匀?答案 为了使每个号签被抽取的可能性相等,保证抽样的公平性.1.简单随机抽样也可以是有放回的抽样.(  )
2.简单随机抽样中每个个体被抽到的机会相等.(  )
3.采用随机数法抽取样本时,个体编号的位数必须相同.(  )思考辨析 判断正误SIKAOBIANXIPANDUANZHENGWU×√√2题型探究PART TWO题型一 对简单随机抽样的理解例1 (1)下列4个抽样中,简单随机抽样的个数是
①从无数个个体中抽取50个个体作为样本;
②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;
③一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地逐个抽出6个号签;
④箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出1个零件进行质量检验后,再把它放回箱子里.
A.0 B.1
C.2 D.3√解析 根据简单随机抽样的特点逐个判断.
①不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.
②不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.
③是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.
④不是简单随机抽样,因为它是有放回抽样.
综上,只有③是简单随机抽样.(2)下列问题中,最适合用简单随机抽样方法抽样的是
A.某电影院有32排座位,每排有40个座位,座位号是1~40,有一次报告会坐
满了听众,报告会结束后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检查
C.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人,
教育部门为了解在编人员对学校机构改革的意见,要从中抽取一个容量为
20的样本
D.某乡农田有:山地800公顷,丘陵1 200公顷,平地2 400公顷,洼地400公顷,
现抽取农田48公顷估计全乡农田平均每公顷产量√解析 A的总体容量较大,用简单随机抽样法比较麻烦;
B的总体容量较少,用简单随机抽样法比较方便;
C由于学校各类人员对这一问题的看法可能差异很大,不宜采用简单随机抽样法;
D总体容量大,且各类田地的差别很大,也不宜采用简单随机抽样法.反思感悟 简单随机抽样必须具备下列特点
(1)被抽取样本的总体中的个体数N是有限的;
(2)抽取的样本是从总体中逐个抽取的;
(3)简单随机抽样是一种不放回抽样;
(4)简单随机抽样是一种等可能的抽样.
如果四个特征有一个不满足,就不是简单随机抽样.跟踪训练1 在简单随机抽样中,某一个体被抽到的可能性
A.与第几次抽样有关,第一次抽到的可能性大一些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽到的可能性要大些
D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不一定
相等√解析 在简单随机抽样中,每一个个体被抽到的可能性都相等,与第几次抽样无关,故A,C,D不正确,B正确.题型二 简单随机抽样等可能性应用例2 一个布袋中有10个同样质地的小球,从中不放回地依次抽取3个小球,则某一特定小球被抽到的可能性是______,第三次抽取时,剩余每个小球被抽到的可能性是_____.反思感悟 简单随机抽样,每次抽取时,总体中各个个体被抽到的可能性相同,在整个抽样过程中各个个体被抽到的机会也都相等.跟踪训练2 从总体容量为N的一批零件中,抽取一个容量为30的样本,若每个零件被抽到的可能性为0.25,则N的值为
A.120 B.200 C.150 D.100√题型三 抽签法与随机数法及应用多维探究命题角度1 抽签法解 方案如下:
第一步,将18名志愿者编号,号码为01,02,03,…,18.
第二步,将号码分别写在相同的纸条上,揉成团,制成号签.
第三步,将得到的号签放到一个不透明的盒子中,充分搅匀.
第四步,从盒子中依次不放回地取出6个号签,并记录上面的编号.
第五步,与所得号码对应的志愿者就是医疗小组成员.例3 某卫生单位为了支援抗震救灾,要在18名志愿者中选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.反思感悟 一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.跟踪训练3 (1)上海某中学从40名学生中选1人作为上海男篮啦啦队的成员,采用下面两种选法,则抽签法的序号是_____.
①将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;
②将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为啦啦队成员.①解析 ①满足抽签法的特征,是抽签法;
②不是抽签法,因为抽签法要求所有的号签编号互不相同,而②中39个白球无法相互区分.(2)在社区公益活动中,某单位共有50名志愿者参与了报名,现要从中随机抽取6人参加一项活动,请用抽签法进行抽样,并写出过程.解 第一步,将50名志愿者编号,号码为1,2,3,…,50.
第二步,将号码分别写在大小、形状、质地都相同的纸条上,揉成团,制成号签.
第三步,将所有号签放入一个不透明的箱子中,搅拌均匀.
第四步,一次取出1个号签,连取6次(不放回抽取),并记录其编号.
第五步,将对应编号的志愿者选出即可.命题角度2 随机数法
例4 从一个含有40个个体的总体中抽取一个容量为7的样本,将个体依次随机编号为01,02,…,40,从随机数表的第6行第8列开始,依次向右,到最后一列转下一行最左一列开始,直到取足样本,则获取的第4个样本编号为________.(下面节选了随机数表第6行和第7行)
第6行 84 42 17 56 31 07 23 55 06
82 77 04 74 43 59 76 30 63 50 25
83 92 12 06
第7行 63 01 63 78 59 16 95 56 67
19 98 10 50 71 75 12 86 73 58 07
44 39 52 3806解析 找到第6行第8列的数开始向右读,第一个数是63,不成立,
第二个数10,成立,第三个数72,不成立,
第四个数35,成立,第五个数50,不成立,
这样依次接着往下读出结果,68,27,70,47,44,35,97,63,06,合适的数是27,35,06,
其中35前面已经出现,应舍掉,
故第四个数是06.引申探究
本例中,利用随机数法抽取样本,若从随机数表的第6行第13列开始,求获取的前4个样本的编号.解 从第6行第13列开始,获取的前4个样本的编号为23,06,04,30.反思感悟 随机数法抽样的3个步骤
(1)编号:这里的所谓编号,实际上是新编数字号码.
(2)确定读数方向:为了保证选取数字的随机性,应在面对随机数表之前就指出开始数字的纵横位置,然后确定读数方向.
(3)获取样本:读数在总体编号内的取出,而读数不在总体编号内的和已取出的不算,依次下去,直至得到容量为n的样本.跟踪训练4 总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法:从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为A.08
B.07
C.02
D.01√解析 从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字开始向右读,第一个数为65,不符合条件,第二个数为72,不符合条件,第三个数为08,符合条件,以下符合条件的数字依次为02,14,07,01,故第5个数为01.故选D.核心素养之数据分析HEXINSUYANGZHISHUJUFENXI随机数法的应用典例1 现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验,如何用随机数法设计抽样方案?解 第一步,将元件的编号调整为010,011,012,…,099,100,…,600.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7个数9.
第三步,从数9开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263.
第四步,以上这6个号码所对应的6个元件就是所要抽取的对象.(答案不唯一)典例2 假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,应如何操作?解 第一步,将800袋牛奶编号为000,001,…,799.
第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7).
第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.素养评析 (1)抽签法和随机数法对个体的编号是不同的,抽签法可以利用个体已有的编号.随机数法对个体的编号要看总体的个数,总体数为100,通常为00,01,…,99.总体数大于100小于1 000,从000开始编起,然后是001,002,….
(2)随机数法是抽取样本的一种重要方法,抽取样本就是收集数据,是整理数据,提取信息的基础,是数据分析的重要步骤,所以,本题充分体现数据分析的核心素养.3达标检测PART THREE1.下面抽样方法是简单随机抽样的是
A.从平面直角坐标系中抽取5个点作为样本
B.可口可乐公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查
C.某连队从200名战士中,挑选出50名最优秀的战士去参加抢险救灾活动
D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编
好号,对编号随机抽取)√12345解析 A中,平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故错误;
B中,一次性抽取不符合简单随机抽样逐个抽取的特点,故错误;
C中,50名战士是最优秀的,不符合简单随机抽样的等可能性,故错误.2.抽签法确保样本代表性的关键是
A.制签 B.搅拌均匀
C.逐一抽取 D.抽取不放回解析 若样本具有很好的代表性,则每一个个体被抽取的机会相等,故需要对号签搅拌均匀.12345√3.使用简单随机抽样从1 000件产品中抽出50件进行某项检查,合适的抽样方法是
A.抽签法 B.随机数法
C.随机抽样法 D.以上都不对√12345解析 由于总体相对较大,样本容量较小,故采用随机数法较为合适.123454.已知下列抽取样本的方式:
①从无限多个个体中抽取100个个体作为样本;
②盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里;
③从20件玩具中一次性抽取3件进行质量检验;
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.其中,不是简单随机抽样的是____________(填序号).①②③④解析 ①不是简单随机抽样,因为被抽取的总体的个数是无限的,而不是有限的;
②不是简单随机抽样,因为它是放回抽样;
③不是简单随机抽样,因为这是“一次性”抽取,而不是“逐个”抽取;
④不是简单随机抽样,因为指定个子最高的5名同学是56名同学中特指的,不存在随机性,不是等可能抽样.12345123455.某地有2 000人参加自学考试,为了了解他们的成绩,从中抽取一个样本,若每个考生被抽到的概率都是0.04,则这个样本的容量是______.80课堂小结KETANGXIAOJIE1.简单随机抽样是一种简单、基本、不放回的抽样方法,常用的简单随机抽样方法有抽签法和随机数法.
2.抽签法的优点是简单易行,缺点是当总体的容量大时,费时、费力,并且标号的签不易搅拌均匀,这样会导致抽样不公平;随机数法的优点也是简单易行,缺点是当总体容量大时,编号不方便.两种方法只适合总体容量较少的抽样类型.
3.简单随机抽样每个个体入样的可能性都相等,均为 ,但要将每个个体入样的可能性与第n次抽取时每个个体入样的可能性区分开,避免在解题中出现错误.2.1.2 系统抽样
2.1.3 分层抽样
学习目标 1.理解并掌握系统抽样、分层抽样.2.会用系统抽样、分层抽样从总体中抽取样本.3.理解三种抽样的区别与联系.
知识点一 系统抽样
1. 定义:要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.
2.步骤
(1)先将总体的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
(2)确定分段间隔k,对编号进行分段.当(n是样本容量)是整数时,取k=;当不是整数时,先从总体中随机剔除几个个体,再重新编号, 然后分段;
(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
知识点二 分层抽样
1.分层抽样的定义
当总体是由差异明显的几个部分组成时,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
分层抽样尽量利用了调查者对调查对象(总体)事先所掌握的各种信息,并充分考虑了保持样本结构与总体结构的一致性,这对提高样本的代表性是非常重要的.
2.分层抽样的实施步骤
第一步,按某种特征将总体分成若干部分(层).
第二步,计算抽样比.抽样比=.
第三步,各层抽取的个体数=各层总的个体数×抽样比.
第四步,依各层抽取的个体数,按简单随机抽样从各层抽取样本.
第五步,综合每层抽样,组成样本.
1.系统抽样和分层抽样都是等可能抽样.( √ )
2.系统抽样中,当总体容量不能被样本容量整除时,余数是几就剔除前几个数.( × )
3.分层抽样是按一定的比例从各层抽取个体组成样本的抽样.( √ )
4.系统抽样在第一段抽样时,采用简单随机抽样.( √ )
题型一 对系统抽样和分层抽样概念的理解
例1 (1)老师从全班50名同学中抽取学号为3,13,23,33,43的五名同学了解学习情况,其最可能用到的抽样方法为(  )
A.简单随机抽样 B.抽签法
C.随机数法 D.系统抽样
(2)某中学有老年教师20人,中年教师65人,青年教师95人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是(  )
A.抽签法 B.系统抽样
C.分层抽样 D.随机数法
答案 (1)D (2)C
解析 (1)从学号上看,相邻两号总是相差10,符合系统抽样的特征.
(2)由于老年人、中年人和青年人的身体情况会有明显的差异,所以要用分层抽样.故选C.
反思感悟 1.系统抽样的判断方法
(1)首先看是否在抽样前知道总体是由什么组成,多少个个体.
(2)再看是否将总体分成几个均衡的部分,并在每一个部分中进行简单随机抽样.
(3)最后看是否等距抽样.
2.使用分层抽样的前提
分层抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.
跟踪训练1 (1)某商场欲通过检查部分发票及销售记录来快速估计每月的销售金额,采用如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序将65号,115号,165号,…发票上的销售金额组成一个调查样本.这种抽取样本的方法是(  )
A.抽签法 B.随机数法
C.系统抽样 D.以上都不对
(2)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等可能抽样,必须进行(  )
A.每层等可能抽样
B.每层可以不等可能抽样
C.所有层按同一抽样比等可能抽样
D.所有层抽取个体数量相同
答案 (1)C (2)C
解析 (1)上述抽样方法是将发票平均分成若干组,每组50张,从第一组抽出了15号,以后各组抽15+50n(n∈N*)号,符合系统抽样的特点.
(2)保证每个个体等可能的被抽取是三种基本抽样方式的共同特征,为了保证这一点,分层抽样时必须在所有层都按同一抽样比等可能抽样.
题型二 系统抽样的应用
例2 为了了解参加某种知识竞赛的1 000名学生的成绩,从中抽取一个容量为50的样本,那么采用什么抽样方法比较恰当?简述抽样过程.
解 适宜选用系统抽样,抽样过程如下:
(1)随机地将这1 000名学生编号为1,2,3,…,1000.
(2)将总体按编号顺序均分成50个部分,每部分包括20个个体.
(3)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码l.
(4)以l为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:l,l+20,l+40,…,l+980.
反思感悟 当总体容量能被样本容量整除时,分段间隔k=,样本编号相差k的整数倍;系统抽样过程中可能会与其他抽样方法结合使用,通常不单独运用.
跟踪训练2 现有60瓶牛奶,编号为1至60,若从中抽取6瓶检验,用系统抽样方法确定所抽取的编号可能为(  )
A.3,13,23,33,43,53
B.2,14,26,38,42,56
C.5,8,31,36,48,54
D.5,10,15,20,25,30
答案 A
解析 因为60瓶牛奶分别编号为1至60,所以把它们依次分成6组,每组10瓶,要从中抽取6瓶检验,用系统抽样方法进行抽样.若在第一组抽取的编号为n(1≤n≤10),则所抽取的编号应为n,n+10,…,n+50.对照4个选项,只有A项符合系统抽样.系统抽样的显著特点之一就是“等距抽样”.因此,对于本题只要求出抽样的间隔k==10,就可判断结果.
题型三 分层抽样的应用
例3 某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层抽样的方法抽取,写出抽样过程.
解 抽样过程如下:
第一步,确定抽样比,样本容量与总体容量的比为=.
第二步,确定分别从三类人员中抽取的人数,从行政人员中抽取16×=2(人);
从教师中抽取112×=14(人);
从后勤人员中抽取32×=4(人).
第三步,采用简单随机抽样的方法,抽取行政人员2人,教师14人,后勤人员4人.
第四步,把抽取的个体组合在一起构成所需样本.
反思感悟 在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体容量之比.
跟踪训练3 一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
解 用分层抽样来抽取样本,步骤如下:
(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.
(2)确定每层抽取个体的个数.抽样比为=,
则在不到35岁的职工中抽取125×=25(人);
在35岁至49岁的职工中抽取280×=56(人);
在50岁及50岁以上的职工中抽取95×=19(人).
(3)在各层分别按系统抽样或随机数法抽取样本.
(4)汇总每层抽样,组成样本.
需要剔除个体的系统抽样问题
典例 某校高中二年级有253名学生,为了了解他们的视力情况,准备按1∶5的比例抽取一个样本,试用系统抽样方法进行抽取,并写出过程.
解 (1)先把这253名学生编号为000,001,…,252.
(2)用随机数法任取3个号,从总体中剔除与这三个号对应的学生.
(3)把余下的250名学生重新编号1,2,3,…,250.
(4)分段.取分段间隔k=5,将总体均分成50段,每段含5名学生.
(5)从第一段即1~5号中用简单随机抽样抽取一个号作为起始号,如l.
(6)从后面各段中依次取出l+5,l+10,l+15,…,l+245这49个号.这样就按1∶5的比例抽取了一个样本容量为50的样本.
[素养评析] (1)实施步骤
①当总体容量不能被样本容量整除时,要先从总体中随机剔除整除后余数个个体且必须是随机的,即每个个体被剔除的机会均等.剔除个体后使总体中剩余的总体容量能被样本容量整除.
②剔除个体后需对样本重新编号.
③起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.
(2)系统抽样是收集数据的一种重要方法,是整理数据、提取信息、构建模型、进行推断的基础,是培养学生数学核心素养的重要内容.

1.检测员每10分钟从匀速传递的新产品生产流水线上抽取一件新产品进行某项指标检测,这样的抽样方法是(  )
A.系统抽样法 B.抽签法
C.随机数法 D.其他抽样方法
答案 A
解析 根据系统抽样法的定义和性质进行判断即可.
2.下列问题中,最适合用分层抽样抽取样本的是(  )
A.从10名同学中抽取3人参加座谈会
B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本
C.从1 000名工人中,抽取100名调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
答案 B
解析 A中总体个体无明显差异且个数较少,适合用简单随机抽样;C和D中总体个体无明显差异且个数较多,适合用系统抽样;B中总体个体差异明显,适合用分层抽样.
3.为了解1 200名学生对学校食堂饭菜的意见,打算从中抽取一个样本容量为40的样本,考虑采用系统抽样,则分段间隔k为(  )
A.10 B.20
C.30 D.40
答案 C
解析 分段间隔k==30.
4.某班级有50名学生,现要采用系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号为1~50号,并均匀分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为________的学生.
答案 37
解析 因为12=5×2+2,所以第n组中抽得号码为5(n-1)+2的学生.所以第八组中抽得号码为5×7+2=37的学生.
5.一批产品中有一级品100个,二级品60个,三级品40个,分别用系统抽样法和分层抽样法从这批产品中抽取一个容量为20的样本.
解 系统抽样法:将200个产品编号为1~200,然后将编号分成20个部分,在第1部分中用简单随机抽样法抽取1个编号.如抽到5号,那么得到编号为5,15,25,…,195的个体,即可得到所需样本.
分层抽样法:因为100+60+40=200,
所以=,
所以100×=10,60×=6,40×=4.
因此在一级品、二级品和三级品中分别抽取10个,6个和4个,即可得到所需样本.
1.系统抽样有以下特点:
(1)适用于总体容量较大的情况;
(2)剔除多余个体及第一段抽样都要用简单随机抽样,因而与简单随机抽样有密切联系;
(3)是等可能抽样,每个个体被抽到的可能性都是;
(4)是不放回抽样.
在抽样时,只要第一段抽取的个体确定了,后面各段中要抽取的个体依照事先确定好的规律就自动地被抽出,因此简单易行.
2.总体容量小,用简单随机抽样;总体容量大,用系统抽样;总体差异明显,用分层抽样.在实际抽样中,为了使样本具有代表性,通常要同时使用几种抽样方法.
一、选择题
1.为了了解某地参加计算机水平测试的5 008名学生的成绩,从中抽取了200名学生的成绩进行统计分析,运用系统抽样方法抽取样本时,每组的容量为(  )
A.24 B.25
C.26 D.28
答案 B
解析 5 008除以200的整数商为25,故选B.
2.我国古代数学名著《九章算术》中有如下问题“今有北乡算八千七百五十八,西乡算七千二百三十六,南乡算八千三百五十六,凡三乡,发役三百七十八人,欲以算数多少出之,问各几何?”意思是:北乡有8 758人,西乡有7 236人,南乡有8 356人,现要按人数多少从三乡共征集378人,问从各乡征集多少人?在上述问题中,需从西乡征集的人数是(  )
A.102 B.112 C.130 D.136
答案 B
解析 因为北乡有8 758人,西乡有7 236人,南乡有8 356人,现要按人数多少从三乡共征集378人,
故需从西乡征集的人数是378×≈112.
3.将A,B,C三种性质的个体按1∶2∶4的比例进行分层抽样调查,若抽取的样本容量为21,则A,B,C三种性质的个体分别抽取(  )
A.12,6,3 B.12,3,6
C.3,6,12 D.3,12,6
答案 C
解析 由分层抽样的概念,知A,B,C三种性质的个体应分别抽取21×=3,21×=6,21×=12.
4.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为(  )
A.100 B.150
C.200 D.250
答案 A
解析 由题意得,=,解得n=100,故选A.
5.要完成下列3项抽样调查:
①从15瓶饮料中抽取5瓶进行食品卫生检查.
②某校报告厅有25排,每排有38个座位,有一次报告会恰好坐满了学生,报告会结束后,为了听取意见,需要抽取25名学生进行座谈.
③某中学共有240名教职工,其中一般教师180名,行政人员24名,后勤人员36名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
较为合理的抽样方法是(  )
A.①简单随机抽样,②系统抽样,③分层抽样
B.①简单随机抽样,②分层抽样,③系统抽样
C.①系统抽样,②简单随机抽样,③分层抽样
D.①分层抽样,②系统抽样,③简单随机抽样
答案 A
解析 由抽样方法的特点可知,①应用简单随机抽样,②应用系统抽样,③应用分层抽样较为合理.故选A.
6.从已编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取的5枚导弹的编号可能是(  )
A.5,10,15,20,25 B.3,13,23,33,43
C.1,2,3,4,5 D.2,4,6,16,32
答案 B
解析 用系统抽样的方法抽取到的导弹编号应该是k,k+d,k+2d,k+3d,k+4d,其中d==10,k是从1到10中用简单随机抽样方法得到的数,因此只有选项B满足要求,故选B.
7.某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法抽取4个班进行调查,若抽到的编号之和为48,则抽到的最小编号为(  )
A.2 B.3 C.4 D.5
答案 B
解析 由题意得系统抽样的抽样间隔为=6.设抽到的最小编号为x,则x+(6+x)+(12+x)+(18+x)=48,所以x=3,故选B.
8.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300,现在按的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为(  )
A.8 B.11 C.16 D.10
答案 A
解析 若设高三学生数为x,则高一学生数为,高二学生数为+300,所以有x+++300=3 500,解得x=1 600.故高一学生数为800,因此应抽取高一学生数为=8.
9.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为(  )
A.26,16,8 B.25,17,8
C.25,16,9 D.24,17,9
答案 B
解析 由题意知间隔为=12,故抽到的号码为12k+3(k=0,1,…,49),列出不等式可解得:第Ⅰ营区抽取25人,第Ⅱ营区抽取17人,第Ⅲ营区抽取8人.
二、填空题
10.一个总体的60个个体的编号为0,1,2,…,59,现要从中抽取一个容量为10的样本,请根据编号按被6除余3的方法,取足样本,则抽取的样本号码是________.
答案 3,9,15,21,27,33,39,45,51,57
解析 由题意,设抽取样本的编号为6n+3,则3≤6n+3≤59,且n∈N,所以n=0,1,2,3,4,5,6,7,8,9,相应的编号依次为3,9,15,21,27,33,39,45,51,57.
11.某单位有职工72人,现需用系统抽样法从中抽取一个样本,若样本容量为n,则不需要剔除个体,若样本容量为n+1,则需剔除2个个体,则n=________.
答案 4或6或9
解析 由题意知n为72的约数,n+1为70的约数,其中72的约数有1,2,3,4,6,8,9,12,18,24,36,72,其中加1能被70整除的有1,4,6,9,其中n=1不符合题意,故n=4或6或9.
12.某公司生产三种型号的轿车,产量分别为1 200辆,6 000辆和2 000辆.为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取的辆数为________.
答案 6,30,10
解析 设三种型号的轿车依次抽取x辆,y辆,z辆,
则有
解得
三、解答题
13.为了对某课题进行研究,分别从A,B,C三所高校中用分层抽样法抽取若干名教授组成研究小组,其中高校A有m名教授,高校B有72名教授,高校C有n名教授(其中0<m≤72≤n).
(1)若A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,求m,n;
(2)若高校B中抽取的教授总数是高校A和C中抽取的教授总数的,求三所高校的教授的总人数.
解 (1)∵0<m≤72≤n,A,B两所高校中共抽取3名教授,∴B高校中抽取2人,
∴A高校中抽取1人,C高校中抽取3人,
∴==,解得m=36,n=108.
(2)∵高校B中抽取的教授数是高校A和C中抽取的教授数的,
∴(m+n)=72,解得m+n=108,
∴三所高校的教授的总人数为m+n+72=180.
14.问题:①有1 000个乒乓球分别装在3个箱子内,其中红色箱子内有500个,蓝色箱子内有200个,黄色箱子内有300个,现从中抽取一个容量为100的样本;
②从20名学生中选出3名参加座谈会.
方法:Ⅰ.简单随机抽样;Ⅱ.系统抽样;Ⅲ.分层抽样.其中问题与方法能配对的是(  )
A.①Ⅰ,②Ⅱ B.①Ⅲ,②Ⅰ
C.①Ⅱ,②Ⅲ D.①Ⅲ,②Ⅱ
答案 B
解析 对于①,由于箱子颜色差异较为明显,可采用分层抽样方法抽取样本;对于②,由于总体容量、样本容量都较小,宜采用简单随机抽样.
15.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,第5组抽取的号码为22,第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.
答案 37 20
解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取的号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x人,则=,解得x=20.
课件34张PPT。2.1.2 系统抽样
2.1.3 分层抽样第二章 §2.1 随机抽样学习目标XUEXIMUBIAO1.理解并掌握系统抽样、分层抽样.
2.会用系统抽样、分层抽样从总体中抽取样本.
3.理解三种抽样的区别与联系.NEIRONGSUOYIN内容索引自主学习题型探究达标检测1自主学习PART ONE知识点一 系统抽样
1.定义:要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.
2.步骤
(1)先将总体的N个个体 .有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;编号分段随机重新编号(3)在第1段用 确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l 得到第2个个体编号 ,再加 得到第3个个体编号 ,依次进行下去,直到获取整个样本.简单随机抽样加上间隔k(l+k)(l+2k)k知识点二 分层抽样
1.分层抽样的定义
当总体是由 的几个部分组成时,在抽样时,将总体分成_________
的层,然后按照 ,从各层 地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做 .
分层抽样尽量利用了调查者对调查对象(总体)事先所掌握的各种信息,并充分考虑了保持 与 的一致性,这对提高样本的代表性是非常重要的.差异明显一定的比例独立互不交叉分层抽样样本结构总体结构2.分层抽样的实施步骤
第一步,按某种特征将总体分成若干部分(层).
第二步,计算抽样比.抽样比= .
第三步,各层抽取的个体数=各层总的个体数×抽样比.
第四步,依各层抽取的个体数,按简单随机抽样从各层抽取样本.
第五步,综合每层抽样,组成样本.1.系统抽样和分层抽样都是等可能抽样.(  )
2.系统抽样中,当总体容量不能被样本容量整除时,余数是几就剔除前几个数.(  )
3.分层抽样是按一定的比例从各层抽取个体组成样本的抽样.(  )
4.系统抽样在第一段抽样时,采用简单随机抽样.(  )思考辨析 判断正误SIKAOBIANXIPANDUANZHENGWU√×√√2题型探究PART TWO题型一 对系统抽样和分层抽样概念的理解例1 (1)老师从全班50名同学中抽取学号为3,13,23,33,43的五名同学了解学习情况,其最可能用到的抽样方法为
A.简单随机抽样 B.抽签法
C.随机数法 D.系统抽样√解析 从学号上看,相邻两号总是相差10,符合系统抽样的特征.(2)某中学有老年教师20人,中年教师65人,青年教师95人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是
A.抽签法 B.系统抽样
C.分层抽样 D.随机数法√解析 由于老年人、中年人和青年人的身体情况会有明显的差异,所以要用分层抽样.故选C.反思感悟 
1.系统抽样的判断方法
(1)首先看是否在抽样前知道总体是由什么组成,多少个个体.
(2)再看是否将总体分成几个均衡的部分,并在每一个部分中进行简单随机抽样.
(3)最后看是否等距抽样.
2.使用分层抽样的前提
分层抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.跟踪训练1 (1)某商场欲通过检查部分发票及销售记录来快速估计每月的销售金额,采用如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序将65号,115号,165号,…发票上的销售金额组成一个调查样本.这种抽取样本的方法是
A.抽签法 B.随机数法
C.系统抽样 D.以上都不对√解析 上述抽样方法是将发票平均分成若干组,每组50张,从第一组抽出了15号,以后各组抽15+50n(n∈N*)号,符合系统抽样的特点.(2)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等可能抽样,必须进行
A.每层等可能抽样
B.每层可以不等可能抽样
C.所有层按同一抽样比等可能抽样
D.所有层抽取个体数量相同√解析 保证每个个体等可能的被抽取是三种基本抽样方式的共同特征,为了保证这一点,分层抽样时必须在所有层都按同一抽样比等可能抽样.解 适宜选用系统抽样,抽样过程如下:
(1)随机地将这1 000名学生编号为1,2,3,…,1000.
(2)将总体按编号顺序均分成50个部分,每部分包括20个个体.
(3)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码l.
(4)以l为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:l,l+20,l+40,…,l+980.题型二 系统抽样的应用例2 为了了解参加某种知识竞赛的1 000名学生的成绩,从中抽取一个容量为50的样本,那么采用什么抽样方法比较恰当?简述抽样过程.反思感悟 当总体容量能被样本容量整除时,分段间隔k= ,样本编号相差k的整数倍;系统抽样过程中可能会与其他抽样方法结合使用,通常不单独运用.跟踪训练2 现有60瓶牛奶,编号为1至60,若从中抽取6瓶检验,用系统抽样方法确定所抽取的编号可能为
A.3,13,23,33,43,53 B.2,14,26,38,42,56
C.5,8,31,36,48,54 D.5,10,15,20,25,30√解析 因为60瓶牛奶分别编号为1至60,所以把它们依次分成6组,每组10瓶,要从中抽取6瓶检验,用系统抽样方法进行抽样.若在第一组抽取的编号为n(1≤n≤10),则所抽取的编号应为n,n+10,…,n+50.对照4个选项,只有A项符合系统抽样.系统抽样的显著特点之一就是“等距抽样”.因此,对于本题只要求出抽样的间隔k= =10,就可判断结果.题型三 分层抽样的应用例3 某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层抽样的方法抽取,写出抽样过程.解 抽样过程如下:第三步,采用简单随机抽样的方法,抽取行政人员2人,教师14人,后勤人员4人.
第四步,把抽取的个体组合在一起构成所需样本.反思感悟 在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体容量之比.跟踪训练3 一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?解 用分层抽样来抽取样本,步骤如下:
(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.(3)在各层分别按系统抽样或随机数法抽取样本.
(4)汇总每层抽样,组成样本.核心素养之数据分析HEXINSUYANGZHISHUJUFENXI需要剔除个体的系统抽样问题典例 某校高中二年级有253名学生,为了了解他们的视力情况,准备按1∶5的比例抽取一个样本,试用系统抽样方法进行抽取,并写出过程.解 (1)先把这253名学生编号为000,001,…,252.
(2)用随机数法任取3个号,从总体中剔除与这三个号对应的学生.
(3)把余下的250名学生重新编号1,2,3,…,250.
(4)分段.取分段间隔k=5,将总体均分成50段,每段含5名学生.
(5)从第一段即1~5号中用简单随机抽样抽取一个号作为起始号,如l.
(6)从后面各段中依次取出l+5,l+10,l+15,…,l+245这49个号.这样就按1∶5的比例抽取了一个样本容量为50的样本.素养评析 (1)实施步骤
①当总体容量不能被样本容量整除时,要先从总体中随机剔除整除后余数个个体且必须是随机的,即每个个体被剔除的机会均等.剔除个体后使总体中剩余的总体容量能被样本容量整除.
②剔除个体后需对样本重新编号.
③起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.
(2)系统抽样是收集数据的一种重要方法,是整理数据、提取信息、构建模型、进行推断的基础,是培养学生数学核心素养的重要内容.3达标检测PART THREE1.检测员每10分钟从匀速传递的新产品生产流水线上抽取一件新产品进行某项指标检测,这样的抽样方法是
A.系统抽样法 B.抽签法
C.随机数法 D.其他抽样方法√12345解析 根据系统抽样法的定义和性质进行判断即可.2.下列问题中,最适合用分层抽样抽取样本的是
A.从10名同学中抽取3人参加座谈会
B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低
收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为
100的样本
C.从1 000名工人中,抽取100名调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量解析 A中总体个体无明显差异且个数较少,适合用简单随机抽样;
C和D中总体个体无明显差异且个数较多,适合用系统抽样;
B中总体个体差异明显,适合用分层抽样.12345√3.为了解1 200名学生对学校食堂饭菜的意见,打算从中抽取一个样本容量为40的样本,考虑采用系统抽样,则分段间隔k为
A.10 B.20
C.30 D.40√12345123454.某班级有50名学生,现要采用系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号为1~50号,并均匀分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为______的学生.37解析 因为12=5×2+2,所以第n组中抽得号码为5(n-1)+2的学生.所以第八组中抽得号码为5×7+2=37的学生.123455.一批产品中有一级品100个,二级品60个,三级品40个,分别用系统抽样法和分层抽样法从这批产品中抽取一个容量为20的样本.解 系统抽样法:将200个产品编号为1~200,然后将编号分成20个部分,在第1部分中用简单随机抽样法抽取1个编号.如抽到5号,那么得到编号为5,15,25,…,195的个体,即可得到所需样本.12345因此在一级品、二级品和三级品中分别抽取10个,6个和4个,即可得到所需样本.课堂小结KETANGXIAOJIE1.系统抽样有以下特点:
(1)适用于总体容量较大的情况;
(2)剔除多余个体及第一段抽样都要用简单随机抽样,因而与简单随机抽样有密切联系;
(3)是等可能抽样,每个个体被抽到的可能性都是 ;
(4)是不放回抽样.
在抽样时,只要第一段抽取的个体确定了,后面各段中要抽取的个体依照事先确定好的规律就自动地被抽出,因此简单易行.
2.总体容量小,用简单随机抽样;总体容量大,用系统抽样;总体差异明显,用分层抽样.在实际抽样中,为了使样本具有代表性,通常要同时使用几种抽样方法.§2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布
第1课时 频率分布直方图
学习目标 1.学会用频率分布表,画频率分布直方图表示样本数据.2.能通过频率分布表或频率分布直方图对数据做出总体统计.
知识点一 数据分析的基本方法
1.借助于图形
分析数据的一种基本方法是用图将它们画出来,此方法可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.
2.借助于表格
分析数据的另一种方法是用紧凑的表格改变数据的排列方式,此方法是通过改变数据的构成形式,为我们提供解释数据的新方式.
知识点二 频率分布表与频率分布直方图
频率分布直方图的画法
思考 要做频率分布表,需要对原始数据做哪些工作?
答案 分组,频数累计,计算频数和频率.
1.频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.
( √ )
2.频率分布直方图中小长方形的面积表示该组的个体数.( × )
3.频率分布直方图中所有小长方形面积之和为1.( √ )
题型一 频率分布概念的理解
例1 一个容量为100的样本,其数据的分组与各组的频数如下:
分组
[0,10)
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70]
频数
12
13
24
15
16
13
7
则样本数据落在[10,40)上的频率为(  )
A.0.13 B.0.39
C.0.52 D.0.64
答案 C
解析 由题意可知频数在[10,40)的有13+24+15=52(个),所以频率为=0.52.故选C.
反思感悟 频率分布是指一个样本数据在各个小范围内所占比例的大小.
跟踪训练1 容量为100的某个样本,数据拆分为10组,若前七组频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最大的一组频率为________.
答案 0.12
解析 设剩下的三组中频率最大的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1,而由频率和为1得0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.
题型二 频率分布直方图的绘制
例2 一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6
5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8
6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5
6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4
6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4
6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6
5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0
5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7
5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0
6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.
解 (1)计算极差:7.4-4.0=3.4.
(2)决定组距与组数:
若取组距为0.3,因为≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.
(3)决定分点:
使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.
(4)列频率分布表:
分组
频数
频率
[3.95,4.25)
1
0.01
[4.25,4.55)
1
0.01
[4.55,4.85)
2
0.02
[4.85,5.15)
5
0.05
[5.15,5.45)
11
0.11
[5.45,5.75)
15
0.15
[5.75,6.05)
28
0.28
[6.05,6.35)
13
0.13
[6.35,6.65)
11
0.11
[6.65,6.95)
10
0.10
[6.95,7.25)
2
0.02
[7.25,7.55]
1
0.01
合计
100
1.00
(5)绘制频率分布直方图如图.
从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm之间的麦穗约占41%.
反思感悟 绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.
跟踪训练2 如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).
区间界限
[122,126)
[126,130)
[130,134)
[134,138)
[138,142)
人数
5
8
10
22
33
区间界限
[142,146)
[146,150)
[150,154)
[154,158]
人数
20
11
6
5
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计身高小于134 cm的人数占总人数的百分比.
解 (1)样本频率分布表如下:
分组
频数
频率
[122,126)
5
0.04
[126,130)
8
0.07
[130,134)
10
0.08
[134,138)
22
0.18
[138,142)
33
0.28
[142,146)
20
0.17
[146,150)
11
0.09
[150,154)
6
0.05
[154,158]
5
0.04
合计
120
1.00
(2)其频率分布直方图如下:
(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.
频率分布直方图的应用
典例 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:
组号
分组
频数
1
[0,2)
6
2
[2,4)
8
3
[4,6)
17
4
[6,8)
22
5
[8,10)
25
6
[10,12)
12
7
[12,14)
6
8
[14,16)
2
9
[16,18]
2
合计
100
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;
(2)求频率分布直方图中的a,b的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).
解 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),
所以样本中的学生一周课外阅读时间少于12小时的频率是1-=0.9.
故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.
(2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a===0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,
所以b===0.125.
(3)样本中的100名学生该周课外阅读时间的平均数在第4组.
[素养评析] (1)在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.
(2)数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理,分析和推断,形成关于研究对象知识的素养,这里的频率分布直方图的应用,就是根据整理的数据,进行推断,是重要的数学素养.
1.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8,其累计频率为0.4,则这个样本的容量是(  )
A.20 B.40
C.70 D.80
答案 A
解析 由已知不超过70分的人数为8,累计频率为0.4,则这个样本容量n==20.故选A.
2.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为(  )
A.20 B.30
C.40 D.50
答案 B
解析 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.
3.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是________.
答案 21
解析 根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.
∵样本中数据在[20,60)内的频率为0.6,样本容量为50,
∴=0.6,
解得x+y=21.
即样本在[40,50),[50,60)内的数据个数之和为21.
4.某校100名学生的数学测试成绩频率分布直方图如图所示,分数不低于a(a为整数)即为优秀,如果优秀的人数为20人,则a的估计值是________.
答案 133
解析 由已知可以判断a∈(130,140),所以[(140-a)×0.015+0.01×10]×100=20.解得a≈133.
5.为了解今年某校高三毕业班准备报考飞行员学生的体重(单位:千克)情况,将所得的数据整理后,画出了频率分布直方图,如图所示,已知图中从左到右的前三个小组的频率之比为1∶2∶3,其中第2小组的频数为12.则该校报考飞行员的总人数为________.
答案 48
解析 设报考飞行员的总人数为n,
设第一小组的频率为a,则有a+2a+3a+(0.013+0.037)×5=1,解得a=0.125,
所以第2小组的频率为0.25.
又第2小组的频数为12,
则有0.25=,所以n=48.
1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.
一、选择题
1.从一堆苹果中任取10个,称得它们的质量如下(单位:克):125 120 122 105 130 114 116 95 120 134
则样本数据落在[114.5,124.5)内的频率为(  )
A.0.2 B.0.3
C.0.4 D.0.5
答案 C
解析 在125,120,122,105,130,114,116,95,120,134这10个数字中,落在[114.5,124.5)内的有116,120,120,122,共4个,
∴样本数据落在[114.5,124.5)内的频率为=0.4.故选C.
2.容量为100的样本数据,按从小到大的顺序分为8组,如下表:
组号
1
2
3
4
5
6
7
8
频数
10
13
x
14
15
13
12
9
第三组的频数和频率分别是(  )
A.14和0.14 B.0.14和14
C.和0.14 D.和
答案 A
解析 x=100-(10+13+14+15+13+12+9)=100-86=14,第三组的频率为=0.14.
3.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出(单位:元)在[50,60]内的学生有30人,则n的值为(  )
A.100 B.1 000
C.90 D.900
答案 A
解析 由题意可知,
前三组的频率之和为(0.01+0.024+0.036)×10=0.7,
∴支出在[50,60]内的频率为1-0.7=0.3,
∴n==100.
4.某调查机构调查了某地100个新生婴儿的体重,并根据所得数据画出了样本的频率分布直方图(如图所示),则这100个新生婴儿中,体重(单位:kg)在[3.2,4.0)内的人数是(  )
A.30 B.40
C.50 D.55
答案 B
解析 在频率分布直方图中小长方形的面积为频率.
在[3.2,3.6)内的频率为0.625×0.4=0.25,
频数为0.25×100=25,
在[3.6,4.0)内的频率为0.375×0.4=0.15,
频数为0.15×100=15.
则这100个新生婴儿中,
体重在[3.2,4.0)内的有25+15=40(人).
故选B.
5.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速在[50,60)内的汽车有(  )
A.30辆 B.40辆
C.60辆 D.80辆
答案 C
解析 因为小长方形的面积即为对应的频率,
时速在[50,60)内的频率为0.3,
所以有200×0.3=60(辆).
6.对某种电子元件使用寿命跟踪调查,所得样本频率分布直方图如图.由图可知,这一批电子元件中寿命在100~300 h的电子元件的数量与寿命在300~600 h的电子元件的数量的比是(  )
A.1∶2 B.1∶3
C.1∶4 D.1∶6
答案 C
解析 由题意,知数量的比即为所对应的小矩形的面积和之比,即1∶4.
7.为了解某幼儿园儿童的身高情况,抽查该园120名儿童的身高绘制成如图所示的频率分布直方图,则抽查的120名儿童中身高大于或等于98 cm且小于104 cm的有(  )
A.90名 B.75名 C.65名 D.40名
答案 A
解析 由图可知身高大于或等于98 cm且小于104 cm的儿童的频率为(0.1+0.15+0.125)×2=0.75,抽查的120名儿童中有120×0.75=90(名)儿童的身高大于或等于98 cm且小于104 cm.
8.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n的值为(  )
A.20 B.27 C.6 D.60
答案 D
解析 ∵n·=27,
∴n=60.
9.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为(  )
A.588 B.480
C.450 D.120
答案 B
解析 ∵少于60分的学生人数为600×(0.05+0.15)=120,
∴不少于60分的学生人数为480.
二、填空题
10.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.则频率分布直方图中x的值为 __________.
答案 0.004 4
解析 ∵(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,
∴x=0.004 4.
11.已知某一段公路限速70千米/时,现抽取400辆通过这一段公路的汽车的速度,其频率分布直方图如图所示,则这400辆汽车中在该路段超速的有________辆.
答案 80
解析 [70,80]内的频率为1-(0.01×10+0.03×10+0.04×10)=0.2,
∴[70,80]内的频数为0.2×400=80.
三、解答题
12.为加强中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解成绩情况,从中抽取50名学生的成绩(得分均为整数,满分为100分)进行统计,请你根据尚未完成的频率分布表解答下列问题:
分组
频数
频率

[60.5,70.5)
a
0.26

[70.5,80.5)
15
c

[80.5,90.5)
18
0.36

[90.5,100.5]
b
d
合计
50
e
(1)求a,b,c,d,e的值;
(2)作出频率分布直方图.
解 (1)根据题意,得分在[60.5,70.5)内的频数是a=50×0.26=13,在[90.5,100.5]内的频数是b=50-13-15-18=4,在[70.5,80.5)内的频率是c==0.30,在[90.5,100.5]内的频率是d==0.08,频率和e=1.00.
(2)根据频率分布表作出频率分布直方图,如图所示.
13.如图所示是总体的一个样本频率分布直方图,且在[15,18)内的频数为8.
(1)求样本在[15,18)内的频率;
(2)求样本容量;
(3)若在[12,15)内的小矩形面积为0.06,求在[18,33)内的频数.
解 由样本频率分布直方图可知组距为3.
(1)由样本频率分布直方图得样本在[15,18)内的频率等于×3=.
(2)∵样本在[15,18)内频数为8,
由(1)可知,样本容量为=8×=50.
(3)∵在[12,15)内的小矩形面积为0.06,
故样本在[12,15)内的频率为0.06,
故样本在[15,33)内的频数为50×(1-0.06)=47,
又在[15,18)内频数为8,
故在[18,33)内的频数为47-8=39.
14.为了解某地居民的月收入情况,一个社会调查机构调查了20 000人,并根据所得数据画出样本的频率分布直方图如图所示(最后一组包含两端值,其他组包含最小值,不包含最大值).现按月收入分层,用分层抽样的方法在这20 000人中抽出200人进一步调查,则月收入在[1 500,2 000)(单位:元)内的应抽取________人.
答案 40
解析 月收入在[1 500,2 000)的频率为1-(0.000 2+0.000 5×2+0.000 3+0.000 1)×500=0.2,故应抽取200×0.2=40(人).
15.如图是根据某中学为地震灾区捐款的情况而制作的统计图.已知该校在校学生3 000人,根据统计图计算该校共捐款________元.
答案 37 770
解析 根据统计图,得
高一人数为3 000×32%=960,
捐款960×15=14 400(元);
高二人数为3 000×33%=990,
捐款990×13=12 870(元);
高三人数为3 000×35%=1 050,
捐款1 050×10=10 500(元).
所以该校学生共捐款14 400+12 870+10 500=37 770(元).
课件33张PPT。第1课时 频率分布直方图第二章 2.2.1 用样本的频率分布估计总体分布学习目标XUEXIMUBIAO1.学会用频率分布表,画频率分布直方图表示样本数据.
2.能通过频率分布表或频率分布直方图对数据做出总体统计.NEIRONGSUOYIN内容索引自主学习题型探究达标检测1自主学习PART ONE知识点一 数据分析的基本方法1.借助于图形
分析数据的一种基本方法是用图将它们画出来,此方法可以达到两个目的,一是从数据中 信息,二是利用图形 信息.
2.借助于表格
分析数据的另一种方法是用紧凑的 改变数据的排列方式,此方法是通过改变数据的 ,为我们提供解释数据的新方式.提取传递表格构成形式频率分布直方图的画法知识点二 频率分布表与频率分布直方图最大值与最小值不小于k的最小整数左闭右开分数频数累计频数频率合计样本容量1频率/组距各小长方形的面积1思考 要做频率分布表,需要对原始数据做哪些工作?答案 分组,频数累计,计算频数和频率.1.频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.(  )
2.频率分布直方图中小长方形的面积表示该组的个体数.(  )
3.频率分布直方图中所有小长方形面积之和为1.(  )思考辨析 判断正误SIKAOBIANXIPANDUANZHENGWU√×√2题型探究PART TWO题型一 频率分布概念的理解例1 一个容量为100的样本,其数据的分组与各组的频数如下:解析 由题意可知频数在[10,40)的有13+24+15=52(个),所以频率为 =0.52.故选C.则样本数据落在[10,40)上的频率为
A.0.13 B.0.39 C.0.52 D.0.64√ 反思感悟 频率分布是指一个样本数据在各个小范围内所占比例的大小.跟踪训练1 容量为100的某个样本,数据拆分为10组,若前七组频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最大的一组频率为________.0.12解析 设剩下的三组中频率最大的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1,而由频率和为1得0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.题型二 频率分布直方图的绘制例2 一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):
6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6
5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8
6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5
6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4
6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4
6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6
5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0
5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7
5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0
6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.解 (1)计算极差:7.4-4.0=3.4.
(2)决定组距与组数:所以取组距为0.3,组数为12.
(3)决定分点:
使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频率分布表:(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm之间的麦穗约占41%.反思感悟 绘制频率分布直方图的注意事项
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.跟踪训练2 如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).(1)列出样本频率分布表;解 样本频率分布表如右:(2)画出频率分布直方图;解 其频率分布直方图如下:(3)估计身高小于134 cm的人数占总人数的百分比.解 由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.典例 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:核心素养之数据分析HEXINSUYANGZHISHUJUFENXI频率分布直方图的应用(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;解 根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),
所以样本中的学生一周课外阅读时间少于12小时的频率是1- =0.9.
故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)求频率分布直方图中的a,b的值;解 课外阅读时间落在[4,6)组内的有17人,频率为0.17,课外阅读时间落在[8,10)组内的有25人,频率为0.25,(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).解 样本中的100名学生该周课外阅读时间的平均数在第4组.素养评析 (1)在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.
(2)数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理,分析和推断,形成关于研究对象知识的素养,这里的频率分布直方图的应用,就是根据整理的数据,进行推断,是重要的数学素养.3达标检测PART THREE1.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8,其累计频率为0.4,则这个样本的容量是
A.20 B.40
C.70 D.80√解析 由已知不超过70分的人数为8,累计频率为0.4,123452.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为
A.20 B.30
C.40 D.50√解析 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.123453.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),
[50,60)内的数据个数之和是____.21解析 根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.
∵样本中数据在[20,60)内的频率为0.6,样本容量为50,12345解得x+y=21.
即样本在[40,50),[50,60)内的数据个数之和为21.4.某校100名学生的数学测试成绩频率分布直方图如图所示,分数不低于a(a为整数)即为优秀,如果优秀的人数为20人,则a的估计值是________.133解析 由已知可以判断a∈(130,140),所以[(140-a)×0.015+0.01×10]×100=20.解得a≈133.123455.为了解今年某校高三毕业班准备报考飞行员学生的体重(单位:千克)情况,将所得的数据整理后,画出了频率分布直方图,如图所示,已知图中从左到右的前三个小组的频率之比为1∶2∶3,其中第2小组的频数为12.则该校报考飞行员的总人数为_____.1234548解析 设报考飞行员的总人数为n,
设第一小组的频率为a,则有a+2a+3a+(0.013+0.037)×5=1,解得a=0.125,
所以第2小组的频率为0.25.
又第2小组的频数为12,课堂小结KETANGXIAOJIE1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.第2课时 频率分布折线图和茎叶图
学习目标 1.了解频率分布折线图和总体密度曲线的定义.2.理解茎叶图的概念,会画茎叶图.3.了解频率分布直方图、频率分布折线图、茎叶图的各自特征,学会选择不同的方法分析样本的分布,从而作出总体估计.
知识点一 频率分布折线图和总体密度曲线
1.频率分布折线图
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
2.总体密度曲线
在样本频率分布直方图中,随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线,它反映了总体在各个范围内取值的百分比.
知识点二 茎叶图
1.将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).
2.茎叶图的优点与不足
(1)优点:一是原始数据信息在图中能够保留,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.
(2)不足:当样本数据较多时,茎叶图就显得不太方便.
1.频率分布折线图就是总体密度曲线.( × )
2.对于两位数的茎叶图,中间的数字表示十位数,旁边的数字表示个位数.( √ )
3.对于三位数的茎叶图,中间的数字表示百位数,旁边的数字表示十位和个位数.( × )
4.茎叶图只可以分析单组数据,不能对两组数据进行比较.( × )
题型一 识读茎叶图
例1 甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示(单位:分),则甲班、乙班的最高成绩分别是________,从图中看,________班的平均成绩较高.
答案 96,92 乙
解析 由茎叶图知甲班的最高成绩为96分,乙班的最高成绩为92分,再根据茎叶图的分布特点知,乙班的成绩分布集中在下面,故乙班的平均成绩较高.
反思感悟 (1)当数据是两位数时,十位上的数字为“茎”,个位上的数字为“叶”;如果是三位数,通常把百位和十位部分作为“茎”,个位上的数字为“叶”;如果是小数,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据的特点合理地选择茎和叶.
(2)应用茎叶图对两组数据进行比较时,要从数据分布的对称性、稳定性等几方面来比较.
跟踪训练1 (1)如图所示,茎叶图表示某城市一台自动售货机在16天内的销售额情况(单位:元),图中的数字7表示的意义是这台自动售货机该天的销售额为(  )
A.7元 B.70元
C.27元 D.72元
(2)甲、乙两名同学12次考试中数学成绩的茎叶图如图所示,则下列说法正确的是(  )
A.甲同学比乙同学发挥稳定,且平均成绩也比乙同学高
B.甲同学比乙同学发挥稳定,但平均成绩比乙同学低
C.乙同学比甲同学发挥稳定,且平均成绩也比甲同学高
D.乙同学比甲同学发挥稳定,但平均成绩比甲同学低
答案 (1)C (2)C
解析 (1)茎表示十位数字,叶表示个位数字,所以7表示27.
(2)由茎叶图的性质可知乙同学比甲同学发挥稳定,且平均成绩比甲同学高.

题型二 茎叶图及其应用
命题角度1 茎叶图的绘制
例2 某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产量数据(单位:千克)如下:
品种A:
357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,
445,451,454.
品种B:
363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,
416,422,430.
(1)画出茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,得出统计结论.
解 (1)茎叶图如图.
(2)样本容量不大,画茎叶图很方便,此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息丢失,而且还可以随时记录新的数据.
(3)通过观察茎叶图可以看出:
①品种A亩产量的平均数比品种B亩产量的平均数大;
②品种A的亩产量波动比品种B的亩产量波动大,故品种A的亩产量稳定性较差.
反思感悟 (1)画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数.要先确定中间的数取数据的哪几位,填写数据时边读边填.比较数据时从数据分布的对称性、稳定性等几方面来比较.
(2)绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.
跟踪训练2 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:
甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
试制作茎叶图来对比描述这些数据.
解 以十位数字为茎,个位数字为叶,制作茎叶图如图:
命题角度2 茎叶图的应用
例3 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:62 73 81 92 95 85 74 64 53 76
78 86 95 66 97 78 88 82 76 89
B地区:73 83 62 51 91 46 53 73 64 82
93 48 65 81 74 56 54 76 65 79
根据两组数据作出两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).
解 两地区用户满意度评分的茎叶图如图:
通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.
反思感悟 茎叶图可保留原始数据,还可以通过叶的疏密情形,得到样本数据的分布离散情形.
跟踪训练3 某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
解 甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的;甲同学的得分情况除一个特殊得分外,也大致对称,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.
茎叶图与频率分布直方图的综合应用
典例 在某市的青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分布直方图都受到不同程度的破坏,可见部分如图所示,据此回答以下问题:
求参赛总人数和频率分布直方图中[80,90)矩形的高,并补全频率分布直方图.
解 由茎叶图知,分数在[50,60)的频数为2.
由频率分布直方图知,分数在[50,60)的频率为0.008×10=0.08,所以参赛总人数为=25.
所以分数在[80,90)的人数为25-2-7-10-2=4,
所以分数在[80,90)的频率为=0.16,
故频率分布直方图中[80,90)矩形的高为=0.016.
补全频率分布直方图,如图所示.
[素养评析] (1)茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录,但样本容量较大时,使用茎叶图就不合适;而频率分布表和频率分布直方图可以处理样本容量很大的数据,但损失了样本的原始数据,而且必须在完成抽样后才能制作.
(2)茎叶图和频率分布直方图都是用来整理数据的,根据整理的数据,提取信息,进行推断,获得结论,这是重要的数学素养之数据分析.
1.如果想用统计图来反映各数据的变化趋势,比较合适的统计图是(  )
A.条形图 B.折线图
C.扇形图 D.其他图形
答案 B
解析 能反映各数据的变化趋势的统计图是折线图.
2.如图是总体密度曲线,下列说法正确的是(  )
A.组距越大,频率分布折线图越接近于它
B.样本容量越小,频率分布折线图越接近于它
C.阴影部分的面积代表总体在(a,b)内取值的百分比
D.阴影部分的平均高度代表总体在(a,b)内取值的百分比
答案 C
3.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151)上的运动员人数是(  )
A.3 B.4 C.5 D.6
答案 B
解析 由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151)的运动员共有4组,故由系统抽样法知,共抽取4名.故选B.
4.从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm).根据数据估计(  )
A.甲种玉米比乙种玉米不仅长得高而且长得整齐
B.乙种玉米比甲种玉米不仅长得高而且长得整齐
C.甲种玉米比乙种玉米长得高但长势没有乙整齐
D.乙种玉米比甲种玉米长得高但长势没有甲整齐
答案 D
解析 由题干中的茎叶图可知,甲种玉米的株高集中在20 cm段,乙种玉米的株高集中在30 cm和40 cm段,则甲种玉米的平均株高小于乙种玉米的平均株高,但乙种玉米的株高较分散,故选D.
5.如图茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,则污损的数字是________.
答案 3
解析 设污损的叶对应的成绩是x,由茎叶图可得89×5=83+83+87+x+99,所以x=93,故污损的数字是3.
1.估计总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录;而频率分布表和频率分布直方图则损失了样本的原始信息,必须在完成抽样后才能制作.

一、选择题
1.下列关于茎叶图的叙述正确的是(  )
A.茎叶图可以展示未分组的原始数据,它与频率分布表以及频率分布直方图的处理方式不同
B.对于重复的数据,只算一个
C.茎叶图中的叶是“茎”十进制的上一级单位
D.制作茎叶图的程序是:第一步:画出茎;第二步:画出叶;第三步:将“叶子”任意排列
答案 A
2.当样本数据增加时,下列说法正确的是(  )
A.频率分布表不会变化
B.茎叶图不会变化
C.频率折线图不会变化
D.频率分布直方图变化不太大
答案 D
3.在茎叶图中比40大的数据的个数为(  )
A.1 B.4 C.3 D.5
答案 C
4.某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是(  )
A.5 B.4
C.3 D.2
答案 D
解析 去掉最低分87,去掉最高分94(假设x≤4),
则7×91=80×2+9+8+90×5+2+3+2+1+x,
∴x=2,符合题意.
同理可验证x>4不合题意.
5.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为(  )
A.0.2 B.0.4
C.0.5 D.0.6
答案 B
解析 依据茎叶图,在区间[22,30)内的频数为4,样本容量为10,故对应的频率为=0.4,故选B.
6.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知(  )
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分
答案 A
解析 从茎叶图上看,由于甲运动员的成绩多数集中在31以上,而乙运动员的成绩集中在12到29之间,所以甲运动员成绩较好.
7.给出如图所示的三幅统计图及四个命题:
①从折线统计图能看出世界人口的变化情况;
②2050年非洲人口将达到大约15亿;
③2050年亚洲人口比其他各洲人口的总和还要多;
④从1957年到2050年各洲中北美洲人口增长速度最慢.
其中命题正确的有(  )
A.①② B.①③
C.①④ D.②④
答案 B
解析 ①从折线统计图能看出世界人口的变化情况,故①正确;②从条形统计图中可得:2050年非洲人口大约将达到18亿,故②错误;③从扇形统计图中能够明显地得到结论:2050年亚洲人口比其他各洲人口的总和还要多,故③正确;④由题中三幅统计图并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故④错误.因此正确的命题有①③.故选B.
8.如图是2017年青年歌手大奖赛中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m,n均为数字0~9中的一个),在去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则有(  )
A.a1>a2
B.a1,a2的大小与m的值有关
C.a2>a1
D.a1,a2的大小与m,n的值有关
答案 A
解析 由题意知去掉一个最高分和一个最低分以后,两组数据都有五个数据,
代入数据可以求得
甲的平均分为a1=80+×(1+5+5+m+9)=84+,
乙的平均分为a2=80+×(1+2+4+4+7)=83.6,
∵m≥0,∴a1>a2.
9.某中学举行了一次“环保知识竞赛”活动.为了了解本次竞赛学生的成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)作为样本(样本容量为n)进行统计.按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出了频率分布直方图,并作出了分数的茎叶图(图中仅列出得分在[50,60),[90,100]的数据),如图.
则样本容量n和频率分布直方图中x,y的值分别为(  )
A.50,0.030,0.004 B.30,0.040,0.003
C.30,0.030,0.040 D.50,0.300,0.400
答案 A
解析 由题意可知,样本容量n==50,y==0.004,x=0.100-0.004-0.010-0.016-0.040=0.030.
二、填空题
10.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.
根据茎叶图判断________班的平均身高较高.
答案 乙
解析 由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间.因此乙班平均身高高于甲班.
11.如图所示是一个班的数学成绩的茎叶图,则优秀率(90分以上)是________,最低分是________.
答案 4% 51
解析 ∵总数为25,
∴优秀率为×100%=4%.
最低分是51.
12.从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图所示,则甲、乙两班的最高成绩分别是______,______.从图中看,________班的平均成绩较高.
答案 96 92 乙
解析 由茎叶图可知,甲班的最高分是96,乙班的最高分是92.甲班的成绩集中在(60,80)内,乙班的成绩集中在(70,90)内,故乙班的平均成绩较高.
三、解答题
13.甲、乙两个网站为了了解各自受欢迎的程度,分别随机选取了14天记录上午8:00~10:00间各自的点击量:
甲:73,24,58,72,64,38,66,70,20,41,55,67,8,25;
乙:12,37,21,5,54,52,61,45,19,6,19,36,42,14.
你能用哪些方法表示上面的数据?你认为甲、乙两个网站哪个更受欢迎?
解 方法一 列频数分布表如下:
点击量的范围
甲的频数
乙的频数
[0,10)
1
2
[10,20)
0
4
[20,30)
3
1
[30,40)
1
2
[40,50)
1
2
[50,60)
2
2
[60,70)
3
1
[70,80]
3
0
由频数分布表可以看出,甲网站的点击量多集中在[50,80]上,而乙网站的点击量多集中在[0,60)上,从数据的分布情况来看,甲网站更受欢迎.
方法二 画出茎叶图如图所示.
由茎叶图可以看出,甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方.从数据的分布情况来看,甲网站更受欢迎.
14.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图(如图)表示,据此估计该校上学期200名教师中,使用多媒体进行教学的次数在[15,25)内的人数.
解 由茎叶图,知抽取的20名教师中使用多媒体进行教学的次数在[15,25)内的人数为6,频率为,故200名教师中使用多媒体进行教学的次数在[15,25)内的人数为×200=60.
15.从甲、乙两个城市所有的自动售货机中随机抽取16台,记录了上午8∶00~11∶00之间各自的销售情况(单位:元):
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
试用纵坐标为频数的频数分布直方图与茎叶图的方式分别表示上面的数据,并简要说明各自的优点.
解 用频数分布直方图表示如图:
茎叶图如图,两竖线中间的数字表示甲、乙销售额的十位数,两边的数字表示甲、乙销售额的个位数.
可以看出频数分布直方图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;而用茎叶图表示有关数据,对数据的记录和表示都带来方便.
课件32张PPT。第2课时 频率分布折线图和茎叶图第二章 2.2.1 用样本的频率分布估计总体分布学习目标XUEXIMUBIAO1.了解频率分布折线图和总体密度曲线的定义.
2.理解茎叶图的概念,会画茎叶图.
3.了解频率分布直方图、频率分布折线图、茎叶图的各自特征,学会选择不同的方法分析样本的分布,从而作出总体估计.NEIRONGSUOYIN内容索引自主学习题型探究达标检测1自主学习PART ONE知识点一 频率分布折线图和总体密度曲线1.频率分布折线图
连接频率分布直方图中各小长方形 ,就得到频率分布折线图.
2.总体密度曲线
在样本频率分布直方图中,随着样本容量的增加,作图时所分的 增加,组距减小,相应的频率折线图会越来越接近于一条 ,统计中称这条光滑曲线为总体密度曲线,它反映了总体在各个范围内取值的百分比.上端的中点组数光滑曲线1.将所有两位数的十位数字作为 ,个位数字作为 ,茎相同者共用一个茎,茎按从 的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).
2.茎叶图的优点与不足
(1)优点:一是原始数据信息在图中能够保留,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.
(2)不足:当样本数据较多时,茎叶图就显得不太方便.知识点二 茎叶图茎小到大1叶1.频率分布折线图就是总体密度曲线.(  )
2.对于两位数的茎叶图,中间的数字表示十位数,旁边的数字表示个位数.
(  )
3.对于三位数的茎叶图,中间的数字表示百位数,旁边的数字表示十位和个位数.(  )
4.茎叶图只可以分析单组数据,不能对两组数据进行比较.(  )思考辨析 判断正误SIKAOBIANXIPANDUANZHENGWU√×××2题型探究PART TWO题型一 识读茎叶图例1 甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示(单位:分),则甲班、乙班的最高成绩分别是________,从图中看,________班的平均成绩较高.解析 由茎叶图知甲班的最高成绩为96分,乙班的最高成绩为92分,再根据茎叶图的分布特点知,乙班的成绩分布集中在下面,故乙班的平均成绩较高.96,92乙反思感悟 (1)当数据是两位数时,十位上的数字为“茎”,个位上的数字为“叶”;如果是三位数,通常把百位和十位部分作为“茎”,个位上的数字为“叶”;如果是小数,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据的特点合理地选择茎和叶.
(2)应用茎叶图对两组数据进行比较时,要从数据分布的对称性、稳定性等几方面来比较.跟踪训练1 (1)如图所示,茎叶图表示某城市一台自动售货机在16天内的销售额情况(单位:元),图中的数字7表示的意义是这台自动售货机该天的销售额为
A.7元 B.70元
C.27元 D.72元解析 茎表示十位数字,叶表示个位数字,所以7表示27.√(2)甲、乙两名同学12次考试中数学成绩的茎叶图如图所示,则下列说法正确的是
A.甲同学比乙同学发挥稳定,且平均成绩也比
乙同学高
B.甲同学比乙同学发挥稳定,但平均成绩比乙
同学低
C.乙同学比甲同学发挥稳定,且平均成绩也比甲同学高
D.乙同学比甲同学发挥稳定,但平均成绩比甲同学低解析 由茎叶图的性质可知乙同学比甲同学发挥稳定,且平均成绩比甲同学高.√例2 某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产量数据(单位:千克)如下:
品种A:
357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,
434,443,445,445,451,454.
品种B:
363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,
410,412,415,416,422,430.题型二 茎叶图及其应用多维探究命题角度1 茎叶图的绘制(1)画出茎叶图;解 茎叶图如图.(2)用茎叶图处理现有的数据,有什么优点?解 样本容量不大,画茎叶图很方便,此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息丢失,而且还可以随时记录新的数据.(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,得出统计结论.解 通过观察茎叶图可以看出:
①品种A亩产量的平均数比品种B亩产量的平均数大;
②品种A的亩产量波动比品种B的亩产量波动大,故品种A的亩产量稳定性较差.反思感悟 (1)画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数.要先确定中间的数取数据的哪几位,填写数据时边读边填.比较数据时从数据分布的对称性、稳定性等几方面来比较.
(2)绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.跟踪训练2 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:
甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
试制作茎叶图来对比描述这些数据.解 以十位数字为茎,个位数字为叶,制作茎叶图如图:例3 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:62 73 81 92 95 85 74 64 53 76
78 86 95 66 97 78 88 82 76 89
B地区:73 83 62 51 91 46 53 73 64 82
93 48 65 81 74 56 54 76 65 79
根据两组数据作出两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).命题角度2 茎叶图的应用解 两地区用户满意度评分的茎叶图如图:通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.反思感悟 茎叶图可保留原始数据,还可以通过叶的疏密情形,得到样本数据的分布离散情形.跟踪训练3 某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.解 甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的;甲同学的得分情况除一个特殊得分外,也大致对称,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.典例 在某市的青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分布直方图都受到不同程度的破坏,可见部分如图所示,据此回答以下问题:核心素养之数据分析HEXINSUYANGZHISHUJUFENXI茎叶图与频率分布直方图的综合应用求参赛总人数和频率分布直方图中[80,90)矩形的高,并补全频率分布直方图.解 由茎叶图知,分数在[50,60)的频数为2.
由频率分布直方图知,分数在[50,60)的频率为0.008×10=0.08,所以参赛总人数为 =25.
所以分数在[80,90)的人数为25-2-7-10-2=4,补全频率分布直方图,如图所示.素养评析 (1)茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录,但样本容量较大时,使用茎叶图就不合适;而频率分布表和频率分布直方图可以处理样本容量很大的数据,但损失了样本的原始数据,而且必须在完成抽样后才能制作.
(2)茎叶图和频率分布直方图都是用来整理数据的,根据整理的数据,提取信息,进行推断,获得结论,这是重要的数学素养之数据分析.3达标检测PART THREE1.如果想用统计图来反映各数据的变化趋势,比较合适的统计图是
A.条形图 B.折线图
C.扇形图 D.其他图形√解析 能反映各数据的变化趋势的统计图是折线图.123452.如图是总体密度曲线,下列说法正确的是
A.组距越大,频率分布折线图越接近于它
B.样本容量越小,频率分布折线图越接近于它
C.阴影部分的面积代表总体在(a,b)内取值的百分比
D.阴影部分的平均高度代表总体在(a,b)内取值的百分比√123453.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151)上的运动员人数是
A.3 B.4
C.5 D.6解析 由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151)的运动员共有4组,故由系统抽样法知,共抽取4名.故选B.12345√4.从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm).根据数据估计
A.甲种玉米比乙种玉米不仅长得高而且长得整齐
B.乙种玉米比甲种玉米不仅长得高而且长得整齐
C.甲种玉米比乙种玉米长得高但长势没有乙整齐
D.乙种玉米比甲种玉米长得高但长势没有甲整齐解析 由题干中的茎叶图可知,甲种玉米的株高集中在20 cm段,乙种玉米的株高集中在30 cm和40 cm段,则甲种玉米的平均株高小于乙种玉米的平均株高,但乙种玉米的株高较分散,故选D.12345√5.如图茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,则污损的数字是________.123453解析 设污损的叶对应的成绩是x,由茎叶图可得89×5=83+83+87+x+99,所以x=93,故污损的数字是3.课堂小结KETANGXIAOJIE1.估计总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录;而频率分布表和频率分布直方图则损失了样本的原始信息,必须在完成抽样后才能制作.2.2.2 用样本的数字特征估计总体的数字特征
学习目标 1.理解样本数据标准差的意义和作用,学会计算数据的标准差.2.会用样本的基本数字特征来估计总体的基本数字特征.
知识点一 众数、中位数、平均数
众数、中位数、平均数定义
(1)众数:一组数据中出现次数最多的数.
(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.
(3)平均数:如果n个数x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数.
思考 平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点?
答案 平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.
知识点二 方差、标准差
标准差、方差的概念及计算公式
(1)标准差是样本数据到平均数的一种平均距离,一般用s表示.
s=.
(2)标准差的平方s2叫做方差.
s2=[(x1-)2+(x2-)2+…+(xn-)2](xn是样本数据,n是样本容量,是样本平均数).
(3)标准差(或方差)越小,数据越稳定在平均数附近.s=0时,每一组样本数据均为.
知识拓展:平均数、方差公式的推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,
mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)设数据x1,x2,…,xn的平均数为,方差为s2,则
①s2=[(x+x+…+x)-n2];
②数据x1+a,x2+a,…,xn+a的方差也为s2;
③数据ax1,ax2,…,axn的方差为a2s2;
④数据ax1+b,ax2+b,…,axn+b的方差也为a2s2,标准差为as.
1.中位数是一组数据中间的数.( × )
2.众数是一组数据中出现次数最多的数.( √ )
3.一组数据的标准差越小,数据越稳定,且稳定在平均数附近.( √ )
4.一组数据的标准差不大于极差.( √ )
题型一 众数、中位数、平均数的计算
例1 (1)某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为(  )
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为(  )
A.2,5 B.5,5 C.5,8 D.8,8
答案 (1)C (2)C
解析 (1)平均数为=87,众数为85,中位数为85.
(2)结合茎叶图上的原始数据,根据中位数和平均数的概念列出方程进行求解.
由于甲组数据的中位数为15=10+x,所以x=5.又乙组数据的平均数为=16.8,所以y=8,所以x,y的值分别为5,8.
反思感悟 平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.
跟踪训练1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
成绩(单位:m)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数
2
3
2
3
4
1
1
1
分别求这些运动员成绩的众数、中位数与平均数.
解 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.这组数据的平均数是=(1.50×2+1.60×3+…+1.90×1)=≈1.69(m).
故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
题型二 标准差、方差的计算及应用
例2 甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:
甲:8,6,7,8,6,5,9,10,4,7;
乙:6,7,7,8,6,7,8,7,9,5.
(1)分别计算以上两组数据的平均数;
(2)分别求出两组数据的方差;
(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?
解 (1)甲=×(8+6+7+8+6+5+9+10+4+7)=7(环),
乙=×(6+7+7+8+6+7+8+7+9+5)=7(环).
(2)由方差公式s2=[(x1-)2+(x2-)2+…+(xn-)2],得s=3,s=1.2.
(3)甲=乙,说明甲、乙两战士的平均水平相当.
又s>s说明甲战士射击情况波动比乙大.
因此,乙战士比甲战士射击情况稳定,从成绩的稳定性考虑,应选择乙参加比赛.
反思感悟 (1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.
(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.
(3)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数据分布情况,而样本数据的离散程度是由标准差来衡量的.
跟踪训练2 某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg):
甲:102 101 99 98 103 98 99
乙:110 115 90 85 75 115 110
(1)这种抽样方法是哪一种方法?
(2)试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间产品比较稳定.
解 (1)采用的抽样方法是:系统抽样.
(2)甲=(102+101+99+98+103+98+99)=100;
乙=(110+115+90+85+75+115+110)=100;
s=[(102-100)2+(101-100)2+(99-100)2+(98-100)2+(103-100)2+(98-100)2+(99-100)2]
=(4+1+1+4+9+4+1)≈3.43;
s=[(110-100)2+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2+(110-100)2]
=(100+225+100+225+625+225+100)
≈228.57.
所以s<s,故甲车间产品较稳定.
频率分布直方图与数字特征的综合应用
典例 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;
(2)求这次测试数学成绩的中位数.
解 (1)知众数为=75.
(2)设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.
引申探究
1.若本例条件不变,求数学成绩的平均分.
解 由题干图知这次数学成绩的平均分为×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.
2.本例条件不变,求80分以上(含80分)的学生人数.
解 [80,90)分的频率为0.025×10=0.25,
频数为0.25×80=20.
[90,100]分的频率为0.005×10=0.05,
频数为0.05×80=4.
所以80分以上的学生人数为20+4=24.
[素养评析] (1)利用频率分布直方图估计总体数字特征
①众数是最高的矩形的底边中点的横坐标;
②中位数左右两侧直方图的面积相等;
③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(2)利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.
(3)在解决本题时,需要选择运算方法,掌握运算法则,求得运算结果,并根据结果进行合理推断,获得结论.这些都是数学核心素养的内含所在.
1.某市2017年各月的平均气温(℃)数据的茎叶图如图:
则这组数据的中位数是(  )
A.19 B.20
C.21.5 D.23
答案 B
解析 由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B.
2.下列关于平均数、中位数、众数的说法中正确的一个是(  )
A.中位数可以准确地反映出总体的情况
B.平均数可以准确地反映出总体的情况
C.众数可以准确地反映出总体的情况
D.平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况
答案 D
3.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得的数据,则A,B两样本的下列数字特征对应相同的是(  )
A.众数 B.平均数 C.中位数 D.标准差
答案 D
4.某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a1,a2,则一定有(  )
A.a1>a2
B.a2>a1
C.a1=a2
D.a1,a2的大小与m的值有关
答案 B
解析 由茎叶图知,
a1=80+=84,
a2=80+=85,故选B.
5.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.
答案 16
解析 设样本数据x1,x2,…,x10的标准差为s,则s=8,
可知数据2x1-1,2x2-1,…,2x10-1的标准差为2s=16.
1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.
2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.
3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.
一、选择题
1.如图是某样本数据的茎叶图,则该样本的中位数、众数、极差分别是(  )
A.32 34 32 B.33 45 35
C.34 45 32 D.33 36 35
答案 B
解析 从茎叶图中知共16个数据,按照从小到大排序后中间的两个数据为32,34,所以这组数据的中位数为33;
45出现的次数最多,所以这组数据的众数为45;
最大值是47,最小值是12,故极差是35.
2.某台机床加工的五批同数量的产品中次品数的频率分布如表:
次品数
0
1
2
3
4
频率
0.5
0.2
0.05
0.2
0.05
则次品数的平均数为(  )
A.1.1 B.3 C.1.5 D.2
答案 A
解析 设数据xi出现的频率为pi(i=1,2,…,n),则x1,x2,…,xn的平均数为x1p1+x2p2+…+xnpn=0×0.5+1×0.2+2×0.05+3×0.2+4×0.05=1.1,故选A.
3.样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本的标准差为(  )
A. B.
C.2 D.
答案 D
解析 ∵样本a,0,1,2,3的平均数为1,
∴=1,解得a=-1.
则样本的方差s2=×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,
故标准差为.故选D.
4.设样本数据x1,x2,…,x10的平均数和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的平均数和方差分别为(  )
A.1+a,4 B.1+a,4+a
C.1,4 D.1,4+a
答案 A
解析 ∵x1,x2,…,x10的平均数=1,方差s=4,
且yi=xi+a(i=1,2,…,10),
∴y1,y2,…,y10的平均数
=·(y1+y2+…+y10)=·(x1+x2+…+x10+10a)=·(x1+x2+…+x10)+a=+a=1+a,
其方差s=·[(y1-)2+(y2-)2+…+(y10-)2]=[(x1-1)2+(x2-1)2+…+(x10-1)2]
=s=4.故选A.
5.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值为(  )
A.62,62.5 B.65,62
C.65,62.5 D.62.5,62.5
答案 C
解析 ∵最高的矩形为第三个矩形,
∴时速的众数的估计值为65.
前两个矩形的面积为(0.01+0.03)×10=0.4.
∵0.5-0.4=0.1,×10=2.5,
∴中位数的估计值为60+2.5=62.5.
故选C.
6.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有(  )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
答案 D
解析 由已知得a=×(15+17+14+10+15+17+17+16+14+12)=14.7,
b=×(15+15)=15,c=17,
∴c>b>a.故选D.
7.高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为:x,y,105,109,110.已知该同学五次数学成绩数据的平均数为108,方差为35.2,则|x-y|的值为(  )
A.15 B.16
C.17 D.18
答案 D
解析 由题意得,=108,①
=35.2,②
由①②解得或
所以|x-y|=18.故选D.
8.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是(  )
A.57.2,3.6 B.57.2,56.4
C.62.8,63.6 D.62.8,3.6
答案 D
解析 每一个数据都加上60,所得新数据的平均数增加60,而方差保持不变.
9.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示.若甲、乙两人的平均成绩分别是甲,乙,则下列结论正确的是(  )
A.甲<乙;乙比甲成绩稳定
B.甲>乙;甲比乙成绩稳定
C.甲>乙;乙比甲成绩稳定
D.甲<乙;甲比乙成绩稳定
答案 A
解析 甲同学的成绩为78,77,72,86,92,乙同学的成绩为78,82,88,91,95,
所以甲=×(78+77+72+86+92)=81,
乙=×(78+82+88+91+95)=86.8.
所以甲<乙,从叶在茎上的分布情况来看,乙同学的成绩更集中于平均值附近,这说明乙比甲成绩稳定.
二、填空题
10.一组数据2,x,4,6,10的平均数是5,则此组数据的标准差是________.
答案 2
解析 ∵一组数据2,x,4,6,10的平均数是5,
∴2+x+4+6+10=5×5,
解得x=3,
∴此组数据的方差s2=×[(2-5)2+(3-5)2+(4-5)2+(6-5)2+(10-5)2]=8,
∴此组数据的标准差s=2.
11.如图所示的茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70分~99分),若甲、乙两组学生的平均成绩一样,则a=________;甲、乙两组学生的成绩相对稳定的是________.
答案 5 甲组
解析 由题意可知=
=89,解得a=5.
因为s=×[(-14)2+(-1)2+0+92+62]=,s=×[(-13)2+(-4)2+0+92+82]=,
所以s<s,故成绩相对稳定的是甲组.
12.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为________,方差为________.
答案 5 
解析 ∵-1,0,4,x,7,14的中位数为5,
∴=5,∴x=6.
∴这组数据的平均数是=5,
这组数据的方差是×(36+25+1+1+4+81)=.
三、解答题
13.现有某城市100户居民的月平均用电量(单位:度)的数据,根据这些数据,以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)内的用户中应抽取多少户?
解 (1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1得x=0.007 5,
故直方图中x的值是0.007 5.
(2)月平均用电量的众数为=230.
∵(0.002+0.009 5+0.011)×20=0.45<0.5,
∴月平均用电量的中位数在[220,240)内,
设中位数为a,
由(0.002+0.009 5+0.011)×20+0.012 5×(a-220)=0.5,
得a=224,即月平均用电量的中位数为224.
(3)月平均用电量在[220,240)内的有0.012 5×20×100=25(户),
月平均用电量在[240,260)内的有0.007 5×20×100=15(户),
月平均用电量在[260,280)内的有0.005×20×100=10(户),
月平均用电量在[280,300]内的有0.002 5×20×100=5(户),
抽取比例为=,
∴月平均用电量在[220,240)内的用户中应抽取25×=5(户).
14.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则(  )
A.A>B,sA>sB B.A<B,sA>sB
C.A>B,sA<sB D.A<B,sA<sB
答案 B
解析 由题图知,A组的6个数分别为2.5,10,5,7.5,2.5,10;B组的6个数分别为15,10,12.5,10,12.5,10,
所以A==,
B==.
显然A<B.
又由图形可知,B组数据的分布比A组的均匀,变化幅度不大,故B组数据比较稳定,方差较小,从而标准差较小,所以sA>sB.
15.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.
答案 50 1 015
解析 由分层抽样可知,
第一分厂应抽取100×50%=50(件).
由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为1 020×50%+980×20%+1 030×30%=1 015(小时).
课件34张PPT。2.2.2 用样本的数字特征估计总体的数字特征第二章 §2.2 用样本估计总体学习目标XUEXIMUBIAO1.理解样本数据标准差的意义和作用,学会计算数据的标准差.
2.会用样本的基本数字特征来估计总体的基本数字特征.NEIRONGSUOYIN内容索引自主学习题型探究达标检测1自主学习PART ONE知识点一 众数、中位数、平均数众数、中位数、平均数定义
(1)众数:一组数据中出现次数 的数.
(2)中位数:把一组数据按 的顺序排列,处在 位置的数(或中间两个数的 )叫做这组数据的中位数.
(3)平均数:如果n个数x1,x2,…,xn,那么 = 叫做这n个
数的平均数.最多从小到大(或从大到小)中间平均数思考 平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点?答案 平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.知识点二 方差、标准差标准差、方差的概念及计算公式
(1)标准差是样本数据到平均数的一种 ,一般用s表示.
s= .平均距离(2)标准差的平方s2叫做方差.s2= (xn是样本数据,n是样本容量,
是样本平均数).(3)标准差(或方差)越小,数据越稳定在平均数附近.s=0时,每一组样本数据均为 .
知识拓展:平均数、方差公式的推广
(1)若数据x1,x2,…,xn的平均数为 ,那么mx1+a,
mx2+a,mx3+a,…,mxn+a的平均数是m +a.
(2)设数据x1,x2,…,xn的平均数为 ,方差为s2,则②数据x1+a,x2+a,…,xn+a的方差也为s2;
③数据ax1,ax2,…,axn的方差为a2s2;
④数据ax1+b,ax2+b,…,axn+b的方差也为a2s2,标准差为as.1.中位数是一组数据中间的数.(  )
2.众数是一组数据中出现次数最多的数.(  )
3.一组数据的标准差越小,数据越稳定,且稳定在平均数附近.(  )
4.一组数据的标准差不大于极差.(  )思考辨析 判断正误SIKAOBIANXIPANDUANZHENGWU×√√√2题型探究PART TWO题型一 众数、中位数、平均数的计算例1 (1)某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90√(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).
已知甲组数据的中位数为15,乙组数据的平均数
为16.8,则x,y的值分别为
A.2,5 B.5,5
C.5,8 D.8,8√解析 结合茎叶图上的原始数据,根据中位数和平均数的概念列出方程进行求解.
由于甲组数据的中位数为15=10+x,所以x=5.所以y=8,所以x,y的值分别为5,8.反思感悟 平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.跟踪训练1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:分别求这些运动员成绩的众数、中位数与平均数.解 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.
上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.题型二 标准差、方差的计算及应用例2 甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:
甲:8,6,7,8,6,5,9,10,4,7;
乙:6,7,7,8,6,7,8,7,9,5.
(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?因此,乙战士比甲战士射击情况稳定,从成绩的稳定性考虑,应选择乙参加比赛.反思感悟 (1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.
(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.
(3)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数据分布情况,而样本数据的离散程度是由标准差来衡量的.跟踪训练2 某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg):
甲:102 101 99 98 103 98 99
乙:110 115 90 85 75 115 110
(1)这种抽样方法是哪一种方法?解 采用的抽样方法是:系统抽样.(2)试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间产品比较稳定.核心素养之数据分析HEXINSUYANGZHISHUJUFENXI频率分布直方图与数字特征的综合应用典例 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数.解 设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,
因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.引申探究
1.若本例条件不变,求数学成绩的平均分.2.本例条件不变,求80分以上(含80分)的学生人数.解 [80,90)分的频率为0.025×10=0.25,
频数为0.25×80=20.
[90,100]分的频率为0.005×10=0.05,
频数为0.05×80=4.
所以80分以上的学生人数为20+4=24.素养评析 (1)利用频率分布直方图估计总体数字特征
①众数是最高的矩形的底边中点的横坐标;
②中位数左右两侧直方图的面积相等;
③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(2)利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.
(3)在解决本题时,需要选择运算方法,掌握运算法则,求得运算结果,并根据结果进行合理推断,获得结论.这些都是数学核心素养的内含所在.3达标检测PART THREE1.某市2017年各月的平均气温(℃)数据的茎叶图如图:
则这组数据的中位数是
A.19 B.20
C.21.5 D.2312345解析 由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B.√2.下列关于平均数、中位数、众数的说法中正确的一个是
A.中位数可以准确地反映出总体的情况
B.平均数可以准确地反映出总体的情况
C.众数可以准确地反映出总体的情况
D.平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况12345√3.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得的数据,则A,B两样本的下列数字特征对应相同的是
A.众数 B.平均数
C.中位数 D.标准差12345√123454.某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a1,a2,则一定有
A.a1>a2 B.a2>a1
C.a1=a2 D.a1,a2的大小与m的值有关解析 由茎叶图知,√123455.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.16解析 设样本数据x1,x2,…,x10的标准差为s,则s=8,
可知数据2x1-1,2x2-1,…,2x10-1的标准差为2s=16.课堂小结KETANGXIAOJIE1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.
2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.
3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.§2.3 变量间的相关关系
学习目标 1.了解变量间的相关关系,会画散点图.2.根据散点图,能判断两个变量是否具有相关关系.3.了解线性回归思想,会求回归直线的方程.
知识点一 变量间的相关关系
相关关系的定义
变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.
知识点二 散点图及正、负相关的概念
1.散点图
将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.点(,)叫样本点中心.
2.正相关与负相关
(1)正相关:散点图中的点散布在从左下角到右上角的区域.
(2)负相关:散点图中的点散布在从左上角到右下角的区域.
知识点三 回归直线
回归直线的方程
(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.回归直线过样本点中心.
(2)线性回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程.
(3)最小二乘法:
求线性回归方程=x+时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.

其中,是线性回归方程的斜率,是线性回归方程在y轴上的截距.
1.人的身高与年龄之间的关系是相关关系.( × )
2.农作物的产量与施肥量之间的关系是相关关系.( √ )
3.回归直线过样本点中心(,).( √ )
4.根据回归直线方程得到的结论一定是可靠的.( × )
题型一 变量间相关关系的判断
例1 (1)下列关系中,属于相关关系的是________.(填序号)
①正方形的边长与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③出租车费与行驶的里程;
④降雪量与交通事故的发生率之间的关系.
答案 ②④
解析 在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.
(2)某个男孩的年龄与身高的统计数据如下表所示.
年龄x(岁)
1
2
3
4
5
6
身高y(cm)
78
87
98
108
115
120
①画出散点图;
②判断y与x是否具有线性相关关系.
解 ①散点图如图所示.
②由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.
反思感悟 两个变量是否相关的两种判断方法
(1)根据实际经验:借助积累的经验进行分析判断.
(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.
跟踪训练1 某中学的兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图所示,则下列说法错误的是(  )
A.沸点与海拔高度呈正相关
B.沸点与气压呈正相关
C.沸点与海拔高度呈负相关
D.沸点与海拔高度、沸点与气压的相关性都很强
答案 A
解析 由左图知气压随海拔高度的增加而减小,由右图知沸点随气压的升高而升高,所以沸点与气压呈正相关,沸点与海拔高度呈负相关,由于两个散点图中的点都成线性分布,所以沸点与海拔高度、沸点与气压的相关性都很强,故B,C,D正确,A错误.
题型二 求回归方程
例2 某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图;
(2)求回归方程.
解 (1)散点图如图所示.
(2)列出下表,并用科学计算器进行有关计算.
i
1
2
3
4
5
xi
2
4
5
6
8
yi
30
40
60
50
70
xiyi
60
160
300
300
560
x
4
16
25
36
64
=5,=50,=145,iyi=1 380
于是可得,===6.5,
=-=50-6.5×5=17.5.
于是所求的回归方程是=6.5x+17.5.
反思感悟 求回归方程的一般步骤
(1)收集样本数据,设为(xi,yi)(i=1,2,…,n).
(2)作出散点图,确定x,y具有线性相关关系.
(3)把数据制成表格.
(4)计算,,,iyi.
(5)代入公式计算,,公式为
(6)写出回归方程= x+.
跟踪训练2 已知变量x,y有如下对应数据:
x
1
2
3
4
y
1
3
4
5
(1)作出散点图;
(2)用最小二乘法求关于x,y的回归方程.
解 (1)散点图如图所示.
(2)==,==,
iyi=1+6+12+20=39.
=1+4+9+16=30,
==,=-×=0,
所以=x即为所求的回归方程.
利用线性回归方程对总体进行估计
典例 由某种设备的使用年限xi(年)与所支出的维修费yi(万元)的数据资料算得如下结果,=90,iyi=112,i=20,i=25.
(1)求所支出的维修费y对使用年限x的线性回归方程=x+;
(2)①判断变量x与y之间是正相关还是负相关;
②当使用年限为8年时,试估计支出的维修费是多少?
解 (1)∵i=20,i=25,
∴=i=4,=i=5,
∴===1.2,
=-=5-1.2×4=0.2.
∴线性回归方程为=1.2x+0.2.
(2)①由(1)知=1.2>0,
∴变量x与y之间是正相关.
②由(1)知,当x=8时,=1.2×8+0.2=9.8,即使用年限为8年时,支出的维修费约是9.8万元.
[素养评析] (1)用回归方程进行总体估计要注意几点,①首先要判断两个变量具有相关关系,②准确求出回归方程,③根据回归方程进行估计或预测,但估计值不是实际值,允许有一定误差.
(2)收集数据,求回归方程,进行估计和预测,充分体现了数学核心素养之数学运算和数据分析素养的形成过程.
1.对变量x,y有观测数据(xi,yi)(i=1,2,3,…,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,3,…,10),得散点图2,由这两个散点图可以断定(  )
A.x与y正相关,u与v正相关
B.x与y正相关,u与v负相关
C.x与y负相关,u与v正相关
D.x与y负相关,u与v负相关
答案 C
解析 由图1可知,点散布在从左上角到右下角的区域,各点整体呈递减趋势,故x与y负相关;
由图2可知,点散布在从左下角到右上角的区域,各点整体呈递增趋势,故u与v正相关.
2.工人工资y(元)与劳动生产率x(千元)的相关关系的回归方程为=50+80x,下列判断正确的是(  )
A.劳动生产率为1 000元时,工人工资为130元
B.劳动生产率提高1 000元时,工人工资平均提高80元
C.劳动生产率提高1 000元时,工人工资平均提高130元
D.当月工资为250元时,劳动生产率为2 000元
答案 B
解析 因为回归直线的斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元.
3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是(  )
A.y与x具有正的线性相关关系
B.回归直线过样本点中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
答案 D
解析 当x=170时,=0.85×170-85.71=58.79,
体重的估计值为58.79 kg.
4.某地区近10年居民的年收入x与年支出y之间的关系大致符合=0.8x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元.
答案 12.1
解析 将x=15代入=0.8x+0.1,得=12.1.
5.已知回归直线的斜率的估计值是1.23,且过定点(4,5),则线性回归方程是_____________.
答案 =1.23x+0.08
解析 回归直线的斜率的估计值为1.23,即=1.23,
又回归直线过定点(4,5),∴=5-1.23×4=0.08,
∴=1.23x+0.08.
1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关.
2.求线性回归方程时应注意的问题
(1)知道x与y成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.
(2)用公式计算,的值时,要先计算,然后才能算出.
3.利用回归方程,我们可以进行估计和预测.若回归方程为=x+,则在x=x0处的估计值为0=x0+ .
一、选择题
1.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其回归方程可能为(  )
A.=1.5x+2
B.=-1.5x+2
C.=1.5x-2
D.=-1.5x-2
答案 B
2.判断下图中的两个变量,具有较强相关关系的是(  )
答案 B
解析 A,C是函数关系,D中的点的分布毫无规律,横轴、纵轴表示的两个变量之间相关性不强.
3.已知x与y之间的一组数据:
x
0
1
2
3
y
m
3
5.5
7
已求得关于y与x的线性回归方程为=2.2x+0.7,则m的值为(  )
A.1 B.0.85
C.0.7 D.0.5
答案 D
解析 ==1.5,=,将其代入=2.2x+0.7,可得m=0.5,故选D.
4.设有一条回归直线的方程为=2-1.5x,则变量x增加1个单位时(  )
A.y平均增加1.5个单位
B.y平均增加2个单位
C.y平均减少1.5个单位
D.y平均减少2个单位
答案 C
解析 ∵回归方程为1=2-1.5x,①
∴2=2-1.5(x+1),②
∴②-①得2-1=-1.5,即y平均减少1.5个单位,故选C.
5.已知x与y之间的一组数据:
x
0
1
2
3
y
1
3
5
7
若y与x线性相关,则y与x的回归直线=x+必过(  )
A.点(2,2) B.点(1.5,0)
C.点(1,2) D.点(1.5,4)
答案 D
解析 ∵==1.5,==4,
∴回归直线必过点(1.5,4).故选D.
6.已知x,y的取值如表所示:
x
2
3
4
y
6
4
5
如果y与x线性相关,且线性回归方程为=x+,则等于(  )
A.- B.
C.- D.
答案 A
解析 ∵==3,==5,
∴回归直线过点(3,5),
∴5=3+,
∴=-,故选A.
7.某产品的广告费用x(单位:万元)与销售额y(单位:万元)的统计数据如下表:
广告费用x
4
2
3
5
销售额y
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为(  )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
答案 B
解析 ==3.5,==42.因为回归直线过点(,),所以42=9.4×3.5+.
解得=9.1.故回归方程为=9.4x+9.1.
所以当x=6时,=6×9.4+9.1=65.5.
8.根据如下样本数据得到的回归方程为=x+,则(  )
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
答案 B
解析 画出散点图,知>0,<0.
二、填空题
9.在一次试验中测得(x,y)的四组数据如下:
x
16
17
18
19
y
50
34
41
31
根据上表可得线性回归方程=-5x+,据此模型预报当x=20时,y的值为________.
答案 26.5
解析 ==17.5,==39,
∴回归直线过点(17.5,39),
∴39=-5×17.5+,
∴=126.5,
∴当x=20时,y=-5×20+126.5=26.5.
10.某工厂对某产品的产量与成本的资料分析后有如下数据:
产量x(千件)
2
3
5
6
成本y(万元)
7
8
9
12
由表中数据得到的线性回归方程=x+中=1.1,预测当产量为9千件时,成本约为________万元.
答案 14.5
解析 由表中数据得=4,=9,代入线性回归方程得=4.6,∴当x=9时,=1.1×9+4.6=14.5.
11.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的回归方程为=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差____________分.
答案 20
解析 令两人的总成绩分别为x1,x2.
则对应的数学成绩估计为
1=6+0.4x1,2=6+0.4x2,
所以|1-2|=|0.4(x1-x2)|=0.4×50=20.
12.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:
时间x
1
2
3
4
5
命中率y
0.4
0.5
0.6
0.6
0.4
小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6 h篮球的投篮命中率为________.
答案 0.5 0.53
解析 ===0.5,
==3.
由公式,得=0.01,
从而=-=0.5-0.01×3=0.47.
所以回归方程为=0.47+0.01x.
所以当x=6时,=0.47+0.01×6=0.53.
三、解答题
13.2018年元旦前夕,某市统计局统计了该市2017年10户家庭的年收入和年饮食支出的统计资料如下表:
年收入x(万元)
2
4
4
6
6
年饮食支出y(万元)
0.9
1.4
1.6
2.0
2.1
年收入x(万元)
6
7
7
8
10
年饮食支出y(万元)
1.9
1.8
2.1
2.2
2.3
(1)如果已知y与x是线性相关的,求线性回归方程;
(2)若某家庭年收入为9万元,预测其年饮食支出.
(参考数据:iyi=117.7,=406)
解 依题意可计算得,=6,=1.83,2=36,
 =10.98,
又∵iyi=117.7,=406,
∴=≈0.17,=-b=0.81,
∴=0.17x+0.81.
∴所求的线性回归方程为=0.17x+0.81.
(2)当x=9时,=0.17×9+0.81=2.34(万元)
可估计大多数年收入9万元的家庭每年饮食支出约为2.34万元.
14.某公司过去五个月的广告费支出x(单元:万元)与销售额y(单位:万元)之间有下列对应数据:
x
2
4
5
6
8
y

40
60
50
70
工作人员不慎将表格中y的第一个数据丢失.已知y对x呈线性相关关系,且回归方程为=6.5x+17.5,有下列说法:①销售额y与广告费支出x正相关;②丢失的数据(表中▲处)为30;③该公司广告费支出每增加1万元,销售额一定增加6.5万元;④若该公司下月广告费支出为8万元,则销售额约为75万元.其中,正确的说法有(  )
A.1个 B.2个 C.3个 D.4个
答案 B
解析 由回归方程=6.5x+17.5,可知=6.5,则销售额y与广告费支出x正相关,所以①正确;设丢失的数据为m,由表中的数据可得=5,=,把点代入回归方程,可得=6.5×5+17.5,解得m=30,所以②正确;该公司广告费支出每增加1万元,销售额不一定增加6.5万元,所以③不正确;若该公司下月广告费支出为8万元,则销售额约为y=6.5×8+17.5=69.5(万元),所以④不正确.故选B.
15.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是(  )
A.>b′,>a′
B.>b′,<a′
C.<b′,>a′
D.<b′,<a′
答案 C
解析 由(1,0),(2,2)求b′,a′.
b′==2,a′=0-2×1=-2.
求,时,iyi=0+4+3+12+15+24=58,
=,=,
=1+4+9+16+25+36=91,
∴==,
=-×=-=-,
∴<b′,>a′.
课件36张PPT。§2.3 变量间的相关关系第二章 统 计学习目标XUEXIMUBIAO1.了解变量间的相关关系,会画散点图.
2.根据散点图,能判断两个变量是否具有相关关系.
3.了解线性回归思想,会求回归直线的方程.NEIRONGSUOYIN内容索引自主学习题型探究达标检测1自主学习PART ONE相关关系的定义
变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有 的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为 和 .随机性函数关系相关关系知识点一 变量间的相关关系知识点二 散点图及正、负相关的概念
1.散点图
将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.点 叫样本点中心.
2.正相关与负相关
(1)正相关:散点图中的点散布在从 到 的区域.
(2)负相关:散点图中的点散布在从 到 的区域.左下角右上角右下角左上角知识点三 回归直线
回归直线的方程
(1)回归直线:如果散点图中点的分布从整体上看大致在 附近,就称这两个变量之间具有 关系,这条直线叫做回归直线.回归直线过样本点中心.
(2)线性回归方程: 对应的方程叫做回归直线的方程,简称回归方程.一条直线线性相关回归直线(3)最小二乘法:
求线性回归方程 时,使得样本数据的点到回归直线的_____________
最小的方法叫做最小二乘法.距离的平方和其中, 是线性回归方程的 , 是线性回归方程在y轴上的 .斜率截距1.人的身高与年龄之间的关系是相关关系.(  )
2.农作物的产量与施肥量之间的关系是相关关系.(  )
3.回归直线过样本点中心 .(  )
4.根据回归直线方程得到的结论一定是可靠的.(  )思考辨析 判断正误SIKAOBIANXIPANDUANZHENGWU××√√2题型探究PART TWO题型一 变量间相关关系的判断例1 (1)下列关系中,属于相关关系的是________.(填序号)
①正方形的边长与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③出租车费与行驶的里程;
④降雪量与交通事故的发生率之间的关系.解析 在①中,正方形的边长与面积之间的关系是函数关系;
在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;
③为确定的函数关系;
在④中,降雪量与交通事故的发生率之间具有相关关系.②④(2)某个男孩的年龄与身高的统计数据如下表所示.①画出散点图;解 散点图如图所示.②判断y与x是否具有线性相关关系.解 由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.反思感悟 两个变量是否相关的两种判断方法
(1)根据实际经验:借助积累的经验进行分析判断.
(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.跟踪训练1 某中学的兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图所示,则下列说法错误的是
A.沸点与海拔高度呈正相关
B.沸点与气压呈正相关
C.沸点与海拔高度呈负相关
D.沸点与海拔高度、沸点与
气压的相关性都很强√解析 由左图知气压随海拔高度的增加而减小,由右图知沸点随气压的升高而升高,所以沸点与气压呈正相关,沸点与海拔高度呈负相关,由于两个散点图中的点都成线性分布,所以沸点与海拔高度、沸点与气压的相关性都很强,故B,C,D正确,A错误.题型二 求回归方程例2 某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:(1)画出散点图;解 散点图如图所示.(2)求回归方程.解 列出下表,并用科学计算器进行有关计算.反思感悟 求回归方程的一般步骤
(1)收集样本数据,设为(xi,yi)(i=1,2,…,n).
(2)作出散点图,确定x,y具有线性相关关系.
(3)把数据制成表格.跟踪训练2 已知变量x,y有如下对应数据:(1)作出散点图;解 散点图如图所示.(2)用最小二乘法求关于x,y的回归方程.核心素养之数学运算与数据分析HEXINSUYANGZHISHUXUEYUNSUANYUSHUJUFENXI利用线性回归方程对总体进行估计(2)①判断变量x与y之间是正相关还是负相关;解 由(1)知 =1.2>0,
∴变量x与y之间是正相关.②当使用年限为8年时,试估计支出的维修费是多少?解 由(1)知,当x=8时, =1.2×8+0.2=9.8,即使用年限为8年时,支出的维修费约是9.8万元.素养评析 (1)用回归方程进行总体估计要注意几点,①首先要判断两个变量具有相关关系,②准确求出回归方程,③根据回归方程进行估计或预测,但估计值不是实际值,允许有一定误差.
(2)收集数据,求回归方程,进行估计和预测,充分体现了数学核心素养之数学运算和数据分析素养的形成过程.3达标检测PART THREE1.对变量x,y有观测数据(xi,yi)(i=1,2,3,…,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,3,…,10),得散点图2,由这两个散点图可以断定
A.x与y正相关,u与v正相关
B.x与y正相关,u与v负相关
C.x与y负相关,u与v正相关
D.x与y负相关,u与v负相关12345解析 由图1可知,点散布在从左上角到右下角的区域,各点整体呈递减趋势,故x与y负相关;
由图2可知,点散布在从左下角到右上角的区域,各点整体呈递增趋势,故u与v正相关.√2.工人工资y(元)与劳动生产率x(千元)的相关关系的回归方程为 =50+80x,下列判断正确的是
A.劳动生产率为1 000元时,工人工资为130元
B.劳动生产率提高1 000元时,工人工资平均提高80元
C.劳动生产率提高1 000元时,工人工资平均提高130元
D.当月工资为250元时,劳动生产率为2 000元√解析 因为回归直线的斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元.123453.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为 =0.85x-85.71,则下列结论中不正确的是
A.y与x具有正的线性相关关系
B.回归直线过样本点中心
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg12345解析 当x=170时, =0.85×170-85.71=58.79,体重的估计值为58.79 kg.√4.某地区近10年居民的年收入x与年支出y之间的关系大致符合 =0.8x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元.12.1123455.已知回归直线的斜率的估计值是1.23,且过定点(4,5),则线性回归方程是______________.12345课堂小结KETANGXIAOJIE1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关.
2.求线性回归方程时应注意的问题
(1)知道x与y成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.专题突破三 例析频率分布直方图中的统计问题
一、求样本中限制条件下的个体所占频率
例1 观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)的频率为(  )
A.0.001 B.0.1
C.0.2 D.0.3
思维切入 求对应区间上的小矩形的面积.
答案 D
解析 由直方图的意义可知,在区间[2 700,3 000)内取值的频率为(3 000-2 700)×0.001=0.3.
点评 频率为直方图中相应小长方形的面积,即频率=纵坐标×横坐标差的绝对值.
跟踪训练1 某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分),现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.
已知图中从左到右的第一、三、四、五小组的频率分别为0.30,0.15,0.10,0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.
答案 100 0.15
解析 设参赛的人数为n,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4,
依题意=0.4,
∴n=100,优秀的频率是0.10+0.05=0.15.
二、求样本中限制条件下的个体的频数
例2 某市高三数学抽样考试中,对90分以上的成绩进行统计,其频率分布如图所示.若130~140分数段的人数为90,则90~100分数段的人数为________.
思维切入 对应区间上的频数即为对应区间的频率×样本总体.
答案 810
解析 由于90分以上的考试人数是样本总体,则图中5个分数段的频率之和等于1,设130~140分数段的频率为p,则0.45+0.25+0.15+0.10+p=1,即0.95+p=1,则p=0.05,设该样本总体共有n个学生的分数,且设90~100分数段的人数为x,则由频率概念得解得故90~100分数段的人数为810.
点评 本题是频率分布条形图.由于各分数段的人数与频率成正比,则可由=,求出x;题设条形图的纵坐标是“频率”这是有别于常规的,在审题时不能混淆.
跟踪训练2 为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.
答案 12
解析 志愿者的总人数为=50,
所以第三组人数为50×0.36×1=18,
所以有疗效的人数为18-6=12.
三、求频率分布直方图中的参数问题
例3 为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图,如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为(  )
A.0.27,78 B.0.27,83
C.2.7,78 D.2.7,83
思维切入 根据频率分布直方图的性质列方程求解.
答案 A
解析 注意到纵轴表示,由图象可知,
前4组的公比为3,最大频率a=0.1×33×0.1=0.27,
设后6组公差为d,
则0.01+0.03+0.09+0.27×6+·d=1,
解得d=-0.05,即后6组频率的公差为-0.05,
所以,视力在4.6到5.0之间的学生数为
(0.27+0.22+0.17+0.12)×100=78,
故选A.
点评 解答本题关键是要利用频率分布直方图中残缺不全的数据,分析它们之间存在的内在关系.
跟踪训练3 某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图所示),其中上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].
(1)求频率分布直方图中x的值;
(2)如果上学所需时间不少于1小时的学生可申请在学校住宿,请估计学校600名新生中有多少名学生可以申请住宿.
解 (1)由频率分布直方图可得20×x+0.025×20+0.006 5×20+0.003×2×20=1,所以x=0.012 5.
(2)由频率分布直方图可知,新生上学所需时间不少于1小时的频率为0.003×2×20=0.12.因为600×0.12=72,所以估计600名新生中有72名学生可以申请住宿.
四、频率分布直方图中的数字特征
例4 从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).
(1)由图中数据求a的值;
(2)若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为多少?
(3)估计这所小学的小学生身高的众数、中位数(保留两位小数)及平均数.
思维切入 众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中.中位数即为从小到大中间的数(或中间两数的平均数).
解 (1)因为直方图中的各个矩形的面积之和为1,
所以10×(0.005+0.035+a+0.020+0.010)=1,
解得a=0.030.
(2)由直方图知,身高在[120,130),[130,140),[140,150]三组的学生总数为100×10×(0.030+0.020+0.010)=60,
其中身高在[140,150]的学生人数为10,所以从身高在[140,150]内选取的学生人数为×10=3.
(3)根据频率分布直方图知,身高在[110,120)的小矩形最高,
所以这所小学的小学生身高的众数为
=115(cm).
又0.005×10+0.035×10=0.4<0.5,
0.4+0.030×10=0.7>0.5,
所以中位数在[120,130)内,可设为x,
则(x-120)×0.030+0.4=0.5,
解得x≈123.33,
所以中位数为123.33 cm.
根据频率分布直方图,计算平均数为
105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm).
点评 用频率分布直方图求得的众数、中位数不一定是样本中的具体数.
跟踪训练4 某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为(  )
A.20 B.25 C.22.5 D.22.75
答案 C
解析 产品的中位数出现在频率是0.5的地方.自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x,则由0.1+0.2+0.08×(x-20)=0.5,
得x=22.5,故选C.
1.统计某校1 000名学生的数学水平测试成绩,得到样本的频率分布直方图如图所示.若满分为100分,规定不低于60分为及格,则及格率是(  )
A.20% B.25% C.60% D.80%
答案 D
2.在中秋的促销活动中,某商场对9月14日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知12时到14时的销售额为7万元,则10时到11时的销售额为(  )
A.1万元 B.2万元
C.3万元 D.4万元
答案 C
3.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.
答案 9
4.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.
答案 25
解析 由频率分布直方图可得[2 500,3 000)(元)月收入段共有10 000×0.000 5×500=2 500(人),按分层抽样应抽出2 500×=25(人).
5.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.估计居民月均用水量的中位数.
解 由(0.08+0.16+a+0.42+0.50+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.
所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.
6.某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如图所示的频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/方立米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.
解 (1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1),[1,1.5),[1.5,2),[2,2.5),[2.5,3)内的频率依次为0.1,0.15,0.2,0.25,0.15.
所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.
依题意,w至少定为3.
(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:
组号
1
2
3
4
5
6
7
8
分组
[2,4)
[4,6)
[6,8)
[8,10)
[10,12)
[12,17)
[17,22)
[22,27]
频率
0.1
0.15
0.2
0.25
0.15
0.05
0.05
0.05
根据题意,该市居民该月的人均水费估计为
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).
一、选择题
1.从向阳小区抽取100户居民进行月用电量调查,为制定阶梯电价提供数据,发现其月用电量都在50到350度之间,制作频率分布直方图(如图所示)的工作人员粗心大意,位置t处未标明数据,则t等于(  )
A.0.004 1 B.0.004 2
C.0.004 3 D.0.004 4
答案 D
解析 由题意得50×(0.006+t+0.003 6+0.002 4×2+0.001 2)=1,故t=0.004 4.故选D.
2.有一容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为(  )
A.18 B.36 C.54 D.72
答案 B
解析 易得样本数据落在区间[10,12]内的频率为0.18,则样本数据落在区间[10,12]内的频数为36.
3.测量某地新生婴儿的体重,得到其频率分布直方图如图所示,则新生婴儿的体重(单位:g)在[2 700,3 000)的频率为(  )
A.0.001 B.0.1 C.0.2 D.0.3
答案 D
解析 由频率分布直方图可知,所求频率为0.001×300=0.3.
4.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图可知,这200名学生中每周的自习时间不少于22.5小时的人数是(  )
A.56 B.60 C.120 D.140
答案 D
解析 设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.
5.如图是某班50名学生身高的频率分布直方图,那么身高(单位:cm)在区间[150,170)内的学生人数为(  )
A.16 B.20 C.22 D.26
答案 B
解析 根据频率分布直方图可知身高在区间[150,170)内的频率为(0.01+0.03)×10=0.4,所以身高在区间[150,170)内的学生人数为50×0.4=20,故选B.
6.某学校对高二年级一次考试进行抽样分析,如图是根据抽样分析后的考试成绩绘制的频率分布直方图,其中抽样成绩的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中成绩小于100分的人数是36.则样本中成绩大于或等于98分且小于104分的人数是(  )
A.90 B.75 C.60 D.45
答案 A
解析 因为样本中成绩小于100分的人数是36,其对应频率之和为0.050×2+0.100×2=0.3,所以样本总数为36÷0.3=120,所以样本中成绩大于或等于98分且小于104分的人数为120×2×(0.100+0.150+0.125)=90,故选A.
7.如图是某校高一一次数学考试成绩的样本频率分布直方图(样本容量n=200),若成绩不低于60分为及格,则样本中的及格人数是(  )
A.6 B.36 C.60 D.120
答案 D
解析 由题中频率分布直方图得,成绩不低于60分的人数为(0.012+0.018)×20×200=120.
8.为了解学生在课外活动方面的支出情况,抽取了n个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[10,50]内,其中支出金额在[30,50]内的学生有117人,频率分布直方图如图所示,则n等于(  )
A.180 B.160 C.150 D.200
答案 A
解析 [30,50]对应的概率为1-×10=0.65,所以n==180.
二、填空题
9.为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间[40,60)内的汽车有________辆.
答案 80
解析 由频率分布直方图得:
时速在区间[40,60)内的汽车的频率为(0.01+0.03)×10=0.4.
∴时速在区间[40,60)内的汽车有0.4×200=80(辆).
10.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用的时间的条形图(如图所示)根据条形图可得这50名学生这一天平均每人的课外阅读时间为________.
答案 0.9
解析 这50名学生这一天平均每人的课外阅读时间为(0×5+0.5×20+1.0×10+1.5×10+2.0×5)÷50=0.9(小时).故选B.
三、解答题
11.为了了解小学生的体能情况,抽取某校一个年级的部分学生进行一分钟跳绳次数的测试,将数据整理后,画出频率分布直方图如图所示.已知图中从左到右前三个小组的频率分别为0.1,0.3,0.4,且第一小组的频数为5.
(1)求第四小组的频率;
(2)求参加这次测试的学生的人数;
(3)若一分钟跳绳次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率.
解 (1)第四小组的频率为1-0.1-0.3-0.4=0.2.
(2)设参加这次测试的学生有x人,则0.1x=5,解得x=50,故参加这次测试的学生有50人.
(3)由题意及频率分布直方图知,样本数据的达标率约为0.3+0.4+0.2=0.9,
∴可估计该年级学生跳绳测试的达标率为90%.
12.为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄调查统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:
(1)年龄分组[25,30)对应小长方形的高度为________.
(2)这800名志愿者中年龄在[25,35)内的人数为________.
答案 (1)0.04 (2)440
解析 (1)因为各个小长方形的面积之和为1,所以年龄分组[25,30)对应小长方形的高度为=0.04.(2)年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440.
13.某校100名学生的期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)若这100名学生的语文成绩在某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段
[50,60)
[60,70)
[70,80)
[80,90)
x∶y
1∶1
2∶1
3∶4
4∶5
解 (1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005.
(2)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.
由题中给出的比例关系知数学成绩在上述分数段的人数依次为
5,40×=20,30×=40,20×=25.
故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.
课件29张PPT。专题突破三 例析频率分布直方图中的统计问题第二章 统 计一、求样本中限制条件下的个体所占频率思维切入 求对应区间上的小矩形的面积.例1 观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在
[2 700,3 000)的频率为
A.0.001 B.0.1
C.0.2 D.0.3√解析 由直方图的意义可知,在区间[2 700,3 000)内取值的频率为(3 000-2 700)×
0.001=0.3.点评 频率为直方图中相应小长方形的面积,即频率=纵坐标×横坐标差的绝对值.跟踪训练1 某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分),现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30,0.15,0.10,0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.1000.15解析 设参赛的人数为n,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4,∴n=100,优秀的频率是0.10+0.05=0.15.二、求样本中限制条件下的个体的频数思维切入 对应区间上的频数即为对应区间的频率×样本总体.例2 某市高三数学抽样考试中,对90分以上的成绩进行统计,其频率分布如图所示.若130~140分数段的人数为90,则90~100分数段的人数为________.810解析 由于90分以上的考试人数是样本总体,则图中5个分数段的频率之和等于1,设130~140分数段的频率为p,则0.45+0.25+0.15+0.10+p=1,即0.95+p=1,则p=0.05,设该样本总体共有n个学生的分数,且设90~100分数段
的人数为x,则由频率概念得 解得 故90~100分数段的人数为810.点评 本题是频率分布条形图.由于各分数段的人数与频率成正比,则可由
,求出x;题设条形图的纵坐标是“频率”这是有别于常规的,在审题时不能混淆.跟踪训练2 为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.12所以第三组人数为50×0.36×1=18,
所以有疗效的人数为18-6=12.三、求频率分布直方图中的参数问题思维切入 根据频率分布直方图的性质列方程求解.例3 为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图,如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为
A.0.27,78 B.0.27,83
C.2.7,78 D.2.7,83√前4组的公比为3,最大频率a=0.1×33×0.1=0.27,
设后6组公差为d,解得d=-0.05,即后6组频率的公差为-0.05,
所以,视力在4.6到5.0之间的学生数为
(0.27+0.22+0.17+0.12)×100=78,
故选A.点评 解答本题关键是要利用频率分布直方图中残缺不全的数据,分析它们之间存在的内在关系.跟踪训练3 某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图所示),其中上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].
(1)求频率分布直方图中x的值;解 由频率分布直方图可得20×x+0.025×20+0.006 5×20+0.003×2×20=1,所以x=0.012 5.(2)如果上学所需时间不少于1小时的学生可申请在学校住宿,请估计学校600名新生中有多少名学生可以申请住宿.解 由频率分布直方图可知,新生上学所需时间不少于1小时的频率为0.003×2×20=0.12.因为600×0.12=72,所以估计600名新生中有72名学生可以申请住宿.四、频率分布直方图中的数字特征例4 从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).
(1)由图中数据求a的值;解 因为直方图中的各个矩形的面积之和为1,
所以10×(0.005+0.035+a+0.020+0.010)=1,
解得a=0.030.(2)若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为多少?解 由直方图知,身高在[120,130),[130,140),[140,150]三组的学生总数为100×10×(0.030+0.020+0.010)=60,
其中身高在[140,150]的学生人数为10,所以从身高在[140,150]内选取的学生人数为 ×10=3.(3)估计这所小学的小学生身高的众数、中位数(保留两位小数)及平均数.思维切入 众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中.中位数即为从小到大中间的数(或中间两数的平均数).解 根据频率分布直方图知,身高在[110,120)的小矩形最高,又0.005×10+0.035×10=0.4<0.5,
0.4+0.030×10=0.7>0.5,
所以中位数在[120,130)内,可设为x,
则(x-120)×0.030+0.4=0.5,
解得x≈123.33,
所以中位数为123.33 cm.
根据频率分布直方图,计算平均数为
105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm).点评 用频率分布直方图求得的众数、中位数不一定是样本中的具体数.跟踪训练4 某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为
A.20
B.25
C.22.5
D.22.75√解析 产品的中位数出现在频率是0.5的地方.自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,
设中位数是x,则由0.1+0.2+0.08×(x-20)=0.5,
得x=22.5,故选C.123451.统计某校1 000名学生的数学水平测试成绩,得到样本的频率分布直方图如图所示.若满分为100分,规定不低于60分为及格,则及格率是
A.20%
B.25%
C.60%
D.80%√6达标检测DABIAOJIANCE1234562.在中秋的促销活动中,某商场对9月14日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知12时到14时的销售额为7万元,则10时到11时的销售额为
A.1万元
B.2万元
C.3万元
D.4万元√1234563.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为___.91234564.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.解析 由频率分布直方图可得[2 500,3 000)(元)月收入段共有10 000×0.000 5×500=2 500(人),251234565.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.估计居民月均用水量的中位数.解 由(0.08+0.16+a+0.42+0.50+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.
所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.1234561234566.某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如图所示的频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/方立米,w至少定为多少?解 由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1),[1,1.5),[1.5,2),[2,2.5),[2.5,3)内的频率依次为0.1,0.15,0.2,0.25,0.15.
所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.
依题意,w至少定为3.123456123456(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解 由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:123456根据题意,该市居民该月的人均水费估计为
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).章末复习
学习目标 1.梳理本章知识,构建知识网络.2.会根据不同的特点选择适当的抽样方法获得样本数据.3.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计总体.4.能利用散点图对两个变量是否相关进行初步判断,能用线性回归方程进行预测.
1.抽样方法
(1)用随机数法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.
(2)用系统抽样法时,如果总体容量N能被样本容量n整除,抽样间隔为k=;如果总体容量N不能被样本容量n整除,先用简单随机抽样剔除多余个体,抽样间隔为k=(其中K=N-多余个体数).
(3)三种抽样方法的异同点
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽到的可能性相同
从总体中逐个抽取
总体中的个体数较少
系统抽样
将总体平均分成几部分,按事先确定的规则分别在各部分中抽取
在起始部分抽样时,采用简单随机抽样
总体中的个体数较多
分层抽样
将总体分成几层,按各层个体数之比抽取
在各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
2.用样本估计总体
(1)用样本估计总体
用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率分布表与频率分布直方图.当样本只有两组数据且样本容量比较小时,用茎叶图刻画数据比较方便.
(2)样本的数字特征
样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本数据波动大小的,包括方差及标准差.
3.变量间的相关关系
(1)两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系).
(2)求回归方程的步骤:
①先把数据制成表,从表中计算出,,x,xiyi;
②计算回归系数,,公式为
③写出回归方程=x+.
题型一 抽样方法
例1 (1)大、中、小三个盒子中分别装有同一产品120个、60个、20个,现在需从这三个盒子中抽取一个容量为25的样本,较为恰当的抽样方法是(  )
A.分层抽样 B.系统抽样
C.简单随机抽样 D.以上三种均可
(2)某企业三月中旬生产A,B,C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的表格:
产品类别
A
B
C
产品数量(件)
1 300
样本数量(件)
130
由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本数量比C产品的样本数量多10,根据以上信息,可得C产品的数量是________件.
答案 (1)B (2)800
解析 (1)总体无明显差异,但总体中个体数较多,故采用系统抽样较恰当.
(2)设C产品的样本数量为n,则A产品的样本数量为n+10,由题意知=,解得n=80.
故C产品的数量为80÷=800(件).
反思感悟 系统抽样的特点是“等距离”抽样,分层抽样的特点是“等比例”抽样.
跟踪训练1 某高级中学有学生270人,其中一年级108人,二、三年级各81人.现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
关于上述样本的下列结论中,正确的是(  )
A.②③都不能为系统抽样
B.②④都不能为分层抽样
C.①④都可能为系统抽样
D.①③都可能为分层抽样
答案 D
解析 按分层抽样时,在一年级抽取108×=4(人),在二年级、三年级各抽取81×=3(人),则在号码段1,2,…,108中抽取4个号码,在号码段109,110,…,189中抽取3个号码,在号码段190,191,…,270中抽取3个号码,①②③符合,所以①②③可能是分层抽样,④不符合,所以④不可能是分层抽样;如果按系统抽样时,抽出的号码应该是“等距”的,①③符合,②④不符合,所以①③都可能为系统抽样,②④都不能为系统抽样.
题型二 用样本的频率分布估计总体
例2 某制造商生产一批直径为40 mm的乒乓球,现随机抽样检查20个,测得每个球的直径(单位:mm,保留两位小数)如下:
40.03 40.00 39.98 40.00 39.99 40.00 39.98
40.01 39.98 39.99 40.00 39.99 39.95 40.01
40.02 39.98 40.00 39.99 40.00 39.96
(1)完成下面的频率分布表,并画出频率分布直方图;
分组
频数
频率

[39.95,39.97)
[39.97,39.99)
[39.99,40.01)
[40.01,40.03]
合计
(2)假定乒乓球的直径误差不超过0.02 mm为合格品.若这批乒乓球的总数为10 000,试根据抽样检查结果估计这批产品的合格个数.
解 (1)频率分布表如下:
分组
频数
频率

[39.95,39.97)
2
0.10
5
[39.97,39.99)
4
0.20
10
[39.99,40.01)
10
0.50
25
[40.01,40.03]
4
0.20
10
合计
20
1.00
50
频率分布直方图如图.
(2)∵抽样的20个产品中在[39.98,40.02]范围内的有17个,∴产品合格率为×100%=85%.
∴10 000×85%=8 500.
故根据抽样检查结果,可以估计这批产品的合格个数为8 500.
反思感悟 总体分布中相应的统计图表主要包括:频率分布表、频率分布直方图、频率分布折线图等.通过这些统计图表给出的相应统计信息可以估计总体.
跟踪训练2 从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率分布折线图;
(3)估计成绩在[60,90)分的学生比例.
解 (1)频率分布表如下.
成绩分组
频数
频率
频率/组距
[40,50)
2
0.04
0.004
[50,60)
3
0.06
0.006
[60,70)
10
0.2
0.020
[70,80)
15
0.3
0.030
[80,90)
12
0.24
0.024
[90,100]
8
0.16
0.016
合计
50
1.00
0.100
(2)频率分布直方图和折线图如图所示:
(3)成绩在[60,90)分的学生比例为0.2+0.3+0.24=0.74=74%.
题型三 用样本的数字特征估计总体的数字特征
例3 为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图.
(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为1,2,估计1-2的值.
解 (1)设甲校高三年级学生总人数为n.
由题意,知=0.05,解得n=600.
样本中甲校高三年级学生数学成绩不及格的人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为
1-=.
(2)设甲、乙两校样本平均数分别为,.
根据样本茎叶图知,30(-)=30-30
=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92
=2+49-53-77+2+92=15.
因此-=0.5,所以1-2的估计值为0.5分.
反思感悟 样本的数字特征分为两大类:一类是反映样本数据集中趋势的特征数,例如平均数;另一类是反映样本数据波动大小的特征数,例如方差和标准差.通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),从而实现对总体的估计.
跟踪训练3 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:

60
80
70
90
70

80
60
70
80
75
问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?
解 甲的平均成绩为甲=74,乙的平均成绩为乙=73.所以甲的平均成绩好.
甲的方差是s=[(-14)2+62+(-4)2+162+(-4)2]=104,乙的方差是s=×[72+(-13)2+(-3)2+72+22]=56.
因为s>s,所以乙的各门功课发展较平衡.
线性回归及应用
典例 理论预测某城市2020到2024年人口总数与年份的关系如下表所示:
年份202x(年)
0
1
2
3
4
人口数y(十万)
5
7
8
11
19
(1)请画出上表数据的散点图;
(2)指出x与y是否线性相关;
(3)若x与y线性相关,请根据上表提供的数据,用最小二乘法求出y关于x的回归方程=x+;
(4)据此估计2025年该城市人口总数.
(参数数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)
解 (1)数据的散点图如图:
(2)由散点图可知,样本点基本上分布在一条直线附近,故x与y呈线性相关.
(3)由表知=×(0+1+2+3+4)=2,
=×(5+7+8+11+19)=10.
∴==3.2,=-=3.6,
∴回归方程为=3.2x+3.6.
(4)当x=5时,=19.6(十万)=196万.
故2025年该城市人口总数约为196万.
[素养评析] (1)最小二乘法估计的三个步骤
①作出散点图,判断是否线性相关.
②如果是,则用公式求,,写出回归方程.
③根据方程进行估计.
(2)线性回归的应用,注意三个方面,一是收集数据,二是准确计算求得回归方程,三是用回归方程进行估计预测,所以,这类题目培养的数学核心素养为数学运算与数据分析.
1.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是(  )
A.1 B.2 C.3 D.4
答案 B
解析 设这10个数为a1,a2,…,a10,
则有a+a+…+a=200,
且a1+a2+…+a10=40,
∴
=
==4,
∴标准差为=2.
2.某农田施肥量x(单位:kg)与小麦产量y(单位:kg)之间的回归方程是=4x+250,则当施肥量为50 kg时,可以预测小麦的产量为________kg.
答案 450
解析 直接将x=50代入回归方程中,
可得=4×50+250=450.
3.如图所示是一次考试结果的频率分布直方图,则据此估计这次考试的平均分为________.
答案 75
解析 利用组中值估算平均分,则有=55×0.1+65×0.2+75×0.4+85×0.2+95×0.1=75,故估计这次考试的平均分为75.
4.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程=x+,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少小时?

解 (1)散点图如图.
(2)由表中数据得:iyi=52.5,
=3.5,=3.5,=54,∴ =0.7,∴=1.05,
∴=0.7x+1.05,回归直线如图所示.
(3)将x=10代入线性回归方程,
得=0.7×10+1.05=8.05,
故加工10个零件约需要8.05小时.
5.从某学校的男生中随机抽取50名测量身高,被测学生身高全部介于155 cm和195 cm之间,将测量结果按如下方式分成八组;第一组[155,160),第二组[160,165),…,第八组[190,195].如图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组的人数相同,第六组的人数为4.
(1)求第七组的频率;
(2)估计该校的800名男生的身高的中位数以及身高在180 cm以上(含180 cm)的人数.
解 (1)第六组的频率为=0.08,所以第七组的频率为1-0.08-5×(0.008×2+0.016+0.04×2+0.06)=0.06.
(2)身高在第一组[155,160)的频率为0.008×5=0.04,
身高在第二组[160,165)的频率为0.016×5=0.08,
身高在第三组[165,170)的频率为0.04×5=0.2,
身高在第四组[170,175)的频率为0.04×5=0.2,
由于0.04+0.08+0.2=0.32<0.5,0.04+0.08+0.2+0.2=0.52>0.5,
估计这所学校的800名男生的身高的中位数为m,
则170<m<175,
由0.04+0.08+0.2+(m-170)×0.04=0.5,得m=174.5,所以可估计这所学校的800名男生的身高的中位数为174.5,
由频率分布直方图得后三组频率为0.06+0.08+0.008×5=0.18,
所以身高在180 cm以上(含180 cm)的人数为0.18×800=144.
1.用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点:
(1)纵轴表示;(2)频率分布直方图中各小长方形高的比就是相应各组的频率之比;(3)直方图中各小长方形的面积是相应各组的频率,所有的小长方形的面积之和等于1,即频率之和为1.
2.平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它们可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述波动大小.
课件55张PPT。章末复习第二章 统 计学习目标XUEXIMUBIAO1.梳理本章知识,构建知识网络.
2.会根据不同的特点选择适当的抽样方法获得样本数据.
3.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计总体.
4.能利用散点图对两个变量是否相关进行初步判断,能用线性回归方程进行预测.NEIRONGSUOYIN内容索引知识梳理题型探究达标检测1知识梳理PART ONE1.抽样方法
(1)用随机数法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.
(2)用系统抽样法时,如果总体容量N能被样本容量n整除,抽样间隔为k= ;如果总体容量N不能被样本容量n整除,先用简单随机抽样剔除多余个体,抽样间隔为k= (其中K=N-多余个体数).(3)三种抽样方法的异同点2.用样本估计总体
(1)用样本估计总体
用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率______
与频率 .当样本只有两组数据且样本容量比较小时,用 刻画数据比较方便.
(2)样本的数字特征
样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括 、
和 ;另一类是反映样本数据波动大小的,包括 及 .分布直方图茎叶图分布表众数中位数平均数方差标准差3.变量间的相关关系
(1)两个变量之间的相关关系的研究,通常先作变量的 ,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系).
(2)求回归方程的步骤:散点图2题型探究PART TWO题型一 抽样方法例1 (1)大、中、小三个盒子中分别装有同一产品120个、60个、20个,现在需从这三个盒子中抽取一个容量为25的样本,较为恰当的抽样方法是
A.分层抽样 B.系统抽样
C.简单随机抽样 D.以上三种均可√解析 总体无明显差异,但总体中个体数较多,故采用系统抽样较恰当.(2)某企业三月中旬生产A,B,C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的表格:由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本数量比C产品的样本数量多10,根据以上信息,可得C产品的数量是______件.800解析 设C产品的样本数量为n,则A产品的样本数量为n+10,反思感悟 系统抽样的特点是“等距离”抽样,分层抽样的特点是“等比例”抽样.跟踪训练1 某高级中学有学生270人,其中一年级108人,二、三年级各81人.现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
关于上述样本的下列结论中,正确的是
A.②③都不能为系统抽样 B.②④都不能为分层抽样
C.①④都可能为系统抽样 D.①③都可能为分层抽样√则在号码段1,2,…,108中抽取4个号码,在号码段109,110,…,189中抽取3个号码,在号码段190,191,…,270中抽取3个号码,①②③符合,所以①②③可能是分层抽样,④不符合,所以④不可能是分层抽样;
如果按系统抽样时,抽出的号码应该是“等距”的,①③符合,②④不符合,所以①③都可能为系统抽样,②④都不能为系统抽样.题型二 用样本的频率分布估计总体例2 某制造商生产一批直径为40 mm的乒乓球,现随机抽样检查20个,测得每个球的直径(单位:mm,保留两位小数)如下:
40.03 40.00 39.98 40.00 39.99 40.00 39.98
40.01 39.98 39.99 40.00 39.99 39.95 40.01
40.02 39.98 40.00 39.99 40.00 39.96(1)完成下面的频率分布表,并画出频率分布直方图;解 频率分布表如下:频率分布直方图如图.(2)假定乒乓球的直径误差不超过0.02 mm为合格品.若这批乒乓球的总数为
10 000,试根据抽样检查结果估计这批产品的合格个数.解 ∵抽样的20个产品中在[39.98,40.02]范围内的有17个,∴10 000×85%=8 500.
故根据抽样检查结果,可以估计这批产品的合格个数为8 500.反思感悟 总体分布中相应的统计图表主要包括:频率分布表、频率分布直方图、频率分布折线图等.通过这些统计图表给出的相应统计信息可以估计总体.跟踪训练2 从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;解 频率分布表如下.(2)画出频率分布直方图和频率分布折线图;解 频率分布直方图和折线图如图所示:(3)估计成绩在[60,90)分的学生比例.解 成绩在[60,90)分的学生比例为0.2+0.3+0.24=0.74=74%.题型三 用样本的数字特征估计总体的数字特征例3 为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图.(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);解 设甲校高三年级学生总人数为n.样本中甲校高三年级学生数学成绩不及格的人数为5,=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92
=2+49-53-77+2+92=15.反思感悟 样本的数字特征分为两大类:一类是反映样本数据集中趋势的特征数,例如平均数;另一类是反映样本数据波动大小的特征数,例如方差和标准差.通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),从而实现对总体的估计.跟踪训练3 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?核心素养之数学运算与数据分析HEXINSUYANGZHISHUXUEYUNSUANYUSHUJUFENXI线性回归及应用典例 理论预测某城市2020到2024年人口总数与年份的关系如下表所示:(1)请画出上表数据的散点图;解 数据的散点图如图:(2)指出x与y是否线性相关;解 由散点图可知,样本点基本上分布在一条直线附近,故x与y呈线性相关.(3)若x与y线性相关,请根据上表提供的数据,用最小二乘法求出y关于x的回
归方程 ;(4)据此估计2025年该城市人口总数.
(参数数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)故2025年该城市人口总数约为196万.素养评析 (1)最小二乘法估计的三个步骤
①作出散点图,判断是否线性相关.
②如果是,则用公式求 ,写出回归方程.
③根据方程进行估计.
(2)线性回归的应用,注意三个方面,一是收集数据,二是准确计算求得回归方程,三是用回归方程进行估计预测,所以,这类题目培养的数学核心素养为数学运算与数据分析.3达标检测PART THREE1.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的标准差是
A.1 B.2 C.3 D.4√12345解析 设这10个数为a1,a2,…,a10,1232.某农田施肥量x(单位:kg)与小麦产量y(单位:kg)之间的回归方程是 =4x+250,则当施肥量为50 kg时,可以预测小麦的产量为________kg.450解析 直接将x=50代入回归方程中,541233.如图所示是一次考试结果的频率分布直方图,则据此估计这次考试的平均分为_____.75解析 利用组中值估算平均分,则有 =55×0.1+65×0.2+75×0.4+85×0.2+95×0.1=75,
故估计这次考试的平均分为75.5412344.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;51234解 散点图如图.512345123451234(3)试预测加工10个零件需要多少小时?解 将x=10代入线性回归方程,5故加工10个零件约需要8.05小时.12345.从某学校的男生中随机抽取50名测量身高,被测学生身高全部介于155 cm和195 cm之间,将测量结果按如下方式分成八组;第一组[155,160),第二组[160,165),…,第八组[190,195].如图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组的人数相同,第六组的人数为4.5(1)求第七组的频率;12345(2)估计该校的800名男生的身高的中位数以及身高在180 cm以上(含180 cm)的人数.123451234解 身高在第一组[155,160)的频率为0.008×5=0.04,
身高在第二组[160,165)的频率为0.016×5=0.08,
身高在第三组[165,170)的频率为0.04×5=0.2,
身高在第四组[170,175)的频率为0.04×5=0.2,
由于0.04+0.08+0.2=0.32<0.5,0.04+0.08+0.2+0.2=0.52>0.5,
估计这所学校的800名男生的身高的中位数为m,
则170<m<175,
由0.04+0.08+0.2+(m-170)×0.04=0.5,得m=174.5,所以可估计这所学校的800名男生的身高的中位数为174.5,
由频率分布直方图得后三组频率为0.06+0.08+0.008×5=0.18,
所以身高在180 cm以上(含180 cm)的人数为0.18×800=144.51.用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点:
(1)纵轴表示 ;(2)频率分布直方图中各小长方形高的比就是相应各组的频
率之比;(3)直方图中各小长方形的面积是相应各组的频率,所有的小长方形的面积之和等于1,即频率之和为1.
2.平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它们可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述波动大小.课堂小结KETANGXIAOJIE阶段训练二(§2.1~§2.3)
一、选择题
1.以下四个叙述:①极差与方差都反映了数据的集中程度;②方差是没有单位的统计量;③标准差比较小时,数据比较分散;④只有两个数据时,极差是标准差的2倍,其中正确的是(  )
A.①④ B.②③
C.①③ D.②④
答案 A
解析 只有两个数据时,极差等于|x2-x1|,标准差等于|x2-x1|.故④正确.由定义可知①正确,②③错误.
2.有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为(  )
A.18 B.36
C.54 D.72
答案 B
解析 样本数据落在区间[10,12]内的频率为0.18,则样本数据落在区间[10,12]内的频数为36.
3.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为(  )
A.101 B.808 C.1 212 D.2 012
答案 B
解析 根据分层抽样的概念知=,
解得N=808,故选B.
4.甲、乙两名篮球运动员在某几场比赛中得分的茎叶图如图所示,则甲、乙两人在这几场比赛中得分的中位数之和是(  )

A.63 B.64
C.65 D.66
答案 A
解析 甲、乙两人在这几场比赛中得分的中位数分别是36和27,则中位数之和是36+27=63.
5.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积的和的,且样本容量为160,则中间一组的频数为(  )
A.32 B.0.2
C.40 D.120
答案 A
解析 频率分布直方图中所有小长方形的面积和等于1,则中间小长方形的面积为,也就是中间一组的频率是,中间一组的频数为160×=32.
6.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是(  )
A.46,45,56 B.46,45,53
C.47,45,56 D.45,47,53
答案 A
解析 根据茎叶图可知样本中共有30个数据,中位数为46,出现次数最多的数是45,最大数与最小数的差为68-12=56.故选A.
7.某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机抽取了24名笔试者的成绩,统计结果如下表所示.
分数段
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
[85,90]
人数
2
3
4
9
5
1
据此估计允许参加面试的分数线大约是(  )
A.90 B.85
C.80 D.75
答案 C
解析 参加面试的频率为=0.25,样本中[80,90]的频率为=0.25,由样本估计总体知,分数线大约为80分.
8.某市对上、下班交通情况作抽样调查,上、下班时间各抽取了12辆机动车行驶时速(km/h)如图所示,则上、下班时间的中位数分别是(  )
A.28,28 B.29,32
C.28,30 D.25,29
答案 A
解析 将两组数据分别按从小到大排列,如上班时间的数据为18,20,21,26,27,28,28,30,32,
33,35,40,找出中间两个数28,28,则其中位数为28,同理得出下班时间的中位数为28.
二、填空题
9.某校高一、高二、高三分别有学生1 600名、1 200名、800名.为了解该校高中学生的牙齿健康状况,按各年级的学生数进行分层抽样.若高三抽取20名学生,则高一、高二共需抽取的学生数为________.
答案 70
解析 先求出每层的抽样比,再进一步求解.
每层的抽样比为=.
∴高一、高二共需抽取的学生数为(1 600+1 200)×=70.
10.将一个容量为m的样本分成3组,已知第一组频数为8,第二、三组的频率为0.15和0.45,则m=________.
答案 20
解析 由题意知第一组的频率为1-(0.15+0.45)=0.4,
∴=0.4,∴m=20.
11.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的数据,计算得回归方程为=0.85x-0.25.由以上信息,可得表中c的值为________.
天数x
3
4
5
6
7
繁殖数量
y(千个)
2.5
3
4
4.5
c
答案 6
解析 ==5,
==,
代入回归方程中得=0.85×5-0.25,
解得c=6.
三、解答题
12.为了选拔参加自行车比赛的选手,对自行车运动员甲、乙两人在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:

27
38
30
37
35
31

33
29
38
34
28
36
(1)画出茎叶图,由茎叶图你能获得哪些信息;
(2)估计甲、乙两运动员的最大速度的平均数和方差,并判断谁参加比赛更合适.
解 (1)画茎叶图如图所示,可以看出,甲、乙两人的最大速度都是均匀分布的,只是甲的最大速度的中位数是33,乙的最大速度的中位数是33.5,因此从中位数看乙的情况比甲好.
(2)甲=(27+38+30+37+35+31)=33,
乙=(33+29+38+34+28+36)=33,
所以他们的最大速度的平均数相同,
再看方差s=[(-6)2+…+(-2)2]=,
s=(02+…+32)=,则s>s.
故乙的最大速度比甲稳定,所以派乙参加比赛更合适.
13.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,iyi=184,=720.
(1)求家庭的月储蓄y对月收入x的线性回归方程=x+;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:线性回归方程=x+中,=,=-,其中,为样本平均数.
解 (1)由题意知n=10,=i==8,
=i==2,
又====0.3,
=-=2-0.3×8=-0.4,
故所求线性回归方程为=0.3x-0.4.
(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间正相关.
(3)将x=7代入回归方程可以预测该家庭的月储蓄为
y=0.3×7-0.4=1.7(千元).
14.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
运动员
第1次
第2次
第3次
第4次
第5次

87
91
90
89
93

89
90
91
88
92
则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.
答案 2
解析 由表中数据计算可得甲=90,乙=90,且
s=[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,
s=[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2,
由于s>s,故乙的成绩较为稳定,其方差为2.
15.某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如下频率分布直方图.观察图形的信息,回答下列问题:
(1)估计这次考试的众数m与中位数n(结果保留一位小数);
(2)估计这次考试的及格率(60分及以上为及格)和平均分.
解 (1)众数是最高小矩形底边中点的横坐标,
∴众数为m=75.
前三个小矩形面积为
0.01×10+0.015×10+0.015×10=0.4.
∵中位数平分直方图中的小矩形的面积,
∴n=70+×10≈73.3.
(2)依题意60分及以上的分数所在的第三、四、五、六组的频率和为(0.015+0.03+0.025+0.005)×10=0.75,
∴抽样学生成绩的及格率是75%.
利用组中值估算抽样学生的平均分为
45·f1+55·f2+65·f3+75·f4+85·f5+95·f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
估计这次考试的平均分是71分.