(共33张PPT)
章末综合提升
第六章 统计
巩固层·知识整合
NO.1
提升层·题型探究
NO.2
类型1 随机抽样方法的应用
类型2 用样本估计总体
类型3 用样本的数字特征估计总体
体验层·真题感悟
NO.3
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
5
1
2
3
4
普查
直接获取
抽查
获取数据的途径
间接获取
总体和样本
抽签法
简单随机抽样
随机数法
抽样的基本方法
分层随机抽样
统
频数频率
计
用样本估计总体分布
画法
频率分布直方图
应用
计算
样本的数字特征众数、中位数、平均数、方差
用样本估计总
应用
体的数字特征
分层随机抽样的均值和方差
百分位数
简单随特
机抽样占逐个抽我范总体中个体较少
每个
围
个体
共被抽
性到的
可能
分层随特」分层按范总体由差异明显
性相
机抽样|点L比例抽取「围L的几部分组成
等
频率/组距
10.00
8.75
7.50
6.25
5.00
3.75}--
2.50
1.25
053153535537539541543545547549直径mm第6章 统计
类型1 随机抽样方法的应用
【例1】 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,干事20人,上级机关为了了解机关人员对政府机构的改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取?
[解] 用分层随机抽样抽取.
∵20∶100=1∶5,∴=2,=14,=4,
即从副处级以上干部中抽取2人,一般干部中抽取14人,干事中抽取4人.
∵副处级以上干部与干事人数都较少,他们分别按1~10编号和1~20编号,然后采用抽签法分别抽取2人和4人,对一般干部采用00,01,…,69编号,然后用随机数法抽取14人.
1.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层随机抽样的方法从全体师生中抽取一个容量为n的样本,若女学生一共抽取了80人,则n的值为( )
A.193 B.192
C.191 D.190
B [1 000×=80,求得n=192.]
类型2 用样本估计总体
【例2】 某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:
[107,109)3株;[109,111)9株;[111,113)13株;
[113,115)16株;[115,117)26株;[117,119)20株;
[119,121)7株;[121,123)4株;[123,125]2株.
(1)列出频率分布表;
(2)画出频率分布直方图;
(3)据上述图表,估计数据在[109,121)范围内的可能性是百分之几?
[解] (1)频率分布表如下:
分组 频数 频率 累积频率
[107,109) 3 0.03 0.03
[109,111) 9 0.09 0.12
[111,113) 13 0.13 0.25
[113,115) 16 0.16 0.41
[115,117) 26 0.26 0.67
[117,119) 20 0.20 0.87
[119,121) 7 0.07 0.94
[121,123) 4 0.04 0.98
[123,125] 2 0.02 1.00
合计 100 1.00
(2)频率分布直方图如下:
(3)由上述图表可知数据落在[109,121)范围内的频率为:0.94-0.03=0.91,即数据落在[109,121)范围内的可能性是91%.
1.在本例中由得到的频率分布直方图估计树苗的高度(cm)的众数和中位数.
[解] 众数是频率分布直方图中最高小矩形的底边的中点,即估计众数为116,
因为前4组数据的累计频率是0.41,前5组数据的累计频率是0.67,所以中位数在[115,117)内,设中位数为x,则0.41+(x-115)×0.13=0.5,解得x≈115.7,即中位数的估计值为115.7.
2.在本例中由得到的频率分布直方图估计树苗的高度(cm)的平均数.
[解] 由频率分布直方图可得树苗的高度(cm)的平均数的估计值为
0.03×108+0.09×110+0.13×112+0.16×114+0.26×116+0.20×118+0.07×120+0.04×122+0.02×124=115.46(cm).
用样本估计总体分布的方法
(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.
(2)借助图表,可以把抽样获得的庞杂数据变得直观,凸显其中的规律,便于信息的提取和交流.
类型3 用样本的数字特征估计总体
【例3】 甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
(1)求甲成绩的80%分位数;
(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由.
[解] (1)把甲的成绩按照从小到大的顺序排列可得:
78 79 81 82 84 88 93 95
因为一共有8个数据,所以8×80%=6.4,不是整数,所以甲成绩的80%分位数是第7个数据93.
(2)x甲=(78+79+81+82+84+88+93+95)=85,
x乙=(75+80+80+83+85+90+92+95)=85.
s=[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,
s=[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41,
∵甲=乙,s用样本的数字特征估计总体的方法
为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体相应的数字特征作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是把样本数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,处于中间位置的数,如果数据的个数是偶数,中间两个的数据的平均数;平均数就是所有样本数据的平均值,用表示;标准差是反映样本数据离散程度大小的最常用统计量,其计算公式是
s=.
2.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( )
分数 5 4 3 2 1
人数 20 10 30 30 10
A.3 B.
C.3 D.
B [∵==3,
∴s2=[(x1-)2+(x2-)2+…+(xn-)2]
=(20×22+10×12+30×12+10×22)==,
∴s=.]
1.(2020·全国卷Ⅲ)在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且p i=1,则下面四种情形中,对应样本的标准差最大的一组是( )
A.p1=p4=0.1,p2=p3=0.4
B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3
D.p1=p4=0.3,p2=p3=0.2
B [法一:标准差反映数据波动的大小程度,波动越大,则标准差越大,根据四个选项频率分布可知B项中数据集中在最大和最小的两个值上,偏离平均值较大,所以标准差最大.
法二:根据标准差公式σ=eq \r(pix\o\al(2,i)-\o(x,\s\up6(-))2).
对于A,σ1==,
对于B,σ2==,
对于C,σ3==,
对于D,σ4==,
σ2最大,故选B.]
2.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
A [平均数与每个数据都相关,方差是反映一组数据在平均值附近的波动情况,极差等于最大值与最小值的差,中位数是一组数据按照自小到大(也可以自大到小)的顺序排列后中间数的值(或者中间两个数的平均值),因此中位数不受数据极端值的影响.由题意知:评委去掉1个最高分和1个最低分时,中位数不发生改变.]
3.(2020·新高考Ⅰ卷)某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是( )
A.62% B.56%
C.46% D.42%
C [设学生总数为n,所求人数比例为x,则0.6n+0.82n-x·n=0.96n,∴x=0.46.]
4.(2020·天津高考)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )
A.10 B.18
C.20 D.36
B [区间[5.43,5.47)对应的频率为(6.25+5)×0.02=0.225,所以直径落在区间[5.43,5.47)内的个数为80×0.225=18.]
5.(2020·江苏高考)已知一组数据4,2a,3-a,5,6的平均数为4,则a的值是________.
2 [由平均数公式可得=4,解得a=2.]
PAGE
6