(共13张PPT)
阶段复习课
第四课 统 计
思维脉图构建
【答案速填】
①__简单随机抽样__
②__分层随机抽样__
③__随机数法__
④__百分位数__
⑤__平均数__
⑥__方差__
易错案例警示
易错一 抽样不合理致误
【案例1】某班有42名男生,30名女生,已知男女身高各有明显不同,现欲调查
平均身高,若采用分层随机抽样方法,抽取男生1人,女生1人,这种做法是否合
适,若不合适,应怎样抽取
【解析】考虑到本题应采用分层随机抽样及男、女生各自的人数,故按7∶5抽
取更合适,即男生抽取7人,女生抽取5人,各自用抽签法或随机数法抽取组成样
本.
【错因探究】由于取样比例数过小,仅抽取2人,很难准确反映总体情况,又因
为男、女生差异较大,抽取人数相同,也不尽合理,故此法不合适,抽取人数过
多,失去了抽样调查的统计意义,取样太少,不能准确反映真实情况.
【避错警示】抽取样本时,应尽可能反映总体的特征,根据具体的情况确定样
本数,按照一定的抽样比进行分层抽取或利用简单随机抽样进行抽取.
易错二 因不理解抽样方法的适用范围而致误
【案例2】某学校附近的一家小型超市为了了解一年的客流量情况,决定用抽签
法从一年中抽取52天作为样本实施调查(假设一年有52个星期),你觉得这样的
选择合适吗 为什么
【解析】这种选择不合适. 应该将全年分为两层,放假(一般一年寒暑假放假共
计10周)与上学(42周).每层用简单随机抽样的方法,抽取适当的样本进行调查.
【错因探究】对于本题,产生错误的根源是没有弄清这家超市一年中的客流量
变化情况.应该清楚这家超市位于学校附近,因此客流量受学生作息制度的影响
较大.
【避错警示】明确每一种抽样的使用范围和抽取方法,是避免出现类似错误的
前提.一般来说,简单随机抽样要求总体中个体数目较少;分层随机抽样适用于
总体由差异明显的几部分组成(即各部分层次性明显).
易错三 分层随机抽样的平均数计算致误
【案例3】若 是x1,x2,…,x100的平均值,a1为x1,x2,…,x40的平均值,a2为
x41,x42,…,x100的平均值,则下列式子中正确的是 ( )
【解析】选A.
由于x1+x2+…+x100= ,
而x1+x2+…+x40=40a1,
x41+x42+…+x100=60a2,
于是
【错因探究】对分层抽样得到的样本,各层抽取的个体个数一般不等,不能对各
层得到的平均数进行简单地相加或取平均值.
【避错警示】对于分别有m,n的两层数据平均数可以由下列公式计算样本平均
数:
数据x1,x2,…,xm的平均数为 ,数据y1,y2,…,yn的平均数为 ,
易错四 公式使用不当致误
【案例4】若10个正整数的平方和是208,平均数是4,则这组数据的方差为多少 将这组数据同时减去3,则新数据的平均数为多少 方差为多少
【解析】由方差公式 展开整理可得
这里由题设知n=10,
所以
因为一组数据同时减去a后,平均数为( -a),方差不变,
所以都减去3后,平均数为1,方差为4.8.
【错因探究】对方差的意义理解不到位,公式记忆不准确导致本题计算错误.对于一组数据都减去或加上同一个数,方差不变.
【避错警示】正确理解方差的概念与意义,方差所表达的是一组数据相对于取值平均水平的偏离(离散)程度.只有理解概念、熟记公式,才不至于出错.(共26张PPT)
阶段提升课 第四课 统计
知识体系·思维建模
考点整合·素养提升
分组 频数 频率
60.5~70.5 0.16
70.5~80.5 10
80.5~90.5 18 0.36
90.5~100.5
合计
分组 频数 频率
60.5~70.5 8 0.16
70.5~80.5 10 0.20
80.5~90.5 18 0.36
90.5~100.5 14 0.28
合计 50 1
样本频数分布
普查
实际问题
样本的百分位数
抽样调查
样本观测数据
样本的平均值、中位数、众数
简单随机抽样
样本标准差、方差、极差
分层随机抽样
抽样
统计
总体的取值规律
总体的百分位数
总体数据
用样本估计总体
决策与建议
总体的平均值、中位数、众数
总体标准差、方差、极差
频率
组距
0.02
0.015
0.01
0.005
0
20
40
60
80100成绩/分
频率/组距
0.036
0.028
0.020
0.016
成绩/分
60.570.580.590.5100.5
频率
组距
a
0.025
0.015
0.010
0.005
90100110120130140150分数阶段提升课 第四课 统计
知能题组一 随机抽样
1.总体由编号为01,02,…,49,50的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第4个个体的编号为( )
附:第6行至第9行的随机数表
2748 6198 7164 4148 7086 2888 8519 1620
7477 0111 1630 2404 2979 7991 9683 5125
3211 4919 7306 4916 7677 8733 9974 6732
2635 7900 3370 9160 1620 3882 7757 4950
A.3 B.19 C.38 D.20
【解析】选B.从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,位于01至50中间,含端点,则这四个数为41,48,28,19.
2.某校有高一学生n名,其中男生数与女生数之比为6∶5,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为的样本,若样本中男生比女生多12人,则n=( )
A.990 B.1 320 C.1 430 D.1 560
【解析】选B.依题意可得×=12,
解得n=1 320.
抽样方法的特点及选取规则
简单随机抽样和比例分配的分层随机抽样的共同特点是在抽样过程中每个个体被抽取的机会相等,
(1)特点:体现了这些抽样方法的客观性和公平性.
(2)规则:当总体中的个体数较少时,常采用简单随机抽样;当已知总体由差异明显的几部分组成时,常采用分层随机抽样.在进行分层随机抽样时要用到简单随机抽样方法.
知能题组二 利用样本的频率分布估计总体
的取值规律
1.某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为,,,[80,100].若低于60分的人数是15人,则该班的学生人数是( )
A.45 B.50 C.55 D.60
【解析】选B.根据频率分布直方图可知成绩低于60分的有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20,则成绩低于60分的频率P=(0.005+0.010)×20=0.3.又因为低于60分的人数是15人,
所以该班的学生人数是15÷0.3=50.
2.某中学举行了一次“丝绸之路知识竞赛”,共有800名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表,解答下列问题:
分组 频数 频率
60.5~70.5 0.16
70.5~80.5 10
80.5~90.5 18 0.36
90.5~100.5
合计
(1)填充频率分布表中的空格(将答案直接填在表格内),并作出频率分布直方图.
(2)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约有多少名?
【解析】(1)频率分布表如表所示,频率分布直方图如图所示.
分组 频数 频率
60.5~70.5 8 0.16
70.5~80.5 10 0.20
80.5~90.5 18 0.36
90.5~100.5 14 0.28
合计 50 1
(2)在被抽到的学生成绩中,在85.5~95.5分的个数约是9+7=16,占样本的比例是=0.32,即获得二等奖的概率约为32%,所以获得二等奖的学生约有800×32%=256(名).
总体频率分布的估计方法:
(1)频率为小矩形的面积,利用频率可以计算样本容量、频数等.
(2)所有小矩形的面积(频率)之和为1.
知能题组三 利用样本的百分位数估计总体
的百分位数
1.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居民,他们的幸福感指数分别为5,6,7,8,9,5,则这组数据的第80百分位数是( )
A.7 B.7.5 C.8 D.9
【解析】选C.该组数据从小到大排列为:5,5,6,7,8,9,且6×80%=4.8.故这组数据的第80百分位数是8.
2.一家保险公司决定对推销员实行目标管理,即给推销员确定一个具体的销售目标.确定的销售目标是否合适,直接影响到公司的经济效益.如果目标定得过高,多数推销员完不成任务,会使推销员失去信心;如果目标定得太低,将不利于挖掘推销员的工作潜力.下面一组数据是部分推销员的月销售额(单位:千元).
19.58 16.11 16.45 20.45 20.24 21.66 22.45
18.22 12.34
19.35 20.55 17.45 18.78 17.96 19.91 18.12
14.65 14.78
16.78 18.78 18.29 18.51 17.86 19.58 19.21
18.55 16.34
15.54 17.55 14.89 18.94 17.43 17.14 18.02
19.98 17.88
17.32 19.35 15.45 19.58 13.45 21.34 14.00
18.42 23.00
17.52 18.51 17.16 24.56 25.14
请根据这组样本数据提出使65%的职工能够完成销售指标的建议.
【解析】将这50个样本数据按从小到大排序,可得
12.34 13.45 14.00 14.65 14.78 14.89 15.45
15.54 16.11
16.34 16.45 16.78 17.14 17.16 17.32 17.43
17.45 17.52
17.55 17.86 17.88 17.96 18.02 18.12 18.22
18.29 18.42
18.51 18.51 18.55 18.78 18.78 18.94 19.21
19.35 19.35
19.58 19.58 19.58 19.91 19.98 20.24 20.45
20.55 21.34
21.66 22.45 23.00 24.56 25.14
有65%的职工能够完成销售指标,那么35%的职工不能完成销售指标.
由50×(1-65%)=17.5可知这组数据的35%分位数为17.52.故为使65%的职工能够完成销售指标,该保险公司可将月销售额定为17.52千元.
计算一组n个数据的第p百分位数的一般步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
知能题组四 利用样本估计总体的集中趋势
与离散程度
1.某校高三年级共有800名学生参加了数学测验,将所有学生的数学成绩分组如下:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],得到的频率分布直方图如图所示,则下列说法中正确的是( )
①成绩不低于120分的学生人数为440;
②这800名学生中数学成绩的众数为125;
③这800名学生数学成绩的中位数的近似值为121.24;④这800名学生数学成绩的平均数为120.
A.1个 B.2个 C.3个 D.4个
【解析】选D.由题意得(0.010×2+0.025+a+0.015+0.005)×10=1,解得a=0.035,所以成绩不低于120分的学生人数为800×10×(0.035+0.015+0.005)=440,所以①正确;由频率直方图可知分在[120,130)中最多,所以众数为=125,所以②正确;
这800名学生数学成绩的中位数为120+≈121.4所以③正确;这800名学生数学成绩的平均数为
10×(95×0.010+105×0.010+115×0.025+125×0.035+135×0.015+145×0.005)=120,所以④正确.
2.某工厂技术人员对三台智能机床生产数据统计后发现,甲车床每天生产次品数的平均数为1.5,标准差为1.28;乙车床每天生产次品数的平均数为1.2,标准差为0.87;丙车床每天生产次品数的平均数为1.2,标准差为1.28.由此数据可以判断生产性能最好且较稳定的为( )
A.无法判断 B.甲车床
C.乙车床 D.丙车床
【解析】选C.由题意,乙车床每天生产次品数的平均数最小,性能最好,且标准差最小,生产性能最稳定,所以可以判断生产性能最好且较稳定的为乙车床.
利用样本数据的众数、中位数、平均数和标准差等估计总体问题
(1)平均数、众数、中位数都是描述一组数据的特点,但描述的含义不同.
(2)标准差、方差都是描述一组数据波动情况的量,越小就表示越稳定.
PAGE
6