课件51张PPT。章末总结网络建构2.抽签法抽签时,先抽签的人占便宜.( )
3.利用随机数表抽样时,开始位置和读数方向可以任意选择.( )
4.分层抽样中,为确保公平性,在每层都应用同一抽样方法.( )
5.频率分布直方图中每个小长方形的面积等于相应组的频率,各个小长方形面积之和小于1.( )
6.从总体中抽取一个样本,用样本的分布估计总体的分布,样本容量越小估计越准确.( )知识辨析判断下列说法是否正确.(请在括号中填“√”或“×”)
1.抽签法和随机数法都是不放回抽样.( )√×√×××7.在样本数据中,频率分布最大值所对应的样本数据是众数.( )√√题型归纳·素养提升题型一 抽样方法的应用解析:(1)由于小学、初中、高中三个学段学生的视力情况差异较大,而男女生视力情况差异不大,因此可以按学段分层抽样.故选C.[典例1] (1)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )
(A)简单随机抽样 (B)按性别分层抽样
(C)按学段分层抽样 (D)系统抽样答案:(1)C (2)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为 4∶5∶5∶6,则应从一年级本科生中抽取 名学生.?答案:(2)60规律方法三种抽样方法中每个个体被抽中的机会均等,系统抽样抽取的号码成等差数列,公差为间隔.分层抽样在各层中抽取的数目取决于抽样比,即各层抽取数目=抽样比×各层个体总数.即时训练1-1:我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )
(A)134石 (B)169石
(C)338石 (D)1 365石题型二 用样本的频率分布估计总体分布[典例2] 有1个容量为100的样本,数据的分组及各组的频数如下:
[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;
[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.
(1)列出样本的频率分布表(含累积频率);解析:(1)样本的频率分布表如下:(2)画出频率分布直方图;
(3)估计小于30的数据约占多大百分比.解析:(2)频率分布直方图如图.规律方法频率分布直方图中,各个矩形的面积为对应数据组的频率,且所有矩形的面积和为1.题型三 用样本的数字特征估计总体的数字特征[典例3] 每年高考结束后,处于休养状态的高中毕业生旅游动机强烈,旅游可支配收入日益增多,可见高中毕业生旅游是一个巨大的市场.为了解高中毕业生每年旅游消费支出(单位:百元)的情况,相关部门随机抽取了某市的1 000名毕业生进行问卷调查,并把所得数据列成如表所示的频数分布表:则所得样本的中位数是 (精确到百元).?答案:51规律方法样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差.我们常通过样本的数字特征估计总体的数字特征.即时训练3-1:从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?题型四 茎叶图的应用[典例4] 为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果
如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5
2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4
1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5
根据两组数据画出茎叶图,从茎叶图看,哪种药的疗效更好?解析:由观测结果可绘制如图茎叶图.规律方法利用茎叶图统计相应数据,要先根据所给数字的位数选好茎,叶上的数字只能为一位数字;如果绘制两份数据的茎叶图,则茎在中间,叶放两边.注意,茎上的数字位数可以不一致.题型五 线性回归分析[典例5] 某企业上半年的某种产品的月产量与单位成本数据如下:(1)产量与单位成本是否具有线性相关关系?若有,试确定回归直线方程;解析:(1)设x表示每月产量(单位:万件),y表示单位成本(单位:元/件),作散点图如图.解:(2)由线性回归直线方程知,每增加10 000件产品时,单位成本下降1.818元/件.(2)指出产量每增加10 000件时,单位成本下降多少?
(3)假定产量为60 000件时,单位成本是多少?单位成本为 规律方法两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量是否具有相关关系.若两变量具有线性相关关系,代入公式求回归直线方程,由直线方程预测变量,估计和预测分析实际问题.即时训练5-1:某研究机构对中学生记忆能力x和识图能力y进行统计分析,得到如下数据:由于某些原因,识图能力的一个数据丢失,但已知识图能力样本平均值是5.5.
(1)求丢失的数据;(3)若某一学生记忆能力值为12,请你预测他的识图能力值.题型六 易错辨析[典例6] 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的数量按5天一组分组统计,绘制了频率分布直方图.已知从左到右各长方形的高的比为2∶3∶
4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数量最多?有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?(3)第四组的获奖率高,因为该组的小长方形面积最大,而且获奖件数最多,故第四组获奖率高.真题体验·素养升级1.(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
(A)x1,x2,…,xn的平均数
(B)x1,x2,…,xn的标准差
(C)x1,x2,…,xn的最大值
(D)x1,x2,…,xn的中位数B 解析:标准差衡量样本的稳定程度,故选B.C3.(2018·全国Ⅰ卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是( )
(A)新农村建设后,种植收入减少
(B)新农村建设后,其他收入增加了一倍以上
(C)新农村建设后,养殖收入增加了一倍
(D)新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的
一半A解析:设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:故选A.4.(2018·全国Ⅲ卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是 .?解析:因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样.答案:分层抽样5.(2018·江苏卷)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .?答案:906.(2017·江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取
件.?答案:187.(2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为
(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间
[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.8.(2018·全国Ⅱ卷)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预
测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.