(共44张PPT)
10.2 用样本估计总体
课标要求 考情分析
1.结合实例,能用样本估计总体的集中趋势 参数(平均数、中位数、众数)、离散程 度参数(标准差、方差、极差),理解集 中趋势参数和离散程度参数的统计含义. 2.结合实例,能用样本估计百分位数,理解 百分位数的统计含义. 3.结合实例,会用随机抽样的基本方法和样 本估计总体的思想解决一些简单的实际问 题. 考点考法:高考命题常以统计
图表为载体考查用样本的数字
特征估计总体的数字特征,其
中频率分布直方图与众数、平
均数、中位数、百分位数、方
差是考查热点,与概率知识的
结合问题也是高考的重要考点.
核心素养:数学运算、数据分
析
必备知识 自主排查
核心考点 师生共研
必备知识 自主排查
01
1.总体百分位数的估计
(1)百分位数
一般地,一组数据的第 百分位数是这样一个值,它使得这组数据中至少
有 的数据小于或等于这个值,且至少有 的数据大于或等于
这个值.
(2)百分位数的意义
反映该组数中小于或等于该百分位数的分布特点.
(3)求百分位数的步骤
可以通过下面的步骤计算一组 个数据的第 百分位数:
第1步,按从________排列原始数据.
第2步,计算 ________.
第3步,若 不是整数,而大于 的比邻整数为 ,则第 百分位数为第 项
数据;若 是整数,则第 百分位数为第 项与第 项数据的_______.
小到大
平均数
[提醒] 常用的分位数有第25百分位数,第50百分位数(即中位数),第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
2.总体集中趋势的估计
名称 概念
平均数 如果有 个数 , , , ,那么 就是这组
数据的平均数,用 表示,即 _ ___________________
中位数 将一组数据按从小到大或从大到小的顺序排列,处在________的
一个数据(当数据个数是奇数时)或最中间两个数据的________
(当数据个数是偶数时)叫做这组数据的中位数
众数 一组数据中出现次数最多的数据(即频数最大值所对应的样本数
据)叫做这组数据的众数
[提醒] 平均数反映了数据取值的平均水平.
最中间
平均数
3.总体离散程度的估计
假设一组数据是 , , , ,用 表示这组数据的平均数,那么这
个数的
(1)标准差
;
(2)方差
.
[提醒] 方差和标准差反映了数据波动程度的大小.
4.分层随机抽样的均值与方差
分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为 ,样
本方差为 .
以分两层抽样的情况为例.假设第一层有 个数,分别为 , , ,
,平均数为 ,方差为 ;第二层有 个数,分别为 , , ,
,平均数为 ,方差为 .则 , ,
, .
则 ;
(2) .
【练一练】
1.判断正误(正确的打“√”,错误的打“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.( )
×
(2)方差和标准差的单位是一样的.( )
×
2.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,
从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效
评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数 C.方差 D.极差
解析:选A.记9个原始评分分别为 , , , , , , , , (按
从小到大的顺序排列),易知 为7个有效评分与9个原始评分的中位数,
故不变的数字特征是中位数.
√
3.(人A必修第二册 例2变条件、变设问)一个容量为20的样本,其数
据按从小到大的顺序排列为: , , , , , , , , , , , , , , ,
, , , , ,则该组数据的第75百分位数为______,第86百分位数为
____.
14.5
17
解析:因为 ,
所以第75百分位数为 .
因为 ,
所以第86百分位数为第18个数据 .
1.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形底边的中点对应的横坐标;
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;
(3)中位数的估计值的左边和右边的小矩形的面积之和是相等的.
2.平均数、方差的公式推广
若数据 , , , 的平均数为 ,方差为 ,那么 , ,
, , 的平均数是 .方差为 .
【用一用】
1.根据某班学生在一次数学考试中的成绩画出
如图所示的频率分布直方图,记由该直方图
得到的数学考试成绩的众数、中位数和平均
数分别为 , , ,则( )
A. B.
C. D.
√
解析:选A.由频率分布直方图可知众数 ;
中位数应落在70到80区间内,则有
,解得 ;
平均数
.
所以 ,故选A.
2.(2023·山东聊城模拟)已知 , , , 的平均值为6,方差为3,
则 , , , 的平均值为____,方差为____.
11
12
解析:新数据的平均值为 ,新数据的方差为 .
核心考点 师生共研
02
考点一 总体百分位数的估计(师生共研)
例1.(1)(2023·山西大同模拟)某工厂随机抽取部分工人,对他们某天生产
的产品件数进行了统计,统计数据如表所示,则该组数据的产品件数的第
60百分位数是( )
件数 7 8 9 10 11
人数 3 6 5 4 2
A. B. C. D.
√
解析:抽取的工人总数为20, ,那么第60百分位数是所有数据从小到大排序的第12项与第13项数据的平均数,第12项与第13项数据分别为9, ,所以第60百分位数是9.故选B.
(2)(2023·天津市南开中学模拟)为了解“双
减”政策实施后学生每天的体育活动时间,
研究人员随机调查了某地区1 000名学生每
天进行体育运动的时间,按照时长(单
位: )分成6组:第一组 ,第二
组 ,第三组 ,第四组 ,第五组 ,第六组
,经整理得到如图所示的频率分布直方图,则可以估计该地区学
生每天体育活动时间的第25百分位数约为_____ .
解析:由 , ,故第25百分位数位于 内,则第25百分位数为 ,
可以估计该地区学生每天体育活动时间的第25百分位数约为47.5.
(1)总体百分位数的估计需要注意的两个问题
①总体百分位数的估计的基础是样本百分位数的计算,因此计算准确是关键;
②由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.
(2)确定要求的 分位数所在分组 ,由频率分布表或频率分布直方图可知,样本中小于 的频率为 ,小于 的频率为 ,所以 分位数 组距 .
【对点训练】
1.(2023·山东青岛模拟)一学习小组10名学生的某次数学测试成绩的名次由
小到大分别是2, , , , , , , , , ,已知该小组数学测试成绩
名次的 分位数是9.5,则 的值是( )
A. B. C. D.
解析:选C.依题意 是整数,那么 分位数9.5就是第4、
第5位数的平均值,所以 ,解得 .故选C.
√
2.如图所示是由某市3月1日至3月10日的最
低气温(单位: )绘制的折线统计图,
由图可知这10天最低气温的第80百分位数是
( )
A. B. C. D.
解析:选D.由折线图可知,这10天的最低气温按照从小到大的排列为
, , , , , , , , , ,因为共有10个数据,所
以 是整数,则这10天最低气温的第80百分位数是 .
√
考点二 总体集中趋势的估计(自主练透)
1.(2023·黑龙江模拟)下面是某城市某日在不同观测点对细颗粒物
的观测值:
396 275 268 225 168 166 176 173 188 168
141 157
若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征没有
改变的是( )
A.极差 B.中位数 C.众数 D.平均数
√
解析:选C.根据题意,若在此组数据中增加一个比现有的最大值大25的数据,即最大值变为 ,极差为最大值与最小值的差,会发生改变,加入数据前,中位数为 ,加入数据后,中位数为176,发生改变,众数为数据中出现次数最多的数,不会改变,平均数体现数据的整体水平,会发生改变.故选C.
2.2022年某省高考体育百米测试中,成绩全部
介于 与 之间,抽取其中100个样本,
将测试结果按如下方式分成六组: ,
, , ,得到如下频率分布直
方图.则该100名考生成绩的平均数和中位数
(保留一位小数)分别是( )
A. B. C. D.
√
解析:选C. 名考生成绩的平均数
,
因为前三组矩形面积之和为 ,前四组矩形面积之和为 ,所以中位数位于第四组内,设中位数为 ,则 ,解得 .故选C.
3.(多选)2022年7月下旬,某省遭遇特大洪涝灾害,
某品牌服饰公司第一时间向该省捐赠5 000万元物资以
援助抗灾,随后该品牌受到消费者的青睐,如图为该
品牌服饰某分店1~8月的销量(单位:件)情况.以下
描述正确的是( )
A.这8个月销量的极差为4 132
B.这8个月销量的中位数为2 499
C.这8个月中2月份的销量最低
D.这8个月中销量比前一个月增长最多的是7月份
√
√
√
解析:选ACD.对于A,这8个月销量的极差为 ,故A
正确;对于B,这8个月的销量从小到大依次为712, , ,
, , , , ,所以这8个月销量的中位数是
,故B不正确;对于C,由题图可知,这8个月中2月份
的销量最低,故C正确;对于D,由题图可知,这8个月中销量比前一个月
增长最多的是7月份,增加了 (件),故D正确.
4.(2023·云南玉溪模拟)为了科普“新型冠状病毒”
相关知识,增强中学生预防意识,某中学随机
抽取了30名学生参加相关知识测试,得分(十
分制)如图所示,假设得分的中位数为 ,众
数为 ,平均数为 ,则 , , 的大小关系为
__________.(用“<”连接)
解析:将分数从小到大排列,中间两个数为5, ,所以中位数为 ;
因为5出现的次数最多,所以众数 ;
平均数 ,
所以 .
(1)求平均数时要注意数据的个数,不要重计或漏计.
(2)求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这两个数据的平均数.
(3)若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.
[注意]中位数、众数分别反映了一组数据的中等水平、多数水平,平均数反映了数据的平均水平,我们需要根据实际需求选择使用.
考点三 总体离散程度的估计(多维探究)
[高考考情] 样本的数字特征主要指平均数、中位数、众数、标准差、方差等,其中平均数、中位数和众数刻画数据的集中趋势,标准差、方差刻画数据的离散程度,它们往往相互补充、相互联系,共同反映一组数据的特征,经常以频率分布直方图或实际问题背景为载体考查,多以客观题的形式出现,也可能在解答题的某一问中结合概率考查.
角度1 方差与标准差
例2
(1)甲、乙两人进行射击比赛,每人射击5次,射击成绩如下表:
甲命中的环数 8 8 9 8 7
乙命中的环数 7 9 10 8 6
根据上述数据,下列判断正确的是( )
A.甲、乙的平均成绩相同,甲的成绩更稳定
B.甲、乙的平均成绩相同,乙的成绩更稳定
C.甲、乙的平均成绩不同,甲的成绩更稳定
D.甲、乙的平均成绩不同,乙的成绩更稳定
√
解析: ,
,
,
, ,
所以甲的平均成绩和乙的平均成绩相同,甲的方差小于乙的方差,甲的成
绩更稳定.故选A.
(2)(2023·山东潍坊模拟)若已知30个数 , , , 的平均数为6,方差
为9;现从原30个数中剔除 , , , 这10个数,且剔除的这10个数
的平均数为8,方差为5,则剩余的20个数 , , , 的方差为___.
解析:由题意得 ,
,
,
,
所以剩余的20个数的平均数为 ,
,
所以剩余的20个数的方差为 .
利用样本的方差、标准差解决优化决策问题的依据
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
角度2 分层随机抽样的方差与标准差
例3 (2023·重庆育才中学模拟)某学校有男生400人,女生600人.为了调查该
校全体学生每天睡眠时间,采用分层随机抽样的方法抽取样本,计算得男
生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间均值为7小时,
方差为0.5.若男、女样本量按比例分配,则可估计总体方差为______.
0.76
解析:由题意,总体的均值为 ,根据分层随机
抽样的性质,则总体的方差为
.
计算分层随机抽样的方差的步骤
(1)确定 , , , ;
(2)确定 ;
(3)应用公式 ,计算 .
【对点训练】
1.(2023·广西河池模拟)在某次足球联赛上,红队每场比赛平均失球个数是1.
6,全年比赛失球个数的标准差是1.1;蓝队每场比赛平均失球个数是2.2,
全年比赛失球个数的标准差是0.4.则下列说法正确的是( )
A.平均来说,蓝队比红队防守技术好
B.相对于红队而言,蓝队很少失球
C.红队有时表现很差,有时表现又非常好
D.蓝队比红队技术水平更不稳定
√
解析:选C.因为红队每场比赛平均失球数是1.6,蓝队每场比赛平均失球数是2.2,所以平均来说红队比蓝队防守技术好,故A错误;
因为蓝队每场比赛平均失球数是2.2,全年比赛失球个数的标准差为0.4,所以相对于红队而言,蓝队经常失球,故B错误;
因为红队全年比赛失球个数的标准差为1.1,蓝队全年比赛失球个数的标准差为0.4,所以红队有时表现很差,有时表现又非常好,相比较而言,蓝队比红队技术水平更稳定,故C正确,D错误.故选C.
2.已知一组数 , , , 的方差是4,则 , , , 的
标准差是___.
4
解析:因为数据 , , , 的方差为4,所以数据 , , , 的方差为 ,所以数据 , , , 的标准差为 .
3.(2023·黑龙江哈尔滨第六中学模拟)某校有高中生200人,为了获得该校全
体高中生的身高信息,抽取了男、女生样本量均为25的样本,计算得到男
生样本的均值为170,方差为16,女生样本的均值为160,方差为20,则总
样本的方差为____.
43
解析:因为男生样本的均值为170,女生样本的均值为160,所以总样本的
均值为 ,所以总样本的方差
.2025年高考数学一轮复习-10.2-用样本估计总体-专项训练
一、单项选择题
1.下面是某城市某日在不同观测点对细颗粒物(PM2.5)的观测值:
396 275 268 225 168 166 176 173 188
168 141 157
若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征没有改变的是( )
A.极差 B.中位数
C.众数 D.平均数
2.某工厂随机抽取20名工人,对他们某天生产的产品件数进行统计,数据如表,则该组数据的第75百分位数是( )
件数 7 8 9 10 11
人数 3 7 5 4 1
A.8.5 B.9
C.9.5 D.10
3.一组数据按从小到大的顺序排列为1,3,5,6,m,10,12,13,若该组数据的中位数是极差的,则该组数据的第60百分位数是( )
A.7.5 B.8
C.9 D.9.5
4.)为落实党中央的“三农”政策,某市组织该市所有乡镇干部进行了一期“三农”政策专题培训,并在培训结束时进行了结业考试.如图是该次考试成绩随机抽样样本的频率分布直方图.则下列关于这次考试成绩的估计错误的是( )
A.众数为82.5
B.中位数为85
C.平均数为86
D.有一半以上干部的成绩在80~90分
5.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图:
则( )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
6.若一组样本数据x1,x2,…,xn的平均数为10,另一组样本数据2x1+4,2x2+4,…,2xn+4的方差为8,则两组样本数据合并为一组样本数据后的平均数和方差分别为( )
A.17,54 B.17,48
C.15,54 D.15,48
二、多项选择题
7.有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
8.病毒研究所检测甲、乙两组实验小白鼠的某医学指标值,得到样本数据的频率分布直方图(如图所示),则下列结论正确的是( )
A.甲组数据中位数大于乙组数据中位数
B.甲组数据平均数小于乙组数据平均数
C.甲组数据平均数大于甲组数据中位数
D.乙组数据平均数小于乙组数据中位数
三、填空题
9.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如表(单位:环):
甲 10 8 9 9 9
乙 10 10 7 9 9
如果甲、乙只有1人能入选,则入选的最佳人选应是 ________.
10.某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是________(写出一个满足条件的m值即可).
四、解答题
11.某地旅游主管部门为了更好地为游客服务,在景区随机发放评分调查问卷100份,并将问卷评分数据分成6组:[70,75),[75,80),[80,85),[85,90),[90,95),[95,100],绘制如图所示频率分布直方图.
(1)已知样本中分数在[80,85)的游客为15人,求样本中分数小于80的人数,并估计第75百分位数;
(2)已知样本中男游客与女游客比例为3∶2,男游客样本的平均值为90,方差为10,女游客样本的平均值为85,方差为12,由样本估计总体,求总体的方差.
12.某滨海城市沙滩风景秀丽,夏日美丽的海景和清凉的海水吸引了不少前来游玩的旅客.某饮品店通过公开竞标的方式获得卖现制饮品的业务,为此先根据前一年沙滩开放的160天的进入沙滩的人数,做前期的市场调查来模拟饮品店开卖之后的利润情况,考虑沙滩承受能力有限,超过1.4万人即停止预约.以下表格是160天内进入沙滩的每日人数(单位:万人)的频数分布表.
人数/万 [0,0.2) [0.2,0.4) [0.4,0.6) [0.6,0.8) [0.8,1.0) [1.0,1.2) [1.2,1.4]
频数/天 8 8 16 24 a 48 32
(1)绘制160天内进入沙滩的每日人数的频率分布直方图(用阴影表示),并求出a的值和这组数据的65%分位数;
(2)据统计,每10个进入沙滩的游客当中平均有1人会购买饮品,X(单位:个)为进入该沙滩的人数(X为10的整倍数.如有8 006人,则X取8 000).每杯饮品的售价为15元,成本为5元,当日未出售饮品当垃圾处理.若该店每日准备1 000杯饮品,记Y为该店每日的利润(单位:元),求Y和X的函数关系式;
(3)以频率估计概率,求该店在160天的沙滩开放日中利润不低于7 000元的概率.
13.某型合金钢生产企业为了合金钢的碳含量百分比在规定的范围值内,检验员在同一试验条件下,每天随机抽样10次,并测量其碳含量(单位:%).已知其产品的碳含量服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内10次抽样中其碳含量百分比在(μ-3σ,μ+3σ)之外的次数,求P(X≥1)及X的数学期望;
(2)一天内的抽检中,如果出现了至少1次检测的碳含量在(μ-3σ,μ+3σ)之外,就认为这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.下面是在一天中,检测员进行10次碳含量(单位:%)检测得到的测量结果:
次数 1 2 3 4 5 6 7 8 9 10
碳含量(%) 0.31 0.32 0.34 0.31 0.30 0.31 0.32 0.31 0.33 0.32
经计算得,==0.317,s==0.011,其中xi为抽取的第 i次的碳含量百分比(i=1,2,…,10).
①用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?
②若去掉x1,剩下的数的平均数和标准差分别记为μ1,σ1,试写出σ1的算式(用,s,x1,μ1表示σ1).
附:若随机变量Z服从正态分布N(μ,σ2),则
P(μ-3σ≤Z≤μ+3σ)≈0.997 3,0.997 310≈0.973 3.
参考答案
1.C [根据题意,若在此组数据中增加一个比现有的最大值大25的数据,即最大值变为396+25=421,极差为最大值与最小值的差,会发生改变,加入数据前,中位数为=174.5,加入数据后,中位数为176,发生改变,众数为数据中出现次数最多的数,不会改变,平均数体现数据的整体水平,会发生改变.故选C.]
2.C [抽取的工人总数为20,20×75%=15,那么第75百分位数是所有数据从小到大排序的第15项与第16项数据的平均数,第15项与第16项数据分别为9,10,所以第75百分位数是=9.5.
故选C.]
3.C [这组数据一共8个数,中位数是,极差为13-1=12,所以=12×,解得m=9,又8×60%=4.8,则第60百分位数是第5个数据9.故选C.]
4.C [由频率分布直方图知,众数为82.5,A正确;
由(0.01+0.03+0.06)×5=0.5,即中位数为85,B正确;
由(0.01×72.5+0.03×77.5+0.06×82.5+0.05×87.5+0.03×92.5+0.02×97.5)×5=85.5,C错误;
由(0.06+0.05)×5=0.55>0.5,则有一半以上干部的成绩在80~90分之间,D正确.
故选C.]
5.B [讲座前中位数为>70%,A错误;
讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,B正确;
讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,C错误;
讲座后问卷答题的正确率的极差为100%-80%=20%,
讲座前问卷答题的正确率的极差为95%-60%=35%>20%,D错误.
故选B.]
6.A [由题意可知,数据x1,x2,…,xn的平均数为10,则=10n,所以数据2x1+4,2x2+4,…,2xn+4的平均数为
×102==102n,将两组数据合并后,新数据x1,x2,…,xn,2x1+4,2x2+4,…,2xn+4的平均数为
=(5×102n-860n+458n)=54.故选A.]
7.BD [取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为=,故A,C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.综上,故选BD.]
8.BCD [根据甲组的样本数据的频率分布直方图可知,甲组的平均数大于中位数,且都小于7,
同理可得乙组的平均数小于中位数,且都大于7,
故甲组数据中位数小于乙组数据中位数,A错误;
甲组数据平均数小于乙组数据平均数,B正确;
甲组数据平均数大于甲组数据中位数,C正确;
乙组数据平均数小于乙组数据中位数,D正确.
故选BCD.]
9.甲 [甲的平均数为=(10+8+9+9+9)=9,
乙的平均数为=(10+10+7+9+9)=9,
甲的方差为=[(10-9)2+(8-9)2]=,
乙的方差为=[(10-9)2×2+(7-9)2]=,
∵=,∴甲、乙的平均水平相同,
,∴甲的成绩稳定,故甲入选.]
10.7或8或9或10(填上述4个数中任意一个均可) [7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为:6,7,7,8,8,9,10,则7×0.25=1.75,故第25百分位数为第二个数即7,所以7,6,8,9,8,7,10,m,第25百分位数为7,而8×0.25=2,所以7为第二个数与第三个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.]
11.解:(1)由频率分布直方图,可得分数在[85,100]内的频率为(0.06+0.05+0.04)×5=0.75,
所以分数在[85,100]内的人数为100×0.75=75,
所以分数小于80分的人数为100-75-15=10,
由题意可设第75百分位数为x,其中x∈[90,95),则1-(0.05×5+0.04×5)+(x-90)×0.05=0.75,解得x=94,
故样本中分数小于80的人数为10人,第75百分位数约为94.
(2)由已知可得总样本平均值为==×90+×85=88,
又由s2=+()2]
=[10+(88-90)2]+[12+(88-85)2]==,
所以用样本估计总体,总体的方差为.
12.解:(1)由题意,8+8+16+24+a+48+32=160,解得a=24.
因为=0.5,=0.8,
所以65%分位数在区间[1.0,1.2)上,
则65%分位数为1.0+0.2×=1.1.
画出频率分布直方图如图所示.
(2)由题意知,当X≥10 000时,Y=10×1 000=10 000元,
当X<10 000时,Y=×10-×5=1.5X-5 000,
所以Y=
(3)记销售的利润不少于7 000元的事件为A,则人数X≥8 000,
此时P(A)==0.65.
13.解:(1)由已知得,抽取一次碳含量在(μ-3σ,μ+3σ)之内的概率为0.997 3,
所以P(X≥1)=1-P(X=0)≈1-0.997 310≈1-0.973 3=0.026 7.
又碳含量在(μ-3σ,μ+3σ)之外的概率为0.002 7,
故X~B(10,0.002 7),
因此E(X)=0.027.
(2)①由=0.317,s=0.011,得μ,σ的估计值为=0.317,=0.011,
所以(-3,+3)=(0.284,0.350),
由所测数据可以看出10次抽检的碳含量均在(-3,+3)之内,
因此不需要对当天的生产过程进行检查.
=
=
=.
又注意到-x1+2μ1=-(9μ1+x1)+x1+2μ1=0,