2019_2020学年高中数学第12章统计学初步章末复习提升课课件+试卷含答案+学案(4份打包)湘教版必修5

文档属性

名称 2019_2020学年高中数学第12章统计学初步章末复习提升课课件+试卷含答案+学案(4份打包)湘教版必修5
格式 zip
文件大小 4.6MB
资源类型 教案
版本资源 湘教版
科目 数学
更新时间 2020-06-28 21:26:43

文档简介

(共38张PPT)
第12章 统计学初步
本部分内容讲解结束
按ESC键退出全屏播放
A
统计学初步
收集数据(随机抽样)
整理、分析数据,估计、推断
机//分
用样本估计总体
变量间的相关关系


/随样抛
系统抽
样样
用样本的频率分用样本数字特征估
布估计总体分布计总体数字特征
线性回归分析
中位数、平方差标散点图的绘制与回
均数众数准差
归直线方程的求法
》知识网络体系构建
理清脉络·宏观把握
知识要点·易错提醒
温故知新·夯实基础
专题突破·链接高考
聚焦考点·拓展升华
O.10
0.06
0.02
0510152025
[巩固提升训练]章末复习提升课
1.抽样的三种方法
简单随机抽样、系统抽样、分层抽样.
2.分层抽样的步骤
(1)分层:按某种特征将总体分成若干部分.
(2)按比例确定每层抽取个体的个数.
(3)各层分别按简单随机抽样或系统抽样的方法抽取个体.
(4)综合每层抽样,组成样本.
3.用茎叶图表示数据有两个突出的优点
一是统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;
二是茎叶图可以随时记录,方便记录与表示.
4.样本的数字特征
众数
在一组数据中,出现次数最多的数据
中位数
将一组数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)在频率分布直方图中,中位数左边和右边的直方图的面积相等
平均数
样本数据的算术平均数,即=(x1+x2+…xn)
方差
s2=[(x1-)2+(x2-)2+…+(xn-)2]其中s为标准差
1.系统抽样中,易忽视抽取的样本数也就是分段的段数,当不是整数时,注意剔除,剔除的个体是随机的.
2.分层抽样中,易忽视每层抽取的个体的比例是相同的,即.
3.在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.
4.回归分析中,易误认为样本数据必在回归直线上,实质上回归直线必过(,)点,可能所有的样本数据点都不在直线上.
 抽样方法及应用[学生用书P44]
1.当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法;
2.当总体容量较大,样本容量较小时,可用随机数法;
3.当总体容量较大,样本容量也较大时,可用系统抽样法;
4.当总体由有明显差异的几部分构成时,采用分层抽样法.
 一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):
轿车A
轿车B
轿车C
舒适型
100
150
z
标准型
300
450
600
按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆.
(1)求z的值;
(2)B类,C类轿车各应抽取多少?
(3)在C类轿车中,按型号分层抽样,应各抽取多少?
【解】 (1)设该厂这个月共生产轿车n辆,
则由题意得=,所以n=2
000,
则z=2
000-(100+300)-150-450-600=400.
(2)B类轿车共有150+450=600(辆).
按抽样比抽取,则应抽取×600=15(辆).
同理,C类应抽取(400+600)×=25(辆).
(3)在C类轿车中,按型号抽样时抽样比仍为.
则舒适型轿车应抽取400×=10(辆);
标准型轿车应抽取600×=15(辆).
 用样本估计总体[学生用书P44]
总体估计要解决的问题主要是:运用频率分布表、频率分布直方图、茎叶图、样本数据的平均数、标准差等概念解决一些简单的实际问题.
解决上述问题的关键是在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、茎叶图,体会它们各自的特点;能根据实际问题的需求合理选取样本,用样本的数字特征去估计总体的数字特征.
 某车站在春运期间为了改进服务,随机抽样调查了100名旅客从开始在购票窗口排队到购到车票所用的时间t(以下简称购票用时,单位:min),下面是这次抽样的频率分布表和频率分布直方图,解答下列问题:
分组
频数
频率
一组
0≤t<5
0
0
二组
5≤t<10
10
三组
10≤t<15
10
0.10
四组
15≤t<20
五组
20≤t≤25
30
0.30
合计
100
1.00
(1)这次抽样的样本容量是多少?
(2)在表中填写出缺失的数据并补全频率分布直方图.
(3)旅客购票用时的平均数可能落在哪一小组?
(4)若每增加一个购票窗口可使平均购票用时减少5
min,要使平均购票用时不超过10
min,那么你估计最少要增加几个窗口?
【解】 (1)样本容量为100.
(2)由频率=可补全频率分布表和频率分布直方图(图中的阴影部分).
分组
频数
频率
一组
0≤t<5
0
0
二组
5≤t<10
10
0.10
三组
10≤t<15
10
0.10
四组
15≤t<20
50
0.50
五组
20≤t≤25
30
0.30
合计
100
1.00
(3)设旅客平均购票时间为s
min,则有
≤s
<,
即15≤s<20.
所以旅客购票用时平均数可能落在第四小组.
(4)设需增加x个窗口,则20-5x≤10,解得x≥2.
所以至少需要增加2个窗口.
【点评】 用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理.
 用样本的数字特征估计总体的数字特征[学生用书P45]
总体的平均数与标准差往往通过样本的平均数、标准差来估计.一般地,样本容量越大,对总体的估计越准确.
(1)从数字特征上描述一组数据的情况
平均数、众数、中位数描述其集中趋势,方差、极差和标准差描述其波动大小,也可以说方差、标准差和极差反映各个数据与其平均数的离散程度.
(2)方差和标准差的运用
一组数据的方差或标准差越大,说明这组数据波动越大,方差的单位是原数据的单位的平方,标准差的单位与原单位相同.
 甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示.
(1)填写下表:
平均数
方差
中位数
命中9环及以上

7
1.2
1

5.4
3
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
③从平均数和命中9环以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
【解】 (1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.可知乙=(2+4+6+8+7+7+8+9+9+10)=7,所以平均数填7,中位数为=7.5;甲10次射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:
平均数
方差
中位数
命中9环及以上

7
1.2
7
1

7
5.4
7.5
3
(2)①甲、乙的平均数相同:均为7,但s<s,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙平均水平相同,而乙的中位数比甲大,可预见乙射靶环数的优秀次数比甲的多,所以乙的成绩比甲好些.
③甲、乙平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,有潜力可挖.
【点评】 样本的平均数常和方差配合使用来反映样本数据的稳定性,从而估计总体.
 回归分析[学生用书P46]
两个变量之间的相关关系即不确定性关系的研究,通常先作变量的散点图,根据散点图判断这两个变量最接近于何种确定性关系(函数关系),然后用这个关系分析预测原来两个变量的关系,这就是回归分析,其中线性回归分析是常用的一种回归分析.
 为了研究某种细菌在特定环境下随时间变化的繁殖情况,得如下数据:
天数t(天)
3
4
5
6
7
繁殖个数y(千个)
2.5
3
4
4.5
6
(1)求y关于t的线性回归方程;
(2)利用第一问中的回归方程,预测t=8时的细菌繁殖个数.
【解】 (1)由表中数据计算得,
=5,=4,
b=0.85,a=-b=-0.25,
所以回归方程为y=0.85t-0.25.
(2)将t=8代入第一问的回归方程中得
y=0.85×8-0.25=6.55.
故预测t=8时细菌繁殖个数约为6.55千个.
【点评】 知道x与y呈线性相关关系,无需进行相关性检验,否则,应先画出散点图,观察散点图是否呈现出线性相关关系;如果是,可以用最小二乘法估计出线性回归方程;如果散点图呈现出其他的曲线关系,即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.
1.某大学共有学生5
600人,其中有专科生1
300人、本科生3
000人、研究生1
300人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为280人,则在专科生、本科生与研究生这三类学生中应分别抽取(  )
A.65人、150人、65人    
B.30人、150人、100人
C.93人、94人、93人
D.80人、120人、80人
解析:选A.抓住分层抽样按比例抽取的特点有===,所以x=z=65,y=150,即专科生、本科生与研究生应分别抽取65人、150人、65人.
2.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是(  )
A.身高一定是145.83
cm
B.身高在145.83
cm以上
C.身高在145.83
cm以下
D.身高在145.83
cm左右
解析:选D.回归直线是用来估计总体的,所以我们求的值都是估算值,所以我们得到的结果也是近似的,只要把自变量的值代入回归直线方程即可求得结果为145.83(cm).
3.某单位为了解用电量y度与气温x
℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
用电量(度)
24
34
38
64
由表中数据得线性回归方程y=bx+a中b=-2,预测当气温为-4
℃时,用电量约为________度.
解析:==10,
==40,
则a=y-b=40+2×10=60,
则y=-x+60,
则当x=-4时,y=-2×(-4)+60=68.
答案:68
4.5个学生的数学和物理成绩(单位:分)如下表:
 学生学科 
A
B
C
D
E
数学
80
75
70
65
60
物理
70
66
68
64
62
画出散点图,判断它们是否具有相关关系,若相关,求出回归方程.
解:以x轴表示数学成绩,y轴表示物理成绩,可得散点图如图.
由散点图可知,两者之间具有相关关系,且为正相关.
=70,=66,b=0.36,a=40.8,
回归方程为y=0.36x+40.8.
PAGE
1(共59张PPT)
章末综合检测(12)
本部分内容讲解结束
按ESC键退出全屏播放
A
0.05
0.04
0.03
0.02
0.01
04050607080
0.30
0.20
0.10
50.560.570.580.590.5100.5
y(万元)
765432
●◆
0123456x()章末综合检测(12)
(时间:120分钟,满分:150分)
一、选择题:本题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.
1.下面的抽样方法是简单随机抽样的是(  )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,检验其质量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见
D.用抽签法从10件产品中选取3件进行质量检验
解析:选D.对每个选项逐条落实简单随机抽样的特点.A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;C不是简单随机抽样,因为总体的个体有明显的层次;D是简单随机抽样.
2.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为(  )
A.7         
B.15
C.25
D.35
解析:选B.由题意知青年职工人数∶中年职工人数∶老年职工人数=350∶250∶150=7∶5∶3.由样本中青年职工为7人得样本容量为15.
3.下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差恒不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率.其中错误的有(  )
A.0个
B.1个
C.2个
D.3个
解析:选C.一组数据的众数不唯一,即①不对;一组数据的方差必须是非负数,即②不对;根据方差的定义知③正确;根据频率分布直方图的概念知④正确.
4.对一个样本容量为100的数据分组,各组的频率如下:
[17,19),1;[19,21),1;[21,23),3;[23,25),3;[25,27),18;[27,29),16;[29,31),28;[31,33],30.
根据累积频率分布,估计小于29(不包括29)的数据大约占总体的(  )
A.42%
B.58%
C.40%
D.16%
解析:选A.数据小于29(不包括29)的频数为1+1+3+3+18+16=42.故其所占比例为=42%.
5.从2
012名学生中选取50人参加全国数学联赛,若采用下面的方法选取;先用简单随机抽样法从2
012人中剔除12人,剩下的2
000人再按系统抽样的方法选取,则每人入选的可能性(  )
A.不全相等
B.均不相等
C.都相等且为
D.都相等且为
解析:选C.不管采取何种抽样,每个个体被抽到的可能性均为,由于每个人不被剔除的可能性为,从2
000人中选出50人每个人选的可能性为,故每个人入选的可能性为×=.
6.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是(  )
A.91.5和91.5
B.91.5和92
C.91和91.5
D.92和92
解析:选A.将这组数据从小到大排列,得87,89,90,91,92,93,94,96.
故中位数为=91.5.
平均数为=91+=91.5.
7.若数据x1,x2,…,xn的平均数为,方差为s2,则3x1+5,3x2+5,…,3xn+5的平均数和标准差分别为(  )
A.,s
B.3+5,s
C.3+5,3s
D.3+5,
解析:选C.因为x1,x2,…,xn的平均数为,
所以3x1+5,3x2+5,…,3xn+5的平均数为3+5,
s′2=[(3x1+5-3-5)2+…+(3xn+5-3-5)2]
=×32[(x1-)2+…+(xn-)2]=9s2.
所以s′=3s.
8.某高中在校学生2
000人,高一年级与高二年级人数相同并都比高三年级多一人.为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动.每人都参加而且只参与其中一项比赛,各年级参与比赛人数情况如下表:
高一年级
高二年级
高三年级
跑步
a
b
c
登山
x
y
z
其中a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高二年级参与跑步的学生中应抽取(  )
A.36人
B.60人
C.24人
D.30人
解析:选A.设高二年级参与跑步的学生中应抽取m人.因为登山的占总数的,所以跑步的占总数的,又跑步中高二年级占=,所以高二级跑步的占总人数的×=,由=,得m=36.
9.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为(  )
A.1
B.2
C.3
D.4
答案:D
10.下列调查的样本不合理的是(  )
①在校内发出一千张印有全校各班级的选票,要求被调查学生在其中一个班级旁画“√”,以了解最受欢迎的教师是谁;
②从一万多名工人中,经过选举,确定100名代表,然后投票表决,了解工人们对厂长的信任情况;
③到老年公寓进行调查,了解全市老年人的健康状况;
④为了了解全班同学每天的睡眠时间,在每个小组中各选取3名学生进行调查.
A.①②
B.①③
C.②③
D.②④
解析:选B.①中样本不符合有效性原则,在班级前画“√”与了解最受欢迎的老师没有关系.③中样本缺少代表性.②、④都是合理的样本.故选B.
11.某市有15个旅游景点,经计算,黄金周期间各个景点的旅游人数平均为20万,标准差为s,后来经核实,发现甲、乙两处景点统计的人数有误,甲景点实际为20万,被误统计为15万,乙景点实际为18万,
被统计成23万;更正后重新计算,得到标准差为s1,则s与s1的大小关系为(  )
A.s=s1
B.s<s1
C.s>s1
D.不能确定
解析:选C.由已知,两次统计所得的旅游人数总数没有变,即两次统计的各景点旅游人数的平均数是相同的,设为,则s=
若比较s与s1的大小,只需比较(15-)2+(23-)2与(20-)2+(18-)2的大小即可.而(15-)2+(23-)2=754-76+22,(20-)2+(18-)2=724-76+22,所以(15-)2+(23-)2>(20-)2+(18-)2.从而s>s1.
12.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如表所示:
甲的成绩
环数
7
8
9
10
频数
5
5
5
5
乙的成绩
环数
7
8
9
10
频数
6
4
4
6
丙的成绩
环数
7
8
9
10
频数
4
6
6
4
s1、s2、s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有(  )
A.s3>s1>s2
B.s2>s1>s3
C.s1>s2>s3
D.s2>s3>s1
解析:选B.因为s=(x+x+…+x)-2,所以s=(5×72+5×82+5×92+5×102)-8.52=73.5-72.25=1.25=,所以s1=.同理s2=,s3=,所以s2>s1>s3,故选B.
二、填空题:本题共4小题,每小题5分.
13.若总体中含有1
645个个体,采用系统抽样的方法从中抽取容量为35的样本,则编号后确定编号分为______段,分段间隔k=________,每段有________个个体.
解析:因为N=1
645,n=35,则编号后确定编号分为35段,且k===47,则分段间隔k=47,每段有47个个体.
答案:35 47 47
14.
在如图所示的“茎叶图”表示的数据中,众数和中位数分别为________、________.
解析:由茎叶图可知这组数据为:
12,14,20,23,25,26,30,31,31,41,42.
所以众数和中位数分别为31、26.
答案:31 26
15.下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(千克)与相应的生产能耗y(千克)的几组对应数据,
x
3
4
5
6
y
2.5
t
4
4.5
根据上表提供的数据,求出y关于x的线性回归方程为y=0.7x+0.35,那么表中t的值为________.
解析:因a=-b,由回归方程知0.35=-0.7=-0.7×,解得t=3.
答案:3
16.400辆汽车通过某一段公路时的时速(单位:km)的频率分布直方图如图所示,则时速在[50,70)的汽车大约有________辆.
解析:(1-0.1-0.2)×400=280(辆).
答案:280
三、解答题:解答应写出文字说明、证明过程或演算步骤.
17.(本小题满分10分)春节前,有超过20万名来自广西、四川的外来务工人员选择驾乘摩托车沿321国道返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个休息站,让过往的摩托车驾驶人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就对其省籍询问一次,询问结果如图所示:
(1)交警小李对进休息站休息的驾驶人员的省籍询问采用的是什么抽样方法;
(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5名,则四川籍的应抽取几名.
解:(1)根据题意,因为有相同的间隔,符合系统抽样的特点,所以交警小李对进休息站休息的驾驶人员的省籍询问采用的是系统抽样方法.
(2)从题干图中可知,被询问了省籍的驾驶人员中
广西籍的有5+20+25+20+30=100(人),
四川籍的有15+10+5+5+5=40(人),
设四川籍的驾驶人员应抽取x名,依题意得=,
解得x=2,即四川籍的应抽取2名.
18.(本小题满分12分)有关部门从甲、乙两个城市所有的自动售货机中随机抽取了16台,记录了上午8:00~11:00之间各自的销售情况(单位:元):
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
试用两种不同的方式分别表示上面的数据,并简要说明各自的优点.
解:法一:从题目中的数不易直接看出各自的分布情况,为此,我们将以上数据用条形统计图表示.如图:
法二:茎叶图如图,两竖线中间的数字表示甲、乙销售额的十位数,两边的数字表示甲、乙销售额的个位数.
从法一可以看出条形统计图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;从法二可以看出,用茎叶图表示有关数据,对数据的记录和表示都带来方便.
19.(本小题满分12分)据报道,某公司的33名职工的月工资(单位:元)如下:
职务
董事长
副董事长
董事
总经理
经理
管理员
职员
人数
1
1
2
1
5
3
20
工资
5
500
5
000
3
500
3
000
2
500
2
000
1
500
(1)求该公司职工月工资的平均数、中位数、众数;
(2)假设副董事长的工资从5
000元提升到20
000元,董事长的工资从5
500元提升到30
000元,那么新的平均数、中位数、众数又是什么?(精确到元)
(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.
解:(1)平均数是=1
500+(4
000+3
500+2
000×2+1
500+1
000×5+500×3+0×20)≈1
500+591=2
091(元).
中位数是1
500元,众数是1
500元.
(2)新的平均数是′=1
500+(28
500+18
500+2
000×2+1
500+1
000×5+500×3+0×20)≈1
500+1
788=3
288(元).
中位数是1
500元,众数是1
500元.
(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.
20.(本小题满分12分)为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题:
分组
频数
频率
[50.5,60.5)
4
0.08
[60.5,70.5)
0.16
[70.5,80.5)
10
[80.5,90.5)
16
0.32
[90.5,100.5]
合计
50
(1)完成频率分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在[75.5,85.5)分的学生为二等奖,问获得二等奖的学生约有多少人?
解:(1)
分组
频数
频率
[50.5,60.5)
4
0.08
[60.5,70.5)
8
0.16
[70.5,80.5)
10
0.20
[80.5,90.5)
16
0.32
[90.5,100.5]
12
0.24
合计
50
1.00
(2)频数分布直方图如图所示.
(3)成绩在[75.5,80.5)分的学生占[70.5,80.5)分的学生的,因为成绩在[70.5,80.5)分的学生频率为0.2,所以成绩在[75.5,80.5)分的学生频率为0.1.成绩在[80.5,85.5)分的学生占[80.5,90.5)分的学生的.因为成绩在[80.5,90.5)分的学生频率为0.32,所以成绩在[80.5,85.5)分的学生频率为0.16.所以成绩在[75.5,85.5)分的学生频率为0.26.由于有900名学生参加了这次竞赛,所以该校获得二等奖的学生约为0.26×900=234(人).
21.(本小题满分12分)假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
(1)作出散点图,判断y对x是否成线性相关?若线性相关,求线性回归方程y=bx+a的回归系数a,b;
(2)估计使用年限为10年时的维修费用.
解:(1)作出散点图,如图所示,由散点图可知y对x是线性相关的.
制表:
i
1
2
3
4
5
合计
xi
2
3
4
5
6
20
yi
2.2
3.8
5.5
6.5
7.0
25
xiyi
4.4
11.4
22.0
32.5
42.0
112.3
于是有b=1.23,
a=-b=5-1.23×4=0.08.
(2)回归直线方程是y=1.23x+0.08,
当x=10时,y=1.23×10+0.08=12.38(万元),
即估计使用10年时维修费用是12.38万元.
22.(本小题满分12分)现有A,B两个班级,每个班级各有45名学生参加测验,参加的每名学生可获得0分、1分、2分、3分、4分、5分、6分、7分、8分、9分这几种不同分值中的一种,A班的测试结果如下表所示:
分数(分)
0
1
2
3
4
5
6
7
8
9
人数(名)
1
3
5
7
6
8
6
4
3
2
B班的成绩如图所示.
(1)你认为哪个班级的成绩比较稳定?
(2)若两班共有60人及格,则参加者最少获得多少分才可能及格?
解:(1)A班成绩的平均数为:
A=×(0×1+1×3+2×5+3×7+4×6+5×8+6×6+7×4+8×3+9×2)≈4.53(分),
所以A班成绩的方差为:
s=×[(0-A)2+3×(1-A)2+5×(2-A)2+7×(3-A)2+6×(4-A)2+8×(5-A)2+6×(6-A)2+4×(7-A)2+3×(8-A)2+2×(9-A)2]
≈4.96(分2).
B班成绩的平均数为:
B=×(1×3+2×3+3×8+4×18+5×10+6×3)
≈3.84(分),
所以B班成绩的方差为:
s=×[3×(1-B)2+3×(2-B)2+8×(3-B)2+18×(4-B)2+10×(5-B)2+3×(6-B)2]
≈1.51(分2).
因为s>s,即B班成绩的方差较小,所以B班的成绩较为稳定.
(2)由图表可知,两个班级1分以下(含1分)的学生共有7人,2分以下(含2分)的学生共有15人,3分以下(含3分)的学生共有30人,4分以下(含4分)的学生共有54人,5分以下(含5分)的学生共有72人.
因为两个班级及格的总人数为60人,而4分以下的共有54人,5分以下的共有72人,所以参加者最少获得4分才可能及格.
PAGE
1
同课章节目录