第一章 学业质量标准检测
时间120分钟,满分150分。
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.经过对随机变量χ2的研究,得到了若干个临界值,当其观测值k≤2.072时,对于两个事件A与B,我们认为( C )
A.有95%的把握认为A与B有关系
B.有99%的把握认为A与B有关系
C.没有充分理由说明事件A与B有关系
D.确定事件A与B没有关系
[解析] 依临界值表排除A、B,选项D不正确,故选C.
2.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是( D )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm以下
D.身高在145.83 cm左右
[解析] 线性回归方程只能近似描述,不是准确值.
3.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现χ2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游愿望有关系的可信程度是( C )
P(χ2≥k)
…
0.25
0.15
0.10
0.025
0.010
0.005
…
k
…
1.323
2.072
2.706
5.024
6.635
7.879
…
A.90% B.95%
C.97.5% D.99.5%
[解析] ∵χ2=6.023>5.024,故其可信度为97.5%.
4.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施( A )
实验效果
教学措施
优、良、中
差
总计
实验班
48
2
50
对比班
38
12
50
总计
86
14
100
A.有关 B.无关
C.关系不明确 D.以上都不正确
[解析] 由公式计算得χ2=≈8.306>6.635,则认为“实验效果与教学措施有关”的概率为0.99.
5.(2019·唐山高二检测)四名同学根据各自的样本数据研究变量x、y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;
② y与x负相关且=-3.476x+5.648;
③y与x正相关且=5.437x+8.493;
④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是( D )
A.①② B.②③
C.③④ D.①④
[解析] y与x正(或负)相关时,线性回归直线方程y=x+中,x的系数>0(或<0),故①④错.
6.(2019·福州高二检测)在一次试验中,当变量x取值分别是1,,,时,变量Y的值依次是2,3,4,5,则Y与之间的回归曲线方程是( A )
A.=+1 B.=+3
C.=2x+1 D.=x-1
[解析] 把x=1,,,代入四个选项,逐一验证可得=+1.
7.已知回归直线的斜率的估计值是2,样本点的中心为(4,12),则回归直线的方程是( A )
A.=2x+4 B.=x+2
C.=2x-20 D.=x+2
[解析] 由回归直线方程=x+的定义知,=2,
∵回归直线过样本点的中心,∴12=2×4+,
∴=4,∴回归直线方程为=2x+4.
8.以下关于线性回归的判断,正确的个数是( D )
①若散点图中所有点都在一条直线附近,则这条直线为回归直线;
②散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;
③已知回归直线方程为=0.50x-0.81,则x=25时,y的估计值为11.69;
④回归直线方程的意义是它反映了样本整体的变化趋势.
A.0 B.1
C.2 D.3
[解析] 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数,得到的直线=bx+才是回归直线,
∴①不对;②正确;
将x=25代入=0.50x-0.81,得=11.69,
∴③正确;④正确,故选D.
9.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表2,则与性别有关联的可能性最大的变量是( D )
表1
成绩
性别
不及格
及格
总计
男
6
14
20
女
10
22
32
总计
16
36
52
表2
视力
性别
好
差
总计
男
4
16
20
女
12
20
32
总计
16
36
52
表3
智商
性别
偏高
正常
总计
男
8
12
20
女
8
24
32
总计
16
36
52
表4
阅读量
性别
丰富
不丰富
总计
男
14
6
20
女
2
30
32
总计
16
36
52
A.成绩 B.视力
C.智商 D.阅读量
[解析] 因为χ=
=,
χ==,
χ==,
χ==,
则χ>χ>χ>χ,所以阅读量与性别有关联的可能性最大.
10.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均收入的百分比约为( A )
A.83% B.72%
C.67% D.66%
[解析] 当=7.675时,x=≈9.262,所以≈0.829,故选A.
11.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
合计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由χ2=,得
χ2=≈7.8.
附表:
P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
参照附表,得到的正确的结论是( C )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
12.有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据如下表:
平均气温/℃
-2
-3
-5
-6
销售额/万元
20
23
27
30
根据以上数据,用线性回归的方法,求得销售额y与平均气温x之间线性回归方程=x+的系数=-2.4,则预测平均气温为-8 ℃时该商品销售额为( A )
A.34.6万元 B.35.6万元
C.36.6万元 D.37.6万元
[解析] ==-4,==25,
∵线性回归直线过点(,),∴25=-2.4×(-4)+,∴=15.4.
∴线性回归方程是=-2.4x+15.4.当x=-8时,y=34.6(万元),故选A.
二、填空题(本大题共4个小题,每小题5分,共20分,将正确答案填在题中横线上)
13.给出下列实际问题:
①一种药物对某种病的治愈率;
②两种药物治疗同一种病是否有关系;
③吸烟者得肺病的概率;
④吸烟人群是否与性别有关系;
⑤上网与青少年的犯罪率是否有关系.
其中,用独立性检验可以解决的问题有__②④⑤__.
[解析] 独立性检验主要是对两个分类变量是否有关系进行检验,主要涉及两种变量对同一种事情的影响,或者是两种变量在同一问题上体现的区别等.
14.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:
冷漠
不冷漠
总计
多看电视
68
42
110
少看电视
20
38
58
总计
88
80
168
则在犯错误的概率不超过__0.001__的前提下认为多看电视与人变冷漠有关系.
[解析] 可计算χ2的观测值k=11.377>10.828.
15.在2019年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:
价格x
9
9.5
10
10.5
11
销售量y
11
10
8
6
5
通过分析,发现销售量y对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线方程为__=-3.2x+40 .
[解析] iyi=392,=10,=8,(xi-)2=2.5,代入公式,得=-3.2,所以,=- =40,故回归直线方程为=-3.2x+40.
16.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
杯数
24
34
38
64
由表中数据算得线性回归方程=bx+a中的b≈-2,预测当气温为-5℃时,热茶销售量为__70__杯.(已知回归系数=,=-b)
[解析] 根据表格中的数据可求得=×(18+13+10-1)=10,=×(24+34+38+64)=40.
∴=- =40-(-2)×10=60,∴=-2x+60,当x=-5时,=-2×(-5)+60=70.
三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤)
17.(本题满分10分)甲、乙、丙三人参加了一家公司的招聘面试,面试合格者可正式签约.甲表示只要面试合格就签约;乙、丙则约定:两人面试都合格就一同签约,否则两人都不签约.设每人面试合格的概率都是,且面试是否合格互不影响.求:
(1)至少有一人面试合格的概率;
(2)没有人签约的概率.
[解析] 用A、B、C表示事件甲、乙、丙面试合格,由题意知A、B、C相互独立,且P(A)=P(B)=P(C)=.
(1)至少有一人面试合格的概率是1-P( )=1-P()P()P()=1-()3=.
(2)没有人签约的概率为P(B)+P( C)+P( )
=P()P(B)P()+P()P()P(C)+P()P()P()
=()3+()3+()3=.
18.(本题满分12分)某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从该部门内随机抽选了10个企业为样本,有如下资料:
产量x(千件)
生产费用(千元)
40
150
42
140
48
160
55
170
65
150
79
162
88
185
100
165
120
190
140
185
(1)计算x与y的相关系数;
(2)对这两个变量之间是否线性相关进行检验;
(3)设回归方程为=x+,求回归系数.
[解析] (1)根据数据可得:
=77.7,=165.7,x=70 903,y=277 119,
xiyi=132 938,所以r=0.808,
即x与y之间的相关系数r≈0.808.
(2)因为r>0.75,所以可认为x与y之间具有线性相关关系.
(3)=0.398,=134.8.
19.(本题满分12分)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如表所示:
喜欢甜品
不喜欢甜品
合计
南方学生
60
20
80
北方学生
10
10
20
合计
70
30
100
根据表中数据,问是否在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
附:
P(χ2≥k0)
0.100
0.050
0.010
k0
2.706
3.841
6.635
χ2=
[解析] 将2×2列联表中的数据代入计算公式,
得χ2的观测值k==≈4.762.
由于4.762>3.841,所以在犯错误的概率不超过0.05的前提下可以认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
20.(本题满分12分)为了响应厦门市政府“低碳生活,绿色出行”的号召,思明区委文明办率先全市发起“少开一天车,呵护厦门蓝”绿色出行活动.“从今天开始,从我车……”铿锵有力的话语,传递了绿色出行、低碳生活的理念.
某机构随机调查了本市部分成年市民某月骑车次数,统计如下:
次数
人数
年龄
[0,10)
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
18岁至31岁
8
12
20
60
140
150
32岁至44岁
12
28
20
140
60
150
45岁至59岁
25
50
80
100
225
450
60岁及以上
25
10
10
18
5
2
若规定:18岁至44岁为青年人,45岁至59岁为中年人,60岁及以上为老年人,用样本估计总体的思想,解决如下问题:
(1)估计本市一个18岁以上青年人每月骑车的平均次数;
(2)若月骑车次数不少于30次者称为“骑行爱好者”,根据这些数据,能否在犯错误的概率不超过0.001的前提下认为“骑行爱好者”与“青年人”有关?
[解析] (1)估计本市一个18岁以上青年人每月骑车的平均次数为(20×5+40×15+40×25+200×35+200×45+300×55)÷(20+40+40+200+200+300)=42.75.
(2)2×2列联表如下:
骑行爱好者
非骑行爱好者
总计
青年人
700
100
800
非青年人
800
200
1 000
总计
1 500
300
1 800
χ2==18>7.879,
∴能在犯错误的概率不超过0.001的前提下认为“骑行爱好者”与“青年人”有关.
21.(本题满分12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得=i=9.97,s==≈0.212,≈18.439,(xi-)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在(-3s,+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①从这一天抽检的结果看,是否需对当天的生产过程进行检查?
②在(-3s,+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
附:样本(xi,yi)(i=1,2,…,n)的相关系数r=,≈0.09.
[解析] (1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数
r=
≈≈-0.18.
由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
(2)①由于=9.97,s≈0.212,因此由样本数据可以看出抽取的第13个零件的尺寸在(-3s,+3s)以外,因此需对当天的生产过程进行检查.
②剔除离群值,即第13个数据,剩下数据的平均数为
(16×9.97-9.22)=10.02,
这条生产线当天生产的零件尺寸的均值的估计值为10.02.
≈16×0.2122+16×9.972≈1 591.134,
剔除第13个数据,剩下数据的样本方差为
(1 591.134-9.222-15×10.022)≈0.008,
这条生产线当天生产的零件尺寸的标准差的估计值为≈0.09.
22.(本题满分12分)为了解某市市民对政府出台楼市限购令的态度,在该市随机抽取了50名市民进行调查,他们月收入(单位:百元)的频数分布及对楼市限购令的赞成人数如下表:
月收入
[15,25)
[25,35)
[35,45)
[45,55)
[55,65)
[65,75)
频数
5
10
15
10
5
5
赞成人数
4
8
8
5
2
1
将月收入不低于55的人群称为“高收入族”,月收入低于55的人群称为“非高收人族”.
(1)根据已知条件完成下面的2×2列联表,有多大的把握认为赞不赞成楼市限购令与收入高低有关?
已知:χ2=,
当χ2<2.706时,没有充分的证据判定赞不赞成楼市限购令与收入高低有关;当χ2>2.706时,有90%的把握判定赞不赞成楼市限购令与收入高低有关;当χ2>3.841时,有95%的把握判定赞不赞成楼市限购令与收入高低有关;当χ2>6.635时,有99%的把握判定赞不赞成楼市限购令与收入高低有关.
非高收入族
高收入族
总计
赞成
不赞成
总计
(2)现从月收入在[55,65)的人群中随机抽取两人,求所抽取的两人中至少一人赞成楼市限购令的概率.
[解析] (1)
非高收入族
高收入族
总计
赞成
25
3
28
不赞成
15
7
22
总计
40
10
50
χ2=≈3.43,故有90%的把握认为楼市限购令与收入高低有关.
(2)设月收入在[55,65)的5人的编号为a、b、c、d、e,其中a、b为赞成楼市限购令的人,从5人中抽取两人的方法数有ab、ac、ad、ae、bc、bd、be、cd、ce、de共10种,其中ab、ac、ad、ae、bc、bd、be为有利事件数,因此所求概率P=.
课件41张PPT。第一章统计案例章末整合提升知 识 网 络知 识 整 合②线性回归方程中的截距a和斜率b都是通过样本估计出来的,存在误差,这种误差可能导致预报结果的偏差;
③线性回归方程y=a+bx中的b表示x每增加1个单位时y的变化量,而a表示y不随x的变化而变化的量;
④可以利用线性回归方程y=a+bx预报当x取某一确定值时y的估计值.
(3)先判定相关性,再求回归直线方程
利用样本相关系数r来判断两个变量之间是否具有线性相关关系时,若|r|>0.75,我们认为有较强的线性相关关系,可以求回归直线方程,并可用求得的回归直线方程来预报变量的取值;若|r|<0.75,则可以认为两个变量之间的线性相关关系并不强,这时求回归直线方程并没有太大的实际价值.
(4)可线性化的回归分析
对于某些非线性的回归问题可以通过简单的变量替换使之线性化,这样就可以按最小二乘法原理求出替换后变量的线性回归方程.在实际工作中常利用该线性回归方程绘制标准工作曲线,同时根据需要还可以将此线性回归方程还原成曲线回归方程,实现对曲线的拟合.2.条件概率
(1)对于求条件概率问题,我们要明确是在事件A发生的情况下求事件B发生的概率,还是在事件B发生的情况下求事件A发生的概率,然后再选择公式去求解.
(2)条件概率问题往往和相互独立事件的概率问题进行综合命题,要注意,如果事件A和B是相互独立事件,则事件A(或B)发生的情况下,事件B(或A)发生的条件概率就是事件B(或A)发生的概率,也就是说事件A(或B)的发生不影响事件B(或A)发生的概率.专 题 突 破 已知对两个变量x、y的观测数据如下表:题型一 ?回归分析及相关系数 想象一下一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录.(1)年龄(解释变量)和身高(预报变量)之间具有怎样的相关关系?
(2)如果年龄相差5岁,则身高有多大差异?(3~16岁之间)
(3)如果身高相差20 cm,其年龄相差多少?
(4)计算残差,说明该函数模型能够较好地反映年龄与身高的关系吗?请说明理由.题型二 ?条件概率与相互独立事件的概率 小张参加某电视台举办的百科知识竞赛的预选赛,只有闯过了三关的人才能参加决赛.按规则:只有过了第一关,才能去闯第二关;只有过了第二关,才能去闯第三关.对小张来说,过第一关的概率为0.8,如果不按规则去闯第一关,而直接去闯第二关能通过的概率为0.75,直接去闯第三关能通过的概率为0.5.
(1)求小张在第二关被淘汰的概率;
(2)求小张不能参加决赛的概率.[思路分析] 设出对应事件,利用题意熟练使用独立事件和对立事件的公式来求解. 某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学总分也为优秀的人数如下表所示,则我们能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学优秀有关系?
注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.题型三 ?独立性检验[解析] (1)根据已知数据列出数学与物理优秀的2×2列联表如下:
∴b=360-228=132,d=880-143=737,b+d=132+737=869.
代入公式可得χ2≈270.114.(2)按照上述方法列出数学与化学成绩优秀的2×2列联表如下:
代入公式可得χ2≈240.611.
综上由于χ2的观测值都大于10.828,由此说明都能在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学优秀有关系.A B C 4.下列事件A、B是独立事件的是( )
A.一枚硬币掷两次,A=“第一次为正面”,B=“第二次为反面”
B.袋中有两个白球和两个黑球,不放回地摸两球,A=“第一次摸到白球”,B=“第二次摸到白球”
C.掷一枚骰子,A=“出现点数为奇数”,B=“出现点数为偶数”
D.A=一个盒子里有6只好晶体管,2只坏晶体管,从中任取一只取后不放回,连取2次.A=“第一次取到坏晶体管”,B=“第二次取到坏晶体管”.
[解析] 依据独立事件定义,B,C,D中两事件发生的概率显然相互影响.A0.254 6.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:
对于人力资源部的研究项目,根据上述数据试求χ2的观测值为______________.10.76 三、解答题
7.据统计,某食品企业一个月内被消费者投诉的次数为0、1、2的概率分别为0.4、0.5、0.1.
(1)求该企业在一个月内共被消费者投诉不超过1次的概率;
(2)假设一月份与二月份被消费者投诉的次数互不影响,求该企业在这两个月内共被消费者投诉2次的概率.
[解析] (1)设事件A表示“一个月内被投诉的次数为0”,事件B表示“一个月内被投诉的次数为1”,
所以P(A+B)=P(A)+P(B)=0.4+0.5=0.9.(2)设事件Ai表示“第i个月被投诉的次数为0”,事件Bi表示“第i个月被投诉的次数为1”,事件Ci表示“第i个月被投诉的次数为2”,事件D表示“两个月内被投诉2次”.
所以P(Ai)=0.4,P(Bi)=0.5,P(Ci)=0.1(i=1,2),
所以两个月中,一个月被投诉2次,另一个月被投诉0次的概率为P(A1C2+A2C1).一、二月份均被投诉1次的概率为P(B1B2),所以P(D)=P(A1C2+A2C1)+P(B1B2)=P(A1C2)+P(A2C1)+P(B1B2),由事件的独立性得
P(D)=0.4×0.1+0.1×0.4+0.5×0.5=0.33.8.对不同的麦堆测得如下表6组数据:
已知y与x具有线性相关关系,求出重量与跨度的回归方程.