/
/[对应学生用书P10]
一、一种重要图形
散点图是进行线性回归分析的主要手段,其作用如下:
一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,则可以断定两个变量有较好的线性相关关系;
二是判断样本中是否存在异常.
二、一个重要方程
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线方程为=x+.
其中=,=-.
三、两个重要参数
(1)相关系数r:
相关系数r是用来判断两个变量之间是否有线性相关关系的.|r|≤1,且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.
(2)χ2统计量:
χ2是用来判断两个事件在多大程度上有关的变量,独立性检验即计算χ2的值,并与两个临界值3.841与6.635进行比较,从而得到两个事件在多大程度上有关.
/[对应学生用书P57]
(时间90分钟,满分120分)
一、选择题(本大题共10小题,每小题5分,共50分.在每小题所给的四个选项中,只有一项是符合题目要求的.)
1.(全国新课标)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0
C. D.1
解析:因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.
答案:D
2.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.=-10x+200 B.=10x+200
C.=-10x-200 D.=10x-200
解析:由题意知选项B,D为正相关,选项C不符合实际意义.
答案:A
3.已知一个回归直线方程为=1.5x+45,其中x的取值依次为1,7,5,13,19,则=( )
A.58.5 B.46.5
C.60 D.75
解析:==9,
因为回归直线过点(,),
所以=1.5×+45=1.5×9+45=58.5.
答案:A
4.为了研究人的肥胖程度(胖、瘦)与家庭富裕水平(贫、富)之间是否相关,调查了50 000人,其中胖人5 000人,下列独立性检验的方案中,较为合理有效的方案是( )
A.随机抽取100名胖人和100名瘦人
B.随机抽取0.08%的胖人和瘦人
C.随机抽取900名瘦人和100名胖人
D.随机抽取0.1%的瘦人和1%的胖人
解析:样本的合理程度直接影响独立性检验的结果,所以选取样本要合理,易知总体中有5 000名胖人,45 000名瘦人,抽样样本时应该按比例抽取.
答案:C
5.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,各自选取10组数据,并用回归分析方法分析求得相关系数r如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲 B.乙
C.丙 D.丁
解析:丁同学所得相关系数r=0.85最接近1,所以A,B两变量线性相关性更强.
答案:D
6.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得=0.577x-0.448(x为人的年龄,y为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )
A.年龄为37岁的人体内脂肪含量都为20.90%
B.年龄为37岁的人体内脂肪含量为21.01%
C.年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%
D.年龄为37岁的大部分人的体内脂肪含量为31.5%
解析:当x=37时,=0.577×37-0.448=20.901≈20.90.由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%.
答案:C
7.2014年7月北京持续高温,下表是某同学记录的7月11日至7月22日每天因中暑去某医院的人数,及根据这些数据绘制出的散点图如下:
日期
7.11
7.12
7.13
7.14
7.15
7.16
人数
100
109
115
118
121
134
日期
7.17
7.18
7.19
7.20
7.21
7.22
人数
141
152
168
175
186
203
/
下列说法:
①根据此散点图,可以判断日期与人数具有线性相关关系;
②根据此散点图,可以判断日期与人数具有正相关关系;
③根据此散点图,可以判断日期与人数具有一次函数关系.
其中正确的个数为( )
A.0 B.1
C.2 D.3
解析:由散点图可知日期与人数具有线性相关关系而不是一次函数关系,故①正确,③错误.
由散点图可知,人数随日期的增加而增多.故②正确.
答案:C
8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
作文成绩优秀
作文成绩一般
总计
课外阅读量较大
22
10
32
课外阅读量一般
8
20
28
总计
30
30
60
由以上数据,计算得到χ2≈9.643,根据临界值表,以下说法正确的是( )
A.没有充足的理由认为课外阅读量大与作文成绩优秀有关
B.有1%的把握认为课外阅读量大与作文成绩优秀有关
C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关
D.有99%的把握认为课外阅读量大与作文成绩优秀有关
解析:根据临界值表,9.643>6.635,在犯错误的概率不超过0.01的前提下,认为课外阅读量大与作文成绩优秀有关,即有99%的把握认为课外阅读量大与作文成绩优秀有关.
答案:D
9.若A,B为相互独立事件,则下列式子成立的有( )
①P(AB)=P(A)P(B);
②P(B)=P()P(B);
③P(A )=P(A)-P(A)P(B);
④P( )=1-P(A)-P(B)+P(A)P(B).
A.① B.①②
C.①②③ D.①②③④
解析:由题意知事件A与B,A与,与B,与均相互独立,显然①②正确.
而P(A)=P(A)P()=P(A)(1-P(B))
=P(A)-P(A)P(B),
P( )=P()P()=(1-P(A))(1-P(B))
=1-P(A)-P(B)+P(A)P(B)
故③④也正确.
答案:D
10.为预测某种产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取了8组观察值.计算知i=52,i=228,=478,iyi=1 849,则y对x的回归直线方程是( )
A.=11.47+2.62x B.=-11.47+2.62x
C.=2.62+11.47x D.=11.47-2.62x
解析:由=,=-,
直接计算得≈2.62,≈11.47,
所以=2.62x+11.47.
答案:A
二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中的横线上)
11.给出下列关系:
①人的年龄与他(她)拥有的财富之间的关系;
②曲线上的点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一种树木,其断面直径与高度之间的关系;
⑤学生与他(她)的学号之间的关系.
其中有相关关系的是 .
解析:利用相关关系的概念判断.①是不确定关系.②曲线上的点与该点坐标是一种对应关系,即每一个点对应一个坐标,是确定关系.⑤学生与其学号也是确定的对应关系.
答案:①③④
12.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁、吸烟量每天多于和不多于20支进行分组,如下表:
年龄
合计
不超过40岁
超过40岁
吸烟量不多于20支/天
50
15
65
吸烟量多于20支/天
10
25
35
合计
60
40
100
则有 把握认为吸烟量与年龄有关.
解析:利用题中列联表,代入公式计算得
χ2=≈22.16>6.635,
所以我们有99%的把握认为吸烟量与年龄有关.
答案:99%
13.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程=x+,其中=-2.现预测当气温为-4℃时,用电量的度数约为 .
用电量y(度)
24
34
38
64
气温x(℃)
18
13
10
-1
解析:由题意可知
=(18+13+10-1)=10,
=(24+34+38+64)=40,
=-2.
又回归直线=-2x+过点(10,40),
故=60,
所以当x=-4时,=-2×(-4)+60=68.
答案:68
14.对四组变量y和x进行线性相关性检验,已知n是观测值组数,r是相关系数.已知:①n=7,r=0.954 5;②n=15,r=0.381 2;③n=17,r=0.498 5;④n=3,r=0.987 0.则变量y与x具有线性相关关系的是 .
解析:①r>r0.05=0.754,②rr0.05=0.482,④r答案:①③
三、解答题(本大题共4小题,共50分.解答应写出必要的文字说明、证明过程或演算步骤)
15.(本小题满分12分)某聋哑研究机构,对聋哑关系进行抽样调查,在耳聋的657人中有416人哑而另外不聋的680人中有249人哑.你能运用这组数据,得出相应结论吗?
解:根据题中数据列如下2×2列联表:
哑
不哑
合计
聋
416
241
657
不聋
249
431
680
合计
665
672
1 337
∴χ2=
=95.29>6.635.
∴有99%的把握认为聋哑有关系.
16.(本题满分12分)(福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
(1)求回归直线方程=x+,其中=-20,=-b;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
解:(1)由于=(x1+x2+x3+x4+x5+x6)=8.5,
=(y1+y2+y3+y4+y5+y6)=80.
所以=-=80+20×8.5=250,从而回归直线方程为=-20x+250.
(2)设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)
=-20x2+330x-1 000
=-202+361.25.
当且仅当x=8.25时,L取得最大值.
故当单价定为8.25元时,工厂可获得最大利润.
17.(本题满分12分)某推销商为某保健药品做广告,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”.经调查发现,在不服用该药品的418人中仅有18人患A疾病.请用所学知识分析该药品对预防A疾病是否有效.
解:将问题中的数据写成2×2列联表:
患A疾病
未患A疾病
合计
服用该药品
5
100
105
不服用该药品
18
400
418
合计
23
500
523
将上述数据代入公式χ2=中,计算可得χ2≈0.041,因为0.041<3.841,故没有充分理由认为该保健药品对预防A疾病有效.
18.(本小题满分14分)某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系.从这个工业部门内随机抽选了10个企业作样本,有如下资料:
产量x/千件
40
42
48
55
65
79
88
100
120
140
生产费用
y/千克
150
140
160
170
150
162
185
165
190
185
完成下列问题:
(1)计算x与y的相关系数;
(2)对这两个变量之间是否线性相关进行相关检验;
(3)设回归直线方程=x+,求系数,.
解:(1)制表
i
xi
yi
x
y
xiyi
1
40
150
1 600
22 500
6 000
2
42
140
1 764
19 600
5 880
3
48
160
2 304
25 600
7 680
4
55
170
3 025
28 900
9 350
5
65
150
4 225
22 500
9 750
6
79
162
6 241
26 244
12 798
7
88
185
7 744
34 225
16 280
8
100
165
10 000
27 225
16 500
9
120
190
14 400
36 100
22 800
10
140
185
19 600
34 225
25 900
∑
777
1 657
70 903
277 119
132 938
==77.7,==165.7,
=70 903,=277 119,iyi=132 938
r=
≈0.808,
即x与y的相关系数r≈0.808.
(2)因为r>0.75,所以可以认为x与y之间具有线性相关关系.
(3)=≈0.398,
=165.7-0.398×77.7≈134.8.
课件6张PPT。知识整合与阶段检测核心要点归纳阶段质量检测阶段质量检测见阶段质量检测(一)阶段质量检测(一) 统计案例
(时间90分钟,满分120分)
一、选择题(本大题共10小题,每小题5分,共50分.在每小题所给的四个选项中,只有一项是符合题目要求的.)
1.(全国新课标)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0
C. D.1
2.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.=-10x+200 B.=10x+200
C.=-10x-200 D.=10x-200
3.已知一个回归直线方程为=1.5x+45,其中x的取值依次为1,7,5,13,19,则=( )
A.58.5 B.46.5
C.60 D.75
4.为了研究人的肥胖程度(胖、瘦)与家庭富裕水平(贫、富)之间是否相关,调查了50 000人,其中胖人5 000人,下列独立性检验的方案中,较为合理有效的方案是( )
A.随机抽取100名胖人和100名瘦人
B.随机抽取0.08%的胖人和瘦人
C.随机抽取900名瘦人和100名胖人
D.随机抽取0.1%的瘦人和1%的胖人
5.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,各自选取10组数据,并用回归分析方法分析求得相关系数r如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲 B.乙
C.丙 D.丁
6.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得=0.577x-0.448(x为人的年龄,y为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )
A.年龄为37岁的人体内脂肪含量都为20.90%
B.年龄为37岁的人体内脂肪含量为21.01%
C.年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%
D.年龄为37岁的大部分人的体内脂肪含量为31.5%
7.2014年7月北京持续高温,下表是某同学记录的7月11日至7月22日每天因中暑去某医院的人数,及根据这些数据绘制出的散点图如下:
日期
7.11
7.12
7.13
7.14
7.15
7.16
人数
100
109
115
118
121
134
日期
7.17
7.18
7.19
7.20
7.21
7.22
人数
141
152
168
175
186
203
下列说法:
①根据此散点图,可以判断日期与人数具有线性相关关系;
②根据此散点图,可以判断日期与人数具有正相关关系;
③根据此散点图,可以判断日期与人数具有一次函数关系.
其中正确的个数为( )
A.0 B.1
C.2 D.3
8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
作文成绩优秀
作文成绩一般
总计
课外阅读量较大
22
10
32
课外阅读量一般
8
20
28
总计
30
30
60
由以上数据,计算得到χ2≈9.643,根据临界值表,以下说法正确的是( )
A.没有充足的理由认为课外阅读量大与作文成绩优秀有关
B.有1%的把握认为课外阅读量大与作文成绩优秀有关
C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关
D.有99%的把握认为课外阅读量大与作文成绩优秀有关
9.若A,B为相互独立事件,则下列式子成立的有( )
①P(AB)=P(A)P(B);
②P(B)=P()P(B);
③P(A )=P(A)-P(A)P(B);
④P( )=1-P(A)-P(B)+P(A)P(B).
A.① B.①②
C.①②③ D.①②③④
10.为预测某种产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取了8组观察值.计算知i=52,i=228,=478,iyi=1 849,则y对x的回归直线方程是( )
A.=11.47+2.62x
B.=-11.47+2.62x
C.=2.62+11.47x
D.=11.47-2.62x
二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中的横线上)
11.给出下列关系:
①人的年龄与他(她)拥有的财富之间的关系;
②曲线上的点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一种树木,其断面直径与高度之间的关系;
⑤学生与他(她)的学号之间的关系.
其中有相关关系的是________.
12.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁、吸烟量每天多于和不多于20支进行分组,如下表:
年龄
合计
不超过40岁
超过40岁
吸烟量不多于20支/天
50
15
65
吸烟量多于20支/天
10
25
35
合计
60
40
100
则有________把握认为吸烟量与年龄有关.
13.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程=x+,其中=-2.现预测当气温为-4℃时,用电量的度数约为________.
用电量y(度)
24
34
38
64
气温x(℃)
18
13
10
-1
14.对四组变量y和x进行线性相关性检验,已知n是观测值组数,r是相关系数.已知:①n=7,r=0.954 5;②n=15,r=0.381 2;③n=17,r=0.498 5;④n=3,r=0.987 0.则变量y与x具有线性相关关系的是________.
三、解答题(本大题共4小题,共50分.解答应写出必要的文字说明、证明过程或演算步骤)
15.(本小题满分12分)某聋哑研究机构,对聋哑关系进行抽样调查,在耳聋的657人中有416人哑而另外不聋的680人中有249人哑.你能运用这组数据,得出相应结论吗?
16.(本题满分12分)(福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
(1)求回归直线方程=x+,其中=-20,=-b;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
17.(本题满分12分)某推销商为某保健药品做广告,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”.经调查发现,在不服用该药品的418人中仅有18人患A疾病.请用所学知识分析该药品对预防A疾病是否有效.
18.(本小题满分14分)某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系.从这个工业部门内随机抽选了10个企业作样本,有如下资料:
产量x/千件
40
42
48
55
65
79
88
100
120
140
生产费用
y/千克
150
140
160
170
150
162
185
165
190
185
完成下列问题:
(1)计算x与y的相关系数;
(2)对这两个变量之间是否线性相关进行相关检验;
(3)设回归直线方程=x+,求系数,.
答 案
1.选D 因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.
2.选A 由题意知选项B,D为正相关,选项C不符合实际意义.
3.选A ==9,
因为回归直线过点(,),
所以=1.5×+45=1.5×9+45=58.5.
4.选C 样本的合理程度直接影响独立性检验的结果,所以选取样本要合理,易知总体中有5 000名胖人,45 000名瘦人,抽样样本时应该按比例抽取.
5.选D 丁同学所得相关系数r=0.85最接近1,所以A,B两变量线性相关性更强.
6.选C 当x=37时,=0.577×37-0.448=20.901≈20.90.由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%.
7.选C 由散点图可知日期与人数具有线性相关关系而不是一次函数关系,故①正确,③错误.由散点图可知,人数随日期的增加而增多.故②正确.
8.选D 根据临界值表,9.643>6.635,在犯错误的概率不超过0.01的前提下,认为课外阅读量大与作文成绩优秀有关,即有99%的把握认为课外阅读量大与作文成绩优秀有关.
9.选D 由题意知事件A与B,A与,与B,与均相互独立,显然①②正确.
而P(A)=P(A)P()=P(A)(1-P(B))
=P(A)-P(A)P(B),
P( )=P()P()=(1-P(A))(1-P(B))
=1-P(A)-P(B)+P(A)P(B)
故③④也正确.
10.选A 由=,=-,
直接计算得≈2.62,≈11.47,
所以=2.62x+11.47.
11.解析:利用相关关系的概念判断.①是不确定关系.②曲线上的点与该点坐标是一种对应关系,即每一个点对应一个坐标,是确定关系.⑤学生与其学号也是确定的对应关系.
答案:①③④
12.解析:利用题中列联表,代入公式计算得
χ2=≈22.16>6.635,
所以我们有99%的把握认为吸烟量与年龄有关.
答案:99%
13.解析:由题意可知
=(18+13+10-1)=10,
=(24+34+38+64)=40,
=-2.
又回归直线=-2x+过点(10,40),
故=60,
所以当x=-4时,=-2×(-4)+60=68.
答案:68
14.解析:①r>r0.05=0.754,②rr0.05=0.482,④r答案:①③
15.解:根据题中数据列如下2×2列联表:
哑
不哑
合计
聋
416
241
657
不聋
249
431
680
合计
665
672
1 337
∴χ2=
=95.29>6.635.
∴有99%的把握认为聋哑有关系.
16.解:(1)由于=(x1+x2+x3+x4+x5+x6)=8.5,
=(y1+y2+y3+y4+y5+y6)=80.
所以=-=80+20×8.5=250,从而回归直线方程为=-20x+250.
(2)设工厂获得的利润为L元,依题意得
L=x(-20x+250)-4(-20x+250)
=-20x2+330x-1 000
=-202+361.25.
当且仅当x=8.25时,L取得最大值.
故当单价定为8.25元时,工厂可获得最大利润.
17.解:将问题中的数据写成2×2列联表:
患A疾病
未患A疾病
合计
服用该药品
5
100
105
不服用该药品
18
400
418
合计
23
500
523
将上述数据代入公式χ2=中,计算可得χ2≈0.041,因为0.041<3.841,故没有充分理由认为该保健药品对预防A疾病有效.
18.解:(1)制表
i
xi
yi
x
y
xiyi
1
40
150
1 600
22 500
6 000
2
42
140
1 764
19 600
5 880
3
48
160
2 304
25 600
7 680
4
55
170
3 025
28 900
9 350
5
65
150
4 225
22 500
9 750
6
79
162
6 241
26 244
12 798
7
88
185
7 744
34 225
16 280
8
100
165
10 000
27 225
16 500
9
120
190
14 400
36 100
22 800
10
140
185
19 600
34 225
25 900
∑
777
1 657
70 903
277 119
132 938
==77.7,==165.7,
=70 903,=277 119,iyi=132 938
r=
≈0.808,
即x与y的相关系数r≈0.808.
(2)因为r>0.75,所以可以认为x与y之间具有线性相关关系.
(3)=≈0.398,
=165.7-0.398×77.7≈134.8.