第3章统计案例学案+章末检测+模块检测

文档属性

名称 第3章统计案例学案+章末检测+模块检测
格式 zip
文件大小 2.1MB
资源类型 教案
版本资源 苏教版
科目 数学
更新时间 2019-05-24 16:49:25

文档简介

模块综合试卷
(时间:120分钟 满分:160分)
一、填空题(本大题共14小题,每小题5分,共70分)
1.由数字0,1,4,5,7组成的没有重复数字的三位奇数的个数为________.
考点 
题点 
答案 27
解析 第一步排个位有C种排法;第二步排首位有C种排法;第三步排中间位置有C种排法,共有排法C·C·C=27(种),所以有不同的三位奇数27个.
2.5的展开式中x2y3的系数是________.
考点 
题点 
答案 -20
解析 由二项展开式的通项,可得第四项T4=C·2(-2y)3=-20x2y3,故x2y3的系数为-20.
3.将甲、乙、丙、丁四名学生分到两个不同的班,每个班至少分到一名学生,且甲、乙两名学生不能分到同一个班,则不同的分法的总数为________.
考点 
题点 
答案 8
解析 A·C+A·A=4+4=8.
4.将字母a,a,b,b,c,c排成三行两列,要求每行的字母互不相同,每列的字母也互不相同,则不同的排列方法共有________种.
考点 
题点 
答案 12
解析 由分步计数原理,先排第一列,有A种方法,再排第二列,有2种方法,故共有A×2=12(种)排列方法.
5.若二项式7的展开式中的系数是84,则实数a=________.
考点 
题点 
答案 1
解析 Tr+1=C(2x)7-rr=C27-rarx7-2r,
令7-2r=-3,得r=5,即T5+1=C22a5x-3=84x-3,
解得a=1.
6.某运输公司有6个车队,每个车队的车辆均多于4辆,现从这个公司中抽调9辆车,并且每个车队至少抽调1辆,那么不同的抽调方法共有________种.
考点 
题点 
答案 56
解析 每个车队先各抽一辆,再分三类,①从一个车队抽3辆,C;②从两个车队分别抽2辆,1辆,A;③从3个车队再各抽一辆,C,∴C+A+C=56.
7.今有2个红球、3个黄球、4个白球,同色球不加以区分,将这9个球排成一列有________种不同的方法.(用数字作答)
答案 1 260
解析 只需找到不同颜色的球所在的位置即可,有CCC=1 260(种).
8.(1+x+x2)6的展开式中的常数项为________.
答案 -5
解析 6展开式的通项为
Tr+1=C(-1)rx6-2r,
当r=3时,T4=-C=-20,当r=4时,T5=C=15,因此常数项为-20+15=-5.
9.若随机变量X的概率分布为
X
-2
-1
0
1
2
3
P
0.1
0.2
0.2
0.3
0.1
0.1
则当P(X<a)=0.8时,实数a的取值范围是________.
考点 
题点 
答案 (1,2]
解析 ∵P(X=-2)+P(X=-1)+P(X=0)+P(X=1)=0.8,
∴a>1且a≤2,即1<a≤2.
10.某计算机程序每运行一次都随机出现一个五位的二进制数A=a1a2a3a4a5,其中A的各位数中,a1=1,ak(k=2,3,4,5)出现0的概率为,出现1的概率为,记ξ=a1+a2+a3+a4+a5,当程序运行一次时,ξ的均值为________.
考点 
题点 
答案 
解析 P(ξ=1)=4=,
P(ξ=2)=C13=,
P(ξ=3)=C22=,
P(ξ=4)=C3=,
P(ξ=5)=4=,
∴E(ξ)=1×+2×+3×+4×+5×=.
11.反复抛掷一个质地均匀的正方体骰子,依次记录每一次落地时骰子向上的点数,当记有三个不同点数时即停止抛掷.若抛掷四次恰好停止,则这四次点数所有不同的结果种数为________.(用数字作答)
答案 360
解析 假设第四次抛出的数字为1,则前三次抛出的数字应该是2,3,4,5,6中的两个,选出两个,放在前三个空中,有种排法.根据分步计数原理知,共有C·=360(种)不同的结果.
12.由1,2,3,4,5,6组成没有重复数字且1,3都不与5相邻的六位偶数的个数是________.
考点 
题点 
答案 108
解析 从2,4,6三个偶数中选一个数放在个位,有C种方法,将其余两个偶数全排列,有A种排法,当1,3不相邻且不与5相邻时有A种排法,当1,3相邻且不与5相邻时有A·A种排法,故满足题意的偶数有C·A·(A+A·A)=108(个).
13.从装有3个黑球和3个白球(大小、形状相同)的盒子中随机摸出3个球,用X表示摸出的黑球个数,则P(X≥2)的值为________.
考点 
题点 
答案 
解析 根据条件,摸出2个黑球的概率为,摸出3个黑球的概率为,故P(X≥2)=+=.
14.若6的展开公式中x3项的系数为20,则a2+b2的最小值为________.
考点 
题点 
答案 2
解析 Tr+1=C(ax2)6-rr=Ca6-rbrx12-3r,
令12-3r=3,得r=3,故Ca3b3=20,
所以ab=1,a2+b2≥2ab=2,
当且仅当a=b=1或a=b=-1时,等号成立.
二、解答题(本大题共6小题,共90分)
15.(14分)已知二项式10的展开式中,
(1)求展开式中含x4项的系数;
(2)如果第3k项和第k+2项的二项式系数相等,试求k的值.
考点 
题点 
解 (1)设第r+1项为Tr+1=Cx10-r·r
=(-2)rC.
令10-r=4,解得r=4,
∴展开式中含x4项的系数为(-2)4C=3 360.
(2)∵第3k项的二项式系数为C,第k+2项的二项式系数为C,
∴C=C,故3k-1=k+1或3k-1+k+1=10,
解得k=1,k=2.5(不合题意,舍去).故k=1.
16.(14分)已知男人中有5%患色盲,女人中有0.25%患色盲,从100个男人和100个女人中任选一人.
(1)求此人患色盲的概率;
(2)如果此人是色盲,求此人是男人的概率.
考点 
题点 
解 设“任选一人是男人”为事件A,“任选一人是女人”为事件B,“任选一人是色盲”为事件C.
(1)此人患色盲的概率P(C)=P(AC)+P(BC)
=P(A)·P(C|A)+P(B)P(C|B)
=×+×=.
(2)P(A|C)===.
17.(14分)甲、乙两人各射击一次,击中目标的概率分别是和.假设两人射击是否击中目标相互之间没有影响;每人各次射击是否击中目标相互之间也没有影响.
(1)求甲射击4次,至少有1次未击中目标的概率;
(2)求两人各射击4次,甲恰好击中目标2次且乙恰好击中目标3次的概率;
(3)假设某人连续2次未击中目标,则中止其射击.问:甲恰好射击5次后,被中止射击的概率是多少?
考点 
题点 
解 设A={甲射击一次击中目标},B={乙射击一次击中目标},则A,B相互独立,且P(A)=,P(B)=.
(1)设C={甲射击4次,至少有1次未击中目标},
则P(C)=1-4=.
(2)设D={两人各射击4次,甲恰好击中目标2次且乙恰好击中目标3次},
∴P(D)=C2·2·C3·=.
(3)甲恰好射击5次,被中止射击,说明甲第4,5次未击中目标,第3次击中目标,第1,2两次至多一次未击中目标,故所求概率P=··2=.
18.(16分)已知某种从太空飞船中带回的植物种子每粒成功发芽的概率都为,某植物研究所分2个小组分别独立开展该种子的发芽试验,每次试验种一粒种子,如果某次没有发芽,则称该次试验是失败的.
(1)第一小组做了3次试验,记该小组试验成功的次数为ξ,求ξ的均值;
(2)第二小组进行试验,到成功了4次为止,求在第4次成功之前共有3次失败的概率.
解 (1)由题意得
P(ξ=0)=C3=,
P(ξ=1)=C12=,
P(ξ=2)=C21=,
P(ξ=3)=C3=,
因此E(ξ)=0×+1×+2×+3×=1.
(2)第二小组第7次试验成功,前面6次试验中有3次失败,因此所求概率P=C3·3·=.
19.(16分)在一块耕地上种植一种作物,每季种植成本为1 000元,此作物的市场价格和这块地上的产量均具有随机性,且互不影响,其具体情况如下表:
作物产量(kg)
300
500
概率
0.5
0.5
作物市场价格(元/kg)
6
10
概率
0.4
0.6
(1)设X表示在这块地上种植1季此作物的利润,求X的概率分布;
(2)若在这块地上连续3季种植此作物,求这3季中至少有2季的利润不少于2 000元的概率.
考点 
题点 
解 (1)设A表示事件“作物产量为300 kg”,B表示事件“作物市场价格为6 元/kg”,由题设知P(A)=0.5,P(B)=0.4,
因为利润=产量×市场价格-成本,
所以X所有可能的取值为
500×10-1 000=4 000,500×6-1 000=2 000,
300×10-1 000=2 000,300×6-1 000=800.
P(X=4 000)=P()P()=(1-0.5)×(1-0.4)
=0.3,
P(X=2 000)=P()P(B)+P(A)P()
=(1-0.5)×0.4+0.5×(1-0.4)=0.5,
P(X=800)=P(A)P(B)=0.5×0.4=0.2,
所以X的概率分布为
X
4 000
2 000
800
P
0.3
0.5
0.2
(2)设Ci表示事件“第i季利润不少于2 000元”(i=1,2,3),由题意知C1,C2,C3相互独立,由(1)知,
P(Ci)=P(X=4 000)+P(X=2 000)=0.3+0.5=0.8(i=1,2,3),
3季的利润均不少于2 000元的概率为
P(C1C2C3)=P(C1)P(C2)P(C3)=0.83=0.512;
3季中有2季的利润不少于2 000元的概率为
P(1C2C3)+P(C12C3)+P(C1C23)
=3×0.82×0.2=0.384,
所以,这3季中至少有2季的利润不少于2 000元的概率为0.512+0.384=0.896.
20.(16分)设每个工作日甲、乙、丙、丁4人需使用某种设备的概率分别为0.6,0.5,0.5,0.4,各人是否需使用设备相互独立.
(1)求同一工作日至少3人需使用设备的概率;
(2)设X表示同一工作日需使用设备的人数,求X的均值.
考点 
题点 
解 记Ai表示事件:同一工作日乙、丙中恰有i人需使用设备,i=0,1,2,
B表示事件:甲需使用设备,
C表示事件:丁需使用设备,
D表示事件:同一工作日至少3人需使用设备,
E表示事件:同一工作日4人需使用设备,
F表示事件:同一工作日需使用设备的人数大于k.
(1)D=A1·B·C+A2·B+A2··C,
P(B)=0.6,P(C)=0.4,P(Ai)=C×0.52,i=0,1,2,
所以P(D)=P(A1·B·C+A2·B+A2··C)
=P(A1·B·C)+P(A2·B)+P(A2··C)
=P(A1)P(B)P(C)+P(A2)P(B)+P(A2)P()P(C)
=0.31.
(2)X的可能取值为0,1,2,3,4,其概率分布为
P(X=0)=P(·A0·)=P()P(A0)P()
=(1-0.6)×0.52×(1-0.4)=0.06,
P(X=1)=P(B·A0·+·A0·C+·A1·)
=P(B)P(A0)P()+P()P(A0)P(C)+
P()P(A1)P()
=0.6×0.52×(1-0.4)+(1-0.6)×0.52×0.4+(1-0.6)×2×0.52×(1-0.4)=0.25,
P(X=4)=P(A2·B·C)=P(A2)P(B)P(C)=0.52×0.6×0.4=0.06,
P(X=3)=P(D)-P(X=4)=0.25,
P(X=2)=1-P(X=0)-P(X=1)-P(X=3)-P(X=4)
=1-0.06-0.25-0.25-0.06=0.38,
均值E(X)=0×P(X=0)+1×P(X=1)+2×P(X=2)+3×P(X=3)+4×P(X=4)
=0.25+2×0.38+3×0.25+4×0.06=2.
章末检测试卷(三)
(时间:120分钟 满分:160分)
一、填空题(本大题共14小题,每小题5分,共70分)
1.下列有关线性回归的说法:
①当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;
②在平面直角坐标系中用描点的方法得到具有相关关系的两个变量的一组数据的图形叫做散点图;
③线性回归直线得到具有代表意义的线性回归方程;
④任何一组观测值都能得到具有代表意义的线性回归方程.
其中错误的是________.(填序号)
考点 
题点 
答案 ④
解析 任何一组观测值并不都能得到具有代表意义的线性回归方程.
2.已知x与y的一组数据,
x
1
3
5
y
2
4
6
则有以下结论:
①x与y正相关;
②x与y负相关;
③其回归方程为y=x+1;
④其相关系数r=1.
其中正确的是________.(填序号)
考点 
题点 
答案 ①③④
解析 从数据看,随着x的增加,y增加,所以x与y正相关,①对,②错,③④正确.
3.为了判断高三年级学生是否喜欢踢足球与性别的关系,对某班50名学生进行了问卷调查,得到下表:

喜欢踢足球
不喜欢踢足球
合计
男生
19
6
25
女生
9
16
25
合计
28
22
50
根据表中的数据及χ2统计量的公式,算得χ2≈8.12.
临界值表:
P(χ2≥x0)
0.010
0.005
0.001
x0
6.635
7.879
10.828
根据临界值表,你认为喜欢踢足球与性别有关的把握有________.
考点 
题点 
答案 99.5%
4.某商场为了了解某品牌羽绒服的月销售量(单位:件)与月平均气温x(单位:℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:
月平均气温x/℃
17
13
8
2
月销售量y/件
24
33
40
55
由表中数据算出线性回归方程=x+中的≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月该品牌羽绒服的销售量的件数约为________.
答案 46
解析 由表格中数据可得==10,
==38.
又∵≈-2,∴=-≈38+2×10=58,
∴=-2x+58.当x=6时,=-2×6+58=46.
5.对有关数据的分析可知,每一立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压度y(单位:kg/cm2)之间具有线性相关关系,其线性回归方程为=0.30x+9.99.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7 kg/cm2,每立方米混凝土的水泥用量最少应为________kg.(精确度0.1 kg)
考点 
题点 
答案 265.7
解析 由0.30x+9.99≥89.7,得x≥265.7.
6.有5组(x,y)的统计数据:(1,2),(2,4),(4,5),(3,10),(10,12),要使剩下的数据具有较强的相关关系,应去掉的一组数据是________.
考点 
题点 
答案 (3,10)
解析 画散点图,从散点图观察(3,10)为一个特殊点,所以去掉(3,10)这组数据.
7.某班主任对全班50名学生进行了作业量多少的调查,数据如下表,则喜不喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为________.
认为作业多
认为作业不多
合计
喜欢玩电脑游戏
18
9
27
不喜欢玩电脑游戏
8
15
23
合计
26
24
50
考点 
题点 
答案 97.5%
解析 假设H0:喜欢玩电脑游戏与认为作业量的多少没有关系,根据列联表中的数据,可以求得χ2=≈5.059,对照临界值表,当假设成立时,χ2>5.024的概率约为0.025,所以我们有97.5%的把握认为喜欢玩电脑游戏与认为作业量的多少有关.
8.某车间加工零件的数量x与加工时间y的统计数据如下表:
零件数x(个)
10
20
30
加工时间y(分钟)
21
30
39
现已求得上表数据的回归方程=x+中的值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为________分钟.
考点 线性回归分析
题点 线性回归方程的应用
答案 102
解析 由已知可得=20,=30,
又=0.9,∴=-=30-0.9×20=12.
∴线性回归方程为=0.9x+12.
∴当x=100时,=0.9×100+12=102.
9.某调查者从调查中获知某公司近年来科研费用支出x(万元)与公司所获得利润y(万元)的统计资料如下表:
序号
科研费用支出xi
利润yi
xiyi
x
1
5
31
155
25
2
11
40
440
121
3
4
30
120
16
4
5
34
170
25
5
3
25
75
9
6
2
20
40
4
合计
30
180
1 000
200
则利润y对科研费用支出x的线性回归方程为___________________________.
考点 线性回归方程
题点 求线性回归方程
答案 =2x+20
解析 设线性回归方程为=x+.
由表中数据,得==2,
∴=-=30-2×5=20,
∴线性回归方程为=2x+20.
10.2017年3月1日,某地物价部门对该地的5家商场的某商品的一天的销售量及其价格进行调查,5家商场该商品的售价x元和销售量y件之间的一组数据如表所示,由散点图可知,销售量y与价格x之间有较好的线性相关关系,其线性回归方程是 =-3.2x+ ,则 =______.
价格x(元)
9
9.5
10
10.5
11
销售量y(件)
11
10
8
6
5
考点 线性回归分析
题点 回归直线的应用
答案 40
解析 由题意,==10,
==8,
∵线性回归方程是=-3.2x+ ,∴8=-3.2×10+ ,∴ =40.
11.下列关于回归分析与独立性检验的说法正确的是________.(填序号)
①回归分析和独立性检验没有什么区别;
②回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;
③回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;
④独立性检验可以100%确定两个变量之间是否具有某种关系.
考点 
题点 
答案 ③
解析 由回归分析、独立性检验的意义知,回归分析与独立性检验都是研究两个变量之间的相关性,但方法与手段有所不同,研究角度不同,由其意义知,③正确.
12.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程为=x+,其中=-2.现预测当气温为-4 ℃时,用电量的度数约为________.
气温x(℃)
18
13
10
-1
用电量y(度)
24
34
38
64
考点 线性回归方程
题点 线性回归方程的应用
答案 68
解析 由题意可知,=(18+13+10-1)=10,
=(24+34+38+64)=40,=-2.
又回归直线=-2x+过点(10,40),故=60.
所以当x=-4时,=-2×(-4)+60=68.
13.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:
读书
健身
合计

24
31
55

8
26
34
合计
32
57
89
在犯错误的概率不超过________的前提下认为性别与休闲方式有关系.
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 0.10
解析 由列联表中的数据,得
χ2=≈3.689>2.706,
因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.
14.已知样本容量为11,计算得i=510,i=214,回归方程为=0.3x+,则≈________,≈________.(精确到0.01)
考点 线性回归方程
题点 样本点中心的应用
答案 46.36 5.55
解析 由题意得=i=,=i=,因为=0.3+,所以=0.3×+,
可得≈5.55.
二、解答题(本大题共6小题,共90分)
15.(14分)暑期社会实践中,小闲所在的小组调查了某地家庭人口数x与每天对生活必需品的消费y的情况,得到的数据如下表:
x/人
2
4
5
6
8
y/元
20
30
50
50
70
(1)利用相关系数r判断y与x是否线性相关;
(2)根据上表提供的数据,求出y关于x的线性回归方程.
考点 
题点 
解 (1)由表中数据,得
=5,=44,iyi=1270,=145,=11 200,
r=≈0.975.
因为r>r0.05=0.878,所以y与x之间具有线性相关关系.
(2)根据以上数据,可得==8.5,
所以=-=44-8.5×5=1.5,
所以所求的线性回归方程为=8.5x+1.5.
16.(14分)某校高一年级理科有8个班,在一次数学考试中成绩情况分析如下:
班级
1
2
3
4
5
6
7
8
大于145分人数
6
6
7
3
5
3
3
7
不大于145分人数
39
39
38
42
40
42
42
38
附:xiyi=171,x=204.
(1)求145分以上成绩y对班级序号x的线性回归方程;(精确到0.000 1)
(2)能否在犯错误的概率不超过0.01的前提下认为7班与8班的成绩是否优秀(大于145分)与班级有关系.
考点 
题点 
解 (1)=4.5,=5,xiyi=171,x=204,
==
=-≈-0.214 3,
=-=5-(-0.214 3)×4.5≈5.964 4,
所以线性回归方程为=-0.214 3x+5.964 4.
(2)由题意知,2×2列联表如下:
优秀
非优秀
合计
7班
3
42
45
8班
7
38
45
合计
10
80
90
χ2==1.8,
因为1.8<6.635,所以在犯错误的概率不超过0.01的前提下不能认为7班与8班的成绩是否优秀(大于145分)与班级有关系.
17.(14分)为了调查某大学学生在某天上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果:
表1:男生上网时间与频数分布表
上网时间(分)
[30,40)
[40,50)
[50,60)
[60,70)
[70,80]
人数
5
25
30
25
15
表2:女生上网时间与频数分布表
上网时间(分)
[30,40)
[40,50)
[50,60)
[60,70)
[70,80]
人数
10
20
40
20
10
(1)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;
(2)完成下面的2×2列联表,并回答能否有90%的把握认为“大学生上网时间与性别有关”.
上网时间少于60分钟
上网时间不少于60分钟
合计
男生
女生
合计
附:χ2=.
P(χ2≥x0)
0.50
0.40
0.25
0.15
0.10
x0
0.455
0.708
1.323
2.072
2.706
P(χ2≥x0)
0.05
0.025
0.010
0.005
0.001
x0
3.841
5.024
6.635
7.879
10.828
考点 独立性检验及其基本思想
题点 分类变量与统计、概率的综合应用
解 (1)设上网时间不少于60分钟的女生人数为x,
依题意有=,解得x=225,
所以估计上网时间不少于60分钟的女生有225人.
(2)填2×2列联表如下:
上网时间少于60分钟
上网时间不少
于60分钟
合计
男生
60
40
100
女生
70
30
100
合计
130
70
200
由表中数据可得到χ2=
≈2.20<2.706,
故没有90%的把握认为“大学生上网时间与性别有关”.
18.(16分)有甲、乙两个班级进行数学考试,按照大于或等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的2×2列联表.已知从全部210人中随机抽取1人为优秀的概率为.
优秀
非优秀
合计
甲班
20
乙班
60
合计
210
(1)请完成上面的2×2列联表,若按99%的可靠性要求,则能否认为“成绩是否优秀与班级有关”?
(2)从210人中有放回地抽取3次,每次抽取1人,记被抽取的3人中的优秀人数为X,若每次抽取的结果是相互独立的,求X的均值E(X).
考点 独立性检验及其基本思想
题点 独立性检验与均值的综合应用
解 (1)2×2列联表如下:
优秀
非优秀
合计
甲班
20
90
110
乙班
40
60
100
合计
60
150
210
由表中数据可得到χ2=
≈12.2>10.828,
所以若按照99%的可靠性要求,则能够判断成绩是否优秀与班级有关.
(2)X~B,
且P(X=r)=Cr·3-r(r=0,1,2,3),E(X)=3×=.
19.(16分)某校团对“学生性别与是否喜欢韩剧有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的,若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?
考点 独立性检验及其基本思想
题点 分类变量与统计、概率的综合应用
解 设男生人数为x,依题意可得列联表如下:
喜欢韩剧
不喜欢韩剧
合计
男生


x
女生



合计

x

若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则χ2>3.841,
由χ2==x>3.841,解得x>10.24.
又∵,为正整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人.
20.(16分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日期
12月1日
12月2日
12月3日
12月4日
12月5日
温差x(℃)
10
11
13
12
8
发芽数y(颗)
23
25
30
26
16
该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻2天数据的概率;
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程=x+;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?
考点 线性回归分析
题点 线性回归方程的应用
解 (1)设事件A表示“选取的2组数据恰好是不相邻2天的数据”,则表示“选取的数据恰好是相邻2天的数据”.
基本事件总数为10,事件包含的基本事件数为4.
∴P()==,∴P(A)=1-P()=.
(2)=12,=27,iyi=977,=434,
∴===2.5,
=- =27-2.5×12=-3,∴=2.5x-3.
(3)由(2)知,当x=10时,=22,误差不超过2颗;
当x=8时,=17,误差不超过2颗.
故所求得的线性回归方程是可靠的.

3.1 独立性检验
学习目标 1.了解2×2列联表的意义.2.了解统计量χ2的意义.3.通过对典型案例分析,了解独立性检验的基本思想和方法.
知识点一 2×2列联表
思考 山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:
体育
文娱
合计
男生
210
230
440
女生
60
290
350
合计
270
520
790
如何判定“喜欢体育还是文娱与性别是否有联系”?
答案 可通过表格与图形进行直观分析,也可通过统计分析定量判断.
梳理 (1)2×2列联表的定义
对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.我们得到如下列联表所示的抽样数据:

类1
类2
合计

类A
a
b
a+b
类B
c
d
c+d
合计
a+c
b+d
a+b+c+d
(2)χ2统计量的求法
公式χ2=.
知识点二 独立性检验
独立性检验的概念
用χ2统计量研究两变量是否有关的方法称为独立性检验.
知识点三 独立性检验的步骤
1.独立性检验的步骤
要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:
(1)提出假设H0:Ⅰ与Ⅱ没有关系;
(2)根据2×2列联表及χ2公式,计算χ2的值;
(3)查对临界值,作出判断.
其中临界值如表所示:
P(χ2≥x0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
表示在H0成立的情况下,事件“χ2≥x0”发生的概率.
2.推断依据
(1)若χ2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有关系”;
(2)若χ2>6.635,则有99%的把握认为“Ⅰ与Ⅱ有关系”;
(3)若χ2>2.706,则有90%的把握认为“Ⅰ与Ⅱ有关系”;
(4)若χ2≤2.706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即不能认为Ⅰ与Ⅱ没有关系.
1.列联表中的数据是两个分类变量的频数.( √ )
2.事件A与B的独立性检验无关,即两个事件互不影响.( × )
3.χ2的大小是判断事件A与B是否相关的统计量.( √ )                   
类型一 2×2列联表
例1 在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的人数的列联表.
考点 
题点 
解 作列联表如下:
喜欢甜食
不喜欢甜食
合计

117
413
530

492
178
670
合计
609
591
1 200
反思与感悟 分清类别是作列联表的关键步骤.表中排成两行两列的数据是调查统计得来的结果.
跟踪训练1 (1)下面是2×2列联表:
y1
y2
合计
x1
a
21
73
x2
2
25
27
合计
b
46
100
则表中a,b的值分别为____________________.
答案 52 54
解析 ∵a+21=73,∴a=52.
又∵a+2=b,∴b=54.
(2)某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中有213名在考前心情紧张.作出2×2列联表.
考点 
题点 
解 作列联表如下:
性格内向
性格外向
合计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
合计
426
594
1 020
类型二 由χ2进行独立性检验
例2 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行三年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示.

又发作过心脏病
未发作过心脏病
合计
心脏搭桥手术
39
157
196
血管清障手术
29
167
196
合计
68
324
392
试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别.
考点 独立性检验及其基本思想
题点 独立性检验的方法
解 假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没有关系,由表中数据得a=39,b=157,c=29,d=167,a+b=196,c+d=196,a+c=68,b+d=324,n=392,
由公式得χ2=≈1.779.
因为χ2≈1.779<2.706,所以不能得出病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术有关系的结论,即这两种手术对病人又发作过心脏病的影响没有差别.
反思与感悟 独立性检验的关注点
在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.
跟踪训练2 某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.
(1)根据以上数据建立一个2×2列联表;
(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系.
考点 独立性检验及其基本思想
题点 独立性检验的方法
解 (1)2×2列联表如下所示:
赞同
不赞同
合计
老教师
10
10
20
青年教师
24
6
30
合计
34
16
50
(2)假设“对新课程教学模式的赞同情况与教师年龄无关”.
由公式得χ2=≈4.963<6.635,
所以没有99%的把握认为对新课程教学模式的赞同情况与教师年龄有关.
类型三 独立性检验的综合应用
例3 电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,并根据调查结果绘制了观众日均收看该体育节目时间的频率分布直方图如图.
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.
(1)根据已知条件完成下面的2×2列联表,并据此资料推断“体育迷”与性别是否有关?
非体育迷
体育迷
合计


10
55
合计
(2)将上述调查所得的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的概率分布、均值E(X)和方差V(X).
附:χ2=.
P(χ2≥x0)
0.10
0.05
0.01
x0
2.706
3.841
6.635
考点 独立性检验及其基本思想
题点 独立性检验的方法
解 (1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:

非体育迷
体育迷
合计

30
15
45

45
10
55
合计
75
25
100
将2×2列联表中的数据代入公式计算,得
χ2==≈3.030.
因为2.706<3.030<3.841,所以在犯错误的概率不超过0.10的前提下认为“体育迷”与性别有关.
(2)由频率分布直方图知,抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为.
由题意知,X~B,从而X的概率分布为
X
0
1
2
3
P




故E(X)=np=3×=,
V(X)=np(1-p)=3××=.
反思与感悟 独立性检验的步骤
第一步,假设两个分类变量X与Y无关系;第二步,找相关数据,列出2×2列联表;第三步,由公式χ2=(其中n=a+b+c+d)计算出χ2的值;第四步,将χ2的值与临界值进行比较,进而作出统计推断.
跟踪训练3 某地区甲校高二年级有1 100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层抽样的方法在两校共抽取了200名学生的数学成绩,如下表:(已知本次测试合格线是50分,两校合格率均为100%)
甲校高二年级数学成绩:
分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
10
25
35
30
x
乙校高二年级数学成绩:
分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
15
30
25
y
5
(1)计算x,y的值,并分别估计以上两所学校数学成绩的平均分;(精确到1分)
(2)若数学成绩不低于80分为优秀,低于80分为非优秀,根据以上统计数据填写下面2×2列联表,并回答能否在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”?
甲校
乙校
合计
优秀
非优秀
合计
考点 独立性检验及其基本思想
题点 独立性检验的方法
解 (1)依题意知,甲校应抽取110人,乙校应抽取90人,
∴x=10,y=15,
估计两个学校的平均分,甲校的平均分为
≈75.
乙校的平均分为
≈71.
(2)数学成绩不低于80分为优秀,低于80分为非优秀,得到2×2列联表如下:
甲校
乙校
合计
优秀
40
20
60
非优秀
70
70
140
合计
110
90
200
χ2=≈4.714,
又4.714>3.841,故能在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”.

1.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填有关或无关)
考点 
题点 
答案 有关
2.为了考察长头发与女性头晕是否有关系,随机抽查了301名女性,得到如下所示的列联表,试根据表格中已有数据填空.
经常头晕
很少头晕
合计
长发
35

121
短发
37
143

合计
72


则空格中的数据分别为:①________;②________;③________;④________.
考点 
题点 
答案 86 180 229 301
3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是________.(填序号)
①若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
②从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;
③若从χ2与临界值的比较中得出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.
考点 
题点 
答案 ③
解析 对于①,99%的把握是通过大量的试验得出的结论,这100个吸烟的人中可能全患肺病也可能都不患,是随机的,所以①错;对于②,某人吸烟只能说其患病的可能性较大,并不一定患病;③的解释是正确的.
4.某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:
患心脏病
无心脏病
合计
秃发
20
300
320
不秃发
5
450
455
合计
25
750
775
根据表中数据得到χ2=≈15.968,因为χ2>6.635,则断定秃发与患心脏病有关系,那么这种判断出错的可能性为________.
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 0.01
解析 因为χ2>6.635,所以有99%的把握说秃发与患心脏病有关,故这种判断出错的可能性有1-0.99=0.01.
5.根据下表计算:
不看电视
看电视
合计

37
85
122

35
143
178
合计
72
228
300
χ2≈________.(保留3位小数)
考点 
题点 
答案 4.514
解析 χ2=≈4.514.
1.2×2列联表
2×2列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系.
2.对独立性检验思想的理解
独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算χ2统计量的值,如果χ2的值很大,说明假设不合理.χ2越大,两个分类变量有关系的可能性越大.
一、填空题
1.在对某小学的学生进行吃零食的调查中,得到如下表数据:
吃零食
不吃零食
合计
男学生
27
34
61
女学生
12
29
41
合计
39
63
102
根据上述数据分析,我们得出的χ2约为________.(保留3位小数)
考点 
题点 
答案 2.334
解析 由公式可计算得χ2=
≈2.334.
2.有两个分类变量X,Y,其2×2列联表如下表所示,
Y1
Y2
X1
a
20-a
X2
15-a
30+a
其中a,15-a均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X,Y有关,则a的值为________.
考点 
题点 
答案 8或9
解析 根据公式,得
χ2=
=>3.841,根据a>5且15-a>5,
a∈Z,求得当a=8或9时满足题意.
3.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y有关系”的可信程度.如果χ2≥5.024,那么有把握认为“X与Y有关系”的百分比约为________.
P(χ2≥x0)
0.50
0.40
0.25
0.15
0.10
x0
0.455
0.708
1.323
2.072
2.706
P(χ2≥x0)
0.05
0.025
0.010
0.005
0.001
x0
3.841
5.024
6.635
7.879
10.828
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 97.5%
解析 x0=5.024,对应的0.025是“X和Y有关系”不合理的程度,因此两个分类变量有关系的可信程度约为97.5%.
4.在一个2×2列联表中,由其数据计算得χ2=6.888,则其两个变量间有关系的可能性为________.
考点 
题点 
答案 99%
解析 由于χ2=6.888>6.635,
所以其两个变量间有关系的可能性为99%.
5.在独立性检验中,两个分类变量“X与Y有关系”的可信度为99%,则χ2统计量的取值范围是________.
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 [6.635,7.879)
6.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:


合计
爱好
40
20
60
不爱好
20
30
50
合计
60
50
110
由χ2=,算得
χ2=≈7.8.
附表:
P(χ2≥x0)
0.050
0.010
0.001
x0
3.841
6.635
10.828
参照附表,得到的正确结论是________.(填序号)
①有99%以上的把握认为“爱好该项运动与性别有关”;
②有99%以上的把握认为“爱好该项运动与性别无关”;
③在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”;
④在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”.
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 ①
解析 由7.8>6.635知,有99%以上的把握认为“爱好该项运动与性别有关”.
7.某班主任对全班50名学生进行了作业量的调查,数据如下表:
认为作业量大
认为作业量不大
合计
男生
18
9
27
女生
8
15
23
合计
26
24
50
则推断“学生的性别与认为作业量大有关”这种事件犯错误的概率不超过________.
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 0.025
解析 由公式得χ2=≈5.059>5.024.
∵P(χ2≥5.024)=0.025,
∴犯错误的概率不超过0.025.
8.假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其中2×2列联表为:
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
对同一样本,以下数据能说明X与Y有关的可能性最大的一组是________.(填序号)
①a=5,b=4,c=3,d=2;
②a=5,b=3,c=4,d=2;
③a=2,b=3,c=4,d=5;
④a=3,b=2,c=4,d=5.
答案 ④
解析 对于同一样本,|ad-bc|越小,说明x与y相关性越弱,而|ad-bc|越大,说明x与y相关性越强,通过计算知,对于①②③都有|ad-bc|=|10-12|=2.对于④,有|ad-bc|=|15-8|=7,显然7>2.
9.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
无效
有效
合计
男性患者
15
35
50
女性患者
6
44
50
合计
21
79
100
设H0:服用此药的效果与患者的性别无关,则χ2≈____________________________
(小数点后保留3位有效数字),从而得出结论;服用此药的效果与患者的性别有关,这种判断出错的可能性为________.
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 4.882 5%
解析 由公式计算得χ2≈4.882,
∵χ2>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.
10.某班主任对全班30名男生进行了作业量多少的调查,数据如下表:
认为作业多
认为作业不多
合计
喜欢玩电脑游戏
12
8
20
不喜欢玩电脑游戏
2
8
10
合计
14
16
30
该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关系,则这种推断犯错误的概率不超过________.
考点 
题点 
答案 0.050
解析 χ2=≈4.286>3.841,
∴这种推断犯错误的概率不超过0.050.
11.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:
月收入2 000元以下
月收入2 000元以上
合计
高中文化以上
10
45
55
高中文化及以下
20
30
50
合计
30
75
105
由上表数据计算得χ2=≈6.109,估计有________的把握认为“文化程度与月收入有关系”.
考点 
题点 
答案 97.5%
解析 ∵χ2=6.109>5.024,
∴有97.5%的把握认为“文化程度与月收入有关系”.
12.在2×2列联表中,若每个数据变为原来的2倍,则χ2的值变为原来的________倍.
考点 
题点 
答案 2
解析 由公式χ2=中所有值变为原来的2倍,
得(χ2)′==2χ2,
故χ2也变为原来的2倍.
二、解答题
13.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
甲厂:
分组
[29.86,
29.90)
[29.90,
29.94)
[29.94,
29.98)
[29.98,
30.02)
[30.02,
30.06)
[30.06,
30.10)
[30.10,
30.14]
频数
12
63
86
182
92
61
4
乙厂:
分组
[29.86,
29.90)
[29.90,
29.94)
[29.94,
29.98)
[29.98,
30.02)
[30.02,
30.06)
[30.06,
30.10)
[30.10,
30.14]
频数
29
71
85
159
76
62
18
(1)试分别估计两个分厂生产的零件的优质品率;
(2)由以上统计数据填写下面的2×2列联表,并问能否在犯错误的概率不超过0.01的前提下认为“两个分厂生产的零件的质量有差异”?
甲厂
乙厂
合计
优质品
非优质品
合计
考点 独立性检验及其基本思想
题点 独立性检验的方法
解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为=72%;
乙厂抽查的产品中有'320件优质品,从而乙厂生产的零件的优质品率估计为=64%.
(2)2×2列联表如下:
甲厂
乙厂
合计
优质品
360
320
680
非优质品
140
180
320
合计
500
500
1 000
χ2=≈7.353>6.635,
所以在犯错误的概率不超过0.01的前提下认为“两个分厂生产的零件的质量有差异.”
三、探究与拓展
14.世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:

不喜欢西班牙队
喜欢西班牙队
合计
高于40岁
p
q
50
不高于40岁
15
35
50
合计
a
b
100
若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关.
附:χ2=.
P(χ2≥x0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 95%
解析 设“从所有人中任意抽取一人,取到喜欢西班牙队的人”为事件A,
由已知得P(A)==,解得q=25.
所以p=25,a=40,b=60.
χ2==≈4.167>3.841.
故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关.
15.某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为.
优秀
非优秀
合计
甲班
10
乙班
30
合计
110
(1)请完成上面的列联表;
(2)根据列联表的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”;
(3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到9号或10号的概率.
考点 
题点 
解 (1)由题意知,优秀的概率P=,故优秀人数为30,故2×2列联表如下:
优秀
非优秀
合计
甲班
10
50
60
乙班
20
30
50
合计
30
80
110
(2)根据列联表中的数据,得到
χ2=≈7.486<10.828.
因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.
(3)设“抽到9或10号”为事件A,先后两次抛掷一枚均匀的骰子,出现的点数为(x,y),所有的基本事件有(1,1),(1,2),(1, 3),…,(6,6),共36个.
事件A包含的基本事件有(3,6),(4,5),(5,4),(6,3),(5,5),(4,6),(6,4),共7个.
所以P(A)=,即抽到9号或10号的概率为.
3.2 回归分析
学习目标 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.3.了解非线性回归分析.
知识点一 线性回归模型
思考 某电脑公司有5名产品推销员,其工作年限与年推销金额数据如下表:
推销员编号
1
2
3
4
5
工作年限x/年
3
5
6
7
9
年推销金额y/万元
2
3
3
4
5
请问如何表示年推销金额y与工作年限x之间的相关关系?y关于x的线性回归方程是什么?
答案 画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归直线表示两变量之间的相关关系.
设所求的线性回归方程为=x+,
则===0.5,
=-=0.4.
所以年推销金额y关于工作年限x的线性回归方程为
=0.5x+0.4.
梳理 线性回归模型
(1)随机误差
具有线性相关关系的两个变量的取值x,y,y的值不能由x完全确定,可将x,y之间的关系表示为y=a+bx+ε,其中a+bx是确定性函数,ε称为随机误差.
(2)随机误差产生的主要原因
①所用的确定性函数不恰当引起的误差;
②忽略了某些因素的影响;
③存在观测误差.
(3)线性回归模型中a,b值的求法
y=a+bx+ε称为线性回归模型.
a,b的估计值为,,则

(4)回归直线和线性回归方程
直线=+x称为回归直线,此直线方程即为线性回归方程,称为回归截距,称为回归系数,称为回归值.
知识点二 样本相关系数r
具有相关关系的两个变量的线性回归方程为=x+.
思考1 变量与真实值y一样吗?
答案 不一定.
思考2 变量与真实值y之间误差大了好还是小了好?
答案 越小越好.
梳理 样本相关系数r及其性质
(1)r= .
(2)r具有以下性质:
①|r|≤1;
②|r|越接近于1,x,y的线性相关程度越强;
③|r|越接近于0,x,y的线性相关程度越弱.
知识点三 对相关系数r进行显著性检验的基本步骤
1.提出统计假设H0:变量x,y不具有线性相关关系;
2.如果以95%的把握作出判断,那么可以根据1-0.95=0.05与n-2在教材附录2中查出一个r的临界值r0.05(其中1-0.95=0.05称为检验水平);
3.计算样本相关系数r;
4.作出统计推断:若|r|>r0.05,则否定H0,表明有95%的把握认为x与y之间具有线性相关关系;若|r|≤r0.05,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为y与x之间有线性相关关系.
1.求线性回归方程前可以不进行相关性检验.( × )
2.在残差图中,纵坐标为残差,横坐标可以选为样本编号.( √ )
3.利用线性回归方程求出的值是准确值.( × )                   
类型一 求线性回归方程
例1 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
x
6
8
10
12
y
2
3
5
6
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.
考点 线性回归方程
题点 求线性回归方程
解 (1)散点图如图:
(2)iyi=6×2+8×3+10×5+12×6=158,
==9,==4,
=62+82+102+122=344,
===0.7,
=-=4-0.7×9=-2.3,
故线性回归方程为=0.7x-2.3.
(3)由(2)中线性回归方程可知,当x=9时,=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.
反思与感悟 (1)求线性回归方程的基本步骤
①画出散点图,从直观上分析数据间是否存在线性相关关系.
②计算:,,,iyi.
③代入公式求出=x+中参数,的值.
④写出线性回归方程并对实际问题作出估计.
(2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义.
跟踪训练1 某班5名学生的数学和物理成绩如下表:
学生编号
1
2
3
4
5
学科编号
A
B
C
D
E
数学成绩(x)
88
76
73
66
63
物理成绩(y)
78
65
71
64
61
(1)画出散点图;
(2)求物理成绩y对数学成绩x的线性回归方程;
(3)一名学生的数学成绩是96,试预测他的物理成绩.
考点 线性回归方程
题点 求线性回归方程
解 (1)散点图如图.
(2)=×(88+76+73+66+63)=73.2,
=×(78+65+71+64+61)=67.8.
iyi=88×78+76×65+73×71+66×64+63×61
=25 054.
=882+762+732+662+632=27 174.
所以==≈0.625.
=-≈67.8-0.625×73.2=22.05.
所以y对x的线性回归方程是=0.625x+22.05.
(3)当x=96时,=0.625×96+22.05≈82,即可以预测他的物理成绩约是82.
类型二 线性回归分析
例2 现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩(x)与入学后第一次考试的数学成绩(y)如下表:
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
请问:这10名学生的两次数学成绩是否具有线性关系?
考点 
题点 
解 =(120+108+…+99+108)=107.8,
=(84+64+…+57+71)=68.
=1202+1082+…+992+1082=116 584.
=842+642+…+572+712=47 384.
iyi=120×84+108×64+…+99×57+108×71
=73 796.
所以相关系数为
r=
≈0.751.
由检验水平0.05及n-2=8,
在附录2中查得r0.05=0.632.
因为0.751>0.632,
由此可看出这10名学生的两次数学成绩具有较强的线性相关关系.
反思与感悟 相关关系的两种判定方法及流程
(1)利用散点图判定的流程
(2)利用相关系数判定的流程
跟踪训练2 一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转的速度而变化,下表为抽样试验的结果:
转速x(转/秒)
16
14
12
8
每小时生产有缺点的零件数y(件)
11
9
8
5
对变量y与x进行线性相关性检验.
考点 
题点 
解 由题中数据可得=12.5,=8.25,
iyi=438,4 =412.5,=660,=291,
所以r=
=
=≈0.995.
由检验水平0.05及n-2=2,在教材附录表2中查得r0.05=0.950,因为r>r0.05,所以y与x具有线性相关关系.
类型三 非线性回归分析
例3 下表为收集到的一组数据:
x
21
23
25
27
29
32
35
y
7
11
21
24
66
115
325
(1)作出x与y的散点图,并猜测x与y之间的关系;
(2)建立x与y的关系;
(3)利用所得模型,估计当x=40时y的值.
考点 非线性回归分析
题点 非线性回归分析
解 (1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线y=的周围,其中c1,c2为待定的参数.
(2)对两边取对数把指数关系变为线性关系,令z=ln y,则有变换后的样本点应分布在直线z=bx+a,a=ln c1,b=c2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程,数据可以转化为
x
21
23
25
27
29
32
35
z
1.946
2.398
3.045
3.178
4.190
4.745
5.784
=(21+23+…+32+35)=27.429,
=(1.946+2.398+…+4.745+5.784)=3.612,
izi=733.741,=5 414.
求得线性回归方程为
=0.273x-3.876,
∴=e0.273x-3.876.
(3)当x=40时,=e0.273x-3.876≈1 146.
反思与感悟 非线性回归问题的处理方法
(1)指数型函数y=ebx+a
①函数y=ebx+a的图象
②处理方法:两边取对数,得ln y=ln ebx+a,即ln y=bx+a.令z=ln y,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出a,b.
(2)对数型函数y=bln x+a
①函数y=bln x+a的图象:
②处理方法:设x′=ln x,原方程可化为y=bx′+a,
再根据线性回归模型的方法求出a,b.
(3)y=bx2+a型
处理方法:设x′=x2,原方程可化为y=bx′+a,再根据线性回归模型的方法求出a,b.
跟踪训练3 已知某种食品每千克的生产成本y(元)与生产该食品的重量x(千克)有关,经生产统计得到以下数据:
x
1
2
3
5
10
y
10.15
5.52
4.08
2.85
2.11
x
20
30
50
100
200
y
1.62
1.41
1.30
1.21
1.15
通过以上数据,判断该食品的生产成本y(元)与生产的重量x(千克)的倒数之间是否具有线性相关关系.若有,求出y关于的回归方程,并估计一下生产该食品500千克时每千克的生产成本约是多少.(精确到0.01)
考点 非线性回归分析
题点 非线性回归分析
解 设u=,通过已知数据得到y与u的相应数据为
u=
1
0.5
0.33
0.2
0.1
y
10.15
5.52
4.08
2.85
2.11
u=
0.05
0.03
0.02
0.01
0.005
y
1.62
1.41
1.30
1.21
1.15
根据上述数据可求得相关系数
r=
≈0.999 8,
于是有很大的把握认为y与具有线性相关关系.
而=≈8.973,
=-·≈1.126,
于是y与的回归方程为=+1.126.
当x=500时,=+1.126≈1.14.
所以估计生产该食品500千克时每千克的生产成本约是1.14元.

1.设有一个线性回归方程=2-1.5x,当变量x增加1个单位时,y平均________个单位.
考点 线性回归分析
题点 线性回归方程的应用
答案 减少1.5
解析 由回归方程中两个变量之间的关系可以得到.
2.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是________.(填序号)
考点 回归分析
题点 散点图的应用
答案 ①③
解析 由图易知①③两个图中样本点在一条直线附近,因此适合用线性回归模型.
3.某厂节能降耗技术改造后,在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如表:
x
3
4
5
6
y
2.5
t
4
4.5
根据上表提供的数据,求出y关于x的线性回归方程为=0.7x+0.35,则上表中的t=________.
考点 线性回归分析
题点 线性回归方程的应用
答案 3
4.下表是x和y之间的一组数据,则y关于x的回归直线必过点________.
x
1
2
3
4
y
1
3
5
7
考点 线性回归方程
题点 样本点中心的应用
答案 (2.5,4)
解析 回归直线必过样本点中心(,),即(2.5,4).
5.已知x,y之间的一组数据如下表:
x
0
1
2
3
y
1
3
5
7
(1)分别计算:,,x1y1+x2y2+x3y3+x4y4,x+x+x+x;
(2)已知变量x与y线性相关,求出回归方程.
考点 线性回归方程
题点 求线性回归方程
解 (1)==1.5,==4,
x1y1+x2y2+x3y3+x4y4=0×1+1×3+2×5+3×7=34,
x+x+x+x=02+12+22+32=14.
(2)==2,
=- =4-2×1.5=1,
故=2x+1.
回归分析的步骤
(1)确定研究对象,明确哪个变量是自变量,哪个变量是因变量;
(2)画出确定好的因变量关于自变量的散点图,观察它们之间的关系(如是否存在线性关系等);
(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程=x+);
(4)按一定规则估计回归方程中的参数.
一、填空题
1.根据如下样本数据:
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到的回归方程为=x+,则,与0的大小关系是________.
考点 线性回归分析
题点 线性回归方程的应用
答案 >0,<0
解析 作出散点图如下:
观察图象可知,回归直线=x+的斜率<0,
当x=0时,=>0.故>0,<0.
2.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:
x(月份)
1
2
3
4
5
y(万盒)
5
5
6
6
8
若x,y线性相关,线性回归方程为=0.7x+,估计该制药厂6月份生产甲胶囊产量约为________万盒.
考点 线性回归方程
题点 样本点中心的应用
答案 8.1
解析 回归直线一定过样本点中心.由已知数据,可得=3,=6,代入回归方程,可得=-0.7=3.9,即回归方程为=0.7x+3.9.把x=6代入,可得=8.1,所以6月份的产量约为8.1万盒.
3.某化工厂为预测某产品的回收率y,而要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得i=52,i=228,=478,iyi=1 849,则y与x的线性回归方程是________________.
考点 线性回归方程
题点 求线性回归方程
答案 =2.62x+11.47
解析 由题中数据得=6.5,=28.5,
∴= ==≈2.62,
=-≈28.5-2.62×6.5=11.47,
∴y与x的线性回归方程是=2.62x+11.47.
4.已知x,y的取值如下表:
x
0
1
3
4
y
2.2
4.3
4.8
6.7
从所得的散点图分析,y与x线性相关,且=0.95x+,则=________.
考点 
题点 
答案 2.6
解析 ∵=2,=4.5.
又回归直线恒过定点(,),代入得=2.6.
5.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为=0.849x-85.712,则身高172 cm的女大学生,由线性回归方程可以估计其体重为________ kg.
考点 
题点 
答案 60.316
解析 =0.849×172-85.712=60.316.
6.有下列关系:
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中的同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系.
其中有相关关系的是________.(填序号)
考点 
题点 
答案 ②③
解析 由相关关系定义分析.
7.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得线性回归方程=x+中的为9.4,据此模型估计广告费用为6万元时的销售额为______________________________________________________万元.
考点 
题点 
答案 65.5
解析 样本点中心是(3.5,42),
则=-=42-9.4×3.5=9.1,
所以线性回归方程是=9.4x+9.1,
把x=6代入,得=65.5.
8.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为________.
考点 线性相关系数
题点 线性相关系数的概念及计算
答案 1
解析 根据样本相关系数的定义可知,当所有样本点都在一条直线上且直线斜率大于零时,相关系数为1.
9.对于回归分析,有下列叙述:
①在回归分析中,变量间的关系若是非确定性关系,则因变量不能由自变量唯一确定;
②线性相关系数可以是正的或是负的;
③回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关;
④样本相关系数r∈(-∞,+∞).
其说法正确的序号是________.
考点 
题点 
答案 ①②③
解析 由回归模型及其性质易知①②③是正确的.相关系数的取值范围应为|r|≤1,所以④是错误的.
10.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围.令z=ln y,求得线性回归方程为=0.25x-2.58,则该模型的回归方程为________.
考点 非线性回归分析
题点 非线性回归分析
答案 y=e0.25x-2.58
解析 因为=0.25x-2.58,z=ln y,
所以=e0.25x-2.58.
11.在对两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验.对这两个回归方程进行检验时,与实际数据(个数)的对比结果如下:
与实际相符数据个数
与实际不符数据个数
合计
甲回归方程
32
8
40
乙回归方程
40
20
60
合计
72
28
100
则从表中数据分析,________回归方程更好.(即与实际数据更贴近)
考点 两个模型拟合效果的比较
题点 两个模型拟合效果的比较
答案 甲
解析 可以根据表中数据分析,两个回归方程对数据预测的正确率进行判断,甲回归方程的数据准确率为=,而乙回归方程的数据准确率为=.显然甲的准确率高些,因此甲回归方程好些.
二、解答题
12.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程=x+,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少时间?
(注:=,=-)
考点 线性回归方程
题点 求线性回归方程
解 (1)散点图如图.
(2)由表中数据得iyi=52.5,
=3.5,=3.5,=54,
所以==0.7,
所以=- =1.05.
所以=0.7x+1.05.
回归直线如图中所示.
(3)将x=10代入线性回归方程,
得=0.7×10+1.05=8.05,
所以预测加工10个零件需要8.05小时.
13.为了研究某种细菌随时间x的变化繁殖个数y的变化情况,收集数据如下:
时间x(天)
1
2
3
4
5
6
繁殖个数y
6
12
25
49
95
190
(1)用时间作自变量,繁殖个数作因变量作出这些数据的散点图;
(2)求y与x之间的回归方程.
考点 非线性回归分析
题点 非线性回归分析
解 (1)散点图如图所示:
(2)由散点图看出样本点分布在一条指数曲线y=c1e的周围,于是令z=ln y,则
x
1
2
3
4
5
6
z
1.79
2.48
3.22
3.89
4.55
5.25
所以=0.69x+1.115,则有=e0.69x+1.115.
三、探究与拓展
14.已知x,y的取值如下表:
x
2
3
5
6
y
2.7
4.3
6.1
6.9
从散点图分析y与x具有线性相关关系,且回归方程为=1.02x+,则=________.
考点 
题点 
答案 0.92
解析 由题意得=4,=5,又(,)在直线=1.02x+上,所以=5-4×1.02=0.92.
15.在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为
1
2
3
4
5
价格x
1.4
1.6
1.8
2
2.2
需求量y
12
10
7
5
3
已知iyi=62,=16.6.
(1)画出散点图;
(2)求出y对x的线性回归方程;
(3)如果价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t)
考点 
题点 
解 (1)散点图如图所示:
(2)因为=×9=1.8,=×37=7.4,
iyi=62,=16.6,
所以===-11.5,
=-=7.4+11.5×1.8=28.1,
故y对x的线性回归方程为=-11.5x+28.1.
(3)=28.1-11.5×1.9=6.25(t).
故价格定为1.9万元,预测需求量大约为6.25 t.
章末复习
学习目标 1.理解独立性检验的基本思想及实施步骤.2.会求线性回归方程,并用回归直线进行预测.
1.2×2列联表
2×2列联表如表所示:
B

合计
A
a
b
a+b

c
d
c+d
合计
a+c
b+d
n
其中n=a+b+c+d为样本容量.
2.最小二乘法
对于一组数据(xi,yi),i=1,2,…,n,如果它们线性相关,则线性回归方程为=x+,其中==,=-.
3.独立性检验
常用统计量
χ2=来检验两个变量是否有相关关系.                   
类型一 独立性检验
例1 为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:
喜爱打篮球
不喜爱打篮球
合计
男生
6
女生
10
合计
48
已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为.
(1)请将上面的2×2列联表补充完整;(不用写计算过程)
(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由;
(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的概率分布与均值.
考点 独立性检验及其基本思想
题点 独立性与均值的综合应用
解 (1)列联表补充如下:
喜爱打篮球
不喜爱打篮球
合计
男生
22
6
28
女生
10
10
20
合计
32
16
48
(2)由χ2=≈4.286.
因为4.286>3.841,所以能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关.
(3)喜爱打篮球的女生人数X的可能取值为0,1,2,其概率分别为
P(X=0)==,
P(X=1)==,
P(X=2)==,
故X的概率分布为
X
0
1
2
P



X的均值E(X)=0++=1.
反思与感悟 独立性检验问题的求解策略
通过公式χ2=,
先计算出χ2,再与临界值表作比较,最后得出结论.
跟踪训练1 某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).
(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯;
(2)根据以上数据完成如表所示的2×2列联表;
主食蔬菜
主食肉类
合计
50岁以下
50岁以上
合计
(3)在犯错误的概率不超过0.01的前提下,是否能认为“其亲属的饮食习惯与年龄有关”?
考点 独立性检验及其基本思想
题点 分类变量与统计、概率的综合应用
解 (1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉类为主.
(2)2×2列联表如表所示:
主食蔬菜
主食肉类
合计
50岁以下
4
8
12
50岁以上
16
2
18
合计
20
10
30
(3)χ2==10>6.635,
故在犯错误的概率不超过0.01的前提下认为“其亲属的饮食习惯与年龄有关”.
类型二 线性回归分析
例2 某城市理论预测2010年到2014年人口总数与年份的关系如表所示:
年份201x(年)
0
1
2
3
4
人口数y(十万)
5
7
8
11
19
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,求出y关于x的线性回归方程=x+;
(3)据此估计2019年该城市人口总数.
考点 回归分析思想的应用
题点 回归分析思想的应用
解 (1)散点图如图:
(2)因为==2,
==10,
iyi=0×5+1×7+2×8+3×11+4×19=132,
=02+12+22+32+42=30,
所以==3.2,
=- =3.6.
所以线性回归方程为=3.2x+3.6.
(3)令x=9,则=3.2×9+3.6=32.4,
故估计2019年该城市人口总数为32.4(十万).
反思与感悟 解决回归分析问题的一般步骤
(1)画散点图:根据已知数据画出散点图.
(2)判断变量的相关性并求回归方程:通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程.
(3)实际应用:依据求得的回归方程解决实际问题.
跟踪训练2 在一段时间内,某种商品的价格x(元)和需求量y(件)之间的一组数据为:
x(元)
14
16
18
20
22
y(件)
12
10
7
5
3
且知x与y具有线性相关关系,求出y关于x的线性回归方程.
考点 回归分析思想的应用
题点 回归分析思想的应用
解 =×(14+16+18+20+22)=18,
=×(12+10+7+5+3)=7.4,
=142+162+182+202+222=1 660,
iyi=14×12+16×10+18×7+20×5+22×3=620,
所以===-1.15,
所以=7.4+1.15×18=28.1,
所以y对x的线性回归方程为=-1.15x+28.1.
1.下面是一个2×2列联表:
y1
y2
合计
x1
a
21
70
x2
5
c
30
合计
b
d
100
则b-d=________.
考点 
题点 
答案 8
解析 ∵a=70-21=49,c=30-5=25,
∴b=49+5=54,d=21+25=46,
∴b-d=8.
2.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时由高尔顿提出的,他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高y与父亲的身高x的线性回归方程=x+中,的取值范围是________.
考点 线性回归分析
题点 线性回归方程的应用
答案 (0,1)
解析 子代平均身高向中心回归,应为正的真分数.
3.假如由数据:(1,2),(3,4),(2,2),(4,4),(5,6),(3,3.6)可以得出线性回归方程=+x,则经过的定点是以上点中的________.
考点 
题点 
答案 (3,3.6)
解析 易知,线性回归方程=+x经过定点(,),根据计算可知这几个点中满足条件的是(3,3.6).
4.考古学家通过始祖鸟化石标本发现:其股骨长度x(cm)与肱骨长度y(cm)的线性回归方程为=1.197x-3.660,由此估计,当股骨长度为50 cm时,肱骨长度的估计值为________cm.
考点 
题点 
答案 56.19
解析 根据线性回归方程=1.197x-3.660,将x=50代入,得y=56.19,则肱骨长度的估计值为56.19 cm.
5.对于线性回归方程=x+,当x=3时,对应的y的估计值是17,当x=8时,对应的y的估计值是22,那么,该线性回归方程是________,根据线性回归方程判断当x=________时,y的估计值是38.
考点 线性回归分析
题点 线性回归方程的应用
答案 =x+14 24
解析 首先把两组值代入线性回归方程,得
所以线性回归方程是=x+14.
令x+14=38,可得x=24,即当x=24时,y的估计值是38.
1.独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法.利用假设的思想方法,计算出某一个χ2统计量的值来判断更精确些.
2.建立回归模型的基本步骤
(1)确定研究对象,明确哪个变量是自变量,哪个变量是因变量;
(2)画出散点图,观察它们之间的关系;
(3)由经验确定回归方程的类型;
(4)按照一定的规则估计回归方程中的参数.
一、填空题
1.如果χ2=8.654,可以认为“x与y无关”的可信度为________.
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 0.5%
解析 ∵8.654>7.879,∴x与y无关的可信度为0.5%.
2.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是____________模型.
x
4
5
6
7
8
9
10
y
14
18
19
20
23
25
28
考点 回归分析
题点 建立回归模型的基本步骤
答案 线性函数
解析 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.
3.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份x
1
2
3
4
用水量y
4.5
4
3
2.5
由散点图(图略)可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是=-0.7x+,则=________.
考点 线性回归方程
题点 样本点中心的应用
答案 5.25
解析 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得=5.25.
4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
x
1.99
3
4
5.1
6.12
y
1.5
4.04
7.5
12
18.01
对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是________.(填序号)
①y=2x-2;②y=x;③y=log2x;④y=(x2-1).
考点 
题点 
答案 ④
解析 可以代入检验,当x取相应的值时,所求y与已知y相差最小的便是拟合程度最高的.
5.某考察团对全国10大城市进行职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)统计调查,y与x具有线性相关关系,回归方程为=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为________.
考点 线性回归分析
题点 线性回归方程的应用
答案 83%
解析 将y=7.675代入回归方程,可计算得x≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83,即约为83%.
6.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析研究方法预测他孙子的身高为________ cm.
考点 
题点 
答案 185
解析 设父亲身高为x cm,儿子身高为y cm,由题意得出下表:
x
173
170
176
y
170
176
182
易得=173,=176,由公式计算得=1,=-=176-1×173=3,则=x+3,当x=182时,=185.故预测该老师孙子的身高为185 cm.
7.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是________.(填序号)
①x与y正相关,x与z负相关;
②x与y正相关,x与z正相关;
③x与y负相关,x与z负相关;
④x与y负相关,x与z正相关.
考点 线性回归分析
题点 线性回归方程的应用
答案 ③
解析 因为y=-0.1x+1,-0.1<0,所以x与y负相关.又y与z正相关,故可设z=ay+b(a>0),所以z=-0.1ax+a+b,-0.1a<0,所以x与z负相关.
8.为了探讨学生的物理成绩y与数学成绩x之间的关系,从某批学生中随机抽取10名学生的成绩(xi,yi)(i=1,2,3,…,10),并已计算出xi=758,x=58 732,yi=774,xiyi=59 686,则物理成绩y关于数学成绩x的线性回归方程为____________.
考点 线性回归分析
题点 线性回归方程的应用
答案 =0.797 1x+16.98
解析 由公式,得≈0.797 1,=16.98,
故物理成绩y关于数学成绩x的线性回归方程为
=0.797 1x+16.98.
9.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场以降低生产成本,某白酒酿造企业市场部对该企业9月份的产品销量(千箱)与单位成本(元)的资料进行线性回归分析,结果如下:=,=71,=79,iyi=1 481,=≈-1.818 2,=71-(-1.818 2)×≈77.36,则销量每增加1千箱,单位成本下降________元.
考点 线性回归分析
题点 线性回归方程的应用
答案 1.818 2
解析 由已知得=-1.818 2x+77.36,销售量每增加1千箱,则单位成本下降1.818 2元.
10.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:
喜爱打篮球
不喜爱打篮球
合计
男生
20
5
25
女生
10
15
25
合计
30
20
50
则在犯错误的概率不超过________的前提下认为喜爱打篮球与性别有关.
附:χ2=.
P(χ2≥x0)
0.10
0.05
0.025
0.010
0.005
0.001
x0
2.706
3.841
5.024
6.635
7.879
10.828
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 0.005
解析 由列联表数据可求得
χ2=≈8.33>7.879,所以在犯错误的概率不超过0.005的前提下认为“喜爱打篮球与性别有关”.
11.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①在犯错误的概率不超过5%的前提下认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,则他在一年中有95%的可能性得感冒;
③这种血清预防感冒的有效率为95%;
④这种血清预防感冒的有效率为5%.
考点 独立性检验及其基本思想
题点 独立性检验的方法
答案 ①
解析 查对临界值表知P(χ2≥3.841)≈0.05,故有95%的把握认为“这种血清能起到预防感冒的作用”.95%仅是指“血清与预防感冒有关”的可信程度,但也有“在100个使用血清的人中一个患感冒的人也没有”的可能.故答案为①.
二、解答题
12.某城区为研究城镇居民家庭月人均生活费支出和月人均收入的相关关系,随机抽取10户进行调查,其结果如下:
月人均收入x(元)
300
390
420
520
570
月人均生活费y(元)
255
324
335
360
450
月人均收入x(元)
700
760
800
850
1 080
月人均生活费y(元)
520
580
600
630
750
(1)作出散点图;
(2)求出线性回归方程;
(3)试预测月人均收入为1 100元和月人均收入为1 200元的两个家庭的月人均生活费.
考点 
题点 
解 (1)作出散点图如图所示,由图可知月人均生活费与月人均收入之间具有较强的线性相关关系.
(2)通过计算可知=639,=480.4,
x=4 610 300,xiyi=3 417 560,
∴ =≈0.659 9, =-=58.723 9,
∴线性回归方程为 =0.659 9x+58.723 9.
(3)由以上分析可知,我们可以利用线性回归方程
 =0.659 9x+58.723 9来计算月人均生活费的预测值.
将x=1 100代入,得y≈784.61,
将x=1 200代入,得y≈850.60.
故预测月人均收入分别为1 100元和1 200元的两个家庭的月人均生活费分别为784.61元和850.60元.
13.在对人们休闲方式的一次调查中,仅就看电视与运动这两种休闲方式比较喜欢哪一种进行了调查.调查结果:接受调查总人数110人,其中男、女各55人;受调查者中,女性有30人比较喜欢看电视,男性有35人比较喜欢运动.
(1)请根据题目所提供的调查结果填写下列2×2列联表;
看电视
运动
合计


合计
(2)能否在犯错误的概率不超过0.05的前提下认为“性别与休闲方式有关系”?
附:χ2=(其中n=a+b+c+d为样本容量).
P(χ2≥x0)
0.10
0.05
0.025
0.010
x0
2.706
3.841
5.024
6.635
考点 独立性检验及其基本思想
题点 独立性检验的方法
解 (1)根据题目所提供的调查结果,可得下列2×2列联表:
看电视
运动
合计

30
25
55

20
35
55
合计
50
60
110
(2)根据列联表中的数据,可计算
χ2=≈3.667,
因为χ2≈3.667<3.841,所以不能在犯错误的概率不超过0.05的前提下认为“性别与休闲方式有关系”.
三、探究与拓展
14.对某台机器购置后的运营年限x(x=1,2,3,…)与当年利润y的统计分析知具备线性相关关系,线性回归方程为=10.47-1.3x,估计该台机器使用________年最合算.
考点 
题点 
答案 8
解析 只要预计利润不为负数,使用该机器就算合算,即≥0,所以10.47-1.3x≥0,解得x≤8.05,所以该台机器使用8年最合算.
15.已知某地每单位面积菜地年平均使用氮肥量x(kg)与每单位面积蔬菜年平均产量y(t)之间的关系有如下数据:
年份
1985
1986
1987
1988
1989
1990
1991
1992
x(kg)
70
74
80
78
85
92
90
95
y(t)
5.1
6.0
6.8
7.8
9.0
10.2
10.0
12.0
年份
1993
1994
1995
1996
1997
1998
1999
x(kg)
92
108
115
123
130
138
145
y(t)
11.5
11.0
11.8
12.2
12.5
12.8
13.0
(1)求x与y之间的相关系数,并检验是否线性相关;
(2)若线性相关,求蔬菜产量y与使用氮肥量x之间的线性回归方程,并估计每单位面积菜地施肥150 kg时,每单位面积蔬菜的年平均产量.
(已知数据:=101,≈10.113 3,=161 125,
=1 628.55,iyi=16 076.8)
解 (1)由已知数据,得每单位面积蔬菜产量与使用氮肥量的相关系数
r==

≈0.863 2>r0.05=0.514.
这说明每单位面积蔬菜产量与使用氮肥量之间存在着很强的线性相关关系.
(2)设所求的线性回归方程为=x+,
则=≈0.093 1,
=-=0.710 2,
则=0.093 1x+0.710 2.
当每单位面积菜地施肥150 kg时,每单位面积蔬菜的年平均产量=0.093 1×150+0.710 2=14.675 2(t).