沪教版(2020)数学选择性必修第二册 第8章 成对数据的统计分析 本章测试(含解析)

文档属性

名称 沪教版(2020)数学选择性必修第二册 第8章 成对数据的统计分析 本章测试(含解析)
格式 docx
文件大小 162.2KB
资源类型 教案
版本资源 上教版(2020)
科目 数学
更新时间 2022-11-15 15:53:35

图片预览

文档简介

【学生版】
本章测试《第8 章 成对数据的统计分析》
一、填空题(共10小题,每小题4分,满分40分)
1、在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为
2、已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为y=0.01x+0.5,则加工600个零件大约需要的时间为________.
3、考古学家通过始祖鸟化石标本发现:其股骨长度x(cm)与肱骨长度y(cm)的线性回归方程为y=1.197x-3.660,由此估计,当股骨长度为50 cm时,肱骨长度的估计值为________cm.
4、已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线的回归方程为________.
5、已知x,y取值如下表:
x 0 1 4 5 6 8
y 1.3 1.8 5.6 6.1 7.4 9.3
从所得的散点图分析可知:y与x线性相关,且y=0.95x+a,则a=________.
6、下列有关样本相关系数的说法不正确的是________.
①相关系数用来衡量变量x与y之间的线性相关程度
②|r|≤1,且|r|越接近于1,相关程度越大
③|r|≤1,且|r|越接近0,相关程度越小
④|r|≥1,且|r|越接近1,相关程度越小
7、下列四个图各反映了两个变量的某种关系,其中可以看作具有较强线性相关关系的是
8、为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算=8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为________.
P(≥k0) 0.100 0.050 0.025 0.010 0.001
k0 2.706 3.841 5.024 6.635 10.828
9、为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:
理科 文科 合计
男 13 10 23
女 7 20 27
合计 20 30 50
已知P(≥3.841)≈0.05,P(≥5.024)≈0.025.
根据表中数据,得到的观测值k=≈4.844,则认为选修文科与性别有关系出错的可能性约为________.
10、针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有 人
临界值表:
α 0.050 0.010
xα 3.841 6.635
附:
二、选择题(共4小题 每小题4分,满分16分)
11、对于变量x与y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做( )
A.函数关系 B.线性关系 C.相关关系 D.回归关系
12、某医疗研究所为了检验某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用过血清的人一年中的感冒记录进行比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)≈0.05.对此,有以下四个结论,正确的是( )
A.依据小概率值α=0.05的独立性检验,可以认为“这种血清能起到预防感冒的作用”
B.若某人未使用该血清,那么他在一年中有95%的可能性得感冒
C.这种血清预防感冒的有效率为95%
D.这种血清预防感冒的有效率为5%
13、某工厂的每月各项开支与毛利润(单位:万元)之间有如下关系,与的线性回归方程,则( )
2 4 5 6 8
30 40 60 50 70
A.17.5 B.17 C.15 D.15.5
14、对具有线性相关关系的变量,有一组观测数据,其回归直线方程是,且,,则实数的值为( )
A. B. C. D.
三、解答题(共4小题,满分44分)
15.(本题8分)
近年空气质量逐步恶化,雾霾天气现象出现增多,大气污染危害加重,大气污染可引起心悸,呼吸困难等心肺疾病,为了解某市心肺疾病是否与性别有关,在某医院随机对入院50人进行了问卷调查,得到了如下的列联表.
患心肺疾病 不患心肺疾病 合计
男 20 5 25
女 10 15 25
合计 30 20 50
(1)用分层抽样的方法在患心肺疾病的人群中抽6人,其中男性抽多少人?
(2)为了研究心肺疾病是否与性别有关,请计算出统计量,并回答有多大把握认为心肺疾病与性别有关?
P(≥k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
参考公式:,其中n=a+b+c+d.
16.(本题10分)
从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,iyi=184,=720.
(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:线性回归方程y=bx+a中,
=,=-,其中,为样本平均值,
线性回归方程也可写为=x+.
17.(本题满分12分).
某高校共有学生15000人,其中男生10500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.
P(K2≥k0) 0.10 0.05 0.010 0.005
k0 2.706 3.841 6.635 7.879
附:χ2=
18.(本题满分14分、第1小题满分4分、第2小题满分4分,第3小题满分6分).
已知某校5名学生的数学成绩和物理成绩如下表:
学生的编号i 1 2 3 4 5
数学成绩xi 80 75 70 65 60
物理成绩yi 70 66 68 64 62
(1)假设在对这5名学生成绩进行统计时,把这5名学生的物理成绩搞乱了,数学成绩没出现问题,问:恰有2名学生的物理成绩是自己的实际分数的概率是多少?
(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x表示数学成绩,用y表示物理成绩,求y关于x的经验回归方程;
(3)利用离差分析经验回归方程的拟合效果,若离差和在(-0.1,0.1)范围内,则称经验回归方程为“优拟方程”,问:该经验回归方程是否为“优拟方程”?
参考数据和公式:=x+,其中=,=-;iyi=23 190,=24 750,
离差和公式:(yi-i).
【教师版】
本章测试《第8 章 成对数据的统计分析》
一、填空题(共10小题,每小题4分,满分40分)
1、在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为
解析:根据相关系数的定义可知,当所有样本点都在直线上时,相关系数为1;
答案:1;
2、已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为y=0.01x+0.5,则加工600个零件大约需要的时间为________.
解析:将600代入线性回归方程=0.01x+0.5中得需要的时间为6.5 h;
答案:6.5 h;
3、考古学家通过始祖鸟化石标本发现:其股骨长度x(cm)与肱骨长度y(cm)的线性回归方程为y=1.197x-3.660,由此估计,当股骨长度为50 cm时,肱骨长度的估计值为________cm.
解析:根据回归方程=1.197x-3.660,将x=50代入,得y=56.19,则肱骨长度的估计值为56.19 cm;
答案:56.19;
4、已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线的回归方程为________.
解析:设回归直线方程为y=1.23x+a,由题意得:5=1.23×4+a,得a=0.08,故回归方程为y=1.23x+0.08.
答案:y=1.23x+0.08
5、已知x,y取值如下表:
x 0 1 4 5 6 8
y 1.3 1.8 5.6 6.1 7.4 9.3
从所得的散点图分析可知:y与x线性相关,且y=0.95x+a,则a=________.
解析 ∵==4,==5.25,
又y=0.95x+a过(,),所以,5.25=0.95×4+a,得a=1.45.
答案:1.45
【注意】回归直线方程 y=x+必过样本点中心(,).利用这一结论,可以快速求出回归方程中的参数;
6、下列有关样本相关系数的说法不正确的是________.
①相关系数用来衡量变量x与y之间的线性相关程度
②|r|≤1,且|r|越接近于1,相关程度越大
③|r|≤1,且|r|越接近0,相关程度越小
④|r|≥1,且|r|越接近1,相关程度越小
答案:④
7、下列四个图各反映了两个变量的某种关系,其中可以看作具有较强线性相关关系的是
解析:对于两个变量的散点图,若样本点成带状分布,则两个变量具有线性相关关系,所以两个变量具有线性相关关系的图是①和④;
答案:①④;
8、为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算=8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为________.
P(≥k0) 0.100 0.050 0.025 0.010 0.001
k0 2.706 3.841 5.024 6.635 10.828
解析 因为=8.01>6.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”.
答案 99%
9、为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:
理科 文科 合计
男 13 10 23
女 7 20 27
合计 20 30 50
已知P(≥3.841)≈0.05,P(≥5.024)≈0.025.
根据表中数据,得到的观测值k=≈4.844,则认为选修文科与性别有关系出错的可能性约为________.
解析 由的观测值k≈4.844>3.841,故认为选修文科与性别有关系出错的可能性约为5%.
答案:5%
10、针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有 人
临界值表:
α 0.050 0.010
xα 3.841 6.635
附:
解析:设男生的人数为6n(n∈N*),
根据题意列出2×2列联表如下表所示:
男生 女生 合计
喜欢抖音 5n 4n 9n
不喜欢抖音 n 2n 3n
合计 6n 6n 12n
则,
由于有95%的把握认为是否喜欢抖音和性别有关,则3.841≤χ2<6.635,
即3.841≤<6.635,得8.642 3≤n<14.929,
因为n∈N*,则n的可能取值有9,10,11,12,13,
因此,调查人数中男生人数的可能值为54,60,66,72,78
二、选择题(共4小题 每小题4分,满分16分)
11、对于变量x与y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做( )
A.函数关系 B.线性关系 C.相关关系 D.回归关系
答案:C;
12、某医疗研究所为了检验某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用过血清的人一年中的感冒记录进行比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)≈0.05.对此,有以下四个结论,正确的是( )
A.依据小概率值α=0.05的独立性检验,可以认为“这种血清能起到预防感冒的作用”
B.若某人未使用该血清,那么他在一年中有95%的可能性得感冒
C.这种血清预防感冒的有效率为95%
D.这种血清预防感冒的有效率为5%
答案:A
解析:由题意,因为χ2≈3.918,P(χ2≥3.841)≈0.05,所以依据小概率值α=0.05的独立性检验,可以认为“这种血清能起到预防感冒的作用”;
13、某工厂的每月各项开支与毛利润(单位:万元)之间有如下关系,与的线性回归方程,则( )
2 4 5 6 8
30 40 60 50 70
A.17.5 B.17 C.15 D.15.5
答案:A
解析:由题意,根据表中的数据,可得,

即样本中心为,代入与的线性回归方程为,解得.故选:A.
14、对具有线性相关关系的变量,有一组观测数据,其回归直线方程是,且,,则实数的值为( )
A. B. C. D.
【答案】D
【解析】根据题意知,,,
所以,,,回归直线过样本中心点,
所以,,即实数.故选:D.
三、解答题(共4小题,满分44分)
15.(本题8分)
近年空气质量逐步恶化,雾霾天气现象出现增多,大气污染危害加重,大气污染可引起心悸,呼吸困难等心肺疾病,为了解某市心肺疾病是否与性别有关,在某医院随机对入院50人进行了问卷调查,得到了如下的列联表.
患心肺疾病 不患心肺疾病 合计
男 20 5 25
女 10 15 25
合计 30 20 50
(1)用分层抽样的方法在患心肺疾病的人群中抽6人,其中男性抽多少人?
(2)为了研究心肺疾病是否与性别有关,请计算出统计量,并回答有多大把握认为心肺疾病与性别有关?
P(≥k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
参考公式:,其中n=a+b+c+d.
解析 (1)在患心肺疾病人群中抽6人,则抽取比例为=,
所以,男性应该抽取20×=4人.
(2)因为,≈8.333,且P(≥7.879)=0.005=0.5%,所以有99.5%的把握认为患心肺疾病与性别有关系;
16.(本题10分)
从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,iyi=184,=720.
(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:线性回归方程y=bx+a中,
=,=-,其中,为样本平均值,
线性回归方程也可写为=x+.
解析 (1)由题意知n=10,=i==8,
=i==2,
又-n2=720-10×82=80,
iyi-n =184-10×8×2=24,
由此得b===0.3,
a=-b=2-0.3×8=-0.4,
故所求回归方程为=0.3x-0.4.
(2)由于变量y的值随x的值增加而增加(b=0.3>0),故x与y之间是正相关.
(3)将x=7代入回归方程可以预测该家庭的月储蓄约为y=0.3×7-0.4=1.7千元.
17.(本题满分12分).
某高校共有学生15000人,其中男生10500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.
P(K2≥k0) 0.10 0.05 0.010 0.005
k0 2.706 3.841 6.635 7.879
附:χ2=
【解析】(1)300×=90,所以应收集90位女生的样本数据.
(2)由频率分布直方图得每周平均体育运动超过4小时的频率为1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.
(3)由(2)知300位学生中有300×0.75=225(位)的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210个是关于男生的,90个是关于女生的,所以每周平均体育运动时间与性别列联表如下:
男生 女生 总计
每周平均体育运动时间不超过4小时 45 30 75
每周平均体育运动时间超过4小时 165 60 225
总计 210 90 300
结合列联表可算得χ2==≈4.762>3.841.
所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”;
18.(本题满分14分、第1小题满分4分、第2小题满分4分,第3小题满分6分).
已知某校5名学生的数学成绩和物理成绩如下表:
学生的编号i 1 2 3 4 5
数学成绩xi 80 75 70 65 60
物理成绩yi 70 66 68 64 62
(1)假设在对这5名学生成绩进行统计时,把这5名学生的物理成绩搞乱了,数学成绩没出现问题,问:恰有2名学生的物理成绩是自己的实际分数的概率是多少?
(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x表示数学成绩,用y表示物理成绩,求y关于x的经验回归方程;
(3)利用离差分析经验回归方程的拟合效果,若离差和在(-0.1,0.1)范围内,则称经验回归方程为“优拟方程”,问:该经验回归方程是否为“优拟方程”?
参考数据和公式:=x+,其中
=,=-;
iyi=23 190,=24 750,
离差和公式:(yi-i).
解析:(1)记事件A为“恰有2名学生的物理成绩是自己的实际成绩”,则P(A)==.
(2)因为==70,==66,
==0.36,
=66-0.36×70=40.8.
所以经验回归方程为=0.36x+40.8.
(3)x1=80,1=69.6.
x2=75,2=67.8.
x3=70,3=66.
x4=65,4=64.2.
x5=60,5=62.4.
(yi-i)=(70-69.6)+(66-67.8)+(68-66)+(64-64.2)+(62-62.4)
=0.4+(-1.8)+2-0.2-0.4=0.
因为0∈(-0.1,0.1),
所以该方程为“优拟方程”.
同课章节目录