章末检测(八) 成对数据的统计分析
(时间:120分钟 满分:150分)
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列两个变量之间的关系是相关关系的为( )
A.正方形的面积与边长的关系
B.学生的成绩和体重
C.路上酒后驾驶的人数和交通事故发生的多少
D.水的体积和重量
2.已知相关变量x和y的散点图如图所示,若用y=b1·ln (k1x)与y=kx2+b2拟合时的相关系数分别为r1,r2,则比较r1,r2的大小结果为( )
A.r1>r2 B.r1=r2
C.r1<r2 D.不确定
3.为了评价某个电视栏目的改革效果,某机构在改革前后分别从居民点抽取了100位居民进行调查,经过计算χ2≈0.99,根据这一数据分析,下列说法正确的是( )
A.有99%的人认为该电视栏目优秀
B.有99%的人认为该电视栏目是否优秀与改革有关系
C.在犯错误的概率不超过1%的前提下,认为该电视栏目是否优秀与改革有关系
D.没有理由认为该电视栏目是否优秀与改革有关系
4.下表为某班5位同学身高x(单位:cm)与体重y(单位:kg)的数据:
身高x 169 172 166 177 161
体重y 75 80 70 85 65
若两个变量之间的经验回归方程为=1.3x+m,则m=( )
A.-140 B.140
C.144.7 D.-144.7
5.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,经计算得χ2=≈15.968,因为χ2>10.828,则断定中年人秃发与心脏病有关系.那么这种判断出错的可能性为( )
A.0.01 B.0.05
C.0.025 D.0.001
6.用模型y=aekx拟合一组数据(xi,yi)(i=1,2,3,…,7),其中x1+x2+…+x7=14,设z=ln y,得变换后的经验回归方程为=x+1,则y1·y2·…·y7=( )
A.e35 B.e21
C.35 D.21
7.某学校校医研究温差x(℃)与本校当天新增感冒人数y(人)的关系,该医生记录了5天的数据,且样本中心点为(8,25).由于保管不善,记录的5天数据中有两个数据看不清楚,现用m,n代替,已知18≤m≤24,26≤n≤34,则下列结论正确的是( )
x 5 6 8 9 12
y 17 m 25 n 35
A.在m,n确定的条件下,去掉样本点(8,25),则样本的相关系数r增大
B.在m,n确定的条件下,经过拟合,发现基本符合经验回归方程=2.6x+,则=4
C.在m,n确定的条件下,经过拟合,发现基本符合经验回归方程=2.6x+,则当x=12时,残差为0.4
D.事件“m=20,n=28”发生的概率为
8.针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为5m(m∈N*)人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为H0:喜欢短视频和性别相互独立.若依据α=0.05的独立性检验认为喜欢短视频和性别不独立,则m的最小值为( )
附:χ2=,
α 0.05 0.01
xα 3.841 6.635
A.7 B.8 C.9 D.10
二、多项选择题(本大题共3小题,每小题6分,共18分.在每小题给出的四个选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.小明同学在做市场调查时得到如下样本数据:
x 1 3 6 10
y 8 a 4 2
他由此得到经验回归方程为=-2.1x+15.5,则下列说法正确的是( )
A.变量x与y线性负相关
B.当x=2时可以估计y=11.3
C.a=6
D.变量x与y之间是函数关系
10.给出以下四个说法,其中正确的说法是( )
A.残差分布的带状区域的宽度越窄,R2越小
B.在刻画经验回归模型的拟合效果时,R2的值越大,说明拟合的效果越好
C.在经验回归方程=0.5x+12中,当解释变量x每增加一个单位时,响应变量y增加0.5个单位
D.对分类变量X与Y,若它们的χ2越小,则推断X与Y有关联时犯错误的概率越小
11.某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩与性别是否有关联,面向该校学生开展了一次随机调查,其中参加调查的男、女生人数相同,并绘制等高堆积条形图(如图),则( )
A.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多
B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多
C.若参与调查的男女生人数均为100人,则有99%的把握认为喜欢攀岩与性别有关联
D.无论参与调查的男女生人数为多少,都有99%的把握认为喜欢攀岩与性别有关联
三、填空题(本大题共3小题,每小题5分,共15分.把答案填在题中横线上)
12.独立性检验中,零假设H0:变量X与变量Y没有关系.则在H0成立的情况下,估算概率P(χ2≥6.635)≈0.01表示的意义是 .
13.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下表对应数据:
x 1 3 4 5 7
y 15 20 30 40 45
根据表中数据得到y关于x的经验回归方程为=5.5x+,则当x=7时,残差为 .(残差=观测值-预测值)
14.高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级的排名情况如图所示,甲、乙、丙为该班学生.从这次考试成绩看:
①在甲、乙两人中,语文成绩名次比总成绩名次靠前的学生是 ;
②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .
四、解答题(本大题共5小题,共77分.解答时应写出必要的文字说明、证明过程或演算步骤)
15.(本小题满分13分)有关部门对某校小学生进行心理障碍测试,得到如下列联表:
性别 心理障碍 合计
有 没有
女生 10 30
男生 70 80
合计 20 110
将表格填写完整,试说明心理障碍与性别是否有关.
附:
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
16.(本小题满分15分)两个具有相关关系的变量(x,y)的一组统计数据为(x1,y1),(x2,y2),…,(xn,yn).其样本中心点为(25,36.8),且由统计数据知=138,=310.5,样本相关系数r≈0.96.
(1)求-n;
(2)根据样本相关系数r以及下面所附公式,建立y关于x的经验回归方程.
附:r=,=,=-.
17.(本小题满分15分)为了研究昼夜温差与引发感冒的关系,医务人员对某高中在同一时间段相同温差下的学生感冒情况进行抽样调研,所得数据统计如表①所示,并将男生感冒的人数与温差情况统计如表②所示.
表①
性别 患感冒的情况 合计
患感冒人数 不患感冒人数
男生 30 70 100
女生 42 58 p
合计 m n 200
表②
温差x 6 7 8 9 10
患感冒人数y 8 10 14 20 23
(1)求出m,n,p的值;
(2)依据小概率值α=0.05的独立性检验判断是否可以认为在相同的温差下“性别”与“患感冒的情况”具有相关性;
(3)根据表②数据,计算y与x的样本相关系数r,并说明y与x的线性相关性强弱(若0.75<|r|≤1,则认为y与x线性相关性很强;0.3<|r|≤0.75,则认为y与x线性相关性一般;|r|≤0.3,则认为y与x线性相关性较弱).
参考数据:(xi-)2=10,(yi-)2=164,≈20.248 5.
18.(本小题满分17分)近年来越来越多的家长开始注重孩子的书法教育.某书法培训机构统计了该机构学习软笔书法的学生人数(每人只学习一种书体),得到相关数据统计表如下:
书体 楷书 行书 草书 隶书 篆书
人数 24 16 10 20 10
(1)该培训机构统计了某周学生软笔书法作业完成情况,得到下表,其中a≤60.
性别 是否认真完成作业 合计
认真完成 不认真完成
男生 a
女生
合计 60
若根据小概率值α=0.10的独立性检验可以认为该周学生是否认真完成作业与性别有关,求该培训机构学习软笔书法的女生人数;
(2)现从学习楷书与行书的学生中用分层随机抽样的方法抽取10人,再从这10人中随机抽取4人,记4人中学习行书的人数为X,求X的分布列及数学期望.
参考公式及数据:χ2=,n=a+b+c+d.
α 0.10 0.05 0.01
xα 2.706 3.841 6.635
19.(本小题满分17分)某电视厂家准备在“五一”期间举行促销活动,现在根据已有的广告费与销售量的数据确定此次广告费支出.广告费支出x(单位:万元)和销售量y(单位:万台)的数据如下:
年份 2018 2019 2020 2021 2022 2023 2024
广告费 支出x 1 2 4 6 11 13 19
销售 量y 1.9 3.2 4.0 4.4 5.2 5.3 5.4
(1)若用线性回归模型拟合y与x的关系,求出y关于x的经验回归方程;
(2)若用模型y=c+d拟合y与x的关系,可得经验回归方程为=1.63+0.99,经计算,线性回归模型和该模型的R2分别约为0.75和0.88,请用R2说明选择哪个回归模型更好;
(3)已知利润z(单位:万元)与x,y的关系为z=200y-x.根据(2)的结果回答:当广告费x=20时,销售量及利润的预测值是多少?(精确到0.01)
参考数据:xiyi=279.4,=708,≈2.236.
参考公式:经验回归方程=+x中的斜率和截距的最小二乘估计公式分别为=,=-.
章末检测(八) 成对数据的统计分析
1.C A中,由正方形的边长和面积的公式知,S=a2(a>0)是确定的函数关系,故A错误;B中,学生的成绩和体重,没有关系,故B错误;C中,路上酒后驾驶的人数会影响交通事故发生的多少,但不是唯一因素,它们之间有相关性,故C正确;D中,水的体积V和重量x的关系为V=k·x,是确定的函数关系,故D错误.
2.C 由散点图可知,用y=b1ln(k1x)拟合比用y=k2x+b2拟合的程度高,故|r1|>|r2|;又因为此关系为负相关,所以-r1>-r2,r1<r2,故选C.
3.D 只有χ2≥6.635=x0.01时才能在犯错误的概率不超过1%的前提下,认为该电视栏目是否优秀与改革有关系,而即使χ2≥6.635也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的推论.
4.D 因为==169,==75,又经验回归方程为=1.3x+m,所以=1.3+m,即75=1.3×169+m,所以m=-144.7,故选D.
5.D 因为χ2>10.828,所以有99.9%的把握认为中年人秃发与患心脏病有关,故这种判断出错的可能性为1-0.999=0.001.
6. B 由题意得==2,故=+1=3,即ln y1+ln y2+…+ln y7=3×7=21,故ln(y1y2·…·y7)=21,解得y1·y2·…·y7=e21.故选B.
7.D 对于A中,因为经验回归直线过数据的样本中心点(8,25),所以在m,n确定的条件下去掉样本点(8,25),则样本相关系数r不变,所以A错误;对于B中,由样本中心点为(8,25),可得25=2.6×8+,解得=4.2,所以B错误;对于C中,由=2.6x+4.2,当x=12,可得y=35.4,则35-35.4=-0.4,所以C错误;对于D中,由m+n=48,18≤m≤24,26≤n≤34,则(m,n)的取值为(18,30),(19,29),(20,28),(21,27),(22,26),所以m=20,n=28的概率为,所以D正确.故选D.
8.C 根据题意,2×2列联表中,a=4m,b=m,c=3m,d=2m,于是χ2===,由于依据α=0.05的独立性检验认为喜欢短视频和性别不独立,根据表格可知≥3.841,解得m≥8.066 1,于是m最小值为9.故选C.
9. ABC 由经验回归方程为=-2.1x+15.5,可知变量x与y之间线性负相关,故A正确;当x=2时,y=-2.1×2+15.5=11.3,故B正确;∵=5,=,∴样本点的中心坐标为,代入=-2.1x+15.5,得=-2.1×5+15.5,解得a=6,故C正确;变量x与y之间具有线性负相关关系,不是函数关系,故D错误.故选A、B、C.
10.BC 在回归分析时,残差图中残差分布的带状区域的宽度越窄,说明拟合精度越高,R2的值越接近1,故A错误;用R2来刻画回归的效果时,R2的值越大,说明模型的拟合效果越好,故B正确;在经验回归方程=0.5x+12中,当解释变量x每增加一个单位时,响应变量增加0.5个单位,故C正确;对分类变量X与Y,它们的χ2越小,推断X与Y有关联时犯错误的概率越大;χ2越大,推断X与Y有关联时犯错误的概率越小,故D错误.故选B、C.
11.AC 对于A,参与调查的男、女生人数相同,男生中喜欢攀岩的占80%,女生中喜欢攀岩的占30%,所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,故选项A正确;对于B,参与调查的女生中喜欢攀岩的人数占30%,所以不喜欢攀岩的人数占70%,所以不喜欢攀岩的人数比喜欢攀岩的人数多,故选项B不正确;对于C,若参与调查的男女生人数都为100人,则可得2×2列联表为
性别 是否喜欢攀岩 合计
喜欢攀岩 不喜欢攀岩
男 80 20 100
女 30 70 100
合计 110 90 200
所以χ2=≈50.505>6.635,所以有99%的把握认为喜欢攀岩与性别有关联,故选项C正确;对于D,如果不确定参与调查的男女生人数,无法计算是否有99%的把握认为喜欢攀岩与性别有关联,故选项D不正确.
12.X与Y不独立,该推断犯错误的概率不超过0.01
解析:基于小概率值α=0.01的检验规则可知:当χ2≥6.635时,我们就推断H0不成立,即认为X与Y不独立,该推断犯错误的概率不超过0.01.
13.-1.5 解析:=×(1+3+4+5+7)=4,=×(15+20+30+40+45)=30,因为经验回归直线过点(4,30),代入=5.5x+,可得30=5.5×4+,=8,当x=7时,=5.5×7+8=38.5+8=46.5,所以残差为45-46.5=-1.5.
14.①乙 ②数学 解析:①在甲、乙两人中,语文成绩名次比总名次靠前的是乙.②观察散点图,发现丙的总成绩在年级中的名次是倒数第5名,数学的名次是倒数第11名,显然丙的语文成绩名次拉低了丙的总成绩排名,故丙同学的成绩名次更靠前的科目是数学.
15.解:补充列联表如下表:
性别 心理障碍 合计
有 没有
女生 10 20 30
男生 10 70 80
合计 20 90 110
零假设为H0:心理障碍与性别无关.
根据列联表中的数据,经计算得
χ2=≈6.366>5.024=x0.025.
根据小概率值α=0.025的独立性检验,可以认为H0不成立.即认为心理障碍与性别有关,此判断犯错误的概率不超过0.025.
16. 解:(1)=++…+
=++…+-2(x1+x2+…+xn)+n
=-2n+n=-n,
代入数据可得-n=138.
(2)由已知得=25,=36.8,
∵===1.5,
∴≈0.96×1.5=1.44,
=-=36.8-1.44×25=0.8,
∴y关于x的经验回归方程为=1.44x+0.8.
17.解:(1)根据题表①中的数据可以得出m=72,n=128,p=100.
(2)零假设为H0:性别与患感冒无关.
根据列联表中的数据,经计算得到χ2==3.125<3.841=x0.05,
所以依据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为在相同的温差下“性别”与“患感冒的情况”无关.
(3)由题意知,==8,==15,所以(xi-)(yi-)=40,
则r==≈≈0.987 7>0.75,
所以y与x的线性相关性很强.
18.解:(1)根据题意,完成列联表如下:
性别 是否认真完成作业 合计
认真完成 不认真完成
男生 a
女生 60- 20- 80-a
合计 60 20 80
由题意可得χ2==≥2.706,
得a>57.38.
易知a为5的倍数,且a≤60,所以a=60,
所以该培训机构学习软笔书法的女生有80-60=20(人).
(2)因为学习软笔书法的学生中学习楷书与行书的人数之比为24∶16=3∶2,
所以用分层随机抽样的方法抽取的10人中,学习楷书的有10×=6(人),学习行书的有10×=4(人),
所以X的所有可能取值为0,1,2,3,4,
P(X=0)===,P(X=1)===,P(X=2)===,
P(X=3)===,P(X=4)==.
X的分布列为
X 0 1 2 3 4
P
所以E(X)=0×+1×+2×+3×+4×=.
19.解:(1)由题意得=8,=4.2,xiyi=279.4,=708,
所以===0.17,=-=4.2-0.17×8=2.84,
所以y关于x的经验回归方程为=0.17x+2.84.
(2)因为R2越接近于1,模型的拟合效果越好,所以选用=1.63+0.99回归模型更好.
(3)当广告费x=20时,销售量y的预测值=1.63+0.99≈6.057 28≈6.06(万台),
故利润z的预测值=200×(1.63+0.99)-20≈1 191.456≈1 191.46(万元).
5 / 5(共49张PPT)
章末检测(八)
成对数据的统计分析
(时间:120分钟 满分:150分)
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给
出的四个选项中,只有一项是符合题目要求的)
1. 下列两个变量之间的关系是相关关系的为( )
A. 正方形的面积与边长的关系
B. 学生的成绩和体重
C. 路上酒后驾驶的人数和交通事故发生的多少
D. 水的体积和重量
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: A中,由正方形的边长和面积的公式知,S=a2(a>
0)是确定的函数关系,故A错误;B中,学生的成绩和体重,
没有关系,故B错误;C中,路上酒后驾驶的人数会影响交通事
故发生的多少,但不是唯一因素,它们之间有相关性,故C正
确;D中,水的体积V和重量x的关系为V=k·x,是确定的函数
关系,故D错误.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
2. 已知相关变量x和y的散点图如图所示,若用y=b1·ln (k1x)与y
=kx2+b2拟合时的相关系数分别为r1,r2,则比较r1,r2的大小结
果为( )
A. r1>r2 B. r1=r2
C. r1<r2 D. 不确定
解析: 由散点图可知,用y=b1ln(k1x)
拟合比用y=k2x+b2拟合的程度高,故|r1|>|r2|;又因为此关系为负相关,所以-r1>-r2,r1<r2,故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
3. 为了评价某个电视栏目的改革效果,某机构在改革前后分别从居民
点抽取了100位居民进行调查,经过计算χ2≈0.99,根据这一数据分
析,下列说法正确的是( )
A. 有99%的人认为该电视栏目优秀
B. 有99%的人认为该电视栏目是否优秀与改革有关系
C. 在犯错误的概率不超过1%的前提下,认为该电视栏目是否优秀与
改革有关系
D. 没有理由认为该电视栏目是否优秀与改革有关系
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 只有χ2≥6.635=x0.01时才能在犯错误的概率不超过1%
的前提下,认为该电视栏目是否优秀与改革有关系,而即使
χ2≥6.635也只是对“该电视栏目是否优秀与改革有关系”这个论
断成立的可能性大小的推论.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
4. 下表为某班5位同学身高x(单位:cm)与体重y(单位:kg)的
数据:
身高x 169 172 166 177 161
体重y 75 80 70 85 65
若两个变量之间的经验回归方程为 =1.3x+m,则m=( )
A. -140 B. 140
C. 144.7 D. -144.7
解析: 因为 = =169, =
=75,又经验回归方程为 =1.3x+m,所以 =1.3 +m,即
75=1.3×169+m,所以m=-144.7,故选D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
5. 某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一
些中年人的情况,经计算得χ2= ≈15.968,
因为χ2>10.828,则断定中年人秃发与心脏病有关系.那么这种判
断出错的可能性为( )
A. 0.01 B. 0.05
C. 0.025 D. 0.001
解析: 因为χ2>10.828,所以有99.9%的把握认为中年人秃发
与患心脏病有关,故这种判断出错的可能性为1-0.999=0.001.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
6. 用模型y=aekx拟合一组数据(xi,yi)(i=1,2,3,…,7),
其中x1+x2+…+x7=14,设z=ln y,得变换后的经验回归方程为
=x+1,则y1·y2·…·y7=( )
A. e35 B. e21
C. 35 D. 21
解析: 由题意得 = =2,故 = +1=3,即ln
y1+ln y2+…+ln y7=3×7=21,故ln(y1y2·…·y7)=21,解得
y1·y2·…·y7=e21.故选B.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
7. 某学校校医研究温差x(℃)与本校当天新增感冒人数y(人)的关系,该医生记录了5天的数据,且样本中心点为(8,25).由于保管不善,记录的5天数据中有两个数据看不清楚,现用m,n代替,已知18≤m≤24,26≤n≤34,则下列结论正确的是( )
x 5 6 8 9 12
y 17 m 25 n 35
A. 在m,n确定的条件下,去掉样本点(8,25),则样本的相关系数r增大
B. 在m,n确定的条件下,经过拟合,发现基本符合经验回归方程 =2.6x+ ,则 =4
C. 在m,n确定的条件下,经过拟合,发现基本符合经验回归方程 =2.6x+ ,则当x=12时,残差为0.4
D. 事件“m=20,n=28”发生的概率为
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 对于A中,因为经验回归直线过数据的样本中心点(8,
25),所以在m,n确定的条件下去掉样本点(8,25),则样本
相关系数r不变,所以A错误;对于B中,由样本中心点为(8,
25),可得25=2.6×8+ ,解得 =4.2,所以B错误;对于C
中,由 =2.6x+4.2,当x=12,可得y=35.4,则35-35.4=-
0.4,所以C错误;对于D中,由m+n=48,18≤m≤24,
26≤n≤34,则(m,n)的取值为(18,30),(19,29),
(20,28),(21,27),(22,26),所以m=20,n=28的概
率为 ,所以D正确.故选D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
8. 针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是
否有关联进行了一次调查,其中被调查的男生、女生人数均为5m
(m∈N*)人,男生中喜欢短视频的人数占男生人数的 ,女生中
喜欢短视频的人数占女生人数的 .零假设为H0:喜欢短视频和性
别相互独立.若依据α=0.05的独立性检验认为喜欢短视频和性别
不独立,则m的最小值为( )
附:χ2= ,
α 0.05 0.01
xα 3.841 6.635
A. 7 B. 8
C. 9 D. 10
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 根据题意,2×2列联表中,a=4m,b=m,c=3m,
d=2m,于是χ2= = =
,由于依据α=0.05的独立性检验认为喜欢短视频和性别不独
立,根据表格可知 ≥3.841,解得m≥8.066 1,于是m最小值
为9.故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
二、多项选择题(本大题共3小题,每小题6分,共18分.在每小题给
出的四个选项中,有多项符合题目要求,全部选对的得6分,部分选
对的得部分分,有选错的得0分)
9. 小明同学在做市场调查时得到如下样本数据:
x 1 3 6 10
y 8 a 4 2
他由此得到经验回归方程为 =-2.1x+15.5,则下列说法正确的
是( )
A. 变量x与y线性负相关 B. 当x=2时可以估计y=11.3
C. a=6 D. 变量x与y之间是函数关系
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 由经验回归方程为 =-2.1x+15.5,可知变量x与
y之间线性负相关,故A正确;当x=2时,y=-2.1×2+15.5=
11.3,故B正确;∵ =5, = ,∴样本点的中心坐标为 ,代入 =-2.1x+15.5,得 =-2.1×5+15.5,解得
a=6,故C正确;变量x与y之间具有线性负相关关系,不是函数
关系,故D错误.故选A、B、C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
10. 给出以下四个说法,其中正确的说法是( )
A. 残差分布的带状区域的宽度越窄,R2越小
B. 在刻画经验回归模型的拟合效果时,R2的值越大,说明拟合的效果越好
C. 在经验回归方程 =0.5x+12中,当解释变量x每增加一个单位时,响应变量y增加0.5个单位
D. 对分类变量X与Y,若它们的χ2越小,则推断X与Y有关联时犯错误的概率越小
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 在回归分析时,残差图中残差分布的带状区域的
宽度越窄,说明拟合精度越高,R2的值越接近1,故A错误;
用R2来刻画回归的效果时,R2的值越大,说明模型的拟合效果
越好,故B正确;在经验回归方程 =0.5x+12中,当解释变
量x每增加一个单位时,响应变量增加0.5个单位,故C正确;
对分类变量X与Y,它们的χ2越小,推断X与Y有关联时犯错误
的概率越大;χ2越大,推断X与Y有关联时犯错误的概率越小,
故D错误.故选B、C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
11. 某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩与性别是否有关联,面向该校学生开展了一次随机调查,其中参加调查的男、女生人数相同,并绘制等高堆积条形图(如图),则( )
A. 参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多
B. 参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多
C. 若参与调查的男女生人数均为100人,则有99%的把握认为喜欢攀岩与性别有关联
D. 无论参与调查的男女生人数为多少,都有99%的把握认为喜欢攀岩与性别有关联
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: 对于A,参与调查的男、女生人数相同,男生中喜欢
攀岩的占80%,女生中喜欢攀岩的占30%,所以参与调查的学生
中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,故选项A正
确;对于B,参与调查的女生中喜欢攀岩的人数占30%,所以不喜
欢攀岩的人数占70%,所以不喜欢攀岩的人数比喜欢攀岩的人数
多,故选项B不正确;对于C,若参与调查的男女生人数都为100
人,则可得2×2列联表为
性别 是否喜欢攀岩 合计
喜欢攀岩 不喜欢攀岩
男 80 20 100
女 30 70 100
合计 110 90 200
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
所以χ2= ≈50.505>6.635,所以有99%的把
握认为喜欢攀岩与性别有关联,故选项C正确;对于D,如果不确
定参与调查的男女生人数,无法计算是否有99%的把握认为喜欢
攀岩与性别有关联,故选项D不正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
三、填空题(本大题共3小题,每小题5分,共15分.把答案填在题中
横线上)
12. 独立性检验中,零假设H0:变量X与变量Y没有关系.则在H0成立
的情况下,估算概率P(χ2≥6.635)≈0.01表示的意义是
.
解析:基于小概率值α=0.01的检验规则可知:当χ2≥6.635时,
我们就推断H0不成立,即认为X与Y不独立,该推断犯错误的概
率不超过0.01.
X与Y
不独立,该推断犯错误的概率不超过0.01
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
13. 已知某种商品的广告费支出x(单位:万元)与销售额y(单位:
万元)之间有如下表对应数据:
x 1 3 4 5 7
y 15 20 30 40 45
根据表中数据得到y关于x的经验回归方程为 =5.5x+ ,则当
x=7时,残差为 .(残差=观测值-预测值)
-1.5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析: = ×(1+3+4+5+7)=4, = ×(15+20+30+
40+45)=30,因为经验回归直线过点(4,30),代入 =5.5x
+ ,可得30=5.5×4+ , =8,当x=7时, =5.5×7+8=
38.5+8=46.5,所以残差为45-46.5=-1.5.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
14. 高三年级267位学生参加期末考试,某班37位学生的语文成绩、数
学成绩与总成绩在全年级的排名情况如图所示,甲、乙、丙为该
班学生.从这次考试成绩看:
①在甲、乙两人中,语文成绩名次比总成绩名次靠前的学生是 ;
②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .
乙
数学
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解析:①在甲、乙两人中,语文成绩名次比总名次靠前的是乙.②
观察散点图,发现丙的总成绩在年级中的名次是倒数第5名,数学
的名次是倒数第11名,显然丙的语文成绩名次拉低了丙的总成绩
排名,故丙同学的成绩名次更靠前的科目是数学.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
四、解答题(本大题共5小题,共77分.解答时应写出必要的文字说
明、证明过程或演算步骤)
15. (本小题满分13分)有关部门对某校小学生进行心理障碍测试,
得到如下列联表:
性别 心理障碍 合计
有 没有
女生 10 30
男生 70 80
合计 20 110
将表格填写完整,试说明心理障碍与性别是否有关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
附:
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
解:补充列联表如下表:
性别 心理障碍 合计
有 没有
女生 10 20 30
男生 10 70 80
合计 20 90 110
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
零假设为H0:心理障碍与性别无关.
根据列联表中的数据,经计算得
χ2= ≈6.366>5.024=x0.025.
根据小概率值α=0.025的独立性检验,可以认为H0不成立.即认
为心理障碍与性别有关,此判断犯错误的概率不超过0.025.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
16. (本小题满分15分)两个具有相关关系的变量(x,y)的一组统
计数据为(x1,y1),(x2,y2),…,(xn,yn).其样本中心
点为(25,36.8),且由统计数据知 =138,
=310.5,样本相关系数r≈0.96.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解: = + +…
+
= + +…+ -2 (x1+x2+…+xn)+n
= -2n +n = -n ,
代入数据可得 -n =138.
(1)求 -n ;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)根据样本相关系数r以及下面所附公式,建立y关于x的经验
回归方程.
附:r= , =
, = - .
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:(2)由已知得 =25, =36.8,
∵ = = =1.5,
∴ ≈0.96×1.5=1.44,
= - =36.8-1.44×25=0.8,
∴y关于x的经验回归方程为 =1.44x+0.8.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
17. (本小题满分15分)为了研究昼夜温差与引发感冒的关系,医务
人员对某高中在同一时间段相同温差下的学生感冒情况进行抽样
调研,所得数据统计如表①所示,并将男生感冒的人数与温差情
况统计如表②所示.
表①
性别 患感冒的情况 合计
患感冒人数 不患感冒人数
男生 30 70 100
女生 42 58 p
合计 m n 200
表②
温差x 6 7 8 9 10
患感冒人数y 8 10 14 20 23
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(1)求出m,n,p的值;
解: 根据题表①中的数据可以得出m=72,n=128,p=100.
(2)依据小概率值α=0.05的独立性检验判断是否可以认为在相
同的温差下“性别”与“患感冒的情况”具有相关性;
解: 零假设为H0:性别与患感冒无关.
根据列联表中的数据,经计算得到χ2=
=3.125<3.841=x0.05,
所以依据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为在相同的温差下“性别”与“患感冒的情况”无关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(3)根据表②数据,计算y与x的样本相关系数r,并说明y与x
的线性相关性强弱(若0.75<|r|≤1,则认为y与x线性
相关性很强;0.3<|r|≤0.75,则认为y与x线性相关性
一般;|r|≤0.3,则认为y与x线性相关性较弱).
参考数据: (xi- )2=10, (yi- )2=164,
≈20.248 5.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解: 由题意知, = =8, =
=15,所以 (xi- )(yi- )=40,
则r= = ≈ ≈0.987 7>0.75,
所以y与x的线性相关性很强.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
18. (本小题满分17分)近年来越来越多的家长开始注重孩子的书法
教育.某书法培训机构统计了该机构学习软笔书法的学生人数(每
人只学习一种书体),得到相关数据统计表如下:
书体 楷书 行书 草书 隶书 篆书
人数 24 16 10 20 10
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(1)该培训机构统计了某周学生软笔书法作业完成情况,得到下表,其中a≤60.
性别 是否认真完成作业 合计
认真完成 不认真完成
男生 a
女生
合计 60
若根据小概率值α=0.10的独立性检验可以认为该周学生是否认真完成作业与性别有关,求该培训机构学习软笔书法的女生人数;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解: 根据题意,完成列联表如下:
性别 是否认真完成作业 合计
认真完成 不认真完成
男生 a
女生 60- 20- 80-a
合计 60 20 80
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
由题意可得χ2= =
≥2.706,
得a>57.38.
易知a为5的倍数,且a≤60,所以a=60,
所以该培训机构学习软笔书法的女生有80-60=20(人).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)现从学习楷书与行书的学生中用分层随机抽样的方法抽取10
人,再从这10人中随机抽取4人,记4人中学习行书的人数
为X,求X的分布列及数学期望.
参考公式及数据:χ2= ,n=a+
b+c+d.
α 0.10 0.05 0.01
xα 2.706 3.841 6.635
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解: 因为学习软笔书法的学生中学习楷书与行书的人
数之比为24∶16=3∶2,
所以用分层随机抽样的方法抽取的10人中,学习楷书的有
10× =6(人),学习行书的有10× =4(人),
所以X的所有可能取值为0,1,2,3,4,
P(X=0)= = = ,P(X=1)= = =
,P(X=2)= = = ,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
P(X=3)= = = ,P(X=4)= = .
X的分布列为
X 0 1 2 3 4
P
所以E(X)=0× +1× +2× +3× +4× = .
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
19. (本小题满分17分)某电视厂家准备在“五一”期间举行促
销活动,现在根据已有的广告费与销售量的数据确定此次广告
费支出.广告费支出x(单位:万元)和销售量y(单位:万
台)的数据如下:
年份 2018 2019 2020 2021 2022 2023 2024
广告费 支出x 1 2 4 6 11 13 19
销售 量y 1.9 3.2 4.0 4.4 5.2 5.3 5.4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(1)若用线性回归模型拟合y与x的关系,求出y关于x的经验回
归方程;
解: 由题意得 =8, =4.2, xiyi=279.4, =708,
所以 = = =0.17, = - =
4.2-0.17×8=2.84,
所以y关于x的经验回归方程为 =0.17x+2.84.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)若用模型y=c+d 拟合y与x的关系,可得经验回归方
程为 =1.63+0.99 ,经计算,线性回归模型和该模
型的R2分别约为0.75和0.88,请用R2说明选择哪个回归
模型更好;
解: 因为R2越接近于1,模型的拟合效果越好,所以
选用 =1.63+0.99 回归模型更好.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(3)已知利润z(单位:万元)与x,y的关系为z=200y-x.
根据(2)的结果回答:当广告费x=20时,销售量及利润
的预测值是多少?(精确到0.01)
参考数据: xiyi=279.4, =708, ≈2.236.
参考公式:经验回归方程 = + x中的斜率和截距的最小
二乘估计公式分别为 = , = - .
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解: 当广告费x=20时,销售量y的预测值 =1.63+
0.99 ≈6.057 28≈6.06(万台),
故利润z的预测值 =200×(1.63+0.99 )-20≈1
191.456≈1 191.46(万元).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
谢 谢 观 看!