强化课 成对数据统计分析中的综合问题(教师版)

文档属性

名称 强化课 成对数据统计分析中的综合问题(教师版)
格式 doc
文件大小 277.6KB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2026-02-27 00:00:00

图片预览

文档简介

INCLUDEPICTURE "强化课LLL.TIF"  成对数据统计分析中的综合问题
题型一 回归分析与独立性检验交汇
INCLUDEPICTURE "例1LLL.TIF"  环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量x(单位:辆)和空气中的PM2.5的平均浓度y(单位:μg/m3). 调研人员采集了50天的数据,制作了关于(xi,yi)(i=1,2,3,…,50)的散点图,并用直线x=1 500与y=100将散点图分成如图所示的四个区域Ⅰ,Ⅱ,Ⅲ,Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
INCLUDEPICTURE "25-BS6.TIF"
(1)完成下面的2×2列联表,并依据小概率值α=0.01的独立性检验,分析PM2.5的平均浓度与汽车日流量是否有关联?
单位:天
PM2.5的平均浓度 汽车日流量 合计
x<1 500辆 x≥1 500辆
y<100 μg/m3
y≥100 μg/m3
合计
(2)经计算得经验回归方程为=0.12x-73.36,且这50天的汽车日流量x的标准差sx=252,PM2.5的平均浓度y的标准差sy=36.求样本相关系数r,并判断y与x的线性相关程度的强弱(若|r|≥0.75,则认为y与x有较强的线性相关程度).
参考公式:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
经验回归方程=+x,其中=,样本相关系数
r=.
【解】 (1)2×2列联表如下:
单位:天
PM2.5的平均浓度 汽车日流量 合计
x<1 500辆 x≥1 500辆
y<100 μg/m3 16 8 24
y≥100 μg/m3 6 20 26
合计 22 28 50
零假设为H0:PM2.5的平均浓度与汽车日流量无关联,
因为χ2=≈9.624>6.635=x0.01,根据小概率值α=0.01的独立性检验,我们推断H0不成立,
即认为PM2.5的平均浓度与汽车日流量有关联,此推断犯错误的概率不大于0.01.
(2)因为经验回归方程为=0.12x-73.36,
所以==0.12,
又因为 =252, =36,
所以r=
=·=0.12×=0.84.
因为|r|=0.84>0.75,所以y与x的线性相关程度较强.
INCLUDEPICTURE "解题技法LLL.TIF"
此类题型只需遵循回归分析的步骤,运用独立性检验的原理,掌握好计算公式、表格的整理与读取即可.
[跟踪训练1] 甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单位:cm)及个数y如下表:
零件尺寸x 1.01 1.02 1.03 1.04 1.05
零件个数y 甲 6 14 17 17 6
乙 m 8 8 8 22
由表中数据得y关于x的经验回归方程为=-171.7+190x(1.01≤x≤1.05),其中合格零件尺寸为1.03±0.01 cm.
(1)求m的值;
(2)根据小概率值α=0.01的独立性检验,判断加工零件的质量与甲、乙机床是否有关联?
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
解:(1)依题意,得=1.03,=,
由=-171.7+190x,得=-171.7+190×1.03,解得m=14.
(2)由于合格零件尺寸为1.03±0.01 cm,
所以甲、乙机床加工的合格与不合格零件的2×2列联表为
单位:件
机床 零件 合计
合格数 不合格数
甲 48 12 60
乙 24 36 60
合计 72 48 120
零假设为H0:加工零件的质量与甲、乙机床无关,根据以上数据,χ2= =20>6.635=x0.01,根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为加工零件的质量与甲、乙机床有关,此推断犯错误的概率不大于0.01.
题型二 回归分析与概率、统计交汇
INCLUDEPICTURE "例2LLL.TIF"  数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1~9,且不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.
参考数据(其中ti=,i=1,2,3,…,n):
iyi -72
1 750 0.37 0.55
参考公式:对于一组数据(μ1,v1),(μ2,v2),…,(μn,vn),其经验回归方程=+μ的斜率和截距的最小二乘估计分别为= eq \f(\i\su(i=1,n,μ)ivi-n\o(μ,\s\up6(-))\o(v,\s\up6(-)),\i\su(i=1,n,μ)-n\o(μ,\s\up6(-))2) ,=-.
(1)赛前小明进行了一段时间的训练,其每天解题的平均速度y(秒/题)与训练天数x(单位:天)有关,经统计得到如下数据:
x/天 1 2 3 4 5 6 7
y/(秒/题) 910 800 600 440 300 240 210
现用=+作为回归方程模型,请利用表中数据,求出该非线性经验回归方程;(,用分数表示)
(2)若小明和小红玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,不存在平局,两人约定先胜3局者赢得比赛.若小明每局获胜的概率为,且各局之间相互独立,设比赛X局后结束,求随机变量X的分布列及均值.
【解】 (1)因为=+,ti=(i=1,2,3,…,n),所以=+t.
因为=×(910+800+600+440+300+240+210)=500,
所以= eq \f(\i\su(i=1,7,t)iyi-7\o(t,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,7,t)-7\o(t,\s\up6(-))2) =
==,
所以=-=500-×0.37=,
所以=+t,
所以所求非线性经验回归方程为=+.
(2)随机变量X的所有可能取值为3,4,5,
P(X=3)=()3+()3=,
P(X=4)=C()2××+C()2××=,
P(X=5)=C()2×()2×+C()2×()2×=.
所以随机变量X的分布列为
X 3 4 5
P
E(X)=3×+4×+5×=.
INCLUDEPICTURE "解题技法LLL.TIF"
此类题型重点考查经验回归方程以及样本相关系数的求解,注意如果是非线性回归问题,要转化为线性回归问题,常与概率、统计知识结合考查.
[跟踪训练2] 某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区植物覆盖面积与某种野生动物数量的关系,将其分成面积相近的若干个地块,从这些地块中随机抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量(单位:只),并计算得(xi-)2=80,(yi-)2=9 000,(xi-)(yi-)=800.
(1)求样本(xi,yi)(i=1,2,…,20)的样本相关系数(精确到0.01),并推断这种野生动物的数量y(单位:只)与植物覆盖面积x(单位:公顷)的线性相关程度(当|r|∈[0.75,1]时,认为线性相关程度强,否则认为线性相关程度弱);
(2)已知20个样区中有8个样区的这种野生动物数量低于样本平均数,从20个样区中随机抽取2个,记抽到这种野生动物数量低于样本平均数的样区的个数为X,求随机变量X的分布列.
附:样本相关系数r=,≈1.414.
解:(1)样本(xi,yi)(i=1,2,…,20)的样本相关系数为r===≈0.94.
由样本相关系数r≈0.94∈[0.75,1],可以推断出这种野生动物的数量y与植物覆盖面积x的线性相关程度强.
(2)由题意得,X的可能取值为0,1,2,
20个样区中有8个样区的这种野生动物数量低于样本平均数,有12个样区的这种野生动物数量不低于样本平均数,
所以P(X=0)= eq \f(C,C) ==,
P(X=1)= eq \f(CC,C) ==,
P(X=2)= eq \f(C,C) ==,
所以X的分布列为
X 0 1 2
P
题型三 独立性检验与概率、统计交汇
INCLUDEPICTURE "例3LLL.TIF"  为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:
单位:人
性别 打篮球 合计
喜爱 不喜爱
男 6
女 10
合计 48
已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为.
(1)请将上面的2×2列联表补充完整(不用写计算过程);
(2)根据小概率值α=0.05的独立性检验,能否据此推断喜爱打篮球与性别有关?
(3)现从女生中随机抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值.
附:χ2=,其中n=a+b+c+d,
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
【解】 (1)依题意,喜爱打篮球的学生人数为48×=32,
完善2×2列联表如下:
单位:人
性别 打篮球 合计
喜爱 不喜爱
男 22 6 28
女 10 10 20
合计 32 16 48
(2)零假设为H0:喜爱打篮球与性别无关,
由(1)得χ2=≈4.286>3.841=x0.05,
根据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为喜爱打篮球与性别有关,此推断犯错误的概率不超过0.05.
(3)由题知X的所有可能取值为0,1,2,
则P(X=0)= eq \f(C,C) =,
P(X=1)= eq \f(CC,C) =,
P(X=2)= eq \f(C,C) =,
所以X的分布列为
X 0 1 2
P
X的均值为E(X)=0×+1×+2×=1.
INCLUDEPICTURE "解题技法LLL.TIF"
独立性检验与概率、统计综合问题的解题思路
本类题目以生活题材为背景,涉及独立性检验与概率、统计问题的综合,解决该类问题首先收集数据列出2×2列联表,并按照公式求得χ2的值后与相应的临界值进行比较,其次按照随机变量满足的概率模型求解.
[跟踪训练3] 某校在课外活动期间设置了文化艺术类活动和体育锻炼类活动,为了解学生对这两类活动的参与情况,统计了如下数据:
单位:人
性别 活动类型 合计
文化艺术类 体育锻炼类
男 100 300 400
女 50 100 150
合计 150 400 550
(1)依据小概率值α=0.1的独立性检验,分析该校学生所选择课外活动的类型与性别有无关联?
(2)为收集学生对课外活动的建议,在参加文化艺术类活动的学生中按性别用分层随机抽样的方法抽取了6名同学.若在这6名同学中随机抽取2名,求所抽取的2名同学中至少有1名女生的概率.
附表及公式:
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
其中χ2=,n=a+b+c+d.
解:(1)零假设为H0:该校学生所选择课外活动的类型与性别无关,由题表中数据可得,
χ2==≈3.819>2.706=x0.1,
根据小概率值α=0.1的独立性检验,我们推断H0不成立,即认为该校学生所选择课外活动的类型与性别有关,此推断犯错误的概率不大于0.1.
(2)抽取的6名同学中,男生有6×=4(人),女生有6×=2(人),
记事件A为“抽取的2名同学中至少有1名女生”,
则P()= eq \f(C,C) ==,
所以P(A)=1-P()=,
即所抽取的2名同学中至少有1名女生的概率为.