(共57张PPT)
[学习目标] 1.熟练掌握回归分析以及独立性检验的相关知识. 2.掌握回归分析与独立性检验、概率统计等交汇问题.
一、回归分析与独立性检验交汇
[例1] 环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量x(单位:辆)和空气中的PM2.5的平均浓度y(单位:μg/m3).调研人员采集了50天的数据,制作了关于(xi,yi)(i=1,2,3,…,50)的散点图,并用直线x=1 500与y=100将散点图分成如图所示的四个区域Ⅰ,Ⅱ,Ⅲ,Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的2×2列联表,并依据小概率值α=0.01的独立性检验,分析“PM2.5平均浓度不小于100 μg/m3”与“汽车日流量不小于1 500辆”是否有关联;
PM2.5平均浓度 汽车日流量 合计
汽车日流量x<1 500 汽车日流量x≥1 500
PM2.5的平均浓度y<100
PM2.5的平均浓度y≥100
合计
解 2×2列联表如下:
PM2.5平均浓度 汽车日流量 合计
汽车日流量x<1 500 汽车日流量x≥1 500
PM2.5的平均浓度y<100 16 8 24
PM2.5的平均浓度y≥100 6 20 26
合计 22 28 50
零假设为H0:“PM2.5平均浓度不小于100 μg/m3”与“汽车日流量不小于1 500辆”无关,
α 0.100 0.050 0.010 0.001
xα 2.706 3.841 6.635 10.828
[反思归纳] 此类题型只需遵循回归分析的步骤,运用独立性检验的原理,掌握好计算公式、表格的整理与读取即可.
1.甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸X(单位: cm)及个数Y如下表:
零件尺寸X 1.01 1.02 1.03 1.04 1.05
零件个
数Y 甲 6 14 17 17 6
乙 m 8 8 8 22
(2)根据小概率值α=0.01的独立性检验,判断加工零件的质量与甲、乙机床是否有关联.
解 由于合格零件尺寸为(1.03±0.01) cm,
所以甲、乙机床加工的合格与不合格零件的2×2列联表为:
机床 机床加工零件质量 计合
合格零件数 不合格零件数
甲 48 12 60
乙 24 36 60
合计 72 48 120
二、回归分析与概率、统计交汇
[例2] 数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1~9,且不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.
(1)赛前小明进行了一段时间的训练,每天解题的平均速度y(秒/题)与训练天数x(天)有关,经统计得到如下数据:
x(天) 1 2 3 4 5 6 7
y(秒/题) 910 800 600 440 300 240 210
[反思归纳] 回归分析与概率、统计交汇问题的解题思路
1.此类问题的特点:同一生活实践情境下设计两类问题,即(1)求经验回归方程(预测);(2)求某随机变量的概率、均值、方差等.
2.充分利用题目中提供的成对样本数据(散点图)做出判断,确定是线性问题还是非线性问题.求解时要充分利用已知数据,合理利用变形公式,以达到快速准确运算的目的.
3.明确所求问题所属事件的类型,准确构建概率模型.
(1)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01),并推断这种野生动物的数量y(单位:只)和植物覆盖面积x(单位:公顷)的相关程度;
(2)已知20个样区中有8个样区的这种野生动物数量低于样本平均数,从20个样区中随机抽取2个,记抽到这种野生动物数量低于样本平均数的样区的个数为X,求随机变量X的分布列.
三、独立性检验与概率、统计交汇
[例3] 某高中学校为了解学生参加体育锻炼的情况,统计了全校所有学生在一年内每周参加体育锻炼的次数,现随机抽取了60名同学在某一周参加体育锻炼的数据,结果如下表:
一周参加体育锻炼次数 0 1 2 3 4 5 6 7 合计
男生人数 3 2 2 5 6 5 4 3 30
女生人数 9 2 3 6 4 3 2 1 30
合计 12 4 5 11 10 8 6 4 60
(1)若将一周参加体育锻炼次数为3次及3次以上的,称为“经常锻炼”,其余的称为“不经常锻炼”.请完成以下2×2列联表,并依据小概率值α=0.1的独立性检验,能否认为性别因素与学生体育锻炼的经常性有关系?
性别 锻炼 合计
不经常 经常
男生
女生
合计
解 根据统计表格数据可得列联表如下:
性别 锻炼 合计
不经常 经常
男生 7 23 30
女生 14 16 30
合计 21 39 60
根据小概率值α=0.1的独立性检验,推断H0不成立,
即性别因素与学生体育锻炼的经常性有关系,此推断犯错误的概率不超过0.1.
(2)若将一周参加体育锻炼次数为0次的称为“极度缺乏锻炼”,“极度缺乏锻炼”会导致肥胖等诸多健康问题.以样本频率估计概率,在全校抽取3名同学,其中“极度缺乏锻炼”的人数为X,求分布列和D(X).
故所求分布列为
(3)若将一周参加体育锻炼6次或7次的同学称为“运动爱好者”,为进一步了解他们的生活习惯,在样本的10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为Y,求Y的分布列和数学期望.
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
[反思归纳] 独立性检验与概率、统计交汇问题的解题思路
本类题目以生活题材为背景,涉及独立性检验及概率问题的综合,解决该类问题首先收集数据列出2×2列联表,并按照公式求得χ2的值后进行比较,其次再按照随机变量满足的概率模型求解.
3.随着互联网发展,网络已成为人们日常学习、工作和生活不可或缺的部分,互联网在带给人们生活便捷与高效工作的同时,网络犯罪也日益增多,为了防范网络犯罪与网络诈骗,学校举办“网络安全宣传倡议”活动.某学校从全体学生中随机抽取了400人对“网络安全宣传倡议”的了解情况进行问卷调查,统计结果如下表所示:
(1)根据所提供的数据,完成2×2列联表,并依据小概率值α=0.005的独立性检验,能否认为对“网络安全宣传倡议”的了解情况与性别有关?
参考数据:
了解情况 性别 合计
男 女
了解 150 240
不了解 90
合计
α 0.10 0.05 0.010 0.005
xα 2.706 3.841 6.635 7.879
解 根据题意,得到2×2列联表为:
了解情况 性别 合计
男 女
了解 150 90 240
不了解 70 90 160
合计 220 180 400
根据小概率值α=0.005的独立性检验,我们推断H0不成立,
即认为对“网络安全宣传倡议”的了解情况与性别有关.
(2)对了解“网络安全宣传倡议”的人按性别用比例分配的分层随机抽样的方法抽取8人,再从这8人中随机抽取3人,记X为抽取的3人中女生的人数,求X的分布列和数学期望.
X的分布列为
1
2
3
4
1.为了解某地区2025年6~10月份电动汽车的销售情况,某机构经过调查,得到如下表所示的数据.
月份 6月 7月 8月 9月 10月
月份代码x 1 2 3 4 5
销售总额y/亿元 4 6 10 15 20
1
2
3
4
1
2
3
4
(2)该机构随机调查了该地区200位购车车主的性别与购车种类,其中购买非电动汽车的男性有60人,女性有90人,购买电动汽车的男性有40人,女性有10人,依据α=0.01的独立性检验,能否认为购买电动汽车与性别有关?
α 0.100 0.050 0.010
xα 2.706 3.841 6.635
1
2
3
4
解 由题可得2×2列联表如下:
性别 购买种类 合计
非电动汽车 电动汽车
男 60 40 100
女 90 10 100
合计 150 50 200
根据小概率值α=0.01的独立性检验我们推断H0不成立,即认为购买电动汽车与性别有关.
1
2
3
4
2.某学校为学生开设了一门模具加工课,经过一段时间的学习,拟举行一次模具加工大赛,学生小明、小红打算报名参加大赛.赛前,小明、小红分别进行了为期一周的封闭强化训练,下表记录了两人在封闭强化训练期间每天加工模具成功的次数,其中小明第7天的成功次数w忘了记录,但知道36≤w≤55,w∈Z(yi,zi分别表示小明、小红第i天的成功次数).
项目 第一天 第二天 第三天 第四天 第五天 第六天 第七天
序号x 1 2 3 4 5 6 7
小明成功
次数(y) 16 20 20 25 30 36 w
小红成功
次数(z) 16 22 25 26 32 35 35
1
2
3
4
(1)求这7天内小明成功的总次数不少于小红成功的总次数的概率;
1
2
3
4
(2)根据小明这7天内前6天的成功次数,求其成功次数y关于序号x的经验回归方程,并估计小明第七天成功次数w的值.
参考数据:1×16+2×20+3×20+4×25+5×30+6×36=582;12+22+32+42+52+62=91.
1
2
3
4
1
2
3
4
3.为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了如下数据.根据医学相关知识,我们认为此项指标大于40为偏高,反之即为正常.
男性: 5 7 9 8 18 19 21 23 27 29
25 32 34 35 37 38 41 42 47 54
女性: 13 14 21 25 25 28 31 32 34 35
38 40 43 47 48 49 52 55 56 57
(1)依据样本数据研究此项血液指标与性别的关系,列出2×2列联表,并判断能否在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关联;
1
2
3
4
解 由题中数据可得2×2列联表为:
性别 血液指标 合计
正常 偏高
男性 16 4 20
女性 12 8 20
合计 28 12 40
1
2
3
4
(2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X的分布列及数学期望.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1
2
3
4
1
2
3
4
4.某餐馆2025年12月份共有800个线上外卖订单,其中好评订单有600个,其余均为非好评订单.为了提升菜品品质,增加营业额,该餐馆在2026年1月份更换了厨师,更换厨师后该餐馆2026年1月份共有2 000个线上外卖订单,其中好评订单有1 600个,其余均为非好评订单.
(1)根据统计数据,完成下列2×2列联表,依据小概率值α=0.01的独立性检验,能否认为该餐馆订单的好评率与更换厨师有关联?
更换厨师 评价 合计
好评 非好评
前
后
合计
1
2
3
4
解 2×2列联表如下:
更换厨师 评价 合计
好评 非好评
前 600 200 800
后 1 600 400 2 000
合计 2 200 600 2 800
1
2
3
4
根据小概率值α=0.01的独立性检验,我们推断H0不成立,所以可以认为该餐馆订单的好评率与更换厨师有关联.
1
2
3
4
(2)现从更换厨师前的订单中,按比例用分层随机抽样法抽取8个订单进行电话回访,再从这8个订单中随机抽取3个订单发放新品品尝券并让顾客评价,记抽取的3个订单中好评的订单个数为ξ,求ξ的分布列和数学期望.
1
2
3
4
所以ξ的分布列为
1
2
3
4
(3)用样本频率估计总体概率,现从更换厨师后的所有订单中随机抽取100个订单,记其中好评的订单个数为η,求当事件“η=r”的概率最大时r的值.
α 0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
1
2
3
4