(共41张PPT)
强化课 成对数据统计分析中的综合问题
题型一 回归分析与独立性检验交汇
环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量x(单位:辆)和空气中的PM2.5的平均浓度y(单位:μg/m3). 调研人员采集了50天的数据,制作了关于(xi,yi)(i=1,2,3,…,50)的散点图,并用直线x=1 500与y=100将散点图分成如图所示的四个区域Ⅰ,Ⅱ,Ⅲ,Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的2×2列联表,并依据小概率值α=0.01的独立性检验,分析PM2.5的平均浓度与汽车日流量是否有关联?
单位:天
PM2.5的平均浓度 汽车日流量 合计
x<1 500辆 x≥1 500辆 y<100 μg/m3
y≥100 μg/m3
合计
【解】 2×2列联表如下:
单位:天
PM2.5的平均浓度 汽车日流量 合计
x<1 500辆 x≥1 500辆 y<100 μg/m3 16 8 24
y≥100 μg/m3 6 20 26
合计 22 28 50
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
此类题型只需遵循回归分析的步骤,运用独立性检验的原理,掌握好计算公式、表格的整理与读取即可.
[跟踪训练1] 甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单位:cm)及个数y如下表:
零件尺寸x 1.01 1.02 1.03 1.04 1.05
零件个数y 甲 6 14 17 17 6
乙 m 8 8 8 22
(1)求m的值;
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
解:由于合格零件尺寸为1.03±0.01 cm,
所以甲、乙机床加工的合格与不合格零件的2×2列联表为
单位:件
机床 零件 合计
合格数 不合格数 甲 48 12 60
乙 24 36 60
合计 72 48 120
(1)赛前小明进行了一段时间的训练,其每天解题的平均速度y(秒/题)与训练天数x(单位:天)有关,经统计得到如下数据:
x/天 1 2 3 4 5 6 7
y/(秒/题) 910 800 600 440 300 240 210
此类题型重点考查经验回归方程以及样本相关系数的求解,注意如果是非线性回归问题,要转化为线性回归问题,常与概率、统计知识结合考查.
(1)求样本(xi,yi)(i=1,2,…,20)的样本相关系数(精确到0.01),并推断这种野生动物的数量y(单位:只)与植物覆盖面积x(单位:公顷)的线性相关程度(当|r|∈[0.75,1]时,认为线性相关程度强,否则认为线性相关程度弱);
性别 打篮球 合计
喜爱 不喜爱 男 6
女 10
合计 48
性别 打篮球 合计
喜爱 不喜爱 男 22 6 28
女 10 10 20
合计 32 16 48
(2)根据小概率值α=0.05的独立性检验,能否据此推断喜爱打篮球与性别有关?
αl 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
独立性检验与概率、统计综合问题的解题思路
本类题目以生活题材为背景,涉及独立性检验与概率、统计问题的综合,解决该类问题首先收集数据列出2×2列联表,并按照公式求得χ2的值后与相应的临界值进行比较,其次按照随机变量满足的概率模型求解.
[跟踪训练3] 某校在课外活动期间设置了文化艺术类活动和体育锻炼类活动,为了解学生对这两类活动的参与情况,统计了如下数据:
单位:人
性别 活动类型 合计
文化艺术类 体育锻炼类 男 100 300 400
女 50 100 150
合计 150 400 550
(1)依据小概率值α=0.1的独立性检验,分析该校学生所选择课外活动的类型与性别有无关联?
(2)为收集学生对课外活动的建议,在参加文化艺术类活动的学生中按性别用分层随机抽样的方法抽取了6名同学.若在这6名同学中随机抽取2名,求所抽取的2名同学中至少有1名女生的概率.
附表及公式:
α 0.1 0.05 0.01
xα 2.706 3.841 6.635