第87题 相关关系、回归方程与独立性检验
I.题源探究·黄金母题
【例1】相关变量的样本数据如下表:
1
2
3
4
5
2
2
3
5
6
经回归分析可得与线性相关,并由最小二乘法求得回归直线方程为,则 ( )
A. B. C. D.
【答案】C
【例2】为考察某种药物预防疾病的效果,科研人员对100只某种动物进行试验,得到如下的列联表:
患病
未患病
总计
服用药
10
40
50
未服药
20
30
50
总计
30
70
100
则有多大的把握认为药物有效? ( )
A. B. C. D.
【答案】B
【解析】
有的把握认为药物有效.
精彩解读
【试题来源】例1:人教A版必修3A组T3改编;例2:人教A版选修2-3习题3.2A组T1改编.
【母题评析】本题考查三角函数的单调性、对称性,考查考生的分析问题解决问题的能力.
【思路方法】结合函数的周期性、单调性、对称性解题.
II.考场精彩·真题回放
【例1】【2017高考山东5】为了研究某班学生的脚长(单位:厘米)和身高(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出与之间有线性相关关系,设其回归直线方程为.
已知,,.该班某学生的脚长为24,据此估计其身高为 ( )
A. B. C. D.
【答案】C
【解析】由已知,故选C.
【例2】【2017高考课标II文19】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
(I)记表示事件“旧养殖法的箱产量低于50kg”,估计的概率;
(II)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg
箱产量≥50kg
旧养殖法
新养殖法
(III)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行较.
附:
【答案】(I)0.62;(II)有把握;(III)新养殖法优于旧养殖法.
试题解析:(I)旧养殖法的箱产量低于50kg的频率为
因此,事件的概率估计值为.
(II)根据箱产量的频率分布直方图得列联表
箱产量
箱产量
旧养殖法
62
38
新养殖法
34
66
,
由于,故有99%的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.
【命题意图】这类题主要考查线性相关与线性回归方程的求法与应用;在给出临界值的情况下判断两个变量是否相关.
【考试方向】这类试题在考查题型上,可以是选择题、填空题或解答题,难度中等.以选择、填空题的形式探究求线性回归系数以及利用线性回归方程进行预测,在解答题中与频率分布结合探究线性回归方程的建立及应用和独立性检验的应用.
【难点中心】
1.判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数公式求出,然后根据的大小进行判断.求线性回归方程时在严格按照公式求解时,一定要注意计算的准确性.
2.利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,随机变量的观测值值越大,说明“两个变量有关系”的可能性越大.
III.理论基础·解题原理
1.相关关系与回归分析
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数.21教育网
(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关;(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关;(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系.2-1-c-n-j-y
2.线性回归方程:
(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:,其回归方程为,则注意:线性回归直线经过定点.
相关系数:.
3.独立性检验
假设有两个分类变量X和Y,它们的值域分另为{x1,x2}和{y1,y2},其样本频数22列联表为:
总计
总计
若要推断的论述为:“与有关系”,可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度.www-2-1-cnjy-com
具体的做法是,由表中的数据算出随机变量的值,其中为样本容量,的值越大,说明“与有关系”成立的可能性越大.
随机变量越大,说明两个分类变量,关系越强;反之,越弱.
时,与无关;时,与有95%可能性有关;时,与有99%可能性有关.
IV.题型攻略·深度挖掘
【考试方向】
这类试题在考查题型上,可以是选择题、填空题或解答题,难度中等.以选择、填空题的形式探究求线性回归系数以及利用线性回归方程进行预测,在解答题中与频率分布结合探究线性回归方程的建立及应用和独立性检验的应用.【出处:21教育名师】
【技能方法】
(1)利用散点图判断两个变量是否有相关关系是比较直观简便的方法.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.2·1·c·n·j·y
(2)利用相关系数判定,当越趋近于1相关性越强.当残差平方和越小,相关指数越大,相关性越强.
(3)在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,也可计算相关系数进行判断.若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.
(4)正确运用计算的公式和准确的计算,是求线性回归方程的关键.并充分利用回归直线过样本点的中心进行求值.21教育名师原创作品
(5)在2×2列联表中,如果两个变量没有关系,则应满足ad-bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.
(6)解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
①根据样本数据制成2×2列联表:
②根据公式K2=计算K2的观测值k0;
③比较k0与临界值的大小关系,作统计推断.
【易错指导】
1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
2.独立性检验中统计量K2的观测值k0的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.
V.举一反三·触类旁通
考向1 变量间的相互关系
【例1】下列变量间的关系,是相关关系的为 ( )
①正方体的体积与棱长间的关系;
②一块农田的水稻产量与施肥量之间的关系;
③商品销售收入与其广告费支出之间的关系;
④人体内的脂肪含量与年龄之间的关系.
A.①②③ B.②③④ C.①②④ D.①③④
【答案】B
【解析】①,由正方体的棱长和体积的公式可知,正方体的体积等于棱长的立方,所以①是确定的函
【例2】【2018湖南张家界高三三模】已知变量,之间的线性回归方程为,且变量,之间的一组相关数据如下表所示,则下列说法错误的是( )21世纪教育网版权所有
6
8
10
12
6
3
2
A.变量,之间呈现负相关关系 B.可以预测,当时,
C. D.由表格数据知,该回归直线必过点
【答案】C
【解析】由题意得,由,得变量,之间呈负相关,故A正确;当时,则
,故B正确;由数据表格可知,
,则,解得,故C错;由数据表易知,数据中心为,故D正确.故选C.
【例3】【2018四川高三“联测促改”活动试题】某中学的兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图所示,则下列说法错误的是( )
A.沸点与海拔高度呈正相关 B.沸点与气压呈正相关
C.沸点与海拔高度呈负相关 D.沸点与海拔高度、 沸点与气压的相关性都很强
【答案】A
【解析】结合绘制的散点图可得:B.沸点与气压呈正相关;C.沸点与海拔高度呈负相关;结合BC选项的说法可知:A选项中:A.沸点与海拔高度呈负相关且:D.沸点与海拔高度、沸点与气压的相关性都很强.
故选A.
【跟踪练习】
1.下列不具有相关关系的是( )
A.单产不为常数时,土地面积和总产量
B.人的身高与体重
C.季节与学生的学习成绩
D.学生的学习态度与学习成绩
【答案】C
2.下列有关线性回归的说法中,不正确的是( )
A.变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图
C.线性回归直线方程最能代表观测值x,y之间的关系
D.任何一组观测值都能得到具有代表意义的回归直线方程
【答案】D
【解析】必须具有广泛性的观测值才能具有代表意义的回归直线方程.故选.
3.【2018四川广安高三上学期期末考试】对变量有观测数据,得散点图(1);对变量有观测数据(,得散点图(2),由这两个散点图可以判断( )
A.变量与正相关,与正相关 B.变量与正相关,与负相关
C.变量与负相关,与正相关 D.变量与负相关,与负相关
【答案】C
【解析】由图(1)可知,随的增大而减小,各点呈下降趋势,变量与负相关,由图(1)可知,随的增大而增大,各点呈上升趋势,变量与正相关,故选C.
4.【2018吉林长春十一中、东北师大附中、吉林一中,重庆一中等五校高三1月联合模拟】下列命题:①在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于1,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1;③在回归直线方程中,当解释变量每增加一个单位时,预报变量平均减少0.5个单位;④对分类变量与,它们的随机变量的观测值来说,越小,“与有关系”的把握程度越大.其中正确命题的个数是( )
A.1个 B.2个 C.3个 D.4个
【答案】C
【解析】对于①,在回归分析模型中,相关指数表示解释变量对于预报变量的贡献率,越因为在对分类变量与进行独立性检验时,随机变量的观测值越大,则“与相关”可信程度越大,故④错误;故选C.
考向2 线性回归方程及其应用
解题模板:第一步,根据题意画出散点图并判断两变量之间是正相关还是负相关;第二步,计算样本中心点并代入公式进行计算;第三步,得出变量间的相互关系——线性回归方程.
【例4】【2018发合肥二模】某公司一种型号的产品近期销售情况如下表
月份
2
3
4
5
6
销售额(万元)
15.1
16.3
17.0
17.2
18.4
根据上表可得到回归直线方程,据此估计,该公司7月份这种型号产品的销售额为( )
A.19.5万元 B.19.25万元 C.19.15万元 D.19.05万元
【答案】D
【解析】由题意可得:,,回归方
【例5】【2018河北保定高三一模】已知具有线性相关的变量,设其样本点为,回归直线方程为,若,( 为原点),则 ( )21*cnjy*com
A. B. C. D.
【答案】B
【解析】因为 ,所以,因此,选B.
【例6】【2018河北衡水中学高三十五模】某印刷厂为了研究单册书籍的成本(单位:元)与印刷册数(单位:千册)之间的关系,在印制某种书籍时进行了统计,相关数据见下表:
根据以上数据,技术人员分别借助甲、乙两种不同的回归模型,得到两个回归方程,方程甲:,方程乙:.
(I)为了评价两种模型的拟合效果,完成以下任务.
①完成下表(计算结果精确到0.1);
②分别计算模型甲与模型乙的残差平方和及,并通过比较的大小,判断哪个模型拟合效果更好.
(II)该书上市之后,受到广大读者热烈欢迎,不久便全部售罄,于是印刷厂决定进行二次印刷,根据市场调查,新需求量为10千册,若印刷厂以每册5元的价格将书籍出售给订货商,求印刷厂二次印刷10千册获得的利润?(按(I)中拟合效果较好的模型计算印刷单册书的成本).
【答案】(1)①.答案见解析;②.答案见解析;(2)33360元.
试题解析:
(I)经计算,可得下表:
②,,,故模型乙的拟合效果更好;
(II)二次印刷10千册,由(I)可知,单册书印刷成本为(元)
故印刷总成本为16640(元),印刷利润33360元.
【跟踪练习】
1.【2018山西省实验中学模拟】某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本.进行5次试验,收集到的数据如表:
由最小二乘法得到回归方程,则__________.
【答案】68
【解析】,,解得.
2.【2018湖南长沙长郡中学模拟】已知具有相关关系的两个变量之间的几组数据如下表所示:
(I)请根据上表数据在网格纸中绘制散点图;
(II)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程,并估计当时,的值;
(III)将表格中的数据看作五个点的坐标,从这五个点中随机抽取2个点,求这两个点都在直线的右下方的概率.
(参考公式:,)
3.【2018广西桂林、贺州、崇左三市高三第二次联合调研】某地区积极发展电商,通过近些年工作的开展在新农村建设和扶贫过程中起到了非常重要的作用,促进了农民生活富裕,为了更好地了解本地区某一特色产品的宣传费 (千元)对销量 (千件)的影响,统计了近六年的数据如下:
(I)若近6年的宣传费与销量呈线性分布,由前5年数据求线性回归直线方程,并写出的预测值;
(II)若利润与宣传费的比值不低于20的年份称为“吉祥年”,在这6个年份中任意选2个年份,求这2个年份均为“吉祥年”的概率
附:回归方程的斜率与截距的最小二乘法估计分别为,
,其中,为,的平均数.
【答案】(1) ,的预测值为82.5 (2)
【解析】【试题分析】(1)利用回归直线方程计算公式计算得回归直线方程,令,求得预测值为.(2)利用列举法和古典概型计算公式,计算得概率为.
∴回归直线方程为,将代入得∴的预测值为82.5.
(II)从6个年份中任取2个年份的情况为:,,,,,,,,,,,,,,,共15种.【来源:21·世纪·教育·网】
2个年份均为“吉祥年”的情况有:,,,,,,共6种.
∴6个年份中任意选个2个年份均为“吉祥年”的概率为.
考向3 独立性检验
解题模板:第一步,根据题意画出列联表;第二步,运用公式(其中)进行计算;第三步,根据已知表格判断两变量间的相互关联性,作统计推断.
【例7】【2018新疆乌鲁木齐高三第二次质量监测】近年来,我国电子商务蓬勃发展,有关部门推出了针对网购平台的商品和服务的评价系统,从该系统中随机选出100名交易者,并对其交易评价进行了统计,网购者对商品的满意率为0.6,对服务的满意率为0.75,其中对商品和服务都满意的有40人.
(I)根据已知条件完成下面的列联表,并回答能否有的把握认为“网购者对服务满意与对商品满意之间有关”?
对服务满意
对服务不满意
合计
对商品满意
对商品不满意
合计
(II)若对商品和服务都不满意者的集合为.已知中有2名男性,现从中任取2人调查其意见.求取到的2人恰好是一男一女的概率.
附: (其中为样本容量)
【答案】(I)没有的把握认为“网购者对服务满意与对商品满意之间有关”;(II).
【解析】试题分析:(I)根据题设中的数据,填写的列联表,利用公式求解的值,根据附表即可作出判断;
(II)由题意中有男 女,记作,从中任取人,得到基本事件的总数为种,其中“一男一女”共有种,利用古典概型的概率计算公式,即可求解相应的概率.
试题解析:(I)
∴没有的把握认为“网购者对服务满意与对商品满意之间有关”.
【方法点睛】本题主要考查古典概型概率公式、离散型随机变量的分布列与期望,以及独立性检验,属于难题.独立性检验的一般步骤:(I)根据样本数据制成列联表;(II)根据公式计算的值;(3) 查表比较与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)
【例8】【2018河南中原名校(即豫南九校)高三第六次质量考评】下表为2014年至2017年某百货零售企业的线下销售额(单位:万元),其中年份代码年份.
(I)已知与具有线性相关关系,求关于的线性回归方程,并预测2018年该百货零售企业的线下销售额;
(II)随着网络购物的飞速发展,有不少顾客对该百货零售企业的线下销售额持续增长表示怀疑,某调査平台为了解顾客对该百货零售企业的线下销售额持续增长的看法,随机调查了55位男顾客、50位女顾客(每位顾客从“持乐观态度”和“持不乐观态度”中任选一种),其中对该百货零售企业的线下销售额持续增长持乐观态度的男顾客有10人、女顾客有20人,能否在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关?
参考公式及数据:
,,,
【答案】(1) 预测2018年该百货零售企业的线下销售额为377.5万元,(2) 以在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续増长所持的态度与性别有关.
【解析】试题分析:(I)第(I)问,直接利用公式求出线性回归方程,再根据线性回归方程预测.(2)第(II)问,先完成2×2列联表,再求出的观测值,最后下结论.
由于,所以当时,,
所以预测2018年该百货零售企业的线下销售额为377.5万元.
(II)由题可得列联表如下:
故的观测值,由于,所以可以在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续増长所持的态度与性别有关.
【例9】【2018辽宁辽阳高三一模】“微信运动”是一个类似计步数据库的公众帐号,用户只需以运动手环或手机协处理器的运动教据为介,然后关注该公众号,就能看见自己与好友每日行走的步数,并在同一排行榜上得以体现,现随机选取朋友圈中的50人记录了他们某一天的走路步数,并将数据整理如下:
规定:人一天行走的步数超过8000步时被系统评定为“积极性”,否则为“懈怠性”.
(I)填写下面列联表(单位:人),并根据列联表判断是否有的把握认为“评定类型与性别有关”;
附:
(II)为了进一步了解“懈怠性”人群中每个人的生活习惯,从步行在的人群中再随机抽取3人,求选中的人中男性人数超过女性人数的概率.
【答案】(1) 没有的把握认为“评定类型与性别有关”(2)
【解析】试题分析:(I)根据题意完成列联表,计算,根据表格数据进行判断;(II)设步
试题解析:(I)根据题意完成下面的列联表:
根据列联表中的数据,得到
所以没有的把握认为“评定类型与性别有关”.
(II)设步行数在中的男性的编号为,,女性的编号为,,.
选取三位的所有情况为:,,,,,,,共中情形.符合条件的情况有:,,共种情形.故所求概率为.
【跟踪练习】
1.【2018宁夏吴忠市高三下学期高考模拟联考】近年空气质量逐步恶化,雾霾天气现象出现增多,大气污染危害加重.大气污染可引起心悸、呼吸困难等心肺疾病.为了解某市心肺疾病是否与性别有关,在某医院随机对心肺疾病入院的人进行问卷调查,得到了如下的列联表:
患心肺疾病
不患心肺疾病
合计
男
女
合计
(I)用分层抽样的方法在患心肺疾病的人群中抽人,其中男性抽多少人?
(II)在上述抽取的人中选人,求恰好有名女性的概率;
(III)为了研究心肺疾病是否与性别有关,请计算出统计量,你有多大把握认为心肺疾病与性别有关?
下面的临界值表供参考:
参考公式:,其中.
【答案】(I)见解析;(II);(III)有把握认为心肺疾病与性别有关
【解析】试题分析:(I)由列联表知,患心肺疾病的有30人,要抽取6人,用分层抽样的方法,则男别有关.21·世纪*教育网
试题解析:(I)在患心肺疾病的人群中抽人,其中男性抽人;
(II)设男分为:,,,;女分为:,,则人中抽出人的所有抽法:(列举略)共种抽法,其中恰好有名女性的抽法有种.所以恰好有个女生的概率为.21*cnjy*com
(III)由列联表得,查临界值表知:有把握认为心肺疾病与性别有关.
2.【2018山东济南高三一模】2018年2月22日上午,山东省省委、省政府在济南召开山东省全面展开新旧动能转换重大工程动员大会,会议动员各方力量,迅速全面展开新旧动能转换重大工程.某企业响应号召,对现有设备进行改造,为了分析设备改造前后的效果,现从设备改造前后生产的大量产品中各抽取了200件产品作为样本,检测一项质量指标值,若该项质量指标值落在内的产品视为合格品,否则为不合格品.图1是设备改造前的样本的频率分布直方图,表1是设备改造后的样本的频数分布表.
表1:设备改造后样本的频数分布表
质量指标值
频数
4
36
96
28
32
4
(I)完成下面的列联表,并判断是否有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关;【版权所有:21教育】
设备改造前
设备改造后
合计
合格品
不合格品
合计
(II)根据图1和表1提供的数据,试从产品合格率的角度对改造前后设备的优劣进行比较;
(III)根据市场调查,设备改造后,每生产一件合格品企业可获利180元,一件不合格品亏损 100元,用频率估计概率,则生产1000件产品企业大约能获利多少元?21cnjy.com
附:
0.150
0.100
0.050
0.025
0.010
2.072
2.706
3.841
5.024
6.635
【答案】(I)见解析;(II)见解析;(III)该企业大约获利168800元.
【解析】试题分析:(I)根基图1和图2得到列联表,将列联表中的数据代入公式计算出大约有960件合格品,40件不合格品,,所以该企业大约获利16800元.
试题解析:(I)根据图1和表1得到列联表:
设备改造前
设备改造后
合计
合格品
172
192
364
不合格品
28
8
36
合计
200
200
400
将列联表中的数据代入公式计算得:
.
∵,∴有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关.
(II)根据图1和表1可知,设备改造后产品为合格品的概率约为,设备改造前产品为合格品的概率约为;即设备改造后合格率更高,因此,设备改造后性能更好.
(III)用频率估计概率,1000件产品中大约有960件合格品,40件不合格品,
,所以该企业大约获利168800元.
【理科】3.【2018江西上饶高三下学期二模】随着节能减排意识深入人心以及共享单车在饶城的大范围推广,越来越多的市民在出行时喜欢选择骑行共享单车.为了研究广大市民在共享单车上的使用情况,某公司在我市随机抽取了100名用户进行调查,得到如下数据:
每周使用次数
1次
2次
3次
4次
5次
6次及以上
男
4
3
3
7
8
30
女
6
5
4
4
6
20
合计
10
8
7
11
14
50
(I)如果认为每周使用超过3次的用户为“喜欢骑行共享单车”,请完成列表(见答题卡),并判断能否在犯错误概率不超过0.05的前提下,认为是否“喜欢骑行共享单车”与性别有关?
(II)每周骑行共享单车6次及6次以上的用户称为“骑行达人”,视频率为概率,在我市所有“骑行达人”中,随机抽取4名用户.
① 求抽取的4名用户中,既有男生“骑行达人”又有女“骑行达人”的概率;
②为了鼓励女性用户使用共享单车,对抽出的女“骑行达人”每人奖励500元,记奖励总金额为,求的分布列及数学期望.
附表及公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(I)见解析;(II)见解析.
【解析】试题分析:(I)第(I)问,先求观测值公式中的基本量,再代入公式即可.(II)第(II)问第1小问,直接利用对立事件的概率公式解答,第(II)小问,根据二项分布,写出分布列求出期望.
试题解析:(I)由图中表格可得列联表如下:
不喜欢骑行共享单车
喜欢骑行共享单车
合计
男
10
45
55
女
15
30
45
合计
25
75
100
所以在犯错误概率不超过的前提下,不能认为是否“喜欢骑行共享单车”与性别有关.
(II)视频率为概率,在我市“骑行达人”中,随机抽取名用户,该用户为男“骑行达人”的概率为,女“骑行达人”的概率为.www.21-cn-jy.com
①抽取的名用户中,既有男“骑行达人”,又有女“骑行达人”的概率为
;
②记抽出的女“骑行达人”人数为,则.由题意得,
(), 的分布列为
0
1
2
3
4
的分布列为
0
500
1000
1500
2000
所以,所以的数学期望元.
【文科】3.【2018】【2018河北衡水中学届高三上学期七调】国内某知名大学有男生14000人,女生10000人.该校体育学院想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取120人,统计他们平均每天运动的时间(已知该校学生平均每天运动的时间范围是 ),如下表所示.
男生平均每天运动的时间分布情况:
女生平均每天运动的时间分布情况:
(I)假设同组中的每个数据均可用该组区间的中间值代替,请根据样本估算该校男生平均每天运动的时间(结果精确到0.1).21·cn·jy·com
(II)若规定平均每天运动的时间不少于的学生为“运动达人”,低于的学生为“非运动达人”.
(ⅰ)根据样本估算该校“运动达人”的数量;
(ⅱ)请根据上述表格中的统计数据填写下面列联表,并通过计算判断能否在犯错误的概率不超过0.05的前提下认为“运动达人”与性别有关.【来源:21cnj*y.co*m】
参考公式:,其中.
参考数据:
【答案】(I).(II)(ⅰ)4000(人).(ⅱ)见解析.
【解析】【试题分析】(1)根据分层抽样计算出男生抽取,女生抽取,由此计算出的值,并
【试题解析】(I)由题意得,抽取的男生人数为(人),抽取的女生人数为(人),故,.则估算该校男生平均每天运动的时间为,
所以该校男生平均每天运动的时间为.
(II)(ⅰ)样本中“运动达人”所占的比例是,
故估算该校“运动达人”有(人).
(ⅱ)由统计数据得:
根据上表,可得.
故不能在犯错误的概率不超过0.05的前提下认为“运动达人”与性别有关.