第八章 成对数据的统计分析-专项练习-人教A版(2019)高三一轮复习(Word含答案)

文档属性

名称 第八章 成对数据的统计分析-专项练习-人教A版(2019)高三一轮复习(Word含答案)
格式 zip
文件大小 251.0KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2022-07-29 12:33:17

图片预览

文档简介

第八章成对数据的统计分析
题号 一 二 三 总分
得分
一、单选题
在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()  .
A. 若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
B. 从独立性检验,可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病
C. 若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
D. 以上三种说法都不正确
在一个2×2列联表中,由其数据计算得,则其两个变量间有关系的可能性为( )
A. 99% B. 95% C. 90% D. 无关系
在下列各散点图中,两个变量具有正相关关系的是  
A. B.
C. D.
某学校开展研究性学习活动,某同学获得一组实验数据如下表:
x 1.99 3 4 5.1 6.12
y 1.5 4.04 7.5 12 18.01
对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是(  )
A. y=2x-2 B. y=()x C. y=log2x D. y=(x2-1)
某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算则在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关.( )
A. 0.001 B. 0.010 C. D.
下表是能耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨)煤的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程为=0.7 x+0.35,那么表中m的值为()
A. 4 B. 3.15 C. 4.5 D. 3
我国古代数学名著《孙子算经》中有如下问题:“今有三女,长女五日一归,中女四日一归,少女三日一归.问:三女何日相会?”意思是:“一家出嫁的三个女儿中,大女儿每五天回一次娘家,二女儿每四天回一次娘家,小女儿每三天回一次娘家.三个女儿从娘家同一天走后,至少再隔多少天三人再次相会?”若当地风俗正月初二都要回娘家,且回娘家当天均返回夫家,则从正月初三算起的一百天内,有女儿回娘家的天数有()
A. 58 B. 59 C. 60 D. 61
已知两个变量x,y线性相关,且根据观测到的数据(xi,yi)(i=1,2……n)计算样本平均数得,,则根据这组观测数据算得的线性回归方程不可能是( )
A. B. C. D.
为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( ).
A. l1和l2必定平行 B. l1与l2必定重合
C. l1和l2有交点(s,t) D. l1与l2相交,但交点不一定是(s,t)
下列说法错误的是()
A. 回归直线过点
B. 两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
C. 回归直线方程中,当变量每增加1个单位时,变量增加0.2个单位
D. 对变量X与Y, 的观测值越大,则判断“X与Y有关系”的把握程度越小
二、填空题
(1)一个袋中装有6个红球和4个白球(这10个球各不相同),不放回地依次摸出2个球,在第一次摸出红球的条件下,第二次摸出红球的概率为________.
(2)已知随机变量X服从正态分布且则P(X>2)= .
(3)下表是数据x,y的记录表,其中y关于x的线性回归方程是,那么表中t的值是__________.
(4)的展开式中,x2的系数为__________(用数字作答).
下列命题中,正确的命题有__________.
①回归直线恒过样本点的中心,且至少过一个样本点;
②将一组数据的每个数据都加一个相同的常数后,方差不变;
③用相关指数来刻面回归效果,越接近于1,说明模型的拟合效果越好;
④若分类变量和的随机变量的观测值越大,则“与相关”的可信程度越小;
⑤.对于自变量和因变量,当取值一定时,的取值具有一定的随机性,,间的这种非确定关系叫做函数关系;
⑥.残差图中残差点比较均匀的地落在水平的带状区域中,说明选用的模型比较合适;
⑦.两个模型中残差平方和越小的模型拟合的效果越好.
以下四个命题中:
①某地市高三理科学生有15000名,在一次调研测试中,数学成绩ξ服从正态分布N(100,σ2),已知P(80<ξ≤100)=0.40,若按成绩分层抽样的方式抽取100分试卷进行分析,则应从120分以上(包括120分)的试卷中抽取15分;②用样本相关系数来刻画回归效果时,||越小,说明两个变量相关性越强③在[-4,3]上随机取一个数m,能使函数在R上有零点的概率为;④在某次飞行航程中遭遇恶劣气候,用分层抽样的20名男乘客中有5名晕机,12名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用独立性检验,有97%以上的把握认为与性别有关.
P(K2≥k) 0.15 0.1 0.05 0.025
k 2.072 2.706 3.841 5.024
其中真命题的序号为_________.参考公式:
下表是某厂1~4月份用水量(单位:百吨)的一组数据,
月份 1 2 3 4
用水量 4.5 4 3 2.5
由其散点图可知,用水量与月份之间有较好的线性相关关系,其线性回归方程是,则=______________。
为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到2×2列联表:
喜欢 不喜欢 总计
男 15 10 25
女 5 20 25
总计 20 30 50
附表:
P(K2≥k0) 0.010 0.005 0.001
k0 6.635 7.879 10.828
(参考公式k2=,( n=a+b+c+d)
则有      以上的把握认为“喜欢足球与性别有关”.
三、解答题
根据淘宝、天猫的调查统计显示,调查的100名网购者的年龄(单位:岁)情况如图所示,已知中间三个年龄段的网购者人数成等差数列.将高于50岁的网购者称为“老年网购者”,并将有关性别的信息统计到表中.
“老年网购者” 非“老年网购者” 合计
男 10 30

合计
(Ⅰ)根据图表信息,判断是否有95%的把握认为“老年网购者”与性别有关?
(Ⅱ)为鼓励大家网上购物,该平台常采用购物就发放代金券的方法进行促销,具体做法如下:年龄在[30,50)岁的每人发放20元,其余年龄段的每人发放50元,现按发放代金券的金额采用分层抽样的方式从参与调查的100名网购者中抽取5人,并在这5人中随机抽取3人进行回访调查,求此3人获得代金券的金额总和为90元的概率;
(Ⅲ)由于网购者每周的消费金额y与年龄x成线性相关,每组数据以组中值为代表,所以根据调查结果进行了线性回归分析,得到回归方程为,如果100名网购者每周的平均消费金额是1100元,那么请判断下列说法的正误,并说明理由:
①b=1310;
②由于回归方程的斜率是负的,说明年龄越大的网购者,每周消费金额一定越少;
③由于回归直线方程的斜率是负的,说明两个变量的相关关系是负相关;
④回归直线是所有直线中穿过数据点最多的直线;
⑤能够算出回归方程,说明两个变量之间确实是线性相关关系.
附:.
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
某种新产品投放市场一段时间后,经过调研获得了时间(天数)与销售单价(元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如图)
表中,.
(1)根据散点图判断,与哪一个更适宜作价格关于时间的回归方程类型?(不必说明理由)
(2)根据判断结果和表中数据,建立关于的回归方程;
(3)若该产品的日销售量(件)与时间的函数关系为(),求该产品投放市场第几天的销售额最高?最高为多少元?(结果保留整数)
附:对于一组数据,,,,,其回归直线的斜率和截距的最小二乘估计分别为,.
某手机厂商推出一款吋大屏手机,现对名该手机使用者(名女性,名男性)进行调查,对手机进行打分,打分的频数分布表如下:
女性用户:
分值区间
频数
男性用户:
分值区间
频数
(Ⅰ)完成下列频率分布直方图,并比较女性用户和男性用户评分的波动大小(不要求计算具体值,给出结论即可);
(Ⅱ)分别求女性用户评分的众数,男性用户评分的中位数;
(Ⅲ)如果评分不低于分,就表示该用户对手机“认可”,否则就表示“不认可”,完成下列列联表,并回答是否有的把握认为性别和对手机的“认可”有关;
女性用户 男性用户 合计
“认可”手机
“不认可”手机
合计
附:
为推动实施健康中国战略,树立国家大卫生、大健康理念.手机APP也推出的多款健康运动软件,如“微信运动”.杨老师的微信朋友圈内有600位好友参与了“微信运动”.他随机选取了40位好友(女20人,男20人),统计他们在某一天的走路步数作为样本.其中,女性好友的走路步数数据记录如下:
5860 8520 7326 6798 7325
8430 3216 7453 11754 9860
8753 6450 7290 4850 10223
9763 7988 9176 6421 5980
男性好友走路的步数情况可分为五个类别:
A(0~2000步)(说明:“0~2000”表示大于等于0,小于等于2000,下同),B(2001~5000步),C(5001~8000步),D(8001~10000步),E(10001步及以上),且B,D,E三种类型人数比例1︰3︰4,将统计结果绘制成如图所示的柱状图.
若某人一天的走路步数超过8000被系统认定为“卫健型”,否则被系统认定为“进步型”.
(1)若以杨老师抽取的好友当天行走步数的频率分布来估计所有微信好友每日走路步数的概率分布,请估计杨老师的微信朋友圈里参与“微信运动”的600名好友中,每天走路步数在5001~10000步的人数;
(2)请根据选取的样本数据完成下面的2×2列联表,并据此判断能否有95%以上的把握认为“认定类型”与“性别”有关
卫健型 讲步型 总计
男 20
女 20
总计 40
(3)若按系统认定类型从选取的样本数据中在男性好友中按比例选取10人,从中任意选取3人,记选到“卫健型”的人数为x;女性好友中按比例选取5人,从中任意选取2人,记选到“卫健型”的人数为y,求事件“|x-y|>1”的概率.
附:,
P(x2>k) 0.10 0.05 0.025 0.010
k 2.706 3.841 5.024 6.635
近年来,某地区积极践行“绿水青山就是金山银山”的绿色发展理念,2012年年初至2018年年初,该地区绿化面积(单位:平方公里)的数据如下表:
年份 2012 2013 2014 2015 2016 2017 2018
年份代号t 1 2 3 4 5 6 7
绿化面积y 2.9 3.3 3.6 4.4 4.8 5.2 5.9
(1)求关于的线性回归方程;
(2)利用(1)中的回归方程,预测该地区2022年年初的绿化面积.
(回归直线的斜率与截距的最小二乘法公式分别为:)
某高中学校对全体学生进行体育达标测试,每人测试A、B两个项目,每个项目满分均为60分.从全体学生中随机抽取了100人,分别统计他们A、B两个项目的测试成绩,得到A项目测试成绩的频率分布直方图和B项目测试成绩的频数分布表如下:
B项目测试成绩频数分布表
分数区间 频数
[0,10) 2
[10,20) 3
[20,30) 5
[30,40) 15
[40,50) 40
[50,60] 35
将学生的成绩划分为三个等级如下表:
分数 [0,30) [30,50) [50,60]
等级 -般 良好 优秀
(1)在抽取的100人中,求A项目等级为优秀的人数;
(2)已知A项目等级为优秀的学生中女生有14人,A项目等级为一般或良好的学生中女生有34人,试完成下列2×2列联表,并分析是否有95%以上的把握认为“A项目等级为优秀”与性别有关?
参考数据:
P(K2≥k) 0.10 0.050 0.025 0.010 0.001
k 2.706 3.841 5.024 6.635 10.828
优秀 -般或良好 合计
男生
女生
合计
参考公式;,其中n=a+b+c+d.
(3)将样本的频率作为总体的概率,并假设A项目和B项目测试成绩互不影响,现从该校学生中随机抽取1人进行调查,试估计其A项目等级比B项目等级高的概率.
1.【答案】C
2.【答案】A
3.【答案】D
4.【答案】D
5.【答案】B
6.【答案】D
7.【答案】C
8.【答案】D
9.【答案】C
10.【答案】D
11.【答案】(1);
(2)0.1;
(3)3;
(4)109

12.【答案】②③⑥⑦
13.【答案】③④
14.【答案】5.25
15.【答案】99.5%
16.【答案】解:(Ⅰ)由频率分布直方图知“老年网购者”的频率为0.25,则调查的100名网购者中有25人是“老年网购者”,得2×2列联表为
“老年网购者” 非“老年网购者” 合计
男 10 20 30
女 15 55 70
合计 25 75 100
∴,
故没有95%的把握认为“老年网购者”与性别有关.
(Ⅱ)由频率分布直方图可知m+n=0.1-0.015×2-0.01=0.06,
∵中间三个年龄段的网购者人数成等差数列,
∴m+0.015=2n,
故可解得:m=0.035,n=0.025.
利用分层抽样的方式从100名网购者中抽取5人,
根据频率分布直方图,可得年龄在[30,50)岁的频率为10×0.035+10×0.025=0.6.
因此抽取的5人年龄在[30,50)岁的人数为5×0.6=3,
记为A1,A2,A3,其余年龄段的有2人,记为B1,B2,
从这5人中抽取3人所有等可能的情况有A1A2A3,A1A2B1,A1A2B2,A1A3B1,A1A3B2,A2A3B1,A2A3B2,A1B1B2,A2B1B2,A3B1B2,共10种,
3人获得代金券的记为A1,A2,A3,有A1A2B1,A1A2B2,A1A3B1,A1A3B2,A2A3B1,A2A3B2,共6种,
∴满足条件的概率.
(Ⅲ)∵网购者年龄的平均数为0.15×25+0.35×35+0.25×45+0.15×55+0.10×65=42,
∴1100=-5×42+b,
∴b=1310,
∴①正确;
由于回归方程的斜率是负的,说明年龄越大的网购者,每周平均消费金额会越少,但不是一定变少,
∴②错误;
由于回归直线方程的斜率是负的,说明两个变量的相关关系是负相关,
∴③正确;
回归直线一定经过点,可能不经过任何数据点,∴④错误;
能够算出回归方程,不能说明两个变量之间确实是线性相关关系,两个变量是不是成线性相关关系还要看相关系数的大小,
∴⑤任何两个相关变量总能算出回归方程,不代表两个变量之间确实是线性相关关系.错误.
故①③正确,②④⑤错误.

17.【答案】解:(1)由散点图可以判断适合作价格y关于时间x的回归方程类型;
(2)令,先建立y关于w的线性回归方程,由,
,
关于w的线性方程为,
关于x的线性方程为;
(3)日销售额,
令,则有,
当,即x=8时,销售额最大.
时,有最大值1266元,
即该产品投放市场第8天的销售额最高,最高为1266 元.
18.【答案】(Ⅰ)女性用户和男性用户的频率分布直方图分别如下左、右图:
由图可得女性用户的波动小,男性用户的波动大;
(Ⅱ)由女性用户频率分布直方图知,女性用户评分的众数为75,
在男性用户频率分布直方图中,中位数两边的面积相等,
设中位数为,则,
∴,
∴;
(Ⅲ)列联表如下图:
女性用户 男性用户 合计
“认可”手机 140 180 320
“不认可”手机 60 120 180
合计 200 300 500
,
∴有的把握认为性别和对手机的“认可”有关.

19.【答案】解:(1)在样本数据中,男性朋友B类别设为x人,则由题意可知1+x+3+3x+4x=20,可知x=2,故B类别有2人,D类别有6人,E类别有8人,走路步数在5000~10000步的包括C、D两类别共计9人;女性朋友走路步数在5000~10000步共有16人.
用样本数据估计所有微信好友每日走路步数的概率分布,则:
人.
(2)根据题意在抽取的40个样本数据的2×2列联表:
卫健型 进步型 总计
男 14 6 20
女 8 12 20
总计 22 18 40
得,
故没有95%以上的把握认为“评定类型”与“性别”有关.
(3)在男性好友中“卫健型”与“进步型”的比例为7︰3,则选取10人,恰好选取“卫健型”7人,“进步型”3人;在女性好友中“卫健型”与“进步型”的比例为2︰3,选取5人,恰好选取“卫健型”2人,“进步型”3人;
“|x-y|>1”包含“x=3,y=1”,“x=3,y=0”,“x=2,y=0”,“x=0,y=2”,
,,
,,
故.

20.【答案】解:(1), ,
线性回归方程为;
(2)将2022年年号11代入,预测绿化面积为7.8平方公里.

21.【答案】解:(1)∵由A项目测试成绩的频率分布直方图,
∴得A项目等级为优秀的频率为0.04×10=0.4,
∴A项目等级为优秀的人数为0.4×100=40;
(2)∵由(1)知:A项目等级为优秀的学生中,女生数为14人,男生数为26人,
A项目等级为一般或良好的学生中,女生数为34人,男生数为26人,
∴作出2×2列联表:
优秀 一般或良好 合计
男生数 26 26 52
女生数 14 34 48
合计 40 60 100
∴计算,
∵K2>3.841,
∴有95%以上的把握认为“A项目等级为优秀”与性别有关;
(3)∵设“A项目等级比B项目等级高”为事件C,
记“A项目等级为良好”为事件A1,
“A项目等级为优秀”为事件A2,
“B项目等级为一般”为事件B,
“B项目等级为良好”为事件B1,
∴P(A1)=(0.02+0.02)×10=0.4,
P(A2)=0.4,
∴由频率估计概率得:,

∵事件Ai与Bi相互独立,其中i=1,2,j=0,1,
∴P(C)=P(A1B+A2B1+A2B),
=0.4×0.1+0.4×0.1+0.4×0.55=0.3,
∴随机抽取一名学生其A项目等级比B项目等级高的概率为0.3.

第6页,共8页
第7页,共8页