第8章成对数据的统计分析章节练习
一、单选题
1.某统计部门对四组数据进行统计分析后,获得如图所示的散点图.
下面关于相关系数的比较,正确的是( )
A. B. C. D.
2.下列命题:
①在线性回归模型中,用相关指数来刻画回归效果,越小,则残差平方和越小,说明拟合效果越好;
②对两个变量和进行回归分析,若相关系数为 r=-0.9462则变量和之间具有线性相关关系;
③在回归直线方程中,当解释变量每增加一个单位时,预报变量平均增加0.5个单位;
④对于两个分类变量与,它们的随机变量的观测值越小,“与有关系”的把握程度越大.
其中不正确命题的个数是( )
A.1个 B.2个 C.3个 D.4个
3.某班班主任对全班名学生学习积极性和对待班级工作的态度进行了调查,统计数据如表所示:
积极参加班级工作 不太主动参加班级工作 合计
学习积极性高
学习积极性一般
合计
临界值表:
根据表中数据分析,以下说法正确的是( )A.有的把握认为学生的学习积极性与对待班级工作的态度有关系
B.有的把握认为学生的学习积极性与对待班级工作的态度有关系
C.有的把握认为学生的学习积极性与对待班级工作的态度有关系
D.没有充分的证据显示学生的学习积极性对待班级工作的态度有关系
4.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:
x 2 4 5 6 8
y 30 40 50 m 60
根据表中的全部数据,用最小二乘法得出y与x的线性回归方程为=6.5x+17.5,则表中m的值为( )A.45 B.50
C.55 D.70
5.某校学生会为研究该校学生的性别与语文、数学、英语成绩这个变量之间的关系,随机抽查了名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中
A.语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
B.数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
C.英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
D.英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
6.某工厂为了对研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x元 9 9.2 9.4 9.6 9.8 10
销量y件 100 94 93 90 85 78
(附:对于一组数据(x1,y1),(x2,y2)…(xn,yn),其回归直线的斜率的最小二乘估计值为参考数值:,);预计在今后的销售中,销量与单价仍然服从这种线性相关关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为( )A.9.4元 B.9.5元 C.9.6元 D.9.7元
7.下列说法正确的是( )
A.设,则
B.已知随机变量服从正态分布,,则
C.随机变量,若,且,则
D.以模型拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则,的值分别是和
8.某产品的广告费用与销售额的统计数据如下表:
广告费用(万元) 4 2 3 5
销售额(万元) 49 26 39 54
根据上表可得回归方程中的为9.4,据此模型预报广告费用为7万元时销售额为( )A.73万元 B.81.4万元 C.77.1万元 D.74.9万元
二、多选题
9.(多选)为了检验变量与的线性相关程度,由样本点、、、,求得两个变量的样本相关系数为,则下列说法正确的是( )
A.若所有样本点都在直线上,则
B.若所有样本点都在直线上,则
C.若越大,则变量与的线性相关程度越强
D.若越小,则变量与的线性相关程度越强
10.卡塔尔足球世界杯比赛于2022年11月揭开战幕,随机询问100人是否喜欢足球,得到如下的列联表:
喜欢足球 不喜欢足球 总计
男 35 15 50
女 25 25 50
总计 60 40 100
参考公式(其中)
常用小概率值和临界值表:
0.05 0.010 0.005
3.841 6.635 7.879
参照临界值表,下列结论正确的是( )A.根据小概率值的独立性检验,有95%的把握认为“喜欢足球与性别无关”
B.根据小概率值的独立性检验,有95%的把握认为“喜欢足球与性别有关”
C.根据小概率值的独立性检验,认为“喜欢足球与性别有关”
D.根据小概率值的独立性检验,认为“喜欢足球与性别无关”
11.给出下列命题,其中正确的命题有( )
A.若,则是纯虚数
B.随机变量,若,则
C.公共汽车上有位乘客,沿途个车站,乘客下车的可能方式有种
D.回归方程为中,变量与具有正的线性相关关系
E.,,,则
12.下列命题中正确的是( ).
A.一组从小到大排列的数据0,1,3,4,6,7,9,x,11,11,去掉x与不去掉x,它们的80%分位数都不变,则
B.两组数据,,,…,与,,,…,,设它们的平均值分别为与,将它们合并在一起,则总体的平均值为
C.已知离散型随机变量,则
D.线性回归模型中,相关系数r的值越大,则这两个变量线性相关性越强
三、填空题
13.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为________.
14.在西非“埃博拉病毒"的传播速度很快,这已经成为全球性的威胁,为了考查某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:
感染 未感染 合计
服用 10 40 50
未服用 20 30 50
合计 30 70 100
附:
0.100 0.050 0.025 0.010
2.706 3.841 5.024 6.635
根据上表,有________的把握认为“小动物是否感染与服用疫苗有关”.
15.邢台市物价部门对市区的天一城、北国商城、恒大城、家乐园、中北世纪城5家商场的某件商品在7月15号一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:
价格 8.5 9 11 11.5
销售量 12 6 7 5
已知销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的______.
16.2019年7月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:
价格 9 9.5 10.5 11
销售量 11 8 6 5
可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的______.
四、解答题
17.某公司的广告费支出与销售额(单位:万元)之间有下列对应数据,且与线性相关.
2 4 5 6 8
30 40 60 50 70
根据表中提供的数据得到线性回归方程中的b=6.5.
(1)求的值.
(2)预测销售额为115万元时,大约需要多少万元的广告费?
18.某生物研究所研发了某种型号的新冠疫苗,为检验该种型号疫苗的效果,研究所将疫苗用在小白鼠身上进行科研实验,得到如下数据:
未感染病毒 感染病毒 总计
未注射疫苗 60
注射疫苗 30
总计 110 90 200
从未注射疫苗的小白鼠中任取1只,取到“未感染病毒”的小白鼠的概率为.
(1)能否有的把握认为注射此疫苗有效?
(2)在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例抽取6只进行病理分析,然后从这6只小白鼠中随机抽取2只对注射疫苗的情况进行核实,求至少有1只为注射过疫苗的概率.
附:.
0.05 0.025 0.010 0.005 0.001
3.841 5.024 6.635 7.879 10.828
19.为了解青少年的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表:
(1)将列联表补充完整;
常喝 不常喝 总计
肥胖 6 2
不肥胖 18
总计 30
(2)是否能在犯错误的概率不超过0.5%的前提下认为肥胖与常喝碳酸饮料有关?请说明你的理由.
P(K2>k) 0.100 0.050 0.025 0.010 0.005 0.001
k 2.706 3.841 5.024 6.635 7.879 10.828
附:,n=a+b+c+d,
20.2009年6月28日,由上海唐人电影制作有限公司出品,根据国产单机游戏改编的同名古装玄幻电视剧《仙剑奇侠传三》在台州三套公共财富频道全国首播,那个暑假,景天、雪见、紫萱、徐长卿、重楼等主角深深刻在大家的脑海中.剧中的紫萱是女娲后人,本体为蛇.追求她的徐长卿和重楼本为两种药材名,都对治疗蛇毒有奇效,只是徐长卿的效果更好.某药材批发商欲购进徐长卿与重楼两种药材,已知该药材批发商每年只购进其中一种,购买徐长卿和重楼的概率分别为和,购买两种药材之间相互独立.
(1)求该药材批发商从2019年至2022年中至少有两年购进徐长卿的概率;
(2)近年来,随着重楼的药用潜力被不断开发,野生的重楼资源已经满足不了市场的需求,越来越多的人开始“家种”重楼,某单位统计了近几年家种重楼年产量y(单位:吨),统计结果如图所示.根据表中的统计数据,求出y关于x的线性回归方程;
年份 2014 2015 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5 6 7
年产量y/吨 130 180 320 390 460 550 630
(3)根据(2)中所求方程,预测2022年家种重楼的产量.
附:回归方程中斜率和截距的最小二乘估计公式分别为,.
21.国际学生评估项目(PISA),是经济合作与发展组织(OECD)举办的,该项目的内容是对15岁学生的阅读、数学、科学能力进行评价研究.在2018年的79个参测国家(地区)的抽样测试中,中国四省市(北京、上海、江苏、浙江作为一个整体在所有参测国家(地区)取得全部3项科目中第一的好成绩,某机构为了分析测试结果优劣的原因,从参加测试的中国学生中随机抽取了200名参赛选手进行调研,得到如下统计数据:
成绩优秀 成绩一般 总计
家长高度重视学生教育 90 x y
家长重视学生教育度一般 30 z
总计 120 80 200
若从上表“家长高度重视学生教育”的参测选手中随机抽取一人,则选到的是“成绩一般”的选手的概率为.
(1)判断是否有99.9%的把握认为“学生取得的成绩情况”与“家长对学生的教育重视程度”有关;
(2)现从成绩优秀的选手中按照分层抽样的方法抽取20人.进行“家长对学生情感支持”的调查,再从这20人中抽取3人进行“学生家庭教育资源保障”的调查.记进行“学生家庭教育资源保障”调查中抽取到“家长高度重视学生教育”的人数为X,求X的分布列和数学期望.
附,.
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
22.经国际卫生组织对大量不同年龄的人群进行血压调查,得出随年龄变化,收缩压的标准值变化情况如下表:
年龄x/岁 28 32 38 42 48 52 58 62
收缩压y/mmHg 114 118 122 127 129 135 140 147
参考数据:,.
(1)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程;(,的值精确到0.01)
(2)若规定,一个人的收缩压为标准值的0.9~1.06倍,则为血压正常人群;收缩压为标准值的1.06~1.12倍,则为轻度高血压人群;收缩压为标准值的1.12~1.20倍,则为中度高血压人群;收缩压为标准值的1.20倍及以上,则为高度高血压人群.一位收缩压为180mmHg的70岁老人,属于哪类人群?(注:0.9~1.06是指大于等于0.9小于1.06)第8章成对数据的统计分析章节练习解析版
一、单选题
1.某统计部门对四组数据进行统计分析后,获得如图所示的散点图.
下面关于相关系数的比较,正确的是( )
A. B. C. D.
2.下列命题:
①在线性回归模型中,用相关指数来刻画回归效果,越小,则残差平方和越小,说明拟合效果越好;
②对两个变量和进行回归分析,若相关系数为 r=-0.9462则变量和之间具有线性相关关系;
③在回归直线方程中,当解释变量每增加一个单位时,预报变量平均增加0.5个单位;
④对于两个分类变量与,它们的随机变量的观测值越小,“与有关系”的把握程度越大.
其中不正确命题的个数是( )
A.1个 B.2个 C.3个 D.4个
3.某班班主任对全班名学生学习积极性和对待班级工作的态度进行了调查,统计数据如表所示:
积极参加班级工作 不太主动参加班级工作 合计
学习积极性高
学习积极性一般
合计
临界值表:
根据表中数据分析,以下说法正确的是( )A.有的把握认为学生的学习积极性与对待班级工作的态度有关系
B.有的把握认为学生的学习积极性与对待班级工作的态度有关系
C.有的把握认为学生的学习积极性与对待班级工作的态度有关系
D.没有充分的证据显示学生的学习积极性对待班级工作的态度有关系
4.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:
x 2 4 5 6 8
y 30 40 50 m 60
根据表中的全部数据,用最小二乘法得出y与x的线性回归方程为=6.5x+17.5,则表中m的值为( )A.45 B.50
C.55 D.70
5.某校学生会为研究该校学生的性别与语文、数学、英语成绩这个变量之间的关系,随机抽查了名学生,得到某次期末考试的成绩数据如表1至表3,根据表中数据可知该校学生语文、数学、英语这三门学科中
A.语文成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
B.数学成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
C.英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小
D.英语成绩与性别有关联性的可能性最大,数学成绩与性别有关联性的可能性最小
6.某工厂为了对研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x元 9 9.2 9.4 9.6 9.8 10
销量y件 100 94 93 90 85 78
(附:对于一组数据(x1,y1),(x2,y2)…(xn,yn),其回归直线的斜率的最小二乘估计值为参考数值:,);预计在今后的销售中,销量与单价仍然服从这种线性相关关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为( )A.9.4元 B.9.5元 C.9.6元 D.9.7元
7.下列说法正确的是( )
A.设,则
B.已知随机变量服从正态分布,,则
C.随机变量,若,且,则
D.以模型拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则,的值分别是和
8.某产品的广告费用与销售额的统计数据如下表:
广告费用(万元) 4 2 3 5
销售额(万元) 49 26 39 54
根据上表可得回归方程中的为9.4,据此模型预报广告费用为7万元时销售额为( )A.73万元 B.81.4万元 C.77.1万元 D.74.9万元
二、多选题
9.(多选)为了检验变量与的线性相关程度,由样本点、、、,求得两个变量的样本相关系数为,则下列说法正确的是( )
A.若所有样本点都在直线上,则
B.若所有样本点都在直线上,则
C.若越大,则变量与的线性相关程度越强
D.若越小,则变量与的线性相关程度越强
10.卡塔尔足球世界杯比赛于2022年11月揭开战幕,随机询问100人是否喜欢足球,得到如下的列联表:
喜欢足球 不喜欢足球 总计
男 35 15 50
女 25 25 50
总计 60 40 100
参考公式(其中)
常用小概率值和临界值表:
0.05 0.010 0.005
3.841 6.635 7.879
参照临界值表,下列结论正确的是( )A.根据小概率值的独立性检验,有95%的把握认为“喜欢足球与性别无关”
B.根据小概率值的独立性检验,有95%的把握认为“喜欢足球与性别有关”
C.根据小概率值的独立性检验,认为“喜欢足球与性别有关”
D.根据小概率值的独立性检验,认为“喜欢足球与性别无关”
11.给出下列命题,其中正确的命题有( )
A.若,则是纯虚数
B.随机变量,若,则
C.公共汽车上有位乘客,沿途个车站,乘客下车的可能方式有种
D.回归方程为中,变量与具有正的线性相关关系
E.,,,则
12.下列命题中正确的是( ).
A.一组从小到大排列的数据0,1,3,4,6,7,9,x,11,11,去掉x与不去掉x,它们的80%分位数都不变,则
B.两组数据,,,…,与,,,…,,设它们的平均值分别为与,将它们合并在一起,则总体的平均值为
C.已知离散型随机变量,则
D.线性回归模型中,相关系数r的值越大,则这两个变量线性相关性越强
三、填空题
13.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为________.
14.在西非“埃博拉病毒"的传播速度很快,这已经成为全球性的威胁,为了考查某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:
感染 未感染 合计
服用 10 40 50
未服用 20 30 50
合计 30 70 100
附:
0.100 0.050 0.025 0.010
2.706 3.841 5.024 6.635
根据上表,有________的把握认为“小动物是否感染与服用疫苗有关”.
15.邢台市物价部门对市区的天一城、北国商城、恒大城、家乐园、中北世纪城5家商场的某件商品在7月15号一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:
价格 8.5 9 11 11.5
销售量 12 6 7 5
已知销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的______.
16.2019年7月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:
价格 9 9.5 10.5 11
销售量 11 8 6 5
可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的______.
四、解答题
17.某公司的广告费支出与销售额(单位:万元)之间有下列对应数据,且与线性相关.
2 4 5 6 8
30 40 60 50 70
根据表中提供的数据得到线性回归方程中的b=6.5.
(1)求的值.
(2)预测销售额为115万元时,大约需要多少万元的广告费?
18.某生物研究所研发了某种型号的新冠疫苗,为检验该种型号疫苗的效果,研究所将疫苗用在小白鼠身上进行科研实验,得到如下数据:
未感染病毒 感染病毒 总计
未注射疫苗 60
注射疫苗 30
总计 110 90 200
从未注射疫苗的小白鼠中任取1只,取到“未感染病毒”的小白鼠的概率为.
(1)能否有的把握认为注射此疫苗有效?
(2)在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例抽取6只进行病理分析,然后从这6只小白鼠中随机抽取2只对注射疫苗的情况进行核实,求至少有1只为注射过疫苗的概率.
附:.
0.05 0.025 0.010 0.005 0.001
3.841 5.024 6.635 7.879 10.828
19.为了解青少年的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表:
(1)将列联表补充完整;
常喝 不常喝 总计
肥胖 6 2
不肥胖 18
总计 30
(2)是否能在犯错误的概率不超过0.5%的前提下认为肥胖与常喝碳酸饮料有关?请说明你的理由.
P(K2>k) 0.100 0.050 0.025 0.010 0.005 0.001
k 2.706 3.841 5.024 6.635 7.879 10.828
附:,n=a+b+c+d,
20.2009年6月28日,由上海唐人电影制作有限公司出品,根据国产单机游戏改编的同名古装玄幻电视剧《仙剑奇侠传三》在台州三套公共财富频道全国首播,那个暑假,景天、雪见、紫萱、徐长卿、重楼等主角深深刻在大家的脑海中.剧中的紫萱是女娲后人,本体为蛇.追求她的徐长卿和重楼本为两种药材名,都对治疗蛇毒有奇效,只是徐长卿的效果更好.某药材批发商欲购进徐长卿与重楼两种药材,已知该药材批发商每年只购进其中一种,购买徐长卿和重楼的概率分别为和,购买两种药材之间相互独立.
(1)求该药材批发商从2019年至2022年中至少有两年购进徐长卿的概率;
(2)近年来,随着重楼的药用潜力被不断开发,野生的重楼资源已经满足不了市场的需求,越来越多的人开始“家种”重楼,某单位统计了近几年家种重楼年产量y(单位:吨),统计结果如图所示.根据表中的统计数据,求出y关于x的线性回归方程;
年份 2014 2015 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5 6 7
年产量y/吨 130 180 320 390 460 550 630
(3)根据(2)中所求方程,预测2022年家种重楼的产量.
附:回归方程中斜率和截距的最小二乘估计公式分别为,.
21.国际学生评估项目(PISA),是经济合作与发展组织(OECD)举办的,该项目的内容是对15岁学生的阅读、数学、科学能力进行评价研究.在2018年的79个参测国家(地区)的抽样测试中,中国四省市(北京、上海、江苏、浙江作为一个整体在所有参测国家(地区)取得全部3项科目中第一的好成绩,某机构为了分析测试结果优劣的原因,从参加测试的中国学生中随机抽取了200名参赛选手进行调研,得到如下统计数据:
成绩优秀 成绩一般 总计
家长高度重视学生教育 90 x y
家长重视学生教育度一般 30 z
总计 120 80 200
若从上表“家长高度重视学生教育”的参测选手中随机抽取一人,则选到的是“成绩一般”的选手的概率为.
(1)判断是否有99.9%的把握认为“学生取得的成绩情况”与“家长对学生的教育重视程度”有关;
(2)现从成绩优秀的选手中按照分层抽样的方法抽取20人.进行“家长对学生情感支持”的调查,再从这20人中抽取3人进行“学生家庭教育资源保障”的调查.记进行“学生家庭教育资源保障”调查中抽取到“家长高度重视学生教育”的人数为X,求X的分布列和数学期望.
附,.
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
22.经国际卫生组织对大量不同年龄的人群进行血压调查,得出随年龄变化,收缩压的标准值变化情况如下表:
年龄x/岁 28 32 38 42 48 52 58 62
收缩压y/mmHg 114 118 122 127 129 135 140 147
参考数据:,.
(1)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程;(,的值精确到0.01)
(2)若规定,一个人的收缩压为标准值的0.9~1.06倍,则为血压正常人群;收缩压为标准值的1.06~1.12倍,则为轻度高血压人群;收缩压为标准值的1.12~1.20倍,则为中度高血压人群;收缩压为标准值的1.20倍及以上,则为高度高血压人群.一位收缩压为180mmHg的70岁老人,属于哪类人群?(注:0.9~1.06是指大于等于0.9小于1.06)
参考答案:
1.C
【分析】根据散点图的分布可得相关性的强弱,即可比较大小.
【详解】由图可知:所对应的图中的散点呈现正相关 ,而且对应的相关性比对应的相关性要强,故,所对应的图中的散点呈现负相关,且根据散点的分布情况可知,因此,
故选:C
2.C
【分析】根据相关指数的性质可判断①,根据相关系数的性质可判断②,根据回归方程的性质可判断③,根据随机变量的观测值的关系可判断④.
【详解】解:对于①,在线性回归模型中,用相关指数来刻画回归效果,越小,则残差平方和越小,说明拟合效果越差,故①错误;
对于②,对两个变量和进行回归分析,若相关系数为r=-0.9462,即,则变量和之间具有线性相关关系,故②正确;
对于③,在回归直线方程中,当解释变量每增加一个单位时,预报变量平均减少0.5个单位,故③错误;
对于④,对于两个分类变量与,它们的随机变量的观测值越小,“与有关系”的把握程度越小,故④错误.
故选:C.
3.A
【分析】根据列联表计算,然后与临界值比较可得.
【详解】,
所以有的把握认为学生的学习积极性与对待班级工作的态度有关系.
故选:A.
4.D
【分析】由表中数据求出平均数,根据回归直线经过样本中心点,代入求解即可.
【详解】由表可知,,
.
因为回归直线会经过平均数样本中心点,
所以=6.5×5+17.5,解得m=70.
故选:D.
5.C
【分析】根据题目所给的列联表,计算的观测值,得出统计结论.
【详解】因为,所以英语成绩与性别有关联性的可能性最大,语文成绩与性别有关联性的可能性最小.故选C.
【点睛】本题主要考查独立性检验的基本思想及其应用,意在考查学生的数据分析和处理能力.
6.B
【分析】由条件求出回归直线方程,然后设该产品的售价为元,可得工厂的利润,从而求出答案.
【详解】由题意
由
所以,则
设该产品的售价为元,工厂的利润为,则
由
当且仅当,即时等号成立.
所以时,工厂的利润的最大为405元
故选:B
7.D
【分析】利用二项式定理及赋值法可得各项系数,判断A选项;根据正态分布的对称性可判断B选项;根据二项分布概率公式可得及,进而可得判断C选项;利用指数与对数式的相互转化可判断D选项.
【详解】A选项:,,令,即,得,所以,错误;
B选项:由已知可得该正态分布曲线的对称轴为,且,故,错误;
C选项:由得,解得,所以,又,则,错误;
D选项:由,得,则,解得,正确;
故选:D.
8.D
【分析】先求样本中心点为,进而得,回归方程为,再代入计算即可得答案.
【详解】解:由题知,,
因为回归方程过定点,
所以,即
所以回归方程为,
所以当广告费用为7万元时销售额为万元.
故选:D
9.BC
【分析】利用相关系数的定义与性质可判断各选项的正误.
【详解】若所有样本点都在直线上,则,A错B对;
若越大,则变量与的线性相关程度越强,
若越小,则变量与的线性相关程度越若,C对D错.
故选:BC.
10.BD
【分析】根据条件求出的值,与所给的临界值进行比较,判断选项的正误即可.
【详解】由题意可知,
,根据小概率值的独立性检验,有95%的把握认为“喜欢足球与性别有关”,故A错误,B正确;
,根据小概率值的独立性检验,认为“喜欢足球与性别无关”,故C错误,D正确,
故选:BD.
11.BD
【分析】根据复数和概率等知识,逐项判断,即可求得答案.
【详解】对于A,当时,是实数,故A错;
对于B,
可得
又
,故B正确;
对于C,公共汽车上有位乘客,沿途个车站,乘客下车的可能方式有种,故C错误;
对于D,回归方程为,由,可得变量与具有正的线性相关关系,故D正确;
对于E,,
由条件概率公式可得:,故E错误;
综上所述正确的是:BD
故选:BD.
【点睛】本题解题关键是掌握复数和概率等知识,考查了分析能力和计算能力,属于中档题.
12.AB
【分析】根据百分位数的计算公式,计算即可验证选项A;由平均值的定义和公式验证选项B;由二项分布的方差公式计算结果验证选项C;由线性相关系数的性质判断选项D.
【详解】对于A:一组从小到大排列的数据0,1,3,4,6,7,9,x,11,11,共10个数据,
因为80%×10=8,所以样本数据的80%分位数为第8个和第9个数据的平均数,即,
若去掉x,一组从小到大排列的数据0,1,3,4,6,7,9,11,11,共9个数据,
因为80%×9=7.2,所以样本数据的80%分位数为第8个数据,即,
去掉x与不去掉x,它们的80%分位数都不变,则,解得,A选项正确;
对于B:两组数据,,,…,与,,,…,,设它们的平均值分别为与,将它们合并在一起,有,则总体的平均值为 ,B选项正确;
对于C:已知离散型随机变量, 有,则,C选项错误;
对于D: 线性回归模型中,相关系数的值越大,则这两个变量线性相关性越强,D选项错误.
故选:AB
13.84%
【解析】将代入,求得,进而可得该城市人均消费额占人均工资收入的百分比.
【详解】因为y与x具有线性相关关系,满足回归方程,该城市居民人均工资为,所以可以估计该城市的职工人均消费水平,所以可以估计该城市人均消费额占人均工资收入的百分比为84%.
故答案为:84%
14.95%
【分析】先由题中数据求出,再由临界值表,即可得出结果.
【详解】由题中数据可得:
,
根据临界值表可得:犯错误的概率不超过0.05.
即有95%的把握认为“小动物是否感染与服用疫苗有关”.
故答案为95%
【点睛】本题主要考查独立性检验的问题,会由公式计算,能分析临界值表即可,属于常考题型.
15.10
【解析】先求样本平均值,,再根据样本中心点在回归直线上列方程求解即可得答案.
【详解】解:依题意,,
代入回归直线方程得①,
根据题意②,
解①②组成的方程组得.
故答案为:.
【点睛】本题考查已知回归方程求原始数据,考查运算能力,解题的关键是样本中心点在回归直线上,是基础题.
16.10
【分析】计算,代入回归直线方程,与结合,求解出的值.
【详解】依题意,代入回归直线方程得①,根据题意②,解①②组成的方程组得,故填.
【点睛】本小题主要考查回归直线方程过样本中心点,考查方程的思想,属于基础题.
17.(1);(2)15万元.
【详解】试题分析:(1)利用公式,,将计算代入即可;
(2)将代入解出即可.
试题解析:
(1) ,
(2)由,令,解得,广告费预计为15万元.
点睛:求解回归方程问题的三个易误点:
① 易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
② 回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过点,可能所有的样本数据点都不在直线上.
③ 利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).
18.(1)有的把握认为注射此疫苗有效;(2).
【分析】(1)由题中条件完善列联表,结合列联表的数据计算出的观测值,结合临界值表可得出结论;
(2)计算出从未注射疫苗的小白鼠中抽取4只,记为,,,;从注射疫苗的小白鼠中抽取2只,记为,,列举出所有的基本事件,利用古典概型的概率公式可计算出所求事件的概率.
【详解】(1)根据条件,得,
从而,,,
由,
因为,所以有的把握认为注射此疫苗有效.
(2)在感染病毒的小白鼠中,未注射疫苗和注射疫苗的比例为,所以从未注射疫苗的小白鼠中抽取4只,记为,,,;从注射疫苗的小白鼠中抽取2只,记为,.
从6只小白鼠中抽取2只共有15种方法,
即有,,,,,
,,,,,,,
,,.
记事件A为“至少有一只注射过疫苗”,则包含9个基本事件,
从而,
故至少有1只为注射过疫苗的概率为.
19.(1)见解析;(2)可在犯错误的概率不超过0.5%的前提下认为肥胖与常喝碳酸饮料有关.
【分析】(1)根据表格中的数据可完善二联表.
(2)根据公式先计算出的值,再结合临界值表可判断是否能在犯错误的概率不超过0.5%的前提下认为肥胖与常喝碳酸饮料有关.
【详解】(1)完善后的二联表如图所示:
常喝 不常喝 总计
肥胖 6 2 8
不肥胖 4 18 22
总计 10 20 30
(2)由(1)可得,
故可在犯错误的概率不超过0.5%的前提下认为肥胖与常喝碳酸饮料有关.
【点睛】本题考查二联表、的计算及其应用,此类问题应根据公式进行计算,本题属于基础题.
20.(1)0.8208
(2)
(3)805吨
【分析】(1)由独立重复试验的概率公式直接计算可得;
(2)根据最小二乘法相关公式,由表格数据直接计算可得;
(3)将2022年的年份代码代入回归方程可得.
(1)
2019至2022年共4年,设至少有两年购进徐长卿为事件A,
则.
(2)
由表格数据,得,
,
,
则,
所以.
所以y关于x的线性回归方程为.
(3)
由题可知,2022年的年份代码为9,即,
将代入回归方程,得,
所以预测2022年家种重楼的年产量为805吨
21.(1)有;(2)分布列见解析;期望为.
【分析】(1)利用古典概型概率公式,可求出家长高度重视孩子成绩一般的人数,再利用独立性检验公式即可解出;
(2)由题意分析可知X的取值可以是0,1,2,3,分别利用古典概型概率公式,结合组合知识计算出对应的概率,进而可解出答案.
【详解】解:(1)由条件知,解得,
所以,,,
,
所以有99.9%的把握认为“学生取得的成绩情况”与“家长对学生的教育重视程度”有关.
(2)从成绩优秀的选手中按照分层抽样的方法抽取20人,则“家长高度重视学生教育”的应抽取15人,“家长重视学生教育度一般”的应抽取5人.
由题意,X的所有可能取值为0,1,2,3.
,
,
,
.
所以X的分布列为
X 0 1 2 3
P
数学期望.
22.(1);(2)属于中度高血压人群.
【分析】(1)根据表中数据求得,,进而求得,,写出回归直线方程;
(2)利用(1)的回归直线方程求解.
【详解】(1),
.
∴..
∴回归直线方程为.
(2)根据回归直线方程,可预测年龄为70岁的老人标准收缩压为(mmHg).
∵,∴收缩压为180mmHg的70岁老人为中度高血压人群.