中小学教育资源及组卷应用平台
第八章 成对数据的统计解题思路(A卷基础夯实)——高二数学人教A版(2019)选择性必修第三册单元测试AB卷
本试卷满分150分,考试时间120分钟。
注意事项:
1.答题前,务必将自己的姓名、班级、考号填写在答题卡规定的位置上。
答选择题时,必须使用2B 铅笔将答题卡上对应题目的答案标号涂黑,如需改动,用橡皮擦
2.擦干净后,再选涂其它答案标号。
3.答非选择题时,必须使用0.5毫米黑色签字笔,将答案书写在答题卡规定的位置上。
4.所有题目必须在答题卡上作答,在试题卷上答题无效。
一、单项选择题:本大题共 8 小题,每小题 5 分,共 40 分. 在每小题给出的四个选项中,只有一个选项是正确的.请把正确的选项填涂在答题卡相应的位置上.
1.某大型企业开发了一款新产品,投放市场后供不应求,为了达到产量最大化,决定增加生产线.经过一段时间的生产,统计得该款新产品的生产线条数x与月产量y(件)之间的统计数据如下表:
x 4 6 8 10
y 30 40 60 70
由数据可知x,y线性相关,且满足回归直线方程,则当该款新产品的生产线为12条时,预计月产量为( )
A.73件 B.79件 C.85件 D.90件
2.变量x与y相对应的一组数据为,,,,;变量u与v相对应的一组数据为,,,,,表示变量y与x之间的线性相关系数,表示变量v与u之间的线性相关系数,则( )
A. B. C. D.
3.某公司收集了某商品销售收入y(万元)与相应的广告支出x(万元)共10组数据(,2,3,…,10),绘制出如下散点图,并利用线性回归模型进行拟合.
若将图中10个点中去掉A点后再重新进行线性回归解题思路,则下列说法正确的是( )
A.决定系数变小 B.残差平方和变小
C.相关系数r的值变小 D.解释变量x与预报变量y相关性变弱
4.现有一组样本数据点,,,,则该组样本数据点的相关系数( )
A. B. C. D.1
5.已知变量x和变量y的一组成对样本数据为,其中,其经验回归方程为,当增加两个样本数据和后,重新得到的经验回归方程斜率为3,则在新的经验回归方程的估计下,样本数据所对应的残差为( )
A. B. C. D.1
6.已知两个变量x和y之间具有较强的线性相关关系,且y关于x的经验回归方程为,由它计算出成对样本数据对应的残差为0.12(残差=观测值-预测值),则( )
A.0.28 B.0.56 C.0.34 D.0.48
7.某小学为提高课后延时服务水平和家长满意度,对该校学生家长就服务质量、课程内容、学生感受、家长认可度等问题进行随机电话回访.某天共回访5位家长,通话时长和评分情况如下表:
时长x(分钟) 10 12 14 15 19
评分y 60 m 75 90
根据散点图解题思路得知y与x具有线性相关关系且求得其回归方程为,则( )
A.61 B.63 C.65 D.67
8.某市2018年至2024年新能源汽车年销量y(单位:千台)与年份代号x的数据如下表:
年份 2019 2024 2024 2024
年份代号x 1 2 3 4
年销量y 15 20 m 35
若根据表中的数据用最小二乘法求得y关于x的经验回归直线方程为,则表中m的值为( )
A.25 B.28 C.30 D.32
二、多项选择题:本大题共 3 小题,每小题 6 分,共 18 分. 在每小题给出的四个选项中,有多项符合题目要求. 全部选对得 6 分,选对但不全的得部分分,有选错的得0分.
9.已知变量x,y之间的经验回归方程为,且变量x,y的数据如下表所示:
x 5 6 8 12 14
y 10 8 6 5 1
则下列说法正确的是( )
A.变量x,y之间负相关
B.
C.当时,可估计y的值为11
D.当时,残差为-1
10.下列说法正确的是( )
A.若随机变量,则
B.若经验回归方程中的,则变量x与y正相关
C.若随机变量,且,则
D.若事件A与B为互斥事件,则A的对立事件与B的对立事件一定互斥
11.某手机商城统计的2024年5个月手机的销量(万部)如下表所示:
月份 7月 8月 9月 10月 11月
x 1 2 3 4 5
y 2 2 3 4
根据表中数据用最小二乘法得到的y关于月份编号x的回归直线方程为,则( )
A.
B.y与x正相关
C.当月份编号x增加1时,销量增加0.5万部
D.预测2025年2月份该手机商城的销量约为4万部
三、填空题:本大题共 3 小题,每小题 5 分,共 15 分.
12.已知一组数据(,2,3,…,n)大致呈线性分布,其回归直线方程为,则的最小值为=________.
13.商家为了解某品牌取暖器的月销售量Y(台)与月平均气温之间的关系,随机统计了某4个月该品牌取暖器的月销售量与当月平均气温,其数据如下表;
平均气温() 10 7 4 1
月销售量(台) 26 37 55 82
由表中数据算出线性回归方程中的,当平均气温为时,此品牌取暖器的月销售量为__________台(结果保留整数).
14.对具有线性相关关系的变量x,y有一组观测数据,,,其经验回归方程,则在样本点处的残差为________.
四、解答题:本题共 5 小题,共 77 分. 解答应写出文字说明、证明过程或演算步骤.
15.某兴趣小组调查并统计了某班级学生期末统考中的数学成绩和建立个性化错题本的情况,用来研究这两者是否有关.若从该班级中随机抽取1名学生,设“抽取的学生期末统考中的数学成绩不及格”,“抽取的学生建立了个性化错题本”,且,,.
(1)求和.
(2)若该班级共有36名学生,请完成列联表,并依据小概率值的独立性检验,解题思路学生期末统考中的数学成绩与建立个性化错题本是否有关,
个性化错题本 期末统考中的数学成绩 合计
及格 不及格
建立
未建立
合计
(3)为进一步验证(2)中的判断,该兴趣小组准备在其他班级中抽取一个容量为的样本(假设根据新样本数据建立的列联表中,所有的数据都扩大为(2)中列联表中数据的k倍,且新列联表中的数据都为整数).若要使得依据的独立性检验可以肯定(2)中的判断,试确定k的最小值
参考公式及数据:,.
0.01 0.005 0.001
6.635 7.879 10.828
16.为了比较两种治疗高血压的药(分别称为甲药,乙药)的疗效,随机选取20位患者服用甲药,20位患者服用乙药,这40位患者在服用一段时间后,记录他们日平均降低的血压数值(单位:mmhg)根据记录的数据绘制了如下茎叶图:
(1)根据茎叶图判断哪种药的疗效更好 并给出两种理由进行说明;
(2)求40位患者在服用一段时间后,日平均降低血压数值的中位数n,并将日平均降低血压数值超过n和不超过n的患者数填入下面的列联表:
超过n 不超过n
服用甲药
服用乙药
(3)根据(2)中的列联表,能否有95%的把握认为这两种药物的疗效有差异
附:,
0.15 0.10 0.05
2.072 2.706 3.841
17.某公司为提升A款产品的核心竞争力,准备加大A款产品的研发投资,为确定投入A款产品的年研发费用,需了解年研发费用x (单位:万元)对年利润y (单位:万元)的影响.该公司统计了最近8年每年投入A款产品的年研发费用与年利润的数据,得到下图所示的散点图:
经数据解题思路知,y与x正线性相关,且相关程度较高.经计算得,,,,.
(1)建立y关于x的经验回归方程;
(2)若该公司对A款产品欲投入的年研发费用为30万元,根据(1)得到的经验回归方程,预测年利润为多少万元
附:,.
18.民族要复兴,乡村要振兴,合作社助力乡村产业振兴,农民专业合作社已成为新型农业经营主体和现代农业建设的中坚力量,为实施乡村振兴战略作出了巨大的贡献.已知某主要从事手工编织品的农民专业合作社共有100名编织工人,该农民专业合作社为了鼓励工人,决定对“编织巧手”进行奖励,为研究“编织巧手”是否与年龄有关,现从所有编织工人中抽取40周岁以上(含周岁40岁)的工人24名,40周岁以下的工人16名,得到的数据如表所示.
“纺织巧手” 非“编织巧手” 总计
年龄岁 19
年龄 10
总计 40
(1)请完成答题卡上的2×2列联表,并根据小概率值的独立性检验,解题思路“编织巧手”与“年龄”是否有关;
(2)为进一步提高编织效率,培养更多的“编织巧手”,该农民专业合作社决定从上表的非“编织巧手”的工人中采用层抽样的方法抽取6人参加技能培训,再从这6人中随机抽取2人享心得,求这2人中恰有1人的年龄在40周岁以下的概率.
参考公式:,其中.
参考数据:
α 0.100 0.050 0.010 0.005
2.706 3.841 6.635 7.879
19.2025年我省将实行的高考模式,其中,“3”为语文、数学,外语3门参加全国统一考试,选择性考试科目为政治、历史、地理、物理、化学,生物6门,由考生根据报考高校以及专业要求,结合自身实际,首先在物理,历史中2选1,再从政治、地理、化学、生物中4选2,形成自己的高考选考组合.
(1)若某学生根据方案进行随机选科,求该生恰好选到“历政地”组合的概率;
(2)由于物理和历史两科必须选择1科,某校想了解高一新生选科的需求.随机选取100名高一新生进行调查,得到如下统计数据,写出下列联表中a,d的值,并判断是否有的把握认为“选科与性别有关”?
选择物理 选择历史 合计
男生 a 10
女生 30 d
合计 30
附:.
0.10 0.05 0.025 0.01 0.005
2.706 3.841 5.024 6.635 7.879
参考答案
1.答案:C
解析:依题意可得,,
因为回归直线方程必过样本中心点,即,解得,所以,
当时,
故当该款新产品的生产线为12条时,预计月产量为85件.
故选:C.
2.答案:C
解析:由变量x与y相对应的一组数据为,,,,,
可得变量y与x正相关,所以.
而由变量u与v相对应的一组数据为,,,,,
可知变量v与u负相关,所以,所以与的大小关系是.
故选:C.
3.答案:B
解析:从图中可以看出A点较其他点,偏离直线远,故去掉A点后,回归效果更好,
故决定系数会变大,更接近于1,残差平方和变小,
相关系数r的绝对值,即会更接近于1,由图可得x与y正相关,故r会更接近于1,
即相关系数r的值变大,解释变量x与预报变量y相关性变强,
故A、C、D错误,B正确.
故选:B.
4.答案:D
解析:根据题意可知:这些样本数据点均在直线上,故,
由直线的斜率为正,可知,所以.
故选:D.
5.答案:B
解析:,增加两个样本点后x的平均数为.,,增加两个样本点后y的平均数为,,解得,新的经验回归方程为,则当时,,样本点的残差为.故选B.
6.答案:A
解析:由题意,,解得.
故选:A.
7.答案:C
解析:依题意,得,
,
将样本中心代入回归方程,
得,解得.
故选:C.
8.答案:C
解析:由已知得,回归直线方程为过样本点中心,
,即,
.
故选:C.
9.答案:AC
解析:对于A选项,由,
可得变量x,y之间负相关,故A选项正确;
对于B选项,,
将,代入经验回归方程,
有,可得,故B选项错误;
对于C选项,由上知,
当时,,故C选项正确;
对于D选项,当时,,
残差为,故D选项错误.
故选:AC.
10.答案:BC
解析:,A错误;若经验回归方程中斜率,
则变量x与y正相关,B正确;易得正态曲线关于直线对称,故,
又,所以,C正确;掷一枚骰子,
设事件A:出现的点数为1,事件B:出现的点数为2,则A与B互斥,但与不互斥,D错误.
故选:BC.
11.答案:AB
解析:由表中数据,计算得,所以,
则,解得,A说法正确;
由回归直线方程中x的系数为正可知,y与x正相关,且其相关系数,B说法正确;
当月份编号x增加1时,销量不一定增加0.5万部,C说法错误;
2025年2月份对应的月份编号,,D说法错误;
故选:AB
12.答案:
解析:回归直线经过,
且,
代入回归方程得:,
即,
所以当时,的最小值为.
故答案为:.
13.答案:90
解析:由题意可得,
,
可知点在回归方程上,其中,
即,解得,所以,
当时,.
故答案为:90.
14.答案:0.5/
解析:将,代入,得,解得,
所以,
故当时,,
所以残差.
故答案为:0.5.
15.答案:(1),
(2)表格见解析,有关
(3)
解析:(1)因为,,
所以,,
由于,解得,所以.
,解得.
(2)
个性化错题本 期末统考中的数学成绩 合计
及格 不及格
建立 20 4 24
未建立 4 8 12
合计 24 12 36
零假设为:期末统考中的数学成绩与建立个性化错题本无关.
根据列联表中的数据,经计算得到.
根据小概率值的独立性检验,我们推断不成立,即认为期末统考中的数学成绩与建立个性化错题本有关,此推断犯错误的概率不大于0.005.
(3),解得.
要使新列联表中的数据都为整数,则需.
又因为,所以的最小值为5,故k的最小值是.
16.答案:(1)乙药的疗效更好,理由见解析
(2),列联表见解析
(3)没有95%的把握认为这两种药物的疗效有差异
解析:(1)乙药的疗效更好参考理由如下:
(i)用各自的平均数说明
设甲药观测数据的平均数为,乙药观测数据的平均数为,
由茎叶图可知,,
,
因为,所以乙药的疗效更好
(ii)用茎2和茎3上分布的数据说明
由茎叶图可知,用甲药有的患者日平均降低血压数值在20及以上,
用乙药有65%的患者日平均降低血压数值在20及以上,所以乙药的疗效更好
(iii)用各自的中位数说明
由茎叶图可知,用甲药的患者日平均降低血压数值的中位数为15,
用乙药的患者日平均降低血压数值的中位数为21,所以乙药的疗效更好
(iv)用各自的叶在茎上的整体分布说明
由茎叶图可知,用甲药的患者日平均降低血压数值分布集中在“单峰”茎1上,且关于茎1大致呈对称分布;
用乙药的患者日平均降低血压数值分布集中在“单峰”茎2上,且关于茎2大致呈对称分布,
又用两种降压药患者日平均降低血压数值都分布的区间内,所以乙药的疗效更好
(2)由茎叶图可知内有个数据,内有3个数据,内有16个数据,,则中位数位于之间,
且内的数据从小到大排列为11,12,12,12,12,13,14,14,15,15,16,17,
18,18,19,所以中位数
列联表如下:
超过n 不超过n
服用甲药 7 13
服用乙药 13 7
(3)由于,
所以没有95%的把握认为这两种药物的疗效有差异
17.答案:(1)
(2)65万元
解析:(1),,
,,
,,
.
.
关于x的经验回归方程为.
(2)由(1)可得,.
当时,.
对A款产品投入30万元年研发费用,年利润约为65万元.
18.答案:(1)“编织巧手”与“年龄”有关
(2)
解析:年龄在40周岁以上(含40周岁)的非“编织巧手”有5人,年龄在40周岁以下的“编织巧手”有6人.列联表如下:
“纺织巧手” 非“编织巧手” 总计
年龄岁 19 5 24
年龄 6 10 16
总计 25 15 40
零假设为:“编织巧手”与“年龄”无关联.
根据列联表中的数据,经计算得到,
代入卡方的式子
算出7.111.
根据小概率值的独立性检验,我们推断不成立,即认为“编织巧手”与“年龄”有关,此推断犯错的概率不大于0.010.
(2)由题意可得这6人中年龄在40周岁以上(含40周岁)的人数是2;年龄在40周岁以下的人数是4.
从这6人中随机抽取人的情况有种,
其中符合条件的情况有种,
故所求概率.
19.答案:(1)
(2),,有的把握认为“选科与性别有关”
解析:(1)记物理为1,历史为2,政治、地理、化学、生物分别为3,4,5,6,
根据选科要求,基本事件如下:,,,,,,,,,,,,共12种,
其中“历政地”组合为,
所以该生恰好选到“历政地”组合的概率为.
(2)依题意,,
由此补全列联表如下:
选择物理 选择历史 合计
男生 10
女生
合计
所以,
所以有的把握认为“选科与性别有关”.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://21世纪教育网(www.21cnjy.com)
" 21世纪教育网(www.21cnjy.com)