第9天 概率与统计-【18天考点全覆盖】冲刺2023年高考数学考前必刷题(含解析)

文档属性

名称 第9天 概率与统计-【18天考点全覆盖】冲刺2023年高考数学考前必刷题(含解析)
格式 doc
文件大小 6.2MB
资源类型 试卷
版本资源 人教A版(2019)
科目 数学
更新时间 2023-05-05 15:49:01

图片预览

文档简介

中小学教育资源及组卷应用平台
【18天考点全覆盖】冲刺2023年高考数学考前必刷题
第9天 统计与概率
一、单选题
1.从分别写有1,2,3,4,5,6的6张卡片中无放回随机抽取2张,则抽到的2张卡片上的数字之积是4的倍数的概率为( )
A. B. C. D.
2.屈原是中国历史上第一位伟大的爱国诗人,中国浪漫主义文学的奠基人,“楚辞”的创立者和代表作者,其主要作品有《离骚》、《九歌》、《九章》、《天问》等.某校于2022年6月第一周举办“国学经典诵读”活动,计划周一至周四诵读屈原的上述四部作品,要求每天只诵读一部作品,则周一不读《天问》,周三不读《离骚》的概率为( )
A. B. C. D.
3.长时间玩手机可能影响视力,据调查,某校学生大约40%的人近视,而该校大约有20%的学生每天玩手机超过1,这些人的近视率约为50%.现从每天玩手机不超过1的学生中任意调查一名学生,则他近视的概率为( )
A. B. C. D.
4.某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为,且.记该棋手连胜两盘的概率为p,则( )
A.p与该棋手和甲、乙、丙的比赛次序无关 B.该棋手在第二盘与甲比赛,p最大
C.该棋手在第二盘与乙比赛,p最大 D.该棋手在第二盘与丙比赛,p最大
5.年10月12日“天宫课堂”首次在问天实验舱中授课,航天员老师们演示和讲解的多种实验,极大地激发了学生的学习兴趣.在一次模仿操作实验中,学生们从装有大小相同的标号分别为的9种不同的种子中随机抽取2种种子进行操作实验,则抽到的两种不同的种子的标号之和恰为10的概率为( )
A. B. C. D.
6.现有5张卡片,其中有2张印有“立”字,其余3张分别印有“德”、“树”、“人”.将这5张卡片随机排成一行,则恰有连续4张卡片从左往右依次为“立”、“德”、“树”、“人”的概率为( )
A. B. C. D.
7.在三个地区爆发了流感,这三个地区分别有6%,5%,4%的人患了流感,假设这三个地区的人口数之比为,现从这三个地区中任意选取一人,则此人是流感患者的概率为( )
A.0.032 B.0.048 C.0.05 D.0.15
8.某物理量的测量结果服从正态分布,下列结论中不正确的是( )
A.越小,该物理量在一次测量中在的概率越大
B.该物理量在一次测量中大于10的概率为0.5
C.该物理量在一次测量中小于9.99与大于10.01的概率相等
D.该物理量在一次测量中落在与落在的概率相等
9.为了增强大学生的环保意识,加强对“碳中和”概念的宣传,某公益组织分别在两所大学随机选取10名学生进行环保问题测试(满分100分),这20名学生得分的折线图如图所示,关于这两所学校被选取的学生的得分,下列结论错误的是( )
A.校学生分数的平均分大于校学生分数的平均分
B.校学生分数的众数大于校学生分数的众数
C.校学生分数的中位数等于校学生分数的中位数
D.校学生分数的方差大于校学生分数的方
10.四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是( )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
11.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则( )
A.讲座前问卷答题的正确率的中位数小于
B.讲座后问卷答题的正确率的平均数大于
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
二、多选题
12.甲和乙两个箱子中各有质地均匀的9个球,其中甲箱中有4个红球,2个白球,3个黑球,乙箱中有4个红球,3个白球,2个黑球,先从甲箱中随机取出一球放入到乙箱中,分别以,,表示从甲箱中取出的球是红球、白球、黑球的事件,再从乙箱中随机取出一球,以B表示取出的球是红球的事件,则( )
A.B与相互独立 B.,,两两互斥
C. D.
13.一口袋中有除颜色外完全相同的3个红球和2个白球,从中无放回的随机取两次,每次取1个球,记事件A1:第一次取出的是红球;事件A2:第一次取出的是白球;事件B:取出的两球同色;事件C:取出的两球中至少有一个红球,则( )
A.事件,为互斥事件 B.事件B,C为独立事件
C. D.
14.为排查新型冠状病毒肺炎患者,需要进行核酸检测.现有两种检测方式:(1)逐份检测:(2)混合检测:将其中k份核酸分别取样混合在一起检测,若检测结果为阴性,则这k份核酸全为阴性,因而这k份核酸只要检测一次就够了,如果检测结果为阳性,为了明确这k份核酸样本究竟哪几份为阳性,就需要对这k份核酸再逐份检测,此时,这k份核酸的检测次数总共为次.假设在接受检测的核酸样本中,每份样本的检测结果是阴性还是阳性都是独立的,并且每份样本是阳性的概率都为,若,运用概率统计的知识判断下列哪些p值能使得混合检测方式优于逐份检测方式.(参考数据:)( )
A.0.4 B.0.3 C.0.2 D.0.1
15.某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,则下列结论正确的是( )
注:90后指1990年及以后出生,80后指1980-1989年之间出生,80前指1979年及以前出生.
A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上
B.互联网行业中从事技术岗位的人数超过总人数的20%
C.互联网行业中从事运营岗位的人数90后比80前多
D.互联网行业中从事技术岗位的人数90后比80后多
16.某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险,各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如下统计图,则下列四个选项正确的是( ).
A.54周岁及以上参保人数最少 B.18~29周岁人群参保总费用最少
C.丁险种更受参保人青睐 D.30周岁及以上的人群约占参保人群的80%
17.某大学共有12 000名学生,为了了解学生课外图书阅读情况,该校随机地从全校学生中抽取1000名,统计他们年度阅读书籍的数量,并制成如图所示的频率分布直方图,由此来估计全体学生年度阅读书籍的情况,下列说法中不正确的是(注:同一组数据用该组区间的中点值作为代表)( )
A.该校学生年度阅读书籍本数的中位数为6
B.该校学生年度阅读书籍本数的众数为10
C.该校学生年度阅读书籍本数的平均数为6.88
D.该校学生年度读书不低于8本的人数约为3600
18.某种产品的价格x(单位:元/)与需求量y(单位:)之间的对应数据如下表所示:
x 10 15 20 25 30
y 11 10 8 6 5
根据表中的数据可得回归直线方程,则以下正确的是( )
A.相关系数
B.
C.若该产品价格为35元,则日需求量大约为
D.第四个样本点对应的残差为
19.自然环境中,大气压受到各种因素的影响,如温度、湿度、风速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔的影响最为显著.下图是根据一组观测数据得到海拔6千米~15千米的大气压强散点图,根据一元线性回归模型得到经验回归方程为,决定系数为;根据非线性回归模型得到经验回归方程为,决定系数为 ,则下列说法正确的是( )
A.由散点图可知,大气压强与海拔高度负相关
B.由方程可知,海拔每升高1千米,大气压强必定降低4.0kPa
C.由方程可知,样本点的残差为
D.对比两个回归模型,结合实际情况,方程的预报效果更好
三、填空题
20.学校高一年级从6个班各自选出2名同学参加市里组织的朗读比赛.若从这12名同学选出6人参加决赛,其中预赛成绩优秀的一(1)班甲和一(2)班乙两名同学必须参加,其余任选,则这6人恰好仅有两名同学来自相同班级的概率为_____________.
21.一学生接连参加同一课程的两次考试,第一次及格的概率为p,若第一次及格则第二次及格的概率也为p;若第一次不及格则第二次及格的概率为.若已知他第二次已经及格,则他第一次及格的概率为 __.
四、解答题
22.一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 良好
病例组 40 60
对照组 10 90
从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(1)证明:;
(2)利用该调查数据,给出及R的估计值.
23.设甲、乙两位同学上学期间,每天7:30之前到校的概率均为.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.
(Ⅰ)用表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量的分布列和数学期望;
(Ⅱ)设为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件发生的概率.
24.已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.
(I)应从甲、乙、丙三个部门的员工中分别抽取多少人?
(II)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.
(i)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;
(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.
25.某中学将立德树人融入到教育的各个环节,开展“职业体验,导航人生”的社会实践教育活动,让学生站在课程“中央”.为了更好地了解学生的喜好情况,根据学校实际将职业体验分为:救死扶伤的医务类、除暴安良的警察类、百花齐放的文化类、公平正义的法律类四种职业体验类型,并在全校学生中随机抽取100名学生调查意向选择喜好类型,统计如下:
类型 救死扶伤的医务类 除暴安良的警察类 百花齐放的文化类 公平正义的法律类
人数 30 20 20 30
在这100名学生中,随机抽取了3名学生,并以统计的频率代替职业意向类型的概率(假设每名学生在选择职业类型时仅能选择其中一类,且不受其他学生选择结果的影响).
(1)求救死扶伤的医务类、除暴安良的警察类这两种职业类型在这3名学生中都有选择的概率;
(2)设这3名学生中选择除暴安良的警察类的随机数为X,求X的分布列与均值.
26.在创建“全国文明卫生城”过程中,某市“创城办”为了调查市民对创城工作的了解情况,进行了一次创城知识问卷调查(一位市民只能参加一次).通过随机抽样,得到参加问卷调查的1000人的得分(满分100分)统计结果如下表所示.
组别
频数 25 150 200 250 225 100 50
(1)由频数分布表可以大致认为,此次问卷调查的得分服从正态分布,近似为这1000人得分的平均值(同一组数据用该组数据区间的中点值表示),请用正态分布的知识求;
(2)在(1)的条件下,“创城办”为此次参加问卷调查的市民制定如下奖励方案:
(ⅰ)得分不低于的可以获赠2次随机话费,得分低于的可以获赠1次随机话费;
(ⅱ)每次获赠送的随机话费和对应的概率为:
赠送的随机话费(单元:元) 20 40
概率 0.75 0.25
现有市民甲要参加此次问卷调查,记 (单位:元)为该市民参加问卷调查获赠的话费,求的分布列与数学期望.
参考数据与公式:,若,则①;②;③.
27.某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记为小明的累计得分,求的分布列;
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
28.某学校组织“一带一路”知识竞赛,有,,三类问题,每位参加比赛的同学先在三类问题中随机选择一类,并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从剩下的两类问题中随机选择一类并从中抽取一个问题回答,回答错误则该同学比赛结束;若回答正确,则从剩下的最后一类问题中随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.类问题中的每个问题回答正确得20分,否则得0分;类问题中的每个问题回答正确得80分,否则得0分,类问题中的每个问题回答正确得70分,否则得0分.已知小明能正确回答类问题的概率为0.8,能正确回答类问题的概率为0.6,能正确回答类问题的概率为0.7.且能正确回答问题的概率与回答次序无关.
(1)若小明先回答类问题,记为小明的累计得分,求的期望.
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
29.为提高核酸检测效率,某医学实验室现准备采用某种检测新冠肺炎病毒核酸的新型技术进行新一轮大规模核酸筛查.经过初步统计分析得出该项技术的错检率约为0.04,漏检率约为0.01.(错检率指在检测出阳性的情况下未感染的概率,漏检率指在感染的情况下检测出阴性的概率)
(1)当有100个人检测出核酸阳性时,求预计检出的假阳性人数;
(2)为节约成本,实验室在该技术的基础上采用“混采”的方式对个别疫区进行核酸检测,即将n个人的样本装进一根试管内送检;若某组检测出核酸阳性,则对这n个人分别进行单人单试管核酸采样.现对两个疫区的居民进行核酸检测,A疫区共有10000名居民,采用的混采策略;B疫区共有20000名居民,采用的混采策略.已知两个疫区每个居民感染新冠肺炎的概率相等且均小于0.00032,通过计算比较A、B两个疫区核酸检测预计消耗试管数量.
参考数据:,
30.单板滑雪U型场地技巧是冬奥会比赛中的一个项目,进入决赛阶段的12名运动员按照预赛成绩由低到高的出场顺序轮流进行三次滑行,裁判员根据运动员的腾空高度、完成的动作难度和效果进行评分,最终取单次最高分作为比赛成绩.现有运动员甲、乙二人在某赛季单板滑雪U型场地技巧比赛中的成绩(单位:分),如表:
分站 运动员甲的三次滑行成绩 运动员乙的三次滑行成绩
第1次 第2次 第3次 第1次 第2次 第3次
第1站 80.20 86.20 84.03 80.11 88.40 0
第2站 92.80 82.13 86.31 79.32 81.22 88.60
第3站 79.10 0 87.50 89.10 75.36 87.10
第4站 84.02 89.50 86.71 75.13 88.20 81.01
第5站 80.02 79.36 86.00 85.40 87.04 87.70
假设甲、乙二人每次比赛成绩相互独立.
(1)从上表5站中随机选取1站,求在该站甲的成绩高于乙的成绩的概率;
(2)从上表5站中任意选取2站,用X表示这2站中甲的成绩高于乙的成绩的站数,求X的分布列和数学期望;
(3)假如从甲、乙二人中推荐一人参加2022年北京冬奥会单板滑雪U型场地技巧比赛,根据以上数据信息,你推荐谁参加?说明理由.
31.排球比赛按“五局三胜制的规则进行(即先胜三局的一方获胜,比赛结束),且各局之间互不影响.根据两队以往交战成绩分析,乙队在前四局的比赛中每局获胜的概率是,但前四局打成2:2的情况下,在第五局中甲队凭借过硬的心理素质,获胜的概率为.若甲队与乙队下次在比赛上相遇.
(1)求甲队以3:1获胜的概率;
(2)设甲的净胜局数(例如:甲队以3:1获胜,则甲队的净胜局数为2,乙队的净胜局数为﹣2)为ξ,求ξ的分布列及.
32.“双十一”期间,某大型商场举行了“消费领奖”的促销活动,在规定的商品中,顾客消费满,200元(含200元)即可抽奖一次,抽奖方式有两种(顾客只能选择其中一种).
方案一:从装有5个形状、大小完全相同的小球(其中红球1个,黑球4个)的抽奖盒中,有放回地摸出2球,每摸出1次红球,立减100元.
方案二:从装有10个形状、大小完全相同的小球(其中红球2个,黑球8个)的抽奖盒中,不放回地摸出2个球,中奖规则为:若摸出2个红球,享受免费优惠;若摸出1个红球,1个黑球,则打5折;若摸出2个黑球,则抵扣现金50元.
(1)某顾客恰好消费200元,选择抽奖方案一,求他实付现金的分布列和期望;
(2)若顾客消费300元,试从实付金额的期望值分析顾客选择哪一种抽奖方式更合理
33.为了解新研制的抗病毒药物的疗效,某生物科技有限公司进行动物试验.先对所有白鼠服药,然后对每只白鼠的血液进行抽样化验,若检测样本结果呈阳性,则白鼠感染病毒;若检测样本结果呈阴性,则白鼠未感染病毒.现随机抽取只白鼠的血液样本进行检验,有如下两种方案:
方案一:逐只检验,需要检验次;
方案二:混合检验,将只白鼠的血液样本混合在一起检验,若检验结果为阴性,则只白鼠未感染病毒;若检验结果为阳性,则对这只白鼠的血液样本逐个检验,此时共需要检验次.
(1)若,且只有两只白鼠感染病毒,采用方案一,求恰好检验3次就能确定两只感染病毒白鼠的概率;
(2)已知每只白鼠感染病毒的概率为.
①采用方案二,记检验次数为,求检验次数的数学期望;
②若,每次检验的费用相同,判断哪种方案检验的费用更少 并说明理由.
34.文渊中学计划在2023年2月举行趣味运动会,其中设置“夹球接力跑”项目,需要男同学和女同学一起合作完成.高一(15)班代表队共派出3个小组(编号为,,)角逐该项目,每个小组由1名男生和2名女生组成,其中男生单独完成该项目的概率为0.6,女生单独完成该项目的概率为().假设他们参加比赛的机会互不影响,记每个小组能完成比赛的人数为.
(1)证明:在的概率分布中,最大;
(2)如果比赛当天天气出现异常,则将临时更改比赛规则:每个代表队每次指派一个小组,比赛时间一分钟,如果一分钟内不能完成,则重新指派另一组参赛.高一(15)班代表队的领队了解后发现,小组能顺利完成比赛的概率为(),且各个小组能否完成比赛相互独立.在更改比赛规则后,领队如何安排小组的出场顺序能使指派的小组个数的均值最小?请给出证明.
35.在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
36.为了推进分级诊疗,实现“基层首诊、双向转诊、急慢分治、上下联动”的诊疗模式,某地区自2016年起全面推行家庭医生签约服务.已知该地区居民约为2000万,从1岁到101岁的居民年龄结构的频率分布直方图如图1所示.为了解各年龄段居民签约家庭医生的情况,现调查了1000名年满18周岁的居民,各年龄段被访者签约率如图2所示.
(1)估计该地区年龄在71~80岁且已签约家庭医生的居民人数;
(2)若以图2中年龄在71~80岁居民签约率作为此地区该年龄段每个居民签约家庭医生的概率,则从该地区年龄在71~80岁居民中随机抽取两人,求这两人中恰有1人已签约家庭医生的概率;
(3)据统计,该地区被访者的签约率约为.为把该地区年满18周岁居民的签约率提高到以上,应着重提高图2中哪个年龄段的签约率 并结合数据对你的结论作出解释.
37.某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数.
38.为了让人民享受到更优质的教育服务,我国逐年加大对教育的投入.为了预测2022年全国普通本科招生数,建立了招生数y(单位:万人)与时间变量t的三个回归模型.其中根据2001年至2019年的数据(时间变量t的值依次取1,2,3,…,19)建立模型①: (决定系数)和模型②:=152.4+16.3t(相关系数0.97,决定系数).根据2014年至2019年的数据(时间变量t的值依次取1,2,3,…,6)建立模型③:=372.8+9.8t(相关系数0.99,决定系数).
(1)可以根据模型①得到2022年全国普通本科招生数的预测值为597.88万人,请你分别利用模型②③,求2022年全国普通本科招生数的预测值;
(2)你认为用哪个模型得到的预测值更可靠?说明理由(写出一个即可).
39.某公司为了预测下月产品销售情况,找出了近7个月的产品销售量(单位:万件)的统计表:
月份代码 1 2 3 4 5 6 7
销售量(万件)
但其中数据污损不清,经查证,,.
(1)请用相关系数说明销售量与月份代码有很强的线性相关关系;
(2)求关于的回归方程(系数精确到0.01);
(3)公司经营期间的广告宣传费(单位:万元)(),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)
参考公式及数据:,相关系数,当时认为两个变量有很强的线性相关关系,回归方程中斜率和截距的最小二乘估计公式分别为,.
40.十四五发展纲要提出要推进能源革命,建设清洁低碳、安全高效的能源体系,加快发展非化石能源,大力提升风电、光伏发展规模,有序发展海上风电.海上风电相比与陆上风电有着一定的优势,海上风电可装的风机更大,风资源利用率更高,近几年我国海上风电事业发展良好.下面是近五年我国海上风电发展情况表和对应的散点图.
2016-2020年中国海上风电新增装机容量及累计装机容量表(单位:万千瓦)
年份 2016 2017 2018 2019 2020
年份代号t 1 2 3 4 5
新增装机容量u 31 69 140 219 306
累计装机容量v 104 173 313 532 838
(1)为了分析中国海上风电装机容量的情况,建立了和两个线性回归模型,你认为用哪个线性回归模型更可靠?并说明理由.
(2)根据(1)的判断结果及表中数据,求出回归方程,并根据这个回归模型回答下列问题:
①2021年我国海上风电新增装机容量的预测值是多少?
②预计至少要到哪一年,我国海上风电累计装机容量超过2000万千瓦?
参考数据:
765 2995 1960 7707
参考公式:回归方程中.
41.甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
附:,
0.100 0.050 0.010
2.706 3.841 6.635
42.某机构为了解市民对交通的满意度,随机抽取了100位市民进行调查结果如下:回答“满意”的人数占总人数的一半,在回答“满意”的人中,“上班族”的人数是“非上班族”人数的;在回答“不满意”的人中,“非上班族”占.
(1)请根据以上数据填写下面列联表,并依据小概率值的独立性检验,分析能否认为市民对于交通的满意度与是否为上班族存关联?
满意 不满意 合计
上班族
非上班族
合计
(2)为了改善市民对交通状况的满意度,机构欲随机抽取部分市民做进一步调查.规定:抽样的次数不超过,若随机抽取的市民属于不满意群体,则抽样结束;若随机抽取的市民属于满意群体,则继续抽样,直到抽到不满意市民或抽样次数达到时,抽样结束.
(i)若,写出的分布列和数学期望;
(ii)请写出的数学期望的表达式(不需证明),根据你的理解说明的数学期望的实际意义.
附:
参考公式:,其中.
43.“碳达峰”“碳中和”成为今年全国两会热词,被首次写入政府工作报告.碳达峰就是二氧化碳的排放不再增长,达到峰值之后再慢慢减下去;碳中和是指在一定时间内直接或间接产生的温室气体排放总量通过植树造林 节能减排等方式,以抵消自身产生的二氧化碳排放量,实现二氧化碳“零排放”.2020年9月,中国向世界宣布了2030年前实现碳达峰,2060年前实现碳中和的目标.某城市计划通过绿色能源(光伏 风电 核能)替代煤电能源,智慧交通,大力发展新能源汽车以及植树造林置换大气中的二氧化碳实现碳中和.该城市某研究机构统计了若干汽车5年内所行驶的里程数(万千米)的频率分布直方图,如图.
(1)求a的值及汽车5年内所行驶里程的平均值(同一组中的数据用该组区间的中点值为代表).
(2)据“碳中和罗盘”显示:一辆汽车每年行驶1万千米的排碳量需要近200棵树用1年时间来吸收.根据频率分布直方图,该城市每一辆汽车平均需要多少棵树才能够达到“碳中和”?
(3)该城市为了减少碳排量,计划大力推动新能源汽车,关于车主购买汽车时是否考虑对大气污染的因素,对300名车主进行了调查,这些车主中新能源汽车车主占,且这些车主在购车时考虑大气污染因素的占,燃油汽车车主在购车时考虑大气污染因素的占.根据以上统计情况,补全下面列联表,并回答是否有的把握认为购买新能源汽车与考虑大气污染有关.
考虑大气污染 没考虑大气污染 合计
新能源汽车车主
燃油汽车车主
合计
附:,其中.
0.10 0.025 0.010 0.005 0.001
2.706 5.024 6.635 7.879 10.828
44.我市为了解学生体育运动的时间长度是否与性别因素有关,从某几所学校中随机调查了男 女生各100名的平均每天体育运动时间,得到如下数据:
分钟性别 (0,40] (40,60] (60,90] (90,120]
女生 10 40 40 10
男生 5 25 40 30
根据学生课余体育运动要求,平均每天体育运动时间在(60,120]内认定为“合格”,否则被认定为“不合格”,其中,平均每天体育运动时间在(90,120]内认定为“良好”.
(1)完成下列22列联表,并依据小概率值的独立性检验,分析学生体育运动时间与性别因素有无关联;
不合格 合格 合计
女生
男生
合计
(2)从女生平均每天体育运动时间在的100人中用分层抽样的方法抽取20人,再从这20人中随机抽取2人,记为2人中平均每天体育运动时间为“良好”的人数,求的分布列及数学期望;
(3)从全市学生中随机抽取100人,其中平均每天体育运动时间为“良好”的人数设为,记“平均每天体育运动时间为'良好'的人数为”的概率为,视频率为概率,用样本估计总体,求的表达式,并求取最大值时对应的值.
附:,其中.
0.010 0.005 0.001
6.635 7.879 10.828
45.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
46.目前直播带货已经席卷全国了,不论老人小孩、男生女生,大家都听说或是尝试过直播购物,它所具有的能突破时间、空间限制的特点已经吸引了越多越多的人.由此可见,它的受众非常广泛,是大势所趋.不管是什么行业领域,都可以去从事直播带货.直播带货的兴起为人们提供了更多就业岗位.小明是一名刚毕业的大学生,通过直播带货的方式售卖自己家乡的特产,下面是他近4个月的家乡特产收入(单位:万元)情况,如表所示.
月份 5 6 7 8
时间代号 1 2 3 4
家乡特产收入 3.9 3.3 2.2 1.8
(1)根据5月至8月的数据,求y与t之间的线性相关系数(精确到0.01),并判断相关性;
(2)求出y关于t的回归直线方程,并预测9月收入能否突破1万元,请说明理由.
附:①相关系数公式:;(若,则线性相关程度非常强,可用线性回归模型拟合)
②一组数据,其回归直线方程的斜率和截距的最小二乘估计公式分别为,;
③参考数据:,,.
47.为了了解某城市70后和80后市民每周的体育锻炼时长情况,随机抽取了200人进行调查,并按年龄段及周平均体育锻炼时间是否少于7小时,将调查结果整理成列联表,统计得出样本中周平均体有锻炼时间少于7小时的人数占,70后的样本人数占样本总数的,80后每周平均体育最炼时间不少于7小时的样本有60人.(70后指1970年至1979年出生的人构成的群体,80后指1980年至1989年出生的人构成的群体)
时间年龄段 少于7小时 不少于7小时 合计
70后
80后 60
合计 200
(1)请根据已知条件将上述列联表补充完整,并依据小概率值的独立性检验,分析周平均体育锻炼时间长短与年龄段是否有关联;
(2)现从70后的样本中按周平均体育锻炼时间是否少于7小时,用分层抽样的方法抽取6人做进一步访谈,然后从这6人中随机抽取3人进行体检,记抽取的3人中周平均体育锻炼时间不少于7小时的人数为,求的分布列及数学期望.
参考公式及数据:.
0.1 0.05 0.01 0.05 0.001
2.706 3.841 6.635 7.879 10.828
48.某公司为了解广告投入对销售收益的影响,在若干地区各4投入万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.
(1)根据频率分布直方图计算图中各小长方形的宽度;
(2)估计该公司投入4万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);
(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:
广告投入(单位:万元) 1 2 3 4 5
销售收益(单位:万元) 2 3 2 7
表中的数据显示,与之间存在线性相关关系,请将(2)的结果填入空白栏,并计算关于的回归方程.
回归直线的斜率和截距的最小二乘估计公式分别为,.
49.文旅部门统计了某网红景点在2022年3月至7月的旅游收入(单位:万),得到以下数据:
月份 3 4 5 6 7
旅游收入 10 12 11 12 20
(1)根据表中所给数据,用相关系数加以判断,是否可用线性回归模型拟合与的关系?若可以,求出关于之间的线性回归方程;若不可以,请说明理由;
(2)为调查游客对该景点的评价情况,随机抽查了200名游客,得到如下列联表,请填写下面的列联表,依据的独立性检验,能否认为“游客是否喜欢该网红景点与性别有关联”.
喜欢 不喜欢 总计
男 100
女 60
总计 110
参考公式:相关系数,参考数据:.线性回归方程:,其中,.
临界值表:
50.攀枝花市地处川滇交界处,攀西大裂谷中段,这里气候条件独特,日照充足,盛产芒果、石榴、枇杷、甘蔗等热带亚热带水果.根据种植规模与以往的种植经验,产自某种植基地的单个“红玉软籽”石榴质量在正常环境下服从正态分布.
(1)10000个产自该基地的“红玉软籽”石榴,估计有多少个质量在内;
(2)2023年该基地考虑增加人工投入,现有以往的人工投入增量x(人)与年收益增量y(万元)的数据如下:
人工投入增量x(人) 2 3 4 5 6 7
年收益增量(万元) 11 13 19 26 31 38
该基地为了预测人工投入增量与年收益增量的关系,建立了y与x的回归模型,试根据表中统计数据,求出y关于x的线性回归方程并预测人工投入增量为10人时的年收益增量.
参考数据:若随机变量,则,,,
回归直线的斜率和截距的最小二乘估计分别为,.
51.中国在第75届联合国大会上承诺,将采取更加有力的政策和措施,力争于2030年之前使二氧化碳的排放达到峰值,努力争取2060年之前实现碳中和(简称“双碳目标”),此举展现了我国应对气候变化的坚定决心,预示着中国经济结构和经济社会运转方式将产生深刻变革,极大促进我国产业链的清洁化和绿色化.新能源汽车 电动汽车是重要的战略新兴产业,对于实现“双碳目标”具有重要的作用.为了解某一地区电动汽车销售情况,一机构根据统计数据,用最小二乘法得到电动汽车销量(单位:万台)关于(年份)的线性回归方程为,且销量的方差为,年份的方差为.
(1)求与的相关系数,并据此判断电动汽车销量与年份的相关性强弱;
(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
性别 购买非电动汽车 购买电动汽车 总计
男性 39 6 45
女性 30 15 45
总计 69 21 90
依据小概率值的独立性检验,能否认为购买电动汽车与车主性别有关;
(3)在购买电动汽车的车主中按照性别进行分层抽样抽取7人,再从这7人中随机抽取3人,记这3人中,男性的人数为,求的分布列和数学期望.
①参考数据:;
②参考公式:(i)线性回归方程:,其中;
(ii)相关系数:,若,则可判断与线性相关较强.
(iii),其中.附表:
参考答案
1.C
【分析】方法一:先列举出所有情况,再从中挑出数字之积是4的倍数的情况,由古典概型求概率即可.
【详解】[方法一]:【最优解】无序
从6张卡片中无放回抽取2张,共有15种情况,其中数字之积为4的倍数的有6种情况,故概率为.
[方法二]:有序
从6张卡片中无放回抽取2张,共有,(2,1),(3,1),(4,1),(5,1),(6,1),(3,2),(4,2),(5,2),(6,2),(4,3),(5,3),(6,3),(5,4),(6,4),(6,5)30种情况,
其中数字之积为4的倍数有(1,4),(2,4),(2,6),(3,4),(4,1),(4,2),(4,3),(4,5),(4,6),(5,4),(6,2),(6,4)12种情况,故概率为.
故选:C.
【整体点评】方法一:将抽出的卡片看成一个组合,再利用古典概型的概率公式解出,是该题的最优解;
方法二:将抽出的卡片看成一个排列,再利用古典概型的概率公式解出;
2.C
【分析】利用古典概型去求周一不读《天问》,周三不读《离骚》的概率
【详解】该校周一至周四诵读屈原的四部作品方法总数为
周一不读《天问》,周三不读《离骚》的方法总数为
则周一不读《天问》,周三不读《离骚》的概率为
故选:C
3.B
【分析】根据给定信息,结合全概率公式列式求解作答.
【详解】令“玩手机时间超过的学生”,“玩手机时间不超过的学生”,“任意调查一人,此人近视”,
则,且互斥,,,
依题意,,解得,
所以所求近视的概率为.
故选:B
【点睛】关键点睛:利用全概率公式求随机事件B的概率问题,把事件B分拆成两个互斥事件与的和,再利用条件概率公式计算是解决问题的关键.
4.D
【分析】该棋手连胜两盘,则第二盘为必胜盘.分别求得该棋手在第二盘与甲比赛且连胜两盘的概率;该棋手在第二盘与乙比赛且连胜两盘的概率;该棋手在第二盘与丙比赛且连胜两盘的概率.并对三者进行比较即可解决
【详解】该棋手连胜两盘,则第二盘为必胜盘,
记该棋手在第二盘与甲比赛,比赛顺序为乙甲丙及丙甲乙的概率均为,
则此时连胜两盘的概率为


记该棋手在第二盘与乙比赛,且连胜两盘的概率为,

记该棋手在第二盘与丙比赛,且连胜两盘的概率为


即,,
则该棋手在第二盘与丙比赛,最大.选项D判断正确;选项BC判断错误;
与该棋手与甲、乙、丙的比赛次序有关.选项A判断错误.
故选:D
5.A
【分析】根据古典概型概率公式结合组合数公式即得.
【详解】从标号分别为的9种不同的种子中随机抽取2种种子的所有结果有种,
而标号之和恰为10的结果有:,,共4种,
所以所求的概率为.
故选:A.
6.B
【分析】将这5张卡片随机排成一行,共有种方法,恰有连续4张卡片从左往右依次为“立”、“德”、“树”、“人”的情况有2种方法,再由古典概型可得答案.
【详解】将这5张卡片随机排成一行,分两步进行:
首先选两个位置为“立”,共有种方法;
其次另外三个位置,将“德”、“树”、“人”全排列,共有种方法,
所以将这5张卡片随机排成一行,共有种方法,
恰有连续4张卡片从左往右依次为“立”、“德”、“树”、“人”的情况有:
“立”、“立”、“德”、“树”、“人”; “立”、“德”、“树”、“人”、“立”,共两种,
所以恰有连续4张卡片从左往右依次为“立”、“德”、“树”、“人”的概率为,
故选:B.
7.B
【分析】由题意可知,分别求出此人来自三个地区的概率,再利用条件概率公式和全概率公式即可求得此人是流感患者的概率.
【详解】设事件为“此人是流感患者”,事件分别表示此人来自三个地区,
由已知可得,

由全概率公式得
故选:B
8.D
【分析】由正态分布密度曲线的特征逐项判断即可得解.
【详解】对于A,为数据的方差,所以越小,数据在附近越集中,所以测量结果落在内的概率越大,故A正确;
对于B,由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为,故B正确;
对于C,由正态分布密度曲线的对称性可知该物理量一次测量结果大于的概率与小于的概率相等,故C正确;
对于D,因为该物理量一次测量结果落在的概率与落在的概率不同,所以一次测量结果落在的概率与落在的概率不同,故D错误.
故选:D.
9.C
【分析】给定的折线图,理出两校学生测试分数,再逐一分析各个选项即可判断作答.
【详解】由图知,校学生测试分数从小到大依次为:50,51,60,63,65,69,74,76,76,78,
校学生测试分数从小到大依次为:53,55,56,61,63,64,65,65,67,73,
校学生分数的平均分,
校学生分数的平均分,A正确;
校学生分数的众数为76,校学生分数的众数为65,B正确;
校学生分数的中位数为67,校学生分数的中位数为63.5,C错误;
校学生分数分布较为分散,相对于波动较大,校学生分数分布较为集中,相对于波动较小,
即校学生分数的方差大于校学生分数的方差,D正确.
故选:C
10.C
【分析】根据等高条形图的概念结合条件逐项分析即得.
【详解】根据等高条形图图1可知样本中选择物理学科的人数较多,故C正确;
根据等高条形图图2可知样本中男生人数多于女生人数,故D错误;
样本中选择物理学科的人数多于选择历史意愿的人数,而选择物理意愿的男生比例高,选择历史意愿的女生比例低,
所以样本中选择物理意愿的男生人数多于选择历史意愿的女生人数,故A错误;
样本中女生选择历史意愿的人数不一定多于男生选择历史意愿的人数,故B错误.
故选:C.
11.B
【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.
【详解】讲座前中位数为,所以错;
讲座后问卷答题的正确率只有一个是个,剩下全部大于等于,所以讲座后问卷答题的正确率的平均数大于,所以B对;
讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;
讲座后问卷答题的正确率的极差为,
讲座前问卷答题的正确率的极差为,所以错.
故选:B.
12.BC
【分析】根据独立事件的定义判断A,根据互斥事件的定义判断B,由条件概率公式计算出概率判断C,由互斥事件与独立事件概率公式计算概率判断D.
【详解】事件的发生与事件的发生有影响,因此事件的发生与事件不独立,A错;
中任何两个事件都不可能同时发生,因此它们两两互斥,B正确;
,C正确;
,D错.
故选:BC.
13.ACD
【分析】根据互斥事件、独立事件的定义判断AB,由组合知识求得判断C,根据条件概率的定义求得判断D.
【详解】第一次取出的球是红球还是白球两个事件不可能同时发生,它们是互斥的,A正确;
由于是红球有3个,白球有2个,事件发生时,两球同为白色或同为红色,,事件不发生,则两球一白一红,,不独立,B错;
,C正确;
事件发生后,口袋中有3个红球1个白球,只有从中取出一个红球,事件才发生,所以,D正确.
故选:ACD.
14.CD
【分析】计算混合检测分式,样本需要检测的总次数的期望,又逐份检测方式,样本需要检测的总次数,知,利用求解可得p的范围,即可得出选项.
【详解】设混合检测分式,样本需要检测的总次数可能取值为

故的分布列为:
1 11
设逐份检测方式,样本需要检测的总次数,则
要使得混合检测方式优于逐份检测方式,需
即,即,即
又,,
故选:CD
15.ABC
【解析】根据扇形统计图和条状图,逐一判断选项,得出答案.
【详解】选项A:因为互联网行业从业人员中,“90后”占比为56%,
其中从事技术和运营岗位的人数占的比分别为39.6%和17%,
则“90后”从事技术和运营岗位的人数占总人数的
.“80前”和“80后”
中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,
故选项A正确;
选项B:因为互联网行业从业人员中,“90后”占比为56%,
其中从事技术岗位的人数占的比为39.6%,则“90后”从事技术
岗位的人数占总人数的.“80前”和“80后”
中必然也有从事技术岗位的人,则总的占比一定超过20%,故选项B正确;
选项C:“90后”从事运营岗位的人数占总人数的比为,
大于“80前”的总人数所占比3%,故选项C正确;
选项D:“90后”从事技术岗位的人数占总人数的,
“80后”的总人数所占比为41%,条件中未给出从事技术岗位的占比,
故不能判断,所以选项D错误.
故选:ABC.
【点睛】本题考查了扇形统计图和条状图的应用,考查数据处理能力和实际应用能力,属于中档题.
16.ACD
【分析】根据统计图逐个分析判断即可.
【详解】由参保人数比例图可知,54周岁及以上参保人数最少,30周岁及以上的人群约占参保人群的80%,故A,D正确;
由参保险种比例图可知,丁险种更受参保人青睐,故C正确;
由不同年龄段人均参保费用图可知,18~29周岁人群人均参保费用最少,约为4000元,但是这类人所占比例为20%,设参保总人数为a,则18~29周岁人群参保总费用约为元,而54周岁及以上参保人群参保总费用约为6000×8%(元),,故B错误.
故选:ACD.
17.ABD
【分析】根据频率分布直方图中中位数、众数、平均数的计算规则计算即可判断A、B、C,求出抽取的学生年度读书不低于8本的频率之和,即可估计该校年度读书不低于8本的人数,从而判断D.
【详解】解:对于A:因为,所以中位数在内,
设中位数为,则,解得,故A错误.
对于B:由图可知,众数在内,且众数为,故B错误.
对于C:平均数为,故C正确.
对于D:由图可知,该校抽取的学生年度读书不低于8本的频率之和为,
所以该校学生年度读书不低于8本的人数约为,故D错误.
故选:ABD.
18.BCD
【分析】先根据回归直线必过样本中心求出,从而判断选项A、B,再根据回归直线方程即可求出预测值及第四个样本点对应的残差.
【详解】解: 对A、B:由表中的数据,,,
将,代入得,所以A选项错误,B选项正确;
对C:由题意代入得,所以日需求量大约为,
所以C选项正确;
对D:第四个样本点对应的残差为,所以D选项正确;
故选:BCD.
19.ACD
【分析】根据散点图即可得出A项;根据回归方程的含义可判断B项;根据残差计算公式求出残差,可判断C项;根据实际大气压强不能为负,可判断D项.
【详解】对于A项,由图象知,海拔高度越高,大气压强越低,所以大气压强与海拔高度负相关,故A项正确;
对于B项,回归直线得到的数据为估计值,而非精确值,故B项错误;
对于C项,当时,,又由散点图知观测值为,所以样本点的残差为,故C项正确;
对于D项,随着海拔高度的增加,大气压强越来越小,但不可能为负数,因此方程的预报效果更好,故D项正确.
故选:ACD.
20.
【分析】在余下的10人中任选4人作为基本事件总数,仅有两名同学来自相同班级可分为:来自一(1)班或一(2)班或余下的四个班中的一个班.
【详解】12名同学中选6人,其中2人必须参加,即在余下的10人中任选4人,所以基本事件总数为,
余下4人中如有一人来自一(1)班或一(2)班选法有种,
余下4人均来自余下的四个班选法有种,故所求概率为.
故答案为:
21.
【分析】由条件概率的性质和全概率公式计算即可.
【详解】设“该学生第i次及格”为事件Ai,i=1,2,
显然A1,A2为样本空间的一个完备事件组,
且已知P(A1)=p,P(A2|A1)=p,P()=1﹣p,P(A2|).
由全概率公式得,P(A2)=P(A1)P(A2|A1)+P()P(A2|)(1+p).
由贝叶斯公式得,P(A1|A2).
故答案为:.
22.(1)证明见解析
(2),,R的估计值为6
【分析】(1)由条件概率公式证明即可;
(2)由条件概率公式结合(1)中结论求解即可.
【详解】(1),,
又,,
则;
(2),,,
,即,,R的估计值为6.
23.(Ⅰ)见解析;(Ⅱ)
【分析】(Ⅰ)由题意可知分布列为二项分布,结合二项分布的公式求得概率可得分布列,然后利用二项分布的期望公式求解数学期望即可;
(Ⅱ)由题意结合独立事件概率公式计算可得满足题意的概率值.
【详解】(Ⅰ)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为,
故,从面.
所以,随机变量的分布列为:
0 1 2 3
随机变量的数学期望.
(Ⅱ)设乙同学上学期间的三天中7:30之前到校的天数为,则.
且.
由题意知事件与互斥,
且事件与,事件与均相互独立,
从而由(Ⅰ)知:
.
【点睛】本题主要考查离散型随机变量的分布列与数学期望,互斥事件和相互独立事件的概率计算公式等基础知识.考查运用概率知识解决简单实际问题的能力.
24.(Ⅰ)从甲、乙、丙三个部门的员工中分别抽取3人,2人,2人.(Ⅱ)(i)答案见解析;(ii).
【详解】分析:(Ⅰ)由分层抽样的概念可知应从甲、乙、丙三个部门的员工中分别抽取3人,2人,2人.
(Ⅱ)(i)随机变量X的所有可能取值为0,1,2,3.且分布列为超几何分布,即P(X=k)=(k=0,1,2,3).据此求解分布列即可,计算相应的数学期望为.
(ii)由题意结合题意和互斥事件概率公式可得事件A发生的概率为.
详解:(Ⅰ)由已知,甲、乙、丙三个部门的员工人数之比为3∶2∶2,
由于采用分层抽样的方法从中抽取7人,
因此应从甲、乙、丙三个部门的员工中分别抽取3人,2人,2人.
(Ⅱ)(i)随机变量X的所有可能取值为0,1,2,3.
P(X=k)=(k=0,1,2,3).
所以,随机变量X的分布列为
X 0 1 2 3
P
随机变量X的数学期望.
(ii)设事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;
事件C为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,
则A=B∪C,且B与C互斥,
由(i)知,P(B)=P(X=2),P(C)=P(X=1),
故P(A)=P(B∪C)=P(X=2)+P(X=1)=.
所以,事件A发生的概率为.
点睛:本题主要在考查超几何分布和分层抽样.超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.超几何分布的特征是:①考查对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考查某类个体个数X的概率分布,超几何分布主要用于抽检产品、摸不同类别的小球等概率模型,其实质是古典概型.进行分层抽样的相关计算时,常利用以下关系式巧解:(1) ;(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
25.(1)
(2)分布列见解析,均值为
【分析】(1)根据题意,设四类职业的选择的概率依次为,求出4个概率,由相互独立事件的概率公式计算可得答案;
(2)根据题意,分析可取的值,可得,由此求出其分布列,计算可得的值,即可得答案.
【详解】(1)解:(1)根据题意,设职业体验选择救死扶伤的医务类、除暴安良的警察类、百花齐放的文化类、公平正义的法律类的概率依次为,
则,,,,
则救死扶伤的医务类、除暴安良的警察类都有选择的概率;
(2)解:由(1)的结论:选择除暴安良的警察类,
这三名学生中选择除暴安良的警察类型的随机数可能为0、1、2、3,且,
故,
则的分布列如下:
0 1 2 3
则.
26.(1)0.8186;(2)分布列见解析,.
【分析】(1)先由频数分布表求出,从而可得,然后利用正态分布的对称性可求得结果;
(2)由题意可得获赠话费的可能取值为20,40,60,80,然后求出各个对应的概率,从而列出分布,求出期望
【详解】(1).故,
又,∴,.
∴.
综上,.
(2)易知.
获赠话费的可能取值为20,40,60,80.
;;
;.
故的分布列为:
20 40 60 80
∴.
27.(1)见解析;(2)类.
【分析】(1)通过题意分析出小明累计得分的所有可能取值,逐一求概率列分布列即可.(2)与(1)类似,找出先回答类问题的数学期望,比较两个期望的大小即可.
【详解】(1)由题可知,的所有可能取值为,,.



所以的分布列为
(2)由(1)知,.
若小明先回答问题,记为小明的累计得分,则的所有可能取值为,,.



所以.
因为,所以小明应选择先回答类问题.
28.(1)80
(2)选择先回答类问题,理由见解析.
【分析】(1)由题意得出由随机变量的可能取值为0,20,90,100,170,计算对应的不同随机变量的概率,即可求的数学期望;
(2)计算小明先回答,,问题时随机变量的取值及对应概率,求出均值与(1)比较即可.
【详解】(1)解:可能的取值为0,20,90,100,170,
依题意得:,,
,,

所以.
(2)解:设小明先回答类问题,记为小明的累计得分,则的可能取值为0,80,100,150,170.
依题意,,
,,

所以
同理设小明先回答类问题,记为小明的累计得分,则的可能取值为0,70,90,150,170,
依题意得,,
,,

所以.
因为,所以为使累计得分的期望最大.
故小明应选择先回答类问题.
29.(1)4;
(2)A疫区核酸检测预计消耗试管数量比疫区核酸检测预计消耗试管数量少.
【分析】(1)利用错检率计算得解;
(2)先求出整个疫区检测次数的期望值和整个疫区检测次数的期望值,再作差比较大小即得解.
【详解】(1)解:当有100个人检测出核酸阳性时,预计检出的假阳性人数为.
(2)解:先计算疫区核酸检测预计消耗试管数量. 设疫区每个居民感染新冠肺炎的概率为,
采用的混采策略,则该小组所需检测次数为和,对应的概率分别为和,所以该小组检测次数的期望为,
10000名居民分成1000个小组,所以整个疫区检测次数的期望值为.
再计算疫区核酸检测预计消耗试管数量. 设疫区每个居民感染新冠肺炎的概率为,
采用的混采策略,则该小组所需检测次数为和,对应的概率分别为和,所以该小组检测次数的期望为,
20000名居民分成1000个小组,所以整个疫区检测次数的期望值为.
因为,所以,,
所以,
所以A疫区核酸检测预计消耗试管数量比疫区核酸检测预计消耗试管数量少.
30.(1)
(2)分布列见解析,数学期望为
(3)答案见解析.
【分析】(1)根据古典概型的概率公式求解即可;
(2)求得X的可能取值及对应概率,完成分布列,根据期望的公式求解即可;
(3)根据数据得出其概率,期望,平均数,方差等数据分析,理由合理即可.
【详解】(1)设“从5站中随机选取1站,该站甲的成绩高于乙的成绩”为事件A.
甲第1站、第2站、第3站、第4站、第5站的成绩分别为86.20,92.80,87.50,89.50,86.00.
乙第1站、第2站、第3站、第4站、第5站的成绩分别为88.40,88.60,89.10,88.20,87.70.
其中第2站和第4站甲的成绩高于乙的成绩,所以.
(2)X的所有可能取值为0,1,2,
则,,,
所以X的分布列为
X 0 1 2
P

(3)答案一:推荐乙.
从5站的成绩可以看出,任意1站甲的成绩高于乙的成绩的概率为,乙的成绩高于甲的成绩的概率为.因为,所以乙的成绩好于甲的成绩的可能性大,所以推荐乙参加.
答案二:推荐乙.
用“”表示任意1站甲的成绩高于乙的成绩,用“”表示任意1站甲的成绩低于乙的成绩,则,,,.
用“”表示任意1站乙的成绩高于甲的成绩,用“”表示任意1站乙的成绩低于甲的成绩,则,,,.
因为,,
所以预测乙的成绩好于甲的成绩,推荐乙参加.
答案三:推荐乙.
设甲5站的平均成绩、乙5站的平均成绩、甲5站成绩的方差、乙5站成绩的方差分别为,,,,
则,



,说明甲、乙二人水平相当,
,表明乙的发挥比甲的更稳定,所以预测乙的成绩会更好,推荐乙参加.
答案四:推荐甲.
甲5站的平均成绩为,
乙5站的平均成绩为,
虽然甲、乙5站的平均成绩相同,但是甲成绩的极大值为92.80,乙成绩的极大值为89.10,
甲成绩的极大值大于乙成绩的极大值,所以预测甲的成绩会比乙的更好,推荐甲参加.
答案五:推荐甲.
所有成绩中两人均有一次0分成绩,是持平的,但除此之外,甲低于80分的有2次,乙有3次,甲发挥不理想的次数要少,所以甲失误的可能性小,推荐甲参加.
31.(1);(2)分布列答案见解析,.
【分析】(1)利用独立事件的概率和独立重复试验的概率求解;
(2)由题得ξ取值有﹣3,﹣2,﹣1,1,2,3,再求出对应的概率,即得解.
【详解】(1)甲队以3:1获胜等价于前3局中,甲2胜一负,第4局甲胜,
所以甲队以3:1获胜的概率.
(2)由题意可知,甲队和乙队的比分有如下六种0:3,1:3,2:3,3:2,3:1,3:0,
则的ξ取值有﹣3,﹣2,﹣1,1,2,3,
ξ=﹣3时,,
ξ=﹣2时,,
ξ=﹣1时,,
ξ=1时,,
ξ=2时,,
ξ=3时,,
所以ξ的分布列为:
ξ -3 -2 -1 1 2 3
所以.
【点睛】方法点睛:求随机变量的期望的解题步骤为:(1)写出随机变量的取值;(2)求出随机变量对应的概率;(3)写出随机变量的分布列;(4)求出随机变量的期望.
32.(1)分布列见解析,160元
(2)选择方案二更合理
【分析】(1)设实付金额为元,则可能取值为0,100,200,分别求出对应独立重复试验的概率,即可按定义求得分布列和期望;
(2)选择期望较小的方案,方案一可先求出摸到红球的个数的期望,再进一步求即可;方案二设实付金额为,则的可能取值为0,150,250,通过古典概型求得对应分布列和期望.
【详解】(1)设实付金额为元,则可能取值为0,100,200.
则,,,
则的分布列为
0 100 200
∴(元)
(2)若选方案一,设摸到红球的个数为,实付金额为,则,
由题意得,故.
∴(元)
若选方案二,设实付金额为,则的可能取值为0,150,250.
则,,.
则的分布列为
0 150 250
∴(元)
∵,
∴选择方案二更合理.
33.(1);
(2)①;②答案见解析.
【分析】(1)应用独立事件乘法公式及互斥事件加法求恰好检验3次就能确定两只感染病毒白鼠的概率;
(2)①次数为可能取值为1,,利用对立事件概率求法求各值的概率,进而求其期望;②由①得,根据其单调性及其零点,判断方案检验的费用的大小关系.
【详解】(1)根据题意,恰好在第一、三次确定两只感染病毒白鼠的概率,
恰好在第二、三次确定有两只感染病毒白鼠的概率,
所以恰好检验3次就能确定有两只白鼠感染病毒的概率.
(2)①设检验次数为,可能取值为1,.
则,,
所以.
②方案二的检验次数期望为,
所以,设,
因为,所以单调递增,由得:,
当时,,则,
当时,,则,
故当时,选择方案二检验费用少,
当时,选择方案一检验费用少,
当时,选择两种方案检验费用相同.
34.(1)证明见解析
(2)出场顺序均值最小,证明见解析
【分析】(1)由已知的所有可能取值为,分别求出对应的概率,再利用作差法比较与、、的大小关系即可得证;
(2)结合(1)知,可得结论,证明时,设三个小组按照某顺序派出,该顺序下三个小组能完成项目的概率为,
记在比赛时所需派出的小组个数为,则,然后求出的分布列和数学期望,进而得证.
【详解】(1)由已知,的所有可能取值为

所以概率最大
(2)由(1)知,当时,有的值最大,
且,,
所以应当以的顺序安排小组的出场顺序,可以使得指派的小组个数的均值最小.
证明如下:
假设为的任意一个排列,即若三个小组按照某顺序派出,
该顺序下三个小组能完成项目的概率为,记在比赛时所需派出的小组个数为,
则,且的分布列为
数学期望
下面证明
所以按照完成任务概率从大到小的的顺序安排小组的出场顺序,可以使得指派的小组个数的均值最小.
35.(1)岁;
(2);
(3).
【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;
(2)设{一人患这种疾病的年龄在区间},根据对立事件的概率公式即可解出;
(3)根据条件概率公式即可求出.
【详解】(1)平均年龄
(岁).
(2)设{一人患这种疾病的年龄在区间},所以

(3)设“任选一人年龄位于区间[40,50)”,“从该地区中任选一人患这种疾病”,
则由已知得:
,
则由条件概率公式可得
从该地区中任选一人,若此人的年龄位于区间,此人患这种疾病的概率为.
36.(1)56万,(2)0.42,(3)应着重提高31-50这个年龄段的签约率,见解析.
【分析】(1)先由图1算出年龄在71-80岁的居民人数,然后由图2得到年龄在71-80岁的居民签约率,即可算出答案;
(2)由图2得到年龄段在71-80的每个居民签约家庭医生的概率,然后即可算出答案;
(3)根据图1算出每个年龄段的人数,然后结合签约率即可得到答案.
【详解】(1)由题知该地区居民约为2000万,由图1知,该地区年龄在71-80岁的居民人数为万.
由图2知,年龄在71-80岁的居民签约率为0.7,所以该地区年龄在71-80岁且已签约家庭医生的居民人数为:万.
(2)由题知此地区年龄段在71-80的每个居民签约家庭医生的概率为,且每个居民之间是否签约都是独立的,
所以设“从该地区年龄在71-80岁居民中随机抽取两人”为事件,随机变量为,
这两人中恰有1人已签约家庭医生的概率为:
(3)由图1,2知:
年龄段 该地区人数(万) 签约率
18-30 大于360,小于460 30.3
31-40,41-50 37.1
51-60 55.7
61-70 61.7
71-80 70
80以上 75.8
由以上数据可知这个地区在31-50这个年龄段的人为740万,基数较其他年龄段是最大的,且签约率为,非常低,
所以为把该地区满18周岁居民的签约率提高到以上,应着重提高31-50这个年龄段的签约率.
【点睛】本题考查了频率分布直方图的应用和概率的求法,考查了学生的阅读能力和计算能力,属于基础题.
37.(1);
(2)
(3)
【分析】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)代入题给相关系数公式去计算即可求得样本的相关系数值;
(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值.
【详解】(1)样本中10棵这种树木的根部横截面积的平均值
样本中10棵这种树木的材积量的平均值
据此可估计该林区这种树木平均一棵的根部横截面积为,
平均一棵的材积量为
(2)

(3)设该林区这种树木的总材积量的估计值为,
又已知树木的材积量与其根部横截面积近似成正比,
可得,解之得.
则该林区这种树木的总材积量估计为
38.(1)利用模型②预测值为511(万人);利用模型③预测值为461(万人)
(2)利用模型③得到的预测值更可靠,理由见解析
【分析】(1)把t=22分别代入两个模型计算即可;
(2)比较模型的决定系数及相关系数大小即可得出结论.
【详解】(1)利用模型②得2022年全国普通本科招生数的预测值为=152.4+16.3×22=511(万人);
利用模型③得2022年全国普通本科招生数的预测值为=372.8+9.8×9=461(万人).
(2)利用模型③得到的预测值更可靠,理由如下(以下理由任选一个作答即可).
理由一:从计算结果可以看出,模型③的决定系数最大,说明其拟合效果最好,因此利用模型③得到的预测值更可靠.
理由二:模型①的决定系数比模型②③小很多,说明其拟合效果最差.对于模型②③,模型③的相关系数0.99比模型②的相关系数0.97大,说明模型③的两变量的线性相关性比模型②更强.因此利用模型③得到的预测值更可靠.
39.(1)见解析;(2) (3)见解析
【分析】(1)根据中条件,计算相关系数的值,即可得出结论;
(2)根据题中数据,计算出,即可得到回归方程;
(3)将代入(2)的结果,结合题中条件,即可求出结果.
【详解】(1)由折线图中的数据和附注中的参考数据得
, , ,
∴, 因为
所以销售量与月份代码有很强的线性相关关系.
(2) 由及(Ⅰ)得
所以关于的回归方程为
(3)当时,代入回归方程得(万件)
第8个月的毛利润为
,预测第8个月的毛利润不能突破万元.
【点睛】本题主要考查线性回归分析,熟记最小二乘法求,以及线性回归分析的基本思想即可,属于常考题型.
40.(1)模型更可靠,理由见解析;(2)①363;②2023年.
【分析】(1)根据散点图的特征,即可直接判定出结果;
(2)根据题中条件,求出,,结合最小二乘法求出与,即可得出回归方程;
①根据所求回归方程,令,即可求出预测值;
②分别求出,的预测值,结合题中条件,计算累计装机容量,即可得出结果.
【详解】(1)模型更可靠.
原因:从散点图可以看出,左边的散点图上的点比右边散点图上的点更集中在一条直线的附近,说明变量u和t具有更强的线性相关关系.
(2)依题意得,,,,
所以,则,
所以;
①当时,2021年我国海上风电新增装机容量的预测值是.
②当时,2022年我国海上风电新增装机容量的预测值是.
当时,2023年我国海上风电新增装机量的预测值是
因为,;
所以预计至少要到2023年,我国海上风电累计装机量超过2000万千瓦.
【点睛】思路点睛:
利用最小二乘法求回归直线方程的一般步骤:
(1)先由题中数据求出两变量的平均数、,
(2)再根据,,求出和,
(3)将系数代入回归直线方程,可得回归直线方程.
41.(1)A,B两家公司长途客车准点的概率分别为,
(2)有
【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;
(2)根据表格中数据及公式计算,再利用临界值表比较即可得结论.
【详解】(1)根据表中数据,A共有班次260次,准点班次有240次,
设A家公司长途客车准点事件为M,
则;
B共有班次240次,准点班次有210次,
设B家公司长途客车准点事件为N,
则.
A家公司长途客车准点的概率为;
B家公司长途客车准点的概率为.
(2)列联表
准点班次数 未准点班次数 合计
A 240 20 260
B 210 30 240
合计 450 50 500
=,
根据临界值表可知,有的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
42.(1)列联表见解析,市民对交通的满意度与是否上班有关,此推断犯错误的概率不大于0.001
(2)(i)分布列见解析,;(ii),平均每抽取2个人,就会有一个不满意的市民
【分析】(1)根据题意完成列联表,进而利用公式计算可得,查表分析可得结果;
(2)(i)由(1)可知市民的满意度和不满意度均为,计算可得的分布列和数学期望,(ⅱ)由(i)可得,当n趋向于正无穷大时,趋向于2,即可理解为平均每抽取2个人,就会有一个不满意的市民.
【详解】(1)由题意可知
满意 不满意 合计
上班族 15 40 55
非上班族 35 10 45
合计 50 50 100
零假设为:市民对交通的满意度与是否上班独立,
因为;
根据小概率值的独立性检验,我们推断不成立,即认为市民对交通的满意度与是否上班有关,此推断犯错误的概率不大于0.001.
(2)(i)当时,的取值为1,2,3,4,5,
由(1)可知市民的满意度和不满意度均为;
所以,,,,,
所以的分布列为
1 2 3 4 5
P
所以;
(ⅱ)
当n趋向于正无穷大时,趋向于2,此时恰好为不满意度的倒数;
也可以理解为平均每抽取2个人,就会有一个不满意的市民.
43.(1),平均值(万千米);(2)棵;(3)列联表答案见解析,没有的把握认为购买新能源汽车与考虑大气污染有关.
【分析】(1)由频率分布直方图及频率之和为1求a,再结合频率分布直方图求均值即可;
(2)求出汽车一年的行驶里程均值,根据碳中和概念列方程求解;
(3)列出联表,计算,根据临界值表作出结论即可.
【详解】(1)由,解得.
设为汽车5年内所行驶里程的平均值,则
(万千米).
(2)由(1)可知,一辆汽车1年内所行驶里程的平均值为(万千米).
因为一辆汽车每年行驶1万千米的排碳量需要近200棵树用1年时间来吸收,
所以每一辆汽车平均需要(棵)树才能够达到“碳中和”.
(3)补全的列联表如下:
考虑大气污染 没考虑大气污染 合计
新能源汽车车主 10 40 50
燃油汽车车主 25 225 250
合计 35 265 300
所以.
因为,
所以没有的把握认为购买新能源汽车与考虑大气污染有关.
44.(1)列联表见解析,认为性别因素与学生体育运动时间有关联,此推断犯错误的概率不大于;
(2)分布列见解析,数学期望为;
(3),
【分析】(1)通过题意可得列联表,计算的值,可得结论;
(2)根据分层抽样的比例可得抽取的女生平均每天体育运动时间在的人数,确定的取值,根据超几何分布可求得每个值对应的概率,即得分布列,从而计算数学期望;
(3)通过题意可得满足二项分布,能得到,然后通过作商法可得到当时,,当时,,即可得到答案
【详解】(1)由题意可知,22列联表如下表
不合格 合格 合计
女生 50 50 100
男生 30 70 100
合计 80 120 200
零假设为:性别与学生体育运动时间无关联.
根据列联表中的数据,经计算得到

根据小概率值的独立性检验,我们推断不成立即认为性别因素与学生体育运动时间有关联,此推断犯错误的概率不大于;
(2)抽取的20人中,女生平均每天运动时间在的人数分别为2人,8人,8人,2人,易知的所有可能取值为,
,,,
所以的分布列为
0 1 2
所以数学期望为;
(3)平均每天运动时间在的频率为,
由题意可知,
所以,
由,得,
所以,当时,,即,
当时,,即,
所以,即取最大值时,.
45.(1);(2);(3)详见解析
【分析】(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可;
(2)利用公式计算即可;
(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.
【详解】(1)样区野生动物平均数为,
地块数为200,该地区这种野生动物的估计值为
(2)样本(i=1,2,…,20)的相关系数为
(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,
由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,
采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,
从而可以获得该地区这种野生动物数量更准确的估计.
【点晴】本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算能力,是一道容易题.
46.(1);认为y与t之间有很强的相关性.
(2)y关于t的回归直线方程为:,不能.
【分析】(1)直接代入公式求出认为y与t之间的线性相关系数,即可判断;
(2)代入公式求出系数,即可得到回归方程,并求出9月收入即可判断.
【详解】(1)由表格数据可知:,,则,
由题意知:,

代入相关系数公式可得:,
因为,所以认为y与t之间有很强的相关性.
(2)由题意可得:,
,,,
所以,则,
所以y关于t的回归直线方程为:,
把代入可得:,
所以预测9月收入不能突破1万元.
47.(1)填表见解析;周平均体育锻炼时间长短与年龄段无关联
(2)分布列见解析;期望为
【分析】(1)根据列联表求得即可解决;(2)抽取的6人中,周平均体育锻炼时间少于7小时的有2人,不少于7小时的有4人,得所有可能的取值为,根据超几何分布解决即可.
【详解】(1)补充列联表如下:
时间年龄段 少于7小时 不少于7小时 合计
70后 30 60 90
80后 50 60 110
合计 80 120 200
假设:周平体育锻炼时间长短与年龄无关联,

依据小概率值的独立性检验分析判断成立,故周平均体育锻炼时间长短与年龄段无关联.
(2)由题意可知:抽取的6人中,周平均体育锻炼时间少于7小时的有人,不少于7小时的有人;
所以所有可能的取值为,
;;;
的分布列为:
1 2 3
数学期望.
48.(1)2
(2)5
(3)空白栏中填5,
【分析】(1)根据频率等于小长方形的面积以及频率和为,得到关于的等式,求解出即可;
(2)由各组数据的组中值与频率的乘积之和得到对应的销售收益的平均值;
(3)先填写空白栏数据,然后根据所给数据计算出,即可求解出回归直线方程.
【详解】(1)设各小长方形的宽度为,
由频率分布直方图中各小长方形的面积总和为1,可知,
解得.
所以图中各小长方形的宽度为2.
(2)由(1)知各小组依次是,
各小组的中点分别为,对应的频率分别为,
所以可估计销售收益的平均值为.
(3)由(2)可知空白栏中填5,
由题意可知,
,,
根据公式,可求得,则,
所以所求的回归直线方程为.
49.(1)可用线性回归模型拟合与的关系,;
(2)列联表见解析,游客是否喜欢该网红景点与性别有关联.
【分析】(1)根据相关系数公式求出相关系数,再应用最小二乘法求回归直线即可;
(2)由已知写出列联表,根据卡方公式求卡方值,结合独立检验的基本思想得到结论.
【详解】(1)由已知得:,
,因为,
说明与的线性相关关系很强.,可用线性回归模型拟合与的关系,

则关于的线性回归方程为:.
(2)列联表如下所示:
喜欢 不喜欢 总计
男 70 30 100
女 40 60 100
总计 110 90 200
零假设:游客是否喜欢该网红景点与性别无关联,
根据列联表中数据,,
依据小概率值的独立性检验,我们推断不成立,
即游客是否喜欢该网红景点与性别有关联.
50.(1)估计有8616个质量在克内;
(2),人工投入增量为10人时的年收益增量约为.
【分析】(1)根据正态分布性质可求出单个石榴的质量在克内的概率,由此可得10000个样本中质量位于克的石榴个数的分布列,进而估计质量位于内的石榴的个数.
(2)根据最小二乘法即可求出线性回归方程,再利用回归方程进行预测即可.
【详解】(1)设单个“红玉软籽”石榴的质量为克,
由已知, ,且,
所以,,
所以,
所以,
又,,
所以,
设10000个产自该基地的“红玉软籽”石榴中,质量在克内的石榴的个数为,则,所以10000个产自该基地的“红玉软籽”石榴,估计有,即个质量在克内;
(2)由已知,,
,,
有,
且,
所以关于的回归方程为.
当时,,
所以可以预测当人工投入增量为10人时的年收益增量约为.
51.(1),与线性相关较强
(2)认为购买电动汽车与车主性别有关,此推断犯错误的概率不大于
(3)分布列答案见解析,数学期望:
【分析】(1)利用相关系数的求解公式,并转化为和方差之间的关系,代入计算即可;
(2)直接利用独立性检验公式求出,根据零点假设定理判断购买电动汽车与车主性别是否有关;
(3)采用分层抽样先得出男性车主和女性车主的选取人数,得出可能取值0,1,2,分别求出对应概率,即可得的分布列,再结合期望公式,即可求解.
【详解】(1)(1)相关系数为
故与线性相关较强.
(2)零假设为:购买电动汽车与车主性别相互独立,
即购买电动汽车与车主性别无关.
所以依据小概率值的独立性检验,我们推断不成立,
即认为购买电动汽车与车主性别有关,此推断犯错误的概率不大于.
(3)抽样比,男性车主选取2人,女性车主选取5人,则的可能取值为故
,,
故的分布列为:
0 1 2
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://21世纪教育网(www.21cnjy.com)
" 21世纪教育网(www.21cnjy.com)
同课章节目录