登录二一教育在线组卷平台 助您教考全无忧
专题03 统计和概率-【大题精做】冲刺2023年高考大题突破训练
一、解答题
1.(2023·宁波模拟)盲盒,是指消费者不能提前得知具体产品款式的玩具盒子,具有随机属性.某品牌推出2款盲盒套餐,A款盲盒套餐包含4款不同单品,且必包含隐藏款X;B款盲盒套餐包含2款不同单品,有的可能性出现隐藏款X.为避免盲目购买与黄牛囤积,每人每天只能购买1件盲盒套餐.开售第二日,销售门店对80名购买了套餐的消费者进行了问卷调查,得到如下列联表:
A款盲盒套餐 B款盲盒套餐 合计
年龄低于30岁 18 30 48
年龄不低于30岁 22 10 32
合计 40 40 80
附:,其中,
P() 0.100 0.050 0.025 0.010 0.001
2.706 3.841 5.024 6.635 0.828
(1)根据列联表,判断是否有的把握认为A,B款盲盒套餐的选择与年龄有关;
(2)甲、乙、丙三人每人购买1件B款盲盒套餐,记随机变量为其中隐藏款X的个数,求的分布列和数学期望;
(3)某消费者在开售首日与次日分别购买了A款盲盒套餐与B款盲盒套餐各1件,并将6件单品全部打乱放在一起,从中随机抽取1件打开后发现为隐藏款X,求该隐藏款来自于B款盲盒套餐的概率.
2.(2023·嘉兴模拟)为了解市某疾病的发病情况与年龄的关系,从市疾控中心得到以下数据:
年龄段(岁)
发病率(‰) 0.09 0.18 0.30 0.40 0.53
(1)若将每个区间的中点数据记为,对应的发病率记为,根据这些数据可以建立发病率(‰)关于年龄(岁)的经验回归方程,求;
附:
(2)医学研究表明,化验结果有可能出现差错.现有市某位居民,年龄在表示事件“该居民化验结果呈阳性”,表示事件“该居民患有某疾病”.已知,,求(结果精确到0.001).
3.(2023·台州模拟)向日葵是常见的一种经济作物,种子常炒制为零食食用,也可榨葵花籽油.但种植向日葵时会频繁地遇到空壳问题,其中开花期大气湿度是导致向日葵空壳的一大主因.为找到向日葵空壳率与开花期大气湿度的关系,研究人员做了观察试验,结果如下:
大气湿度x 45% 59% 66% 68% 69% 70% 72% 77% 80% 88%
空壳率y 18% 21% 25% 27% 26% 29% 31% 32% 33% 37%
附:经验回归方程系数:,,,,,.
(1)试求向日葵空壳率与大气湿度之间的回归直线方程;(回归直线方程的系数均保留两位有效数字)
(2)某地大气湿度约为时,试根据(1)中的回归直线方程推测空壳率大约为多少
4.(2023·绍兴模拟)2023年是全面贯彻落实党二十大精神的开局之年,也是实施“十四五”规划承上启下的关键之年,今年春季以来,各地出台了促进经济发展的各种措施,经济增长呈现稳中有进的可喜现象.服务业的消费越来越火爆,绍兴一些超市也纷纷加大了广告促销.现随机抽取7家超市,得到其广告支出x(单位:万元)与销售额y(单位:万元)数据如下:
超市 A B C D E F G
广告支出 1 2 4 6 10 13 20
销售额 19 32 44 40 52 53 54
附注:参考数据,回归方程中斜率和截距的最小二乘估计公式分别为:.
(1)建立关于的一元线性回归方程(系数精确到0.01);
(2)若将超市的销售额与广告支出的比值称为该超市的广告效率值,当时,称该超市的广告为“好广告”.从这7家超市中随机抽取4家超市,记这4家超市中“好广告”的超市数为,求的分布列与期望.
5.(2023·金华模拟)全国 “两会”召开的一项重要意义在于将“两会代表”从人民中得来的信息和要求进行收集及整理,传达给中央,“两会代表”代表着广大选民的利益,代表选民在“两会”期间向政府有关部门提出选民的意见和要求.下表是2011年至2020年历年全国政协提案的数量统计.
年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5 6 7 8 9 10
提案数量y(单位:千件) 5.762 6.069 5.641 5.875 5.857 5.769 5.21 5.36 5.488 5.044
参考公式:相关系数,.
参考数据:.
(1)请用相关系数说明y与x之间的关系可否用线性回归模型拟合?若能,求y关于x的一元线性回归方程;(运算结果精确到0.01)(若,则线性相关程度很高,可用直线拟合)
(2)中央政府回应2020年“两会”的热点议题“战胜疫情”,以令世界惊叹的中国速度、中国效率和中国奇迹,社会各阶层、各行各业迅速投身战“疫”行动,团结共进、众志成城.其中一个关键举措是2021年全国各地全面展开的疫苗接种.为方便市民合理安排疫苗接种,城市便民电子系统即时提供接种点相关信息,若某疫苗接种点上午和下午接种疫苗分别需要等待20分钟和40分钟,而甲、乙市民均在某日接种疫苗,且上午去接种疫苗的概率分别为,要使两市民需要等待时间的总和的期望值不超过60分钟,求实数p的取值范围.
6.(2023·浦东模拟)为了庆祝党的二十大顺利召开,某学校特举办主题为“重温光辉历史 展现坚定信心”的百科知识小测试比赛.比赛分抢答和必答两个环节,两个环节均设置10道题,其中5道人文历史题和5道地理环境题.
(1)在抢答环节,某代表队非常积极,抢到4次答题机会,求该代表队至少抢到1道地理环境题的概率;
(2)在必答环节,每个班级从5道人文历史题和5道地理环境题各选2题,各题答对与否相互独立,每个代表队可以先选择人文历史题,也可以先选择地理环境题开始答题.若中间有一题答错就退出必答环节,仅当第一类问题中2题均答对,才有资格开始第二类问题答题.已知答对1道人文历史题得2分,答对1道地理环境题得3分.假设某代表队答对人文历史题的概率都是,答对地理环境题的概率都是.请你为该代表队作出答题顺序的选择,使其得分期望值更大,并说明理由.
7.(2023·嘉定模拟)李先生是一名上班族,为了比较上下班的通勤时间,记录了20天个工作日内,家里到单位的上班时间以及同路线返程的下班时间(单位:分钟),如下茎叶图显示两类时间的共40个记录:
附:,,
(1)求出这40个通勤记录的中位数M,并完成下列2×2列联表:
超过M 不超过M
上班时间
下班时间
(2)根据列联表中的数据,请问上下班的通勤时间是否有显著差异?并说明理由.
8.(2023·黄浦模拟)将某工厂的工人按年龄分成两组:“35周岁及以上”、“35周岁以下”,从每组中随机抽取80人,将他们的绩效分数分成5组:,分别加以统计,得到下列频率分布直方图.该工厂规定绩效分数不少于80者为生产标兵.
附:.
0.100 0.050 0.010 0.001
k 2.706 3.841 6.635 10.828
(1)请列出列联表,并判断能否有的把握认为是否为生产标兵与工人所在的年龄组有关:
(2)若已知该工厂工人中生产标兵的占比为,试估计该厂35周岁以下的工人所占的百分比以及生产标兵中35周岁以下的工人所占的百分比.
9.(2023·长春模拟)国学小组有编号为1,2,3,…,的位同学,现在有两个选择题,每人答对第一题的概率为、答对第二题的概率为,每个同学的答题过程都是相互独立的,比赛规则如下:①按编号由小到大的顺序依次进行,第1号同学开始第1轮出赛,先答第一题;②若第号同学未答对第一题,则第轮比赛失败,由第号同学继继续比赛;③若第号同学答对第一题,则再答第二题,若该生答对第二题,则比赛在第轮结枣;若该生未答对第二题,则第轮比赛失败,由第号同学继续答第二题,且以后比赛的同学不答第一题;④若比赛进行到了第轮,则不管第号同学答题情况,比赛结束.
(1)令随机变量表示名同学在第轮比赛结束,当时,求随机变量的分布列;
(2)若把比赛规则③改为:若第号同学未答对第二题,则第轮比赛失败,第号同学重新从第一题开始作答.令随机变量表示名挑战者在第轮比赛结束.
①求随机变量的分布列;
②证明:单调递增,且小于3.
10.(2023·茂名模拟)马尔可夫链是因俄国数学家安德烈·马尔可夫得名,其过程具备“无记忆”的性质,即第次状态的概率分布只跟第次的状态有关,与第次状态是“没有任何关系的”.现有甲、乙两个盒子,盒子中都有大小、形状、质地相同的2个红球和1个黑球.从两个盒子中各任取一个球交换,重复进行次操作后,记甲盒子中黑球个数为,甲盒中恰有1个黑球的概率为,恰有2个黑球的概率为.
(1)求的分布列;
(2)求数列的通项公式;
(3)求的期望.
11.(2023·虹口模拟)电解电容是常见的电子元件之一.检测组在的温度条件下对电解电容进行质量检测,按检测结果将其分为次品、正品,其中正品分合格品、优等品两类
(1)铝 是组成电解电容必不可少的材料.现检测组在的温度条件下,对铝箵质量与电解电容质量进行测试,得到如下列联表,那么他们是否有的把握认为电解电容质量与铝 质量有关?请说明理由;
电解电容为次品 电解电容为正品
铝箔为次品 174 76
铝箔为正品 108 142
(2)电解电容经检验为正品后才能装箱,已知两箱电解电容(每箱50个),第一箱和第二箱中分别有优等品8件与9件.现用户从两箱中随机挑选出一箱,并从该箱中先后随机抽取两个元件,求在第一次取出的是优等品的情况下,第二次取出的是合格品的概率.
12.(2023·金山模拟)某网站计划4月份订购草莓在网络销售,每天的进货量相同,成本价为每盒15元.假设当天进货能全部售完,决定每晚七点前(含七点)售价为每盒20元,每晚七点后售价为每盒10元.根据销售经验,每天的购买量与网站每天的浏览量(单位:万次)有关.为确定草莓的进货量,相关人员统计了前两年4月份(共60天)网站每天的浏览量(单位:万次)、购买草莓的数量(单位:盒)以及达到该流量的天数,如下表所示:
每天的浏览量
每天的购买量 300 900
天数 36 24
以每天的浏览量位于各区间的频率代替浏览量位于该区间的概率.
(1)求4月份草莓一天的购买量(单位:盒)的分布;
(2)设4月份销售草莓一天的利润为(单位:元),一天的进货量为(单位:盒),为正整数且,当为多少时,的期望达到最大值,并求此最大值.
13.(2023·静安模拟)概率统计在生产实践和科学实验中应用广泛.请解决下列两个问题.
参考公式及数据:,其中,
(1)随着中小学“双减”政策的深入人心,体育教学和各项体育锻炼迎来时间充沛的春天.某初中学校学生篮球队从开学第二周开始每周进行训练,第一次训练前共有6个篮球,其中3个是新球(即没有用过的球),3个是旧球(即至少用过一次的球).每次训练,都是从中不放回任意取出2个篮球,训练结束后放回原处. 设第一次训练时取到的新球个数为ξ,求随机变量ξ的分布和期望.
(2)由于手机用微波频率信号传递信息,那么长时间使用手机是否会增加得脑瘤的概率?研究者针对这个问题,对脑瘤病人进行问卷调查,询问他们是否总是习惯在固定的一侧接听电话?如果是,是哪边?结果有88人喜欢用固定的一侧接电话.其中脑瘤部位在左侧的病人习惯固定在左侧接听电话的有14人,习惯固定在右侧接听电话的有28人;脑瘤部位在右侧的病人习惯固定在左侧接听电话的有19人,习惯固定在右侧接听电话的有27人.根据上述信息写出下面这张列联表中字母所表示的数据,并对患脑瘤在左右侧的部位是否与习惯在该侧接听手机电话相关进行独立性检验.(显著性水平
习惯固定在左侧接听电话 习惯固定在右侧接听电话 总计
脑瘤部位在左侧的病人 a b 42
脑瘤部位在右侧的病人 c d 46
总计 a+c b+d 88
14.(2023·闵行模拟)在临床检测试验中,某地用某种抗原来诊断试验者是否患有某种疾病.设事件表示试验者的检测结果为阳性,事件表示试验者患有此疾病,据临床统计显示,,.已知该地人群中患有此种疾病的概率为.(下列两小题计算结果中的概率值精确到)
(1)对该地某人进行抗原检测,求事件与同时发生的概率;
(2)对该地个患有此疾病的患者进行抗原检测,用随机变量表示检测结果为阳性的人数,求的分布和期望.
15.(2023·梅州模拟)元宵佳节,是民间最重要的民俗节日之一,我们梅州多地都会举行各种各样的民俗活动,如五华县河东镇的“迎灯”、丰顺县埔寨镇的“火龙”、大埔县百侯镇的“迎龙珠灯”等系列活动.在某庆祝活动现场,为了解观众对该活动的观感情况(“一般”或“激动”),现从该活动现场的观众中随机抽取200名,得到下表:
一般 激动 总计
男性 90 120
女性 25
总计 200
附:,其中.
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
(1)填补上面的2×2列联表,并依据小概率值的独立性检验,能否认为性别与对该活动的观感程度有关?
(2)该活动现场还举行了有奖促销活动,凡当天消费每满300元,可抽奖一次.抽奖方案是:从装有3个红球和3个白球(形状、大小、质地完全相同)的抽奖箱里一次性摸出2个球,若摸出2个红球,则可获得100元现金的返现;若摸出1个红球,则可获得50元现金的返现;若没摸出红球,则不能获得任何现金返现.若某观众当天消费600元,记该观众参加抽奖获得的返现金额为X,求随机变量X的分布列和数学期望.
16.(2023·吉林模拟)我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.该企业为了了解研发资金的投入额x(单位:百万元)对年收入的附加额y(单位:百万元)的影响,对往年研发资金投入额和年收入的附加额进行研究,得到相关数据如下:
投入额 2 3 4 5 6 8 9 11
年收入的附加额 3.6 4.1 4.8 5.4 6.2 7.5 7.9 9.1
【参考数据】,,.
【附】在经验回归方程中,,.
(1)求年收入的附加额y与投入额x的经验回归方程;
(2)若年收入的附加额与投入额的比值大于1,则称对应的投入额为“优秀投资额”,现从上面8个投入额中任意取3个,用X表示这3个投入额为“优秀投资额”的个数,求X的分布列及数学期望.
17.(2023·广安模拟)某商店销售某种产品,为了解客户对该产品的评价,现随机调查了200名客户,其评价结果为“一般”或“良好”,并得到如下列联表:
一般 良好 合计
男 20 100 120
女 30 50 80
合计 50 150 200
附表及公式:
0.15 0.10 0.05 0.025 0.010
2.072 2.706 3.841 5.024 6.635
其中,.
(1)通过计算判断,有没有99%的把握认为客户对该产品的评价结果与性别有关系?
(2)该商店在春节期间开展促销活动,该产品共有如下两个销售方案.方案一:按原价的8折销售;方案二:顾客购买该产品时,可在一个装有4张“每满200元少80元”,6张“每满200元少40元”共10张优惠券的不透明箱子中,随机抽取1张,购买时按照所抽取的优惠券进行优惠.已知该产品原价为260(元/件).顾客甲若想采用方案二的方式购买一件产品,估计顾客甲需支付的金额;你认为顾客甲选择哪种购买方案较为合理?
18.(2023·杭州模拟)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为:假设我们的序列状态是…,,,,,…,那么时刻的状态的条件概率仅依赖前一状态,即.
现实生活中也存在着许多马尔科夫链,例如著名的赌徒模型.
假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率为,且每局赌赢可以赢得1元,每一局赌徒赌输的概率为,且赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束赌博游戏:一种是手中赌金为0元,即赌徒输光;一种是赌金达到预期的B元,赌徒停止赌博.记赌徒的本金为,赌博过程如下图的数轴所示.
当赌徒手中有n元(,)时,最终输光的概率为,请回答下列问题:
(1)请直接写出与的数值.
(2)证明是一个等差数列,并写出公差d.
(3)当时,分别计算,时,的数值,并结合实际,解释当时,的统计含义.
19.(2023·崇明模拟)某校工会开展健步走活动,要求教职工上传3月1日至3月7日的微信记步数信息,下图是职工甲和职工乙微信记步数情况:
(1)从3月2日至3月7日中任选一天,求这一天职工甲和职工乙微信记步数都不低于10000的概率;
(2)从3月1日至3月7日中任选两天,记职工乙在这两天中微信记步数不低于10000的天数为,求的分布列及数学期望;
(3)下图是校工会根据3月1日至3月7日某一天的数据制作的全校200名教职工微信记步数的频率分布直方图.已知这一天甲和乙微信记步数在单位200名教职工中排名(按照从大到小排序)分别为第68和第142,请指出这是根据哪一天的数据制作的频率分布直方图(不用说明理由).
20.(2023·红河模拟)某市教育行政部门为开展普及法律常识的宣传教育活动,增强学生的法律意识,提高自身保护能力,在全市中小学生范围内,组织了一次法律常识知识竞赛(满分100分),现从所有参赛学生的竞赛成绩中随机抽取200份,经统计,这200份成绩全部介于之间,将数据按照,,……,分成七组,得到如下频数分布表:
竞赛成绩(单位:分)
人数(单位:人) 6 14 30 74 42 23 11
(1)试估计该市竞赛成绩的平均分(同一组中的数据用该组区间的中点值作代表)和第80百分位数(保留一位小数);
(2)以样本频率值作为概率的估计值,若从该市所有参与竞赛的学生中,随机抽取3名学生进行座谈,设抽到60分及以上的学生人数为,求的分布列和数学期望.
21.(2023·宜宾模拟)2022年中国新能源汽车销量继续蝉联全球第一,以比亚迪为代表的中国汽车交出了一份漂亮的“成绩单”,比亚迪新能源汽车成为2022年全球新能源汽车市场销量冠军,在中国新能源车的销量中更是一骑绝尘,占比约为30%.为了解中国新能源车的销售价格情况,随机调查了10000辆新能源车的销售价格,得到如下的样本数据的频率分布直方图:
(1)估计一辆中国新能源车的销售价格位于区间(单位:万元)的概率,以及中国新能源车的销售价格的众数;
(2)若从中国新能源车中随机地抽出3辆,设这3辆新能源车中比亚迪汽车的数量为,求的分布列与数学期望.
22.(2023·温州模拟)在一次全市的联考中,某校高三有100位学生选择“物化生”组合,100位学生选择“物化地”组合,现从上述的学生中分层抽取100人,将他们此次联考的化学原始成绩作为样本,分为6组:,得到如图所示的频率分布直方图.
附:,其中.
0.10 0.05 0.01 0.001
2.706 3.841 6.635 10.828
(1)求直方图中的值;
(2)在抽取的100位学生中,规定原始成绩不低于80分为“优秀”,低于80分为“不够优秀",请将下面的列联表补充完整,并判断是否有的把握认为成绩是否优秀与所选的组合有关?
优秀 不够优秀 总计
“物化生”组合 40
“物化地”组合
总计
(3)浙江省高考的选考科目采用等级赋分制,等级赋分的分差为1分,具体操作步骤如下:
第一步:将原始成绩从高到低排列,按人数比例划分为20个赋分区间.
第二步:对每个区间的原始成绩进行等比例转换,公式为:
其中分别是该区间原始成绩的最低分 最高分;分别是该区间等级分的最低分 最高分;为某考生原始成绩,为转换结果.
第三步:将转换结果四舍五入,确定为该考生的最终等级分.
本次联考采用浙江选考等级赋分制,已知全市所有的考生原始成绩从高到低前(最低分为80分)的考生被划分至的赋分区间,甲 乙两位考生的化学原始成绩分别为,最终的等级分为98 99.试问:本次联考全市化学原始成绩的最高分是否可能是91分?请说明理由.
23.(2023·南宁模拟)在某次现场招聘会上,某公司计划从甲和乙两位应聘人员中录用一位,规定从6个问题中随机抽取3个问题作答.假设甲能答对的题目有4道,乙每道题目能答对的概率为,
(1)求甲在第一次答错的情况下,第二次和第三次均答对的概率;
(2)请从期望和方差的角度分析,甲 乙谁被录用的可能性更大?
24.(2023·桂林模拟)某互联网公司为了确定下一季度的前期广告投入计划,收集了近个月广告投入量(单位:万元)和收益(单位:万元)的数据如下表:
月份
广告投入量
收益
他们分别用两种模型①,②分别进行拟合,得到相应的回归方程并进行残差分析,得到如下图所示的残差图及一些统计量的值.
附:回归方程中斜率和截距的最小二乘估计公式分别为:,.
(1)根据残差图,比较模型①②的拟合效果,应该选择哪个模型?请说明理由.
(2)残差绝对值大于的数据认为是异常数据,需要剔除.
(i)剔除异常数据后求出(1)中所选模型的回归方程;
(ii)若广告投入量,求该模型收益的预报值是多少?
25.(2023·宣城模拟)某校在一次庆祝活动中,设计了一个“套圈游戏”,规则如下:每人3个套圈,向,两个目标投掷,先向目标掷一次,套中得1分,没有套中不得分,再向目标连续掷两次,每套中一次得2分,没套中不得分,根据累计得分发放奖品.已知小明每投掷一次,套中目标的概率为,套中目标的概率为,假设小明每次投掷的结果相互独立,累计得分记为.
(1)求小明恰好套中2次的概率;
(2)求的分布列及数学期望.
26.(2023·深圳模拟)某食品公司在八月十五来临之际开发了一种月饼礼盒,礼盒中共有7个两种口味的月饼,其中4个五仁月饼和3个枣泥月饼.
(1)一次取出两个月饼,求两个月饼为同一种口味的概率;
(2)依次不放回地从礼盒中取2个月饼,求第1次 第2次取到的都是五仁月饼的概率;
(3)依次不放回地从礼盒中取2个月饼,求第2次取到枣泥月饼的概率.
27.(2023·广西模拟)2016~2020年广西城乡居民人均可支配收入的柱形图如下图所示.
参考数据:,,.
附:样本的相关系数,
线性回归方程中的系数,.
(1)不考虑价格因素,求广西2020年农村居民人均可支配收入的年增长率(结果精确到0.1%).
(2)现欲了解广西各年城镇居民人均可支配收入y(单位:元)与农村居民人均可支配收入x(单位:元)是否存在较好的线性关系.设广西2016年城镇居民人均可支配收入为元,农村居民人均可支配收入为元,2017年对应的数据分别为,,2018年对应的数据分别为,,2019年对应的数据分别为,,2020年对应的数据分别为,.根据图中的五组数据,得到y关于x的线性回归方程为.试问y关于x的线性相关系数r是否大于0.95,并判断y与x之间是否存在较好的线性关系.
28.(2023·柳州模拟)随着中国实施制造强国战略以来,中国制造(Made in china)逐渐成为世界上认知度最高的标签之一,企业也越来越重视产品质量的全程控制.某企业从生产的一批产品中抽取40件作为样本,检测其质量指标值,质量指标的范围为,经过数据处理后得到如下频率分布直方图.
(1)求频率分布直方图中质量指标值的平均数和中位数(结果精确到0.1);
(2)为了进一步检验产品质量,在样本中从质量指标在和的两组中抽取2件产品,记取自的产品件数为,求的分布列和数学期望.
29.(2023·蚌埠模拟)某校为了丰富学生课余生活,组建了足球社团.为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各100名进行调查,部分数据如表所示:
喜欢足球 不喜欢足球 合计
男生 40
女生 30
合计
附:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
(1)根据所给数据完成上表,依据的独立性检验,能否认为该校学生喜欢足球与性别有关?
(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球射门.已知这两名男生进球的概率均为,这名女生进球的概率为,每人射门一次,假设各人射门相互独立,求3人进球总次数的分布列和数学期望.
30.(2023·广东模拟)某商场为了回馈广大顾客,设计了一个抽奖活动,在抽奖箱中放10个大小相同的小球,其中5个为红色,5个为白色.抽奖方式为:每名顾客进行两次抽奖,每次抽奖从抽奖箱中一次性摸出两个小球.如果每次抽奖摸出的两个小球颜色相同即为中奖,两个小球颜色不同即为不中奖.
(1)若规定第一次抽奖后将球放回抽奖箱,再进行第二次抽奖,求中奖次数的分布列和数学期望.
(2)若规定第一次抽奖后不将球放回抽奖箱,直接进行第二次抽奖,求中奖次数的分布列和数学期望.
(3)如果你是商场老板,如何在上述问两种抽奖方式中进行选择?请写出你的选择及简要理由.
31.(2023·吉林模拟)2022年11月20日,卡塔尔足球世界杯正式开幕,世界杯上的中国元素随处可见.从体育场建设到电力保障,从赛场内的裁判到赛场外的吉祥物都是中国制造,为卡塔尔世界杯提供了强有力的支持.国内也再次掀起足球热潮.某地足球协会组建球队参加业余比赛,该足球队教练组为了考查球员甲对球队的贡献,作出如下数据统计(甲参加过的比赛均分出了输赢):
球队输球 球队赢球 总计
甲参加 2 30 32
甲未参加 8 10 18
总计 10 40 50
附:.
参考数据:
a 0.05 0.01 0.005 0.001
3.841 6.635 7.879 10.828
(1)根据小概率值的独立性检验,能否认为该球队赢球与甲球员参赛有关联;
(2)从该球队中任选一人,A表示事件“选中的球员参赛”,B表示事件“球队输球”.与的比值是选中的球员参赛对球队贡献程度的一项度量指标,记该指标为R.
①证明:;
②利用球员甲数据统计,给出,的估计值,并求出R的估计值.
32.(2023·赣州模拟)近年来,我国加速推行垃圾分类制度,全国垃圾分类工作取得积极进展.某城市推出了两套方案,并分别在,两个大型居民小区内试行.方案一:进行广泛的宣传活动,通过设立宣传点、发放宣传单等方式,向小区居民和社会各界宣传垃圾分类的意义,讲解分类垃圾桶的使用方式,垃圾投放时间等,定期召开垃圾分类会议和知识宣传教育活动;方案二:智能化垃圾分类,在小区内分别设立分类垃圾桶,垃圾回收前端分类智能化,智能垃圾桶操作简单,居民可以通过设备进行自动登录、自动称重、自动积分等一系列操作.建立垃圾分类激励机制,比如,垃圾分类换积分,积分可兑换礼品等,激发了居民参与垃圾分类的热情,带动居民积极主动地参与垃圾分类.经过一段时间试行之后,在这两个小区内各随机抽取了100名居民进行问卷调查,记录他们对试行方案的满意度得分(满分100分),将数据分成6组:,,,,,,并整理得到如下频率分布直方图:
(1)请通过频率分布直方图分别估计两种方案满意度的平均得分,判断哪种方案的垃圾分类推广措施更受居民欢迎(同一组中的数据用该组中间的中点值作代表);
(2)以样本频率估计概率,若满意度得分不低于70分说明居民赞成推行此方案,低于70分说明居民不太赞成推行此方案.现从小区内随机抽取5个人,用表示赞成该小区推行方案的人数,求的分布列及数学期望.
33.(2023·呼和浩特模拟)某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)
(1)应收集多少位女生样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:,,,,,.估计该校学生每周平均体育运动时间超过4个小时的概率.
(3)视样本数据的频率为概率,现从全校取4名学生,记为这四名学生中运动时间超过4小时的人数,求的分布列以及数学期望.
34.(2023·鞍山模拟)甲 乙 丙三人,为了研究某地区高中男生的体重(单位:)与身高(单位:)是否存在较好的线性关系,他们随机调查了6名高中男生身高和体重的数据,得到如下表格:
身高/
体重/
根据表中数据计算得到关于的线性回归方程对应的直线的斜率为.
(1)求关于的线性回归方程;
(2)从该地区大量高中男生中随机抽出位男生,他们身高(单位:)的数据绘制成如图的茎叶图.
①估计体重超过的频率,
②视频率为概率,从该地区大量高中男生中随机选出人,记这人中体重超过的人数为,求的分布列及其数学期望(用(1)中的回归方程估测这位男生的体重).
35.(2023·南通模拟)设是一个二维离散型随机变量,它们的一切可能取的值为,其中i,,令,称是二维离散型随机变量的联合分布列.与一维的情形相似,我们也习惯于把二维离散型随机变量的联合分布列写成下表形式:现有个相同的球等可能的放入编号为1,2,3的三个盒子中,记落下第1号盒子的球的个数为X,落入第2号盒子中的球的个数为
(1)当时,求的联合分布列;
(2)设,且,求
36.(2023·抚顺模拟)学校为提升高一年级学生自主体育锻炼的意识,拟称每周自主进行体育锻炼的时间不低于6小时的同学称为“体育迷”并予以奖励,为了确定奖励方案,先对学生自主体育锻炼的情况进行抽样调查,学校从高一年级随机抽取100名学生,将他们分为男生组、女姓组,对每周自主体育锻炼的时间分段进行统计(单位:小时)第一段,第二段,第三段,第四段,第五段.将男生在各段的频率及女生在各段的频数用折线图表示如下:
(1)求折线图中m的值,并估计该校高一年级学生中“体育迷”所占的比例;
(2)填写下列列联表,并判断是否有95%的把握认为是否为“体育迷”与学生的性别有关?
体育迷 非体育迷 合计
男
女
合计
附:
0.050 0.010 0.001
3.841 6.635 10.828
(3)若中学生每周自主体育锻炼的时间不低于5小时,才能保持身体的良好健康发展,试估计该校高一年级学生的周平均锻炼时间是否达到保持身体良好健康发展的水平?(同一段中的数据用该组区间的中点值代表)
37.(2023·包头模拟)新型冠状病毒疫情已经严重影响了我们正常的学习、工作和生活.某市为了遏制病毒的传播,利用各种宣传工具向市民宣传防治病毒传播的科学知识.某校为了解学生对新型冠状病毒的防护认识,对该校学生开展防疫知识有奖竞赛活动,并从女生和男生中各随机抽取30人,统计答题成绩分别制成如下频数分布表和频率分布直方图.规定:成绩在80分及以上的同学成为“防疫标兵”.
名女生成绩频数分布表:
成绩
频数 10 10 6 4
附:
0.100 0.050 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
(1)根据以上数据,完成以下列联表,并判断是否有%的把握认为“防疫标兵”与性别有关;
男生 女生 合计
防疫标兵
非防疫标兵
合计
(2)以样本估计总体,以频率估计概率,现从该校女生中随机抽取人,其中“防疫标兵”的人数为,求随机变量的分布列与数学期望.
38.(2023·湖南模拟)直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2022年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示,若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,且“经常使用直播销售用户”中有是“年轻人”.
参考数据:独立性检验临界值表
(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成2×2列联表,根据的独立性检验,能否认为经常使用网络直播销售与年龄有关?
使用直播销售情况与年龄列联表
年轻人 非年轻人 合计
经常使用直播售用户
不常使用直播销售用户
合计
(2)某投资公司在2023年年初准备将1000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:方案一:线下销售 根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不赔不赚,且这三种情况发生的概率分别为.方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.
39.(2023·湖北模拟)某市举行招聘考试,共有4000人参加,分为初试和复试,初试通过后参加复试.为了解考生的考试情况,随机抽取了100名考生的初试成绩,并以此为样本绘制了样本频率分布直方图,如图所示.
附:若随机变量X服从正态分布,则:,,.
(1)根据频率分布直方图,试求样本平均数的估计值;
(2)若所有考生的初试成绩X近似服从正态分布,其中为样本平均数的估计值,,试估计初试成绩不低于88分的人数;
(3)复试共三道题,第一题考生答对得5分,答错得0分,后两题考生每答对一道题得10分,答错得0分,答完三道题后的得分之和为考生的复试成绩.已知某考生进入复试,他在复试中第一题答对的概率为,后两题答对的概率均为,且每道题回答正确与否互不影响.记该考生的复试成绩为Y,求Y的分布列及均值.
40.(2023·安庆模拟)为了“锤炼党性修养,筑牢党性根基”,党员教师小A每天自觉登录“学习强国APP”,参加各种学习活动,同时热衷于参与四人赛.每局四人赛是由网络随机匹配四人进行比赛,每题回答正确得20分,第1个达到100分的比赛者获得第1名,赢得该局比赛,该局比赛结束.每天的四人赛共有30局,前2局是有效局,根据得分情况获得相应名次,从而得到相应的学习积分,第1局获得第1名的得3分,获得第2、3名的得2分,获得第4名的得1分;第2局获得第1名的得2分,获得第2、3、4名的得1分;后28局是无效局,无论获得什么名次,均不能获得学习积分.经统计,小A每天在第1局四人赛中获得3分、2分、1分的概率分别为,,,在第2局四人赛中获得2分、1分的概率分别为,.
(1)设小A每天获得的得分为,求的分布列、数学期望和方差;
(2)若小A每天赛完30局,设小A在每局四人赛中获得第1名从而赢得该局比赛的概率为,每局是否赢得比赛相互独立,请问在每天的30局四人赛中,小A赢得多少局的比赛概率最大?
答案解析部分
1.【答案】(1)解:零假设为::A,B款盲盒套餐的选择与年龄之间无关联.
根据列联表中的数据,经计算得,
根据小概率值的独立性检验,推断不成立,
即有的把握认为A,B款盲盒套餐的选择与年龄有关.
(2)解:的所有可能取值为0,1,2,3,
,
所以的分布列为:
0 1 2 3
P
(或).
(3)解:设事件A:随机抽取1件打开后发现为隐藏款X,
设事件:随机抽取的1件单品来自于A款盲盒套餐,
设事件:随机抽取的1件单品来自于B款盲盒套餐,
,
故由条件概率公式可得
.
【知识点】独立性检验的基本思想;离散型随机变量及其分布列;离散型随机变量的期望与方差;条件概率与独立事件
【解析】【分析】(1)根据独立性检验计算K2,再进行判断即可;
(2)根据二项分布的概率公式,进行计算得分布列及数学期望即可;
(3)根据全概率公式及条件概率公式分析计算即可.
2.【答案】(1)解:由表格中的数据,可得,
则
所以.
(2)解:由题意,可得,
,
所以.
【知识点】线性回归方程;条件概率与独立事件
【解析】【分析】(1)根据表格中的数据,结合公式求得,进而求得 的值;
(2)根据题意,结合相互独立事件的概率乘法公式和条件概率的计算公式,即可求解出 的值.
3.【答案】(1)解:由已知得.
所以.
所以回归直线方程为.
(2)解:由(1)知当大气湿度为时,空壳率约为.
【知识点】线性回归方程;回归分析的初步应用
【解析】【分析】(1)利用已知条件结合平均数公式和最小二乘法得出向日葵空壳率与大气湿度之间的回归直线方程。
(2) 由(1)中的线性回归方程和代入法得出当大气湿度为时的空壳率。
4.【答案】(1)解:由数据可得;
,
又,
,
.
.
(2)解:由题知,7家超市中有3家超市的广告是“好广告”,X的可能取值是0,1,2,3
.
.
所以的分布列为
0 1 2 3
所以.
【知识点】线性回归方程;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)利用已知条件结合平均数公式和最小二乘法得出 关于的一元线性回归方程 。
(2) 由题知,7家超市中有3家超市的广告是“好广告”,从而得出随机变量X的可能取值,再结合组合数公式和古典概型求概率公式得出随机变量的分布列,再利用随机变量的分布列求数学期望公式得出随机变量X的数学期望。
5.【答案】(1)解:由题意可得,
因为,
根据参考数据,所以相关系数,即,
所以线性相关程度很高,可用直线拟合;
由,
所以,
即y关于x的线性回归程为.
(2)解:设甲、乙两人需要排队的总时间为,则的可能取值为,
,
,
,
所以的分布列为:
40 60 80
P
因此,
可得,又,
故实数p的取值范围为.
【知识点】线性回归方程;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)根据题中数据求得相关系数,比较可得结论;求出,即可得出 y关于x的一元线性回归方程;
(2) 设甲、乙两人需要排队的总时间为,则的可能取值为, 求得每个值对应的概率,可得其分布列,求出其数学期望的表达式,列出不等式,即可求出实数p的取值范围 .
6.【答案】(1)解:从10道题中随机抽取4道题,所有的基本事件的个数为,
将“某代表队没有抢到地理环境题”的事件记为,事件的对立事件为“某代表队抢到至少1道地理环境题”.则
,
(2)解:情况一:某代表队先答人文历史题,再答地理环境题,
设该代表队必答环节的得分为,,
,,,
,,
则的分布为:
此时得分期望
情况二:某代表队先答地理环境题,再答人文历史题,
设该代表队必答环节的得分为,,
,,,
,,
则的分布为:
此时得分期望
由于,故为了使该代表队必答环节得分期望值更大,该代表队应该先答人文历史题,再答地理环境题.
【知识点】互斥事件与对立事件;古典概型及其概率计算公式;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)利用已知条件结合组合数公式和古典概型求概率公式和对立事件求概率公式,进而得出 该代表队至少抢到1道地理环境题的概率。
(2) 情况一:某代表队先答人文历史题,再答地理环境题,设该代表队必答环节的得分为,进而得出随机变量X的取值,再结合独立事件乘法求概率公式得出随机变量X的分布列,再结合随机变量的分布列求数学期望公式得出随机变量X的数学期望。
情况二:某代表队先答地理环境题,再答人文历史题,设该代表队必答环节的得分为,进而得出随机变量Y的取值,再结合独立事件乘法求概率公式得出随机变量Y的分布列,再结合随机变量的分布列求数学期望公式得出随机变量Y的数学期望。再结合数学期望比较法判断出为了使该代表队必答环节得分期望值更大,该代表队应该先答人文历史题,再答地理环境题。
7.【答案】(1)解:由茎叶图可知,该组数据的中位数为,故列出2×2列联表如下:
超过M 不超过M
上班时间 8 12
下班时间 7 13
(2)解:由2×2列联表可知,,
故上下班的通勤时间不存在显著差异.
【知识点】茎叶图;独立性检验的基本思想
【解析】【分析】 (1)根据茎叶图计数中位数即;
(2)根据独立性检验公式,计算并判断即可.
8.【答案】(1)解:观察频率分布直方图知,35周岁及以上组,绩效分数不少于80的频率为,
因此35周岁及以上组,绩效分数不少于80的人数为,绩效分数少于80的人数为60,
35周岁以下组,绩效分数不少于80的频率为,
因此35周岁及以上组,绩效分数不少于80的人数为,绩效分数少于80的人数为50,
所以列联表为:
生产标兵 非生产标兵 总计
35周岁及以上组 20 60 80
35周岁以下组 30 50 80
总计 50 110 160
提出零假设:是否为生产标兵与工人所在的年龄组无关,确定显著性水平,
的观测值,而,
所以没有的把握认为是否为生产标兵与工人所在的年龄组有关.
(2)解:令事件表示“在35周岁以下组”,表示“是生产标兵”,
用样本估计总体知,,,,设,
则由,得,解得,
因此,
所以估计该厂35周岁以下的工人所占的百分比,生产标兵中35周岁以下的工人所占的百分比分别为.
【知识点】独立性检验的基本思想;条件概率与独立事件
【解析】【分析】(1)由频率分布直方图可得35周岁以上组中的生产标兵的人数,以及35周岁以下组中的生产标兵的人数,再列出2 x 2列联表,求出 的值即可;
(2)利用全概率公式求出P(A) , 再利用条件概率公式求解即可.
9.【答案】(1)解:由题设,可取值为1,2,3,
,,,
因此的分布列为
1 2 3
(2)解:①可取值为1,2,…,,
每位同学两题都答对的概率为,则答题失败的概率均为:,
所以时,;当时,
故的分布列为:
1 2 3 …
…
②由①知:(,).
,故单调递增;
由上得,故,
∴,
故.
【知识点】离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1) 由题设,可取值为1,2,3, 利用独立事件乘法公式、互斥事件概率求法求各值对应的概率,即可得随机变量的分布列;
(2)①应用二项分布概率公式求 可取值为1,2,…,对应概率,即可得分布列;
②由①分布列得 (,),定义法判断E(Yn)单调性,累加法、等比数列前n项和公式求E(Yn)通项公式,即可证得结论.
10.【答案】(1)解:由题可知,的可能取值为0,1,2.由相互独立事件概率乘法公式可知:
;;,
故的分布列如下表:
0 1 2
(2)解:由全概率公式可知:
,
即:,
所以,
所以,
又,
所以,数列为以为首项,以为公比的等比数列,
所以,
即:.
(3)解:由全概率公式可得:
,
即:,
又,
所以,
所以,
又,
所以,
所以,
所以,
所以.
【知识点】相互独立事件的概率乘法公式;离散型随机变量及其分布列;离散型随机变量的期望与方差;全概率公式
【解析】【分析】(1) 由题可知,的可能取值为0,1,2 ,求出对应的概率,可得 的分布列 ;
(2) 由全概率公式可得 , 可得 ,数列为以为首项,以为公比的等比数列, 利用等比数列的通项公式可求出数列的通项公式;
(3) 由全概率公式可得 ,即,可得 , 进而求出 的期望.
11.【答案】(1)解:提出原假设:电解电容质量与铝 质量无关.
由题意及列联表,可得
.
由于,而,
因此,根据检测组的数据,原假设不成立,并且有的把握认为电解电容质量与铝箔质量有关.
(2)解:设第一次取出的元件是优等品的事件为,第二次取出的元件是合格品的事件为.取出的元件是第一箱、第二箱的事件分别为,.
则由全概率公式,得
,
于是,由条件概率公式,得.
因此,在第一次取出的是优等品的情况下,第二次取出的是合格品的概率约为0.846.
【知识点】独立性检验的基本思想;条件概率与独立事件
【解析】【分析】 (1)先填写2x2联列表,再求出K2,即可判断;
(2)利用条件概率公式,求解即可得第二次取出的是合格品的概率.
12.【答案】(1)解:依题意的可能取值为、,
则,,
所以的分布列为
(2)解:当一天的进货量为(单位:盒),为正整数且时利润的可能取值为或,
且,,
所以,
显然随着的增大而减少,所以当时的期望达到最大值,.
【知识点】离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)依题意X的可能取值为300,900,求出所对应的概率,即可得到概率分布列;
(2)依题意可得Y的可能取值为3000-5n或5n,求出所对应的概率,即可得到E(Y),进而求出 的期望达到最大值 .
13.【答案】(1)解:第一次训练时所取的球是从6个球(3新,3旧)中不放回取出2个球,所以可取的值为0,1,2..
则分布列如下
0 1 2
则期望为;
(2)解:由题目条件可得列联表如下:
习惯固定在左侧接听电话 习惯固定在右侧接听电话 总计
脑瘤部位在左侧的病人 14 28 42
脑瘤部位在右侧的病人 19 27 46
总计 33 55 88
则=,故长时间使用手机与是否得脑瘤没有显著关系.
【知识点】独立性检验的应用;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1) 利用已知条件结合第一次训练时所取的球是从6个球(3新,3旧)中不放回取出2个球,从而得出随机变量以可取的值,再利用组合数公式和古典概型求概率公式得出随机变量的分布列,再结合随机变量的分布列求数学期望公式得出随机变量的数学期望。
(2) 由题目条件可得列联表,再利用列联表中的数据结合独立性检验的方法判断出长时间使用手机与是否得脑瘤没有显著关系。
14.【答案】(1)解:由题意知:,,
,
即事件与同时发生的概率为.
(2)解:,,
所有可能的取值为,
;;;;
的分布为,数学期望.
【知识点】互斥事件与对立事件;离散型随机变量及其分布列;离散型随机变量的期望与方差;条件概率与独立事件;二项分布与n次独立重复试验的模型
【解析】【分析】(1)利用已知条件结合对立事件求概率公式、条件概型求概率公式,进而得出事件与同时发生的概率。
(2)利用 ,所以,进而得出X所有可能的取值,再利用二项分布求概率公式得出随机变量X的分布列,再结合随机变量的分布列求数学期望公式,进而得出随机变量X的数学期望。
15.【答案】(1)解:补全的2×2列联表如下:
一般 激动 总计
男性 30 90 120
女性 25 55 80
总计 55 145 200
零假设为:性别与对活动的观感程度相互独立.
根据表中数据,计算得到
根据小概率值的独立性检验,没有充分证据推断不成立,因此我们可以认为,成立,即认为对该场活动活动的观感程度与性别无关.
(2)解:设一次摸球摸出2个红球的事件为A,摸出1个红球的事件为B,没摸出红球的事件为C,
则,,,
由题意,X可取.
,,
,,
,
所以X的分布列为:
X 200 150 100 50 0
P
.
【知识点】独立性检验的基本思想;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)写出零假设,补全2 x 2列联表,计算 的值,并与临界值比较,得出结论;
(2)分别求出一次摸球摸出0 , 1 , 2个红球的概率,写出X的所有可能取值及对应取值的概率,写出X的分布列并计算其数学期望.
16.【答案】(1)解:,,
,
又因为,所以,
所以年收入的附加额y与投入额x的线性回归方程为
(2)解:8个投入额中,“优秀投资额”的个数为5个,故X的所有可能取值为0,1,2,3,
;;;
则X的分布列为
X 0 1 2 3
P
.
【知识点】线性回归方程;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)根据已知数据和参考公式,即可求出y与投入额x的经验回归方程;
(2)求出X的所有可能取值和对应的概率,即可求出X的分布列,再由期望公式即可求出数学期望.
17.【答案】(1)解:,
所以有99%的把握认为客户对该产品的评价结果与性别有关系;
(2)解:若甲顾客按方案二购买一件产品,设需要出元,则可取,
,
所以(元),
所以顾客甲若想采用方案二的方式购买一件产品,估计顾客甲需支付元,
若甲顾客按方案一购买一件产品,则需要(元),
因为,
所以顾客甲选择方案二购买较为合理.
【知识点】独立性检验;函数模型的选择与应用
【解析】【分析】(1)根据公式求出,再对照临界值表即可得出结论;
(2)设甲顾客按方案二购买一件产品需要出元,则可取, 求出对应概率,再根据期望公式求出期望即可,再求出选择方案一所需的金额,即可得出结论.
18.【答案】(1)解:当时,赌徒已经输光了,因此.
当时,赌徒到了终止赌博的条件,不再赌了,因此输光的概率.
(2)证明:记M:赌徒有n元最后输光的事件,N:赌徒有n元下一场赢的事件,
,
即,
所以,
所以是一个等差数列,
设,则,
累加得,故,得,
(3)解:,由得,即,
当时,,
当时,,
当时,,因此可知久赌无赢家,
即便是一个这样看似公平的游戏,
只要赌徒一直玩下去就会的概率输光.
【知识点】概率的应用;全概率公式
【解析】【分析】(1)明确n=0和n=B的含义,即可求出 与的数值;
(2)由全概率公式可得 ,整理为 ,即可证明结论;
(3)由(2)结论可得 ,即可求得B=200,B=1000时,P(A)的数值,结合概率的变化趋势,即可得统计含义.
19.【答案】(1)解:令时间A为“职工甲和职工乙微信记步数都不低于10000”,
从3月2日至3月7日这6天中,3月2日、5日、7日这3天中,
甲乙微信记步数都不低于10000,
故.
(2)解:由(1)知:,
,,,
的分布列为:
(3)解:根据频率分步直方图知:微信记步数落在,,,,
(单位:千步)区间内的人数依次为人,人,
人,人,人,
由甲微信记步数排名第68,可知当天甲微信记步数在15000到20000万之间,
根据折线图知:只有3月2日,3月3日,3月7日.
由乙微信记步数排名第142,可知当天乙微信记步数在5000到10000万之间,
根据折线图知:只有3月3日和3月6日,
所以3月3日符合要求.
【知识点】频率分布直方图;古典概型及其概率计算公式;离散型随机变量的期望与方差
【解析】【分析】(1)根据古典概型公式求解即可;
(2)根据题意得到, ,,,再写出分布列数学期望即可;
(3)根据折线图和频率分布直方图求解即可.
20.【答案】(1)解:平均分
前4组频率之和为,前5组频率之和为,
故第80百分位数位于第5组
设第80百分位数为,则
则该市竞赛成绩的平均分和第80百分位数分别约为67.3和78.6.
(2)解:抽到60分及以上的学生的概率为,
由题意,的可能取值为0,1,2,3,且服从,则
,,
,,
所以的分布列为:
0 1 2 3
所以或.
【知识点】众数、中位数、平均数;离散型随机变量及其分布列;离散型随机变量的期望与方差;二项分布与n次独立重复试验的模型
【解析】【分析】(1)根据平均数以及百分位数的计算公式即可求解出第80百分位数;
(2)根据二项分布即可求解概率,进而可求解出 的分布列和数学期望.
21.【答案】(1)解:销售价格位于区间(单位:万元)的概率为.
销售价格的众数为
(2)解:的可能取值为,
;;
;,
分布列为:
.
【知识点】众数、中位数、平均数;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)根据频率分布直方图得到概率为,众数为,计算得到答案;
(2)的可能取值为, 计算概率得到分布列,再计算数学期望得到答案.
22.【答案】(1)解:由频率分布直方图得:,解得,
所以直方图中的值是.
(2)解:由频率分布直方图“优秀”人数为人,则不够优秀的为85人,
所以列联表为:
优秀 不够优秀 总计
“合物化生”组 10 40 50
“物化地”组 5 45 50
合总计 15 85 100
零假设:成绩是否优秀与所选的组合无关,
因此,
所以没有的把握认为成绩是否优秀与所选的组合有关.
(3)解:假设本次联考全市化学原始成绩的最高分是91分,
则有,
此时99.73四舍五入后变为100分,与99分矛盾,因此假设不成立,
所以本次联考全市化学原始成绩的最高分不可能是91分.
【知识点】频率分布直方图;独立性检验的基本思想
【解析】【分析】(1)利用频率分布直方图所有小矩形面积和为1列式计算可求出直方图中的值;
(2)利用频率分布直方图求出"优秀”人数,完善 列联表,再求出K2的预测值,可得结论;
(3)假定最高分是91分,求出甲乙的等级分成绩即可判断得结论.
23.【答案】(1)解:记“该甲自媒体平台公司第一次答错”为事件A,“该甲自媒体平台公司第二次和第三次均答对”为事件,则,
故甲自媒体平台公司在第一次答错的的条件下,第二次和第三次均答对的概率为
.
(2)解:设甲自媒体平台公司答对的问题数为,则的所有可能取值为.
,
则的分布列为
1 2 3
可得,
;
设乙自媒体平台公司答对的问题数为,则的所有可能取值为.
解法一:,,
,,
则的分布列为:
0 1 2 3
可得,
,
由可得,甲自媒体平台公司竞标成功的可能性更大.
解法二:∵,则,;
由可得,甲自媒体平台公司竞标成功的可能性更大.
【知识点】离散型随机变量及其分布列;离散型随机变量的期望与方差;条件概率与独立事件
【解析】【分析】(1) 记“该甲自媒体平台公司第一次答错”为事件A,“该甲自媒体平台公司第二次和第三次均答对”为事件,求得 ,可求出第二次和第三次均答对的概率;
(2)分别求甲、乙两家公司答对题数的分布列,再求两个随机变量的期望和方差,由此作出判断.
24.【答案】(1)解:应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,
所以模型①的拟合精度高,回归方程的预报精度高;
(2)解:(i)剔除异常数据,即月份的数据后,
得,.
,.
,.
所以关于的回归方程为;
(ii)把代入①中所求回归方程得,故预报值为万元.
【知识点】线性回归方程
【解析】【分析】 (1)根据残差图分析,得出模型①残差波动小,故选模型①;
(2)(i)剔除异常数据,计算剩下数据的平均数,求出回归系数,写出回归方程;
(ii)把x=18代入回归方程,即可求得该模型收益的预报值.
25.【答案】(1)解:小明恰好套中2次包括:套中,各一次和未套中,套中两次.
所以套中,各一次的概率为,
未套中,套中两次的概率未,
所以小明恰好套中2次的概率.
(2)解:由题意可得:的可能取值为0,1,2,3,4,5
,,
,,
,.
所以的分布列为
0 1 2 3 4 5
所以.
【知识点】互斥事件的概率加法公式;相互独立事件的概率乘法公式;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1) 利用已知条件结合独立事件乘法求概率公式和互斥事件加法求概率公式,进而得出小明恰好套中2次的概率。
(2) 由题意可得随机变量的可能取值,再利用独立事件乘法求概率公式得出随机变量X的分布列,再结合随机变量的分布列求数学期望公式,进而得出随机变量X的数学期望。
26.【答案】(1)解:一次取出2个月饼,共有种方法,其中两个都是五仁的有种方法,两个都是枣泥的有种方法,两个月饼为同一种口味的概率为;
(2)解:依次不放回地从礼盒中取2个月饼,共有种方法,其中求第1次 第2次取到的取到都是五仁月饼的有种方法,所以第1次 第2次取到的都是五仁月饼的概率是;
(3)解:依次不放回地从礼盒中取2个月饼,共有种方法,第1次取五仁 第2次取到枣泥月饼的方法有种,第1次取到枣泥 第2次也取到枣泥月饼的方法有种,所以第2次取到枣泥月饼的概率为.
【知识点】古典概型及其概率计算公式;分类加法计数原理;分步乘法计数原理
【解析】【分析】(1)根据组合知识,利用古典概型概率公式求解即可;
(2)根据两个计数原理以及排列知识,利用古典概型概率公式求解即可;
(3)根据两个计数原理以及排列知识,利用古典概型概率公式求解即可;
27.【答案】(1)解:因为广西2020年农村居民人均可支配收入为14815元,广西2019年农村居民人均可支配收入为13676元,
所以广西2020年农村居民人均可支配收入的年增长率为.
(2)解:
y关于x的线性回归方程为,所以,
所以,
,
所以,
所以,
故y与x之间存在较好的线性关系.
【知识点】线性回归方程
【解析】【分析】(1)根据表中数据计算人均可支配收入的年增长率即可;
(2)求出,再由已知 , 求出 , 根据相关系数公式求出 y与x之间存在较好的线性关系.
28.【答案】(1)解:设质量指标值的平均数为,中位数为,
则,
因为,,所以中位数位于之间,
则,解得;
(2)解:样本中质量指标在的产品有件,质量指标在的有件,
则可能的取值为,,,
相应的概率为:,
,,
所以随机变量的分布列为
所以随机变量的期望.
【知识点】频率分布直方图;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)由频率分布直方图中平均数和中位数的公式计算即可;
(2)先算出样本中质量指标在[50, 60)的产品有6件,质量指标在[90, 100]的有4件, 可能的取值为,,, 分别求出对应的概率,可得 的分布列 ,再根据数学期望公式可求出数学期望.
29.【答案】(1)解:列联表如下:
喜欢足球 不喜欢足球 合计
男生 60 40 100
女生 30 70 100
合计 90 110 200
则,
所以依据的独立性检验,能认为该校学生喜欢足球与性别有关.
(2)解:依题意得3人进球总次数的所有可能取值为,
,
,
,
,
所以的分布列如下:
0 1 2 3
所以的数学期望为.
【知识点】独立性检验的应用;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】 (1)利用已知条件列出 列联表,再利用列联表和独立性检验的方法以及,从而能认为该校学生喜欢足球与性别有关。
(2) 依题意得3人进球总次数的所有可能取值,再利用二项分布求概率公式和互斥事件加法求概率公式,进而得出随机变量X的分布列,再结合随机变量的分布列求数学期望公式,进而得出随机变量X的数学期望。
30.【答案】(1)解:若第一次抽奖后将球放回抽奖箱,再进行第二次抽奖,则每次中奖的概率为,
因为两次抽奖相互独立,所以中奖次数服从二项分布,即,
所以的所有可能取值为,则
,
所以的分布列为
0 1 2
所以的数学期望为.
(2)解:若第一次抽奖后不将球放回抽奖箱,直接进行第二次抽奖,中奖次数的所有可能取值为,
则,
,
,
所以的分布列为
0 1 2
所以的数学期望为.
(3)解:因为(1)(2)两问的数学期望相等,第(1)问中两次奖的概率比第(2)问的小,
即,第(1)不中奖的概率比第问小,即,
回答一:若商场老板希望中两次奖的顾客多,产生宣传效应,则选择按第(2)问方式进行抽.
回答二:若商场老板希望中奖的顾客多,则选择按第(1)问方式进行抽奖.
【知识点】离散型随机变量的期望与方差
【解析】【分析】(1)根据古典概型的运算公式,结合二项分布的性质进行求解即可;
(2)根据古典概型的运算公式,结合数学期望公式进行求解即可;
(3)根据数学期望的性质,结合商场老板希望进行判断即可.
31.【答案】(1)解:零假设为:该球队胜利与甲球员参赛无关.
,
因为,
所以依据的独立性检验,我们推断不成立,所以认为该球队胜利与甲球员参赛有关,此推断犯错误的概率不大于0.005.
(2)①证明:
②,,
.
【知识点】独立性检验的基本思想;条件概率与独立事件
【解析】【分析】(1)由所给数据结合公式求出 的值, 将其与临界值比较大小,由此确定能否认为该球队赢球与甲球员参赛有关联;
(2)①根据定义结合条件概率公式即可完成证明;
②根据①结合已知数据求出R.
32.【答案】(1)解:设小区方案一的满意度平均分为,
则
设小区方案二的满意度平均分为,
则
∵,
∴方案二的垃圾分类推行措施更受居民欢迎.
(2)解:由题意可知方案二中,
满意度不低于70分的频率为,
低于70分的频率为,
现从小区内随机抽取5个人,的所有可能取值为0,1,2,3,4,5,则
,
,
,
∴的分布列为
0 1 2 3 4 5
期望.
【知识点】频率分布直方图;众数、中位数、平均数;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)利用已知条件结合频率分布直方图求平均数公式,再利用平均数比较法判断出方案二的垃圾分类推行措施更受居民欢迎。
(2) 由题意可知方案二中,再利用频率分布直方图中各小组的矩形的面积等于各小组的频率,进而得出满意度不低于70分的频率和低于70分的频率,现从小区内随机抽取5个人,进而得出随机变量的所有可能取值,则,再利用二项分布求出随机变量X的分布列,再结合随机变量X的分布列求数学期望的方法得出随机变量X的数学期望。
33.【答案】(1)解:因为男生10500人,女生4500人,
所以抽取女生占总人数的比例为.
又因为分层抽样收集300位学生,
所以女生样本数据应收集为.
(2)解:由频率分布直方图可知,
学生每周平均体育运动时间超过4个小时的频率为.
估计该校学生每周平均体育运动时间超过4个小时的概率0.75.
(3)解:由(2)可知运动时间超过4小时的概率为,则,
所以,
,
,
,
,
则的分布列为:
0 1 2 3 4
则.
【知识点】分层抽样方法;频率分布直方图;离散型随机变量的期望与方差
【解析】【分析】(1) 根据分层抽样的定义即可求解即可;
(2)利用样本频率估计总体概率;
(3) 由(2)可知运动时间超过4小时的概率为,则 ,结合分布列和数学期望的定义求解出 的分布列以及数学期望.
34.【答案】(1)解:依题意可知
故关于的线性回归方程为
(2)解:①令得
故这位男生的体重有位体重超过
所以频率
②的可能取值为
则的分布列为
.
【知识点】线性回归方程;古典概型及其概率计算公式;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)利用已知条件结合平均数公式和最小二乘法得出 关于的线性回归方程 。
(2) ① 利用已知条件结合线性回归方程和代入法得出这位男生的体重有位体重超过,再利用频数除以样本容量的方法得出频率。
②利用已知条件得出随机变量X的可能的取值,再结合二项分布求概率公式得出随机变量X的分布列,再利用随机变量的分布列求数学期望公式得出随机变量X的数学期望。
35.【答案】(1)解:由题意知,的可能取值为,的可能取值为
则,
,
,
,
,
,
,
所以的联合分布列为:
(2)解:当时,,
所以
,
所以,
设,则由二项分布的期望公式得.
【知识点】离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)根据题意,由联合分布列的定义,分别求得对应概率即可得到结果;
(2)根据题意,将问题转化为二项分布,然后由二项分布的期望计算公式即可得到结果.
36.【答案】(1)解:由频率折线图可得
由频数折线图可知女生共有人,其中“体育迷”有人,
故男生共有人,其中“体育迷”有人.
因此估计该校高一学生中“体育迷”所占比例约为.
(2)解:
体育迷 非体育迷 合计
男 30 45 75
女 15 10 25
合计 45 55 100
因为,而,
故没有95%的把握认为是否为“体育迷”与性别有关.
(3)解:由频率折线图可知男生的锻炼时间在每组的频数分别为
,,,,;
故这100名学生每周的锻炼时间在每组的频率分别为
,,,
,.
所以估计该校高一年级学生的周平均锻炼时间为:.
因为,
所以估计该校高一年级学生的周平均锻炼时间达到了保持身体良好健康发展的水平.
【知识点】频率分布折线图、密度曲线;独立性检验的基本思想
【解析】【分析】(1)由折线图的性质可求m ,由频数统计图求女生人数,再求男生人数,和男生和女生中的体育迷的人数,由此可求该校高一年级学生中"体育迷"所占的比例;
(2)由已知数据填写列联表,由公式求K2的值,与临界值比较大小,确定结论;
(3)由已知数据求该校高一年级学生的周平均锻炼时间的估计值,由此确定结论.
37.【答案】(1)解:由频率分布直方图,可得名男生中成绩大于等于分的频率为,故名男生中“防疫标兵”人数为人,“非防疫标兵”人数为人.
由频数分布表,可得名女生中“防疫标兵”人数为人,“非防疫标兵”人数为人.
男生 女生 合计
防疫标兵 18
非防疫标兵
合计
故,所以有%的把握认为“防疫标兵”与性别有关.
(2)解:名女生样本中有人成绩在分以上,所以女生样本中“防疫标兵”的频率为.用样本估计总体,以频率估计概率,从该校女生中随机抽取人,则“防疫标兵”的人数服从二项分布,即.
X的可能取值为.
,,,,.
所以随机变量的分布列为
X 0 1 2 3 4
P
数学期望为.
【知识点】频率分布直方图;独立性检验的基本思想;离散型随机变量及其分布列;离散型随机变量的期望与方差;二项分布与n次独立重复试验的模型
【解析】【分析】(1)分别分析男女生样本中 “防疫标兵”和“非防疫标兵”人数,完成2 x 2列联表,再计算K2的数值,并与参考数值作比较得出结论;
(2)从该校女生中随机抽取4人,则"防疫标兵”的人数,服从二项分布,分别求出概率从而得到分布列,再计算数学期望.
38.【答案】(1)解:由图1知,“年轻人”占比为,即有人),“非年轻人”有200人
由图2知,“经常使用直播销售用户”占比为,即有(人),“不常使用直播销售用户”有(人).
“经常使用直播销售用户中的年轻人”有(人),“经常使用直播销售用户中的非年轻人”有120-人.
∴补全的列联表如下:
年轻人 非年轻人 合计
经常使用直播销售用户 100 20 120
不常使用直播销隹用户 60 20 80
合计 160 40 200
零假设:经常使用网络直播销售与年龄相互独立,即经常使用网络直播销售与年龄无关.
于是.
∴.
根据小概率的独立性检验,我们推断成立,
即认为经常使用网络直播销售与年龄无关.
(2)解:若按方案一,设获利万元,则可取的值为,则的分布列为:
300 0
万元.
.(或.)
若按方案二,设获利万元,则可取的值为,则的分布列为:
500 0
万元,
106900.
(或.)
∵.
①方案一与方案二的利润均值差异不大,但方案二的方差要比方案一的方差大得多,从稳定性方面看方案一线下销售更稳妥,故答案为:方案一.
②方案一的利润均值低于方案二,选择方案二.
【知识点】独立性检验的基本思想;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】 (1)由题意填写列联表,计算K2,对照附表得出结;
(2)计算方案一、方案二的期望与方差,比较即可得出结论.
39.【答案】(1)解:样本平均数的估计值为.
(2)解:因为学生初试成绩X服从正态分布,其中,,
则,
所以,
所以估计初试成绩不低于88分的人数为人.
(3)解:Y的取值分别为0,5,10,15,20,25,
则,
,
,
,
,
,
故Y的分布列为:
Y 0 5 10 15 20 25
P
所以数学期望为.
【知识点】离散型随机变量及其分布列;离散型随机变量的期望与方差;正态分布曲线的特点及曲线所表示的意义
【解析】【分析】(1)根据频率分布直方图的平均数的估算公式即可求解出样本平均数的估计值;
(2)由 可知 即可求解出初试成绩不低于88分的人数;
(3)根据题意确定 Y的取值分别为0,5,10,15,20,25,利用独立性可求得分布列,进而求得均值.
40.【答案】(1)解:记事件表示第一局获得分,事件表示第二局获得分,这些事件相互独立,由条件知的可能值为5,4,3,2.
其分布列为
5 4 3 2
,
.
(2)解:设小A每天赢得的局数为,则,
于是.
根据条件得,
由①得,得,
同理由②得,所以,
又因为,所以,因此在每天的30局四人赛中,小A赢得10局的比赛概率最大.
【知识点】概率的意义;离散型随机变量及其分布列;离散型随机变量的期望与方差;二项分布与n次独立重复试验的模型
【解析】【分析】(1)利用已知条件得出随机变量X的可能的取值,再结合独立事件乘法求概率公式、互斥事件加法求概率公式,进而得出随机变量X的分布列,再结合随机变量的分布列求数学期望公式得出随机变量X的数学期望,再利用随机变量的数学期望求方差公式得出随机变量X的方差。
(2) 设小A每天赢得的局数为,则,再利用二项分布求概率公式得出,根据条件得,由①结合组合数公式得出实数k的取值范围,同理由②得出实数k的取值范围,再利用,进而得出k的值,因此在每天的30局四人赛中,小A赢得10局的比赛概率最大。
二一教育在线组卷平台(zujuan.21cnjy.com)自动生成 1 / 1登录二一教育在线组卷平台 助您教考全无忧
专题03 统计和概率-【大题精做】冲刺2023年高考大题突破训练
一、解答题
1.(2023·宁波模拟)盲盒,是指消费者不能提前得知具体产品款式的玩具盒子,具有随机属性.某品牌推出2款盲盒套餐,A款盲盒套餐包含4款不同单品,且必包含隐藏款X;B款盲盒套餐包含2款不同单品,有的可能性出现隐藏款X.为避免盲目购买与黄牛囤积,每人每天只能购买1件盲盒套餐.开售第二日,销售门店对80名购买了套餐的消费者进行了问卷调查,得到如下列联表:
A款盲盒套餐 B款盲盒套餐 合计
年龄低于30岁 18 30 48
年龄不低于30岁 22 10 32
合计 40 40 80
附:,其中,
P() 0.100 0.050 0.025 0.010 0.001
2.706 3.841 5.024 6.635 0.828
(1)根据列联表,判断是否有的把握认为A,B款盲盒套餐的选择与年龄有关;
(2)甲、乙、丙三人每人购买1件B款盲盒套餐,记随机变量为其中隐藏款X的个数,求的分布列和数学期望;
(3)某消费者在开售首日与次日分别购买了A款盲盒套餐与B款盲盒套餐各1件,并将6件单品全部打乱放在一起,从中随机抽取1件打开后发现为隐藏款X,求该隐藏款来自于B款盲盒套餐的概率.
【答案】(1)解:零假设为::A,B款盲盒套餐的选择与年龄之间无关联.
根据列联表中的数据,经计算得,
根据小概率值的独立性检验,推断不成立,
即有的把握认为A,B款盲盒套餐的选择与年龄有关.
(2)解:的所有可能取值为0,1,2,3,
,
所以的分布列为:
0 1 2 3
P
(或).
(3)解:设事件A:随机抽取1件打开后发现为隐藏款X,
设事件:随机抽取的1件单品来自于A款盲盒套餐,
设事件:随机抽取的1件单品来自于B款盲盒套餐,
,
故由条件概率公式可得
.
【知识点】独立性检验的基本思想;离散型随机变量及其分布列;离散型随机变量的期望与方差;条件概率与独立事件
【解析】【分析】(1)根据独立性检验计算K2,再进行判断即可;
(2)根据二项分布的概率公式,进行计算得分布列及数学期望即可;
(3)根据全概率公式及条件概率公式分析计算即可.
2.(2023·嘉兴模拟)为了解市某疾病的发病情况与年龄的关系,从市疾控中心得到以下数据:
年龄段(岁)
发病率(‰) 0.09 0.18 0.30 0.40 0.53
(1)若将每个区间的中点数据记为,对应的发病率记为,根据这些数据可以建立发病率(‰)关于年龄(岁)的经验回归方程,求;
附:
(2)医学研究表明,化验结果有可能出现差错.现有市某位居民,年龄在表示事件“该居民化验结果呈阳性”,表示事件“该居民患有某疾病”.已知,,求(结果精确到0.001).
【答案】(1)解:由表格中的数据,可得,
则
所以.
(2)解:由题意,可得,
,
所以.
【知识点】线性回归方程;条件概率与独立事件
【解析】【分析】(1)根据表格中的数据,结合公式求得,进而求得 的值;
(2)根据题意,结合相互独立事件的概率乘法公式和条件概率的计算公式,即可求解出 的值.
3.(2023·台州模拟)向日葵是常见的一种经济作物,种子常炒制为零食食用,也可榨葵花籽油.但种植向日葵时会频繁地遇到空壳问题,其中开花期大气湿度是导致向日葵空壳的一大主因.为找到向日葵空壳率与开花期大气湿度的关系,研究人员做了观察试验,结果如下:
大气湿度x 45% 59% 66% 68% 69% 70% 72% 77% 80% 88%
空壳率y 18% 21% 25% 27% 26% 29% 31% 32% 33% 37%
附:经验回归方程系数:,,,,,.
(1)试求向日葵空壳率与大气湿度之间的回归直线方程;(回归直线方程的系数均保留两位有效数字)
(2)某地大气湿度约为时,试根据(1)中的回归直线方程推测空壳率大约为多少
【答案】(1)解:由已知得.
所以.
所以回归直线方程为.
(2)解:由(1)知当大气湿度为时,空壳率约为.
【知识点】线性回归方程;回归分析的初步应用
【解析】【分析】(1)利用已知条件结合平均数公式和最小二乘法得出向日葵空壳率与大气湿度之间的回归直线方程。
(2) 由(1)中的线性回归方程和代入法得出当大气湿度为时的空壳率。
4.(2023·绍兴模拟)2023年是全面贯彻落实党二十大精神的开局之年,也是实施“十四五”规划承上启下的关键之年,今年春季以来,各地出台了促进经济发展的各种措施,经济增长呈现稳中有进的可喜现象.服务业的消费越来越火爆,绍兴一些超市也纷纷加大了广告促销.现随机抽取7家超市,得到其广告支出x(单位:万元)与销售额y(单位:万元)数据如下:
超市 A B C D E F G
广告支出 1 2 4 6 10 13 20
销售额 19 32 44 40 52 53 54
附注:参考数据,回归方程中斜率和截距的最小二乘估计公式分别为:.
(1)建立关于的一元线性回归方程(系数精确到0.01);
(2)若将超市的销售额与广告支出的比值称为该超市的广告效率值,当时,称该超市的广告为“好广告”.从这7家超市中随机抽取4家超市,记这4家超市中“好广告”的超市数为,求的分布列与期望.
【答案】(1)解:由数据可得;
,
又,
,
.
.
(2)解:由题知,7家超市中有3家超市的广告是“好广告”,X的可能取值是0,1,2,3
.
.
所以的分布列为
0 1 2 3
所以.
【知识点】线性回归方程;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)利用已知条件结合平均数公式和最小二乘法得出 关于的一元线性回归方程 。
(2) 由题知,7家超市中有3家超市的广告是“好广告”,从而得出随机变量X的可能取值,再结合组合数公式和古典概型求概率公式得出随机变量的分布列,再利用随机变量的分布列求数学期望公式得出随机变量X的数学期望。
5.(2023·金华模拟)全国 “两会”召开的一项重要意义在于将“两会代表”从人民中得来的信息和要求进行收集及整理,传达给中央,“两会代表”代表着广大选民的利益,代表选民在“两会”期间向政府有关部门提出选民的意见和要求.下表是2011年至2020年历年全国政协提案的数量统计.
年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5 6 7 8 9 10
提案数量y(单位:千件) 5.762 6.069 5.641 5.875 5.857 5.769 5.21 5.36 5.488 5.044
参考公式:相关系数,.
参考数据:.
(1)请用相关系数说明y与x之间的关系可否用线性回归模型拟合?若能,求y关于x的一元线性回归方程;(运算结果精确到0.01)(若,则线性相关程度很高,可用直线拟合)
(2)中央政府回应2020年“两会”的热点议题“战胜疫情”,以令世界惊叹的中国速度、中国效率和中国奇迹,社会各阶层、各行各业迅速投身战“疫”行动,团结共进、众志成城.其中一个关键举措是2021年全国各地全面展开的疫苗接种.为方便市民合理安排疫苗接种,城市便民电子系统即时提供接种点相关信息,若某疫苗接种点上午和下午接种疫苗分别需要等待20分钟和40分钟,而甲、乙市民均在某日接种疫苗,且上午去接种疫苗的概率分别为,要使两市民需要等待时间的总和的期望值不超过60分钟,求实数p的取值范围.
【答案】(1)解:由题意可得,
因为,
根据参考数据,所以相关系数,即,
所以线性相关程度很高,可用直线拟合;
由,
所以,
即y关于x的线性回归程为.
(2)解:设甲、乙两人需要排队的总时间为,则的可能取值为,
,
,
,
所以的分布列为:
40 60 80
P
因此,
可得,又,
故实数p的取值范围为.
【知识点】线性回归方程;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)根据题中数据求得相关系数,比较可得结论;求出,即可得出 y关于x的一元线性回归方程;
(2) 设甲、乙两人需要排队的总时间为,则的可能取值为, 求得每个值对应的概率,可得其分布列,求出其数学期望的表达式,列出不等式,即可求出实数p的取值范围 .
6.(2023·浦东模拟)为了庆祝党的二十大顺利召开,某学校特举办主题为“重温光辉历史 展现坚定信心”的百科知识小测试比赛.比赛分抢答和必答两个环节,两个环节均设置10道题,其中5道人文历史题和5道地理环境题.
(1)在抢答环节,某代表队非常积极,抢到4次答题机会,求该代表队至少抢到1道地理环境题的概率;
(2)在必答环节,每个班级从5道人文历史题和5道地理环境题各选2题,各题答对与否相互独立,每个代表队可以先选择人文历史题,也可以先选择地理环境题开始答题.若中间有一题答错就退出必答环节,仅当第一类问题中2题均答对,才有资格开始第二类问题答题.已知答对1道人文历史题得2分,答对1道地理环境题得3分.假设某代表队答对人文历史题的概率都是,答对地理环境题的概率都是.请你为该代表队作出答题顺序的选择,使其得分期望值更大,并说明理由.
【答案】(1)解:从10道题中随机抽取4道题,所有的基本事件的个数为,
将“某代表队没有抢到地理环境题”的事件记为,事件的对立事件为“某代表队抢到至少1道地理环境题”.则
,
(2)解:情况一:某代表队先答人文历史题,再答地理环境题,
设该代表队必答环节的得分为,,
,,,
,,
则的分布为:
此时得分期望
情况二:某代表队先答地理环境题,再答人文历史题,
设该代表队必答环节的得分为,,
,,,
,,
则的分布为:
此时得分期望
由于,故为了使该代表队必答环节得分期望值更大,该代表队应该先答人文历史题,再答地理环境题.
【知识点】互斥事件与对立事件;古典概型及其概率计算公式;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)利用已知条件结合组合数公式和古典概型求概率公式和对立事件求概率公式,进而得出 该代表队至少抢到1道地理环境题的概率。
(2) 情况一:某代表队先答人文历史题,再答地理环境题,设该代表队必答环节的得分为,进而得出随机变量X的取值,再结合独立事件乘法求概率公式得出随机变量X的分布列,再结合随机变量的分布列求数学期望公式得出随机变量X的数学期望。
情况二:某代表队先答地理环境题,再答人文历史题,设该代表队必答环节的得分为,进而得出随机变量Y的取值,再结合独立事件乘法求概率公式得出随机变量Y的分布列,再结合随机变量的分布列求数学期望公式得出随机变量Y的数学期望。再结合数学期望比较法判断出为了使该代表队必答环节得分期望值更大,该代表队应该先答人文历史题,再答地理环境题。
7.(2023·嘉定模拟)李先生是一名上班族,为了比较上下班的通勤时间,记录了20天个工作日内,家里到单位的上班时间以及同路线返程的下班时间(单位:分钟),如下茎叶图显示两类时间的共40个记录:
附:,,
(1)求出这40个通勤记录的中位数M,并完成下列2×2列联表:
超过M 不超过M
上班时间
下班时间
(2)根据列联表中的数据,请问上下班的通勤时间是否有显著差异?并说明理由.
【答案】(1)解:由茎叶图可知,该组数据的中位数为,故列出2×2列联表如下:
超过M 不超过M
上班时间 8 12
下班时间 7 13
(2)解:由2×2列联表可知,,
故上下班的通勤时间不存在显著差异.
【知识点】茎叶图;独立性检验的基本思想
【解析】【分析】 (1)根据茎叶图计数中位数即;
(2)根据独立性检验公式,计算并判断即可.
8.(2023·黄浦模拟)将某工厂的工人按年龄分成两组:“35周岁及以上”、“35周岁以下”,从每组中随机抽取80人,将他们的绩效分数分成5组:,分别加以统计,得到下列频率分布直方图.该工厂规定绩效分数不少于80者为生产标兵.
附:.
0.100 0.050 0.010 0.001
k 2.706 3.841 6.635 10.828
(1)请列出列联表,并判断能否有的把握认为是否为生产标兵与工人所在的年龄组有关:
(2)若已知该工厂工人中生产标兵的占比为,试估计该厂35周岁以下的工人所占的百分比以及生产标兵中35周岁以下的工人所占的百分比.
【答案】(1)解:观察频率分布直方图知,35周岁及以上组,绩效分数不少于80的频率为,
因此35周岁及以上组,绩效分数不少于80的人数为,绩效分数少于80的人数为60,
35周岁以下组,绩效分数不少于80的频率为,
因此35周岁及以上组,绩效分数不少于80的人数为,绩效分数少于80的人数为50,
所以列联表为:
生产标兵 非生产标兵 总计
35周岁及以上组 20 60 80
35周岁以下组 30 50 80
总计 50 110 160
提出零假设:是否为生产标兵与工人所在的年龄组无关,确定显著性水平,
的观测值,而,
所以没有的把握认为是否为生产标兵与工人所在的年龄组有关.
(2)解:令事件表示“在35周岁以下组”,表示“是生产标兵”,
用样本估计总体知,,,,设,
则由,得,解得,
因此,
所以估计该厂35周岁以下的工人所占的百分比,生产标兵中35周岁以下的工人所占的百分比分别为.
【知识点】独立性检验的基本思想;条件概率与独立事件
【解析】【分析】(1)由频率分布直方图可得35周岁以上组中的生产标兵的人数,以及35周岁以下组中的生产标兵的人数,再列出2 x 2列联表,求出 的值即可;
(2)利用全概率公式求出P(A) , 再利用条件概率公式求解即可.
9.(2023·长春模拟)国学小组有编号为1,2,3,…,的位同学,现在有两个选择题,每人答对第一题的概率为、答对第二题的概率为,每个同学的答题过程都是相互独立的,比赛规则如下:①按编号由小到大的顺序依次进行,第1号同学开始第1轮出赛,先答第一题;②若第号同学未答对第一题,则第轮比赛失败,由第号同学继继续比赛;③若第号同学答对第一题,则再答第二题,若该生答对第二题,则比赛在第轮结枣;若该生未答对第二题,则第轮比赛失败,由第号同学继续答第二题,且以后比赛的同学不答第一题;④若比赛进行到了第轮,则不管第号同学答题情况,比赛结束.
(1)令随机变量表示名同学在第轮比赛结束,当时,求随机变量的分布列;
(2)若把比赛规则③改为:若第号同学未答对第二题,则第轮比赛失败,第号同学重新从第一题开始作答.令随机变量表示名挑战者在第轮比赛结束.
①求随机变量的分布列;
②证明:单调递增,且小于3.
【答案】(1)解:由题设,可取值为1,2,3,
,,,
因此的分布列为
1 2 3
(2)解:①可取值为1,2,…,,
每位同学两题都答对的概率为,则答题失败的概率均为:,
所以时,;当时,
故的分布列为:
1 2 3 …
…
②由①知:(,).
,故单调递增;
由上得,故,
∴,
故.
【知识点】离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1) 由题设,可取值为1,2,3, 利用独立事件乘法公式、互斥事件概率求法求各值对应的概率,即可得随机变量的分布列;
(2)①应用二项分布概率公式求 可取值为1,2,…,对应概率,即可得分布列;
②由①分布列得 (,),定义法判断E(Yn)单调性,累加法、等比数列前n项和公式求E(Yn)通项公式,即可证得结论.
10.(2023·茂名模拟)马尔可夫链是因俄国数学家安德烈·马尔可夫得名,其过程具备“无记忆”的性质,即第次状态的概率分布只跟第次的状态有关,与第次状态是“没有任何关系的”.现有甲、乙两个盒子,盒子中都有大小、形状、质地相同的2个红球和1个黑球.从两个盒子中各任取一个球交换,重复进行次操作后,记甲盒子中黑球个数为,甲盒中恰有1个黑球的概率为,恰有2个黑球的概率为.
(1)求的分布列;
(2)求数列的通项公式;
(3)求的期望.
【答案】(1)解:由题可知,的可能取值为0,1,2.由相互独立事件概率乘法公式可知:
;;,
故的分布列如下表:
0 1 2
(2)解:由全概率公式可知:
,
即:,
所以,
所以,
又,
所以,数列为以为首项,以为公比的等比数列,
所以,
即:.
(3)解:由全概率公式可得:
,
即:,
又,
所以,
所以,
又,
所以,
所以,
所以,
所以.
【知识点】相互独立事件的概率乘法公式;离散型随机变量及其分布列;离散型随机变量的期望与方差;全概率公式
【解析】【分析】(1) 由题可知,的可能取值为0,1,2 ,求出对应的概率,可得 的分布列 ;
(2) 由全概率公式可得 , 可得 ,数列为以为首项,以为公比的等比数列, 利用等比数列的通项公式可求出数列的通项公式;
(3) 由全概率公式可得 ,即,可得 , 进而求出 的期望.
11.(2023·虹口模拟)电解电容是常见的电子元件之一.检测组在的温度条件下对电解电容进行质量检测,按检测结果将其分为次品、正品,其中正品分合格品、优等品两类
(1)铝 是组成电解电容必不可少的材料.现检测组在的温度条件下,对铝箵质量与电解电容质量进行测试,得到如下列联表,那么他们是否有的把握认为电解电容质量与铝 质量有关?请说明理由;
电解电容为次品 电解电容为正品
铝箔为次品 174 76
铝箔为正品 108 142
(2)电解电容经检验为正品后才能装箱,已知两箱电解电容(每箱50个),第一箱和第二箱中分别有优等品8件与9件.现用户从两箱中随机挑选出一箱,并从该箱中先后随机抽取两个元件,求在第一次取出的是优等品的情况下,第二次取出的是合格品的概率.
【答案】(1)解:提出原假设:电解电容质量与铝 质量无关.
由题意及列联表,可得
.
由于,而,
因此,根据检测组的数据,原假设不成立,并且有的把握认为电解电容质量与铝箔质量有关.
(2)解:设第一次取出的元件是优等品的事件为,第二次取出的元件是合格品的事件为.取出的元件是第一箱、第二箱的事件分别为,.
则由全概率公式,得
,
于是,由条件概率公式,得.
因此,在第一次取出的是优等品的情况下,第二次取出的是合格品的概率约为0.846.
【知识点】独立性检验的基本思想;条件概率与独立事件
【解析】【分析】 (1)先填写2x2联列表,再求出K2,即可判断;
(2)利用条件概率公式,求解即可得第二次取出的是合格品的概率.
12.(2023·金山模拟)某网站计划4月份订购草莓在网络销售,每天的进货量相同,成本价为每盒15元.假设当天进货能全部售完,决定每晚七点前(含七点)售价为每盒20元,每晚七点后售价为每盒10元.根据销售经验,每天的购买量与网站每天的浏览量(单位:万次)有关.为确定草莓的进货量,相关人员统计了前两年4月份(共60天)网站每天的浏览量(单位:万次)、购买草莓的数量(单位:盒)以及达到该流量的天数,如下表所示:
每天的浏览量
每天的购买量 300 900
天数 36 24
以每天的浏览量位于各区间的频率代替浏览量位于该区间的概率.
(1)求4月份草莓一天的购买量(单位:盒)的分布;
(2)设4月份销售草莓一天的利润为(单位:元),一天的进货量为(单位:盒),为正整数且,当为多少时,的期望达到最大值,并求此最大值.
【答案】(1)解:依题意的可能取值为、,
则,,
所以的分布列为
(2)解:当一天的进货量为(单位:盒),为正整数且时利润的可能取值为或,
且,,
所以,
显然随着的增大而减少,所以当时的期望达到最大值,.
【知识点】离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)依题意X的可能取值为300,900,求出所对应的概率,即可得到概率分布列;
(2)依题意可得Y的可能取值为3000-5n或5n,求出所对应的概率,即可得到E(Y),进而求出 的期望达到最大值 .
13.(2023·静安模拟)概率统计在生产实践和科学实验中应用广泛.请解决下列两个问题.
参考公式及数据:,其中,
(1)随着中小学“双减”政策的深入人心,体育教学和各项体育锻炼迎来时间充沛的春天.某初中学校学生篮球队从开学第二周开始每周进行训练,第一次训练前共有6个篮球,其中3个是新球(即没有用过的球),3个是旧球(即至少用过一次的球).每次训练,都是从中不放回任意取出2个篮球,训练结束后放回原处. 设第一次训练时取到的新球个数为ξ,求随机变量ξ的分布和期望.
(2)由于手机用微波频率信号传递信息,那么长时间使用手机是否会增加得脑瘤的概率?研究者针对这个问题,对脑瘤病人进行问卷调查,询问他们是否总是习惯在固定的一侧接听电话?如果是,是哪边?结果有88人喜欢用固定的一侧接电话.其中脑瘤部位在左侧的病人习惯固定在左侧接听电话的有14人,习惯固定在右侧接听电话的有28人;脑瘤部位在右侧的病人习惯固定在左侧接听电话的有19人,习惯固定在右侧接听电话的有27人.根据上述信息写出下面这张列联表中字母所表示的数据,并对患脑瘤在左右侧的部位是否与习惯在该侧接听手机电话相关进行独立性检验.(显著性水平
习惯固定在左侧接听电话 习惯固定在右侧接听电话 总计
脑瘤部位在左侧的病人 a b 42
脑瘤部位在右侧的病人 c d 46
总计 a+c b+d 88
【答案】(1)解:第一次训练时所取的球是从6个球(3新,3旧)中不放回取出2个球,所以可取的值为0,1,2..
则分布列如下
0 1 2
则期望为;
(2)解:由题目条件可得列联表如下:
习惯固定在左侧接听电话 习惯固定在右侧接听电话 总计
脑瘤部位在左侧的病人 14 28 42
脑瘤部位在右侧的病人 19 27 46
总计 33 55 88
则=,故长时间使用手机与是否得脑瘤没有显著关系.
【知识点】独立性检验的应用;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1) 利用已知条件结合第一次训练时所取的球是从6个球(3新,3旧)中不放回取出2个球,从而得出随机变量以可取的值,再利用组合数公式和古典概型求概率公式得出随机变量的分布列,再结合随机变量的分布列求数学期望公式得出随机变量的数学期望。
(2) 由题目条件可得列联表,再利用列联表中的数据结合独立性检验的方法判断出长时间使用手机与是否得脑瘤没有显著关系。
14.(2023·闵行模拟)在临床检测试验中,某地用某种抗原来诊断试验者是否患有某种疾病.设事件表示试验者的检测结果为阳性,事件表示试验者患有此疾病,据临床统计显示,,.已知该地人群中患有此种疾病的概率为.(下列两小题计算结果中的概率值精确到)
(1)对该地某人进行抗原检测,求事件与同时发生的概率;
(2)对该地个患有此疾病的患者进行抗原检测,用随机变量表示检测结果为阳性的人数,求的分布和期望.
【答案】(1)解:由题意知:,,
,
即事件与同时发生的概率为.
(2)解:,,
所有可能的取值为,
;;;;
的分布为,数学期望.
【知识点】互斥事件与对立事件;离散型随机变量及其分布列;离散型随机变量的期望与方差;条件概率与独立事件;二项分布与n次独立重复试验的模型
【解析】【分析】(1)利用已知条件结合对立事件求概率公式、条件概型求概率公式,进而得出事件与同时发生的概率。
(2)利用 ,所以,进而得出X所有可能的取值,再利用二项分布求概率公式得出随机变量X的分布列,再结合随机变量的分布列求数学期望公式,进而得出随机变量X的数学期望。
15.(2023·梅州模拟)元宵佳节,是民间最重要的民俗节日之一,我们梅州多地都会举行各种各样的民俗活动,如五华县河东镇的“迎灯”、丰顺县埔寨镇的“火龙”、大埔县百侯镇的“迎龙珠灯”等系列活动.在某庆祝活动现场,为了解观众对该活动的观感情况(“一般”或“激动”),现从该活动现场的观众中随机抽取200名,得到下表:
一般 激动 总计
男性 90 120
女性 25
总计 200
附:,其中.
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
(1)填补上面的2×2列联表,并依据小概率值的独立性检验,能否认为性别与对该活动的观感程度有关?
(2)该活动现场还举行了有奖促销活动,凡当天消费每满300元,可抽奖一次.抽奖方案是:从装有3个红球和3个白球(形状、大小、质地完全相同)的抽奖箱里一次性摸出2个球,若摸出2个红球,则可获得100元现金的返现;若摸出1个红球,则可获得50元现金的返现;若没摸出红球,则不能获得任何现金返现.若某观众当天消费600元,记该观众参加抽奖获得的返现金额为X,求随机变量X的分布列和数学期望.
【答案】(1)解:补全的2×2列联表如下:
一般 激动 总计
男性 30 90 120
女性 25 55 80
总计 55 145 200
零假设为:性别与对活动的观感程度相互独立.
根据表中数据,计算得到
根据小概率值的独立性检验,没有充分证据推断不成立,因此我们可以认为,成立,即认为对该场活动活动的观感程度与性别无关.
(2)解:设一次摸球摸出2个红球的事件为A,摸出1个红球的事件为B,没摸出红球的事件为C,
则,,,
由题意,X可取.
,,
,,
,
所以X的分布列为:
X 200 150 100 50 0
P
.
【知识点】独立性检验的基本思想;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)写出零假设,补全2 x 2列联表,计算 的值,并与临界值比较,得出结论;
(2)分别求出一次摸球摸出0 , 1 , 2个红球的概率,写出X的所有可能取值及对应取值的概率,写出X的分布列并计算其数学期望.
16.(2023·吉林模拟)我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.该企业为了了解研发资金的投入额x(单位:百万元)对年收入的附加额y(单位:百万元)的影响,对往年研发资金投入额和年收入的附加额进行研究,得到相关数据如下:
投入额 2 3 4 5 6 8 9 11
年收入的附加额 3.6 4.1 4.8 5.4 6.2 7.5 7.9 9.1
【参考数据】,,.
【附】在经验回归方程中,,.
(1)求年收入的附加额y与投入额x的经验回归方程;
(2)若年收入的附加额与投入额的比值大于1,则称对应的投入额为“优秀投资额”,现从上面8个投入额中任意取3个,用X表示这3个投入额为“优秀投资额”的个数,求X的分布列及数学期望.
【答案】(1)解:,,
,
又因为,所以,
所以年收入的附加额y与投入额x的线性回归方程为
(2)解:8个投入额中,“优秀投资额”的个数为5个,故X的所有可能取值为0,1,2,3,
;;;
则X的分布列为
X 0 1 2 3
P
.
【知识点】线性回归方程;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)根据已知数据和参考公式,即可求出y与投入额x的经验回归方程;
(2)求出X的所有可能取值和对应的概率,即可求出X的分布列,再由期望公式即可求出数学期望.
17.(2023·广安模拟)某商店销售某种产品,为了解客户对该产品的评价,现随机调查了200名客户,其评价结果为“一般”或“良好”,并得到如下列联表:
一般 良好 合计
男 20 100 120
女 30 50 80
合计 50 150 200
附表及公式:
0.15 0.10 0.05 0.025 0.010
2.072 2.706 3.841 5.024 6.635
其中,.
(1)通过计算判断,有没有99%的把握认为客户对该产品的评价结果与性别有关系?
(2)该商店在春节期间开展促销活动,该产品共有如下两个销售方案.方案一:按原价的8折销售;方案二:顾客购买该产品时,可在一个装有4张“每满200元少80元”,6张“每满200元少40元”共10张优惠券的不透明箱子中,随机抽取1张,购买时按照所抽取的优惠券进行优惠.已知该产品原价为260(元/件).顾客甲若想采用方案二的方式购买一件产品,估计顾客甲需支付的金额;你认为顾客甲选择哪种购买方案较为合理?
【答案】(1)解:,
所以有99%的把握认为客户对该产品的评价结果与性别有关系;
(2)解:若甲顾客按方案二购买一件产品,设需要出元,则可取,
,
所以(元),
所以顾客甲若想采用方案二的方式购买一件产品,估计顾客甲需支付元,
若甲顾客按方案一购买一件产品,则需要(元),
因为,
所以顾客甲选择方案二购买较为合理.
【知识点】独立性检验;函数模型的选择与应用
【解析】【分析】(1)根据公式求出,再对照临界值表即可得出结论;
(2)设甲顾客按方案二购买一件产品需要出元,则可取, 求出对应概率,再根据期望公式求出期望即可,再求出选择方案一所需的金额,即可得出结论.
18.(2023·杭州模拟)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为:假设我们的序列状态是…,,,,,…,那么时刻的状态的条件概率仅依赖前一状态,即.
现实生活中也存在着许多马尔科夫链,例如著名的赌徒模型.
假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率为,且每局赌赢可以赢得1元,每一局赌徒赌输的概率为,且赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束赌博游戏:一种是手中赌金为0元,即赌徒输光;一种是赌金达到预期的B元,赌徒停止赌博.记赌徒的本金为,赌博过程如下图的数轴所示.
当赌徒手中有n元(,)时,最终输光的概率为,请回答下列问题:
(1)请直接写出与的数值.
(2)证明是一个等差数列,并写出公差d.
(3)当时,分别计算,时,的数值,并结合实际,解释当时,的统计含义.
【答案】(1)解:当时,赌徒已经输光了,因此.
当时,赌徒到了终止赌博的条件,不再赌了,因此输光的概率.
(2)证明:记M:赌徒有n元最后输光的事件,N:赌徒有n元下一场赢的事件,
,
即,
所以,
所以是一个等差数列,
设,则,
累加得,故,得,
(3)解:,由得,即,
当时,,
当时,,
当时,,因此可知久赌无赢家,
即便是一个这样看似公平的游戏,
只要赌徒一直玩下去就会的概率输光.
【知识点】概率的应用;全概率公式
【解析】【分析】(1)明确n=0和n=B的含义,即可求出 与的数值;
(2)由全概率公式可得 ,整理为 ,即可证明结论;
(3)由(2)结论可得 ,即可求得B=200,B=1000时,P(A)的数值,结合概率的变化趋势,即可得统计含义.
19.(2023·崇明模拟)某校工会开展健步走活动,要求教职工上传3月1日至3月7日的微信记步数信息,下图是职工甲和职工乙微信记步数情况:
(1)从3月2日至3月7日中任选一天,求这一天职工甲和职工乙微信记步数都不低于10000的概率;
(2)从3月1日至3月7日中任选两天,记职工乙在这两天中微信记步数不低于10000的天数为,求的分布列及数学期望;
(3)下图是校工会根据3月1日至3月7日某一天的数据制作的全校200名教职工微信记步数的频率分布直方图.已知这一天甲和乙微信记步数在单位200名教职工中排名(按照从大到小排序)分别为第68和第142,请指出这是根据哪一天的数据制作的频率分布直方图(不用说明理由).
【答案】(1)解:令时间A为“职工甲和职工乙微信记步数都不低于10000”,
从3月2日至3月7日这6天中,3月2日、5日、7日这3天中,
甲乙微信记步数都不低于10000,
故.
(2)解:由(1)知:,
,,,
的分布列为:
(3)解:根据频率分步直方图知:微信记步数落在,,,,
(单位:千步)区间内的人数依次为人,人,
人,人,人,
由甲微信记步数排名第68,可知当天甲微信记步数在15000到20000万之间,
根据折线图知:只有3月2日,3月3日,3月7日.
由乙微信记步数排名第142,可知当天乙微信记步数在5000到10000万之间,
根据折线图知:只有3月3日和3月6日,
所以3月3日符合要求.
【知识点】频率分布直方图;古典概型及其概率计算公式;离散型随机变量的期望与方差
【解析】【分析】(1)根据古典概型公式求解即可;
(2)根据题意得到, ,,,再写出分布列数学期望即可;
(3)根据折线图和频率分布直方图求解即可.
20.(2023·红河模拟)某市教育行政部门为开展普及法律常识的宣传教育活动,增强学生的法律意识,提高自身保护能力,在全市中小学生范围内,组织了一次法律常识知识竞赛(满分100分),现从所有参赛学生的竞赛成绩中随机抽取200份,经统计,这200份成绩全部介于之间,将数据按照,,……,分成七组,得到如下频数分布表:
竞赛成绩(单位:分)
人数(单位:人) 6 14 30 74 42 23 11
(1)试估计该市竞赛成绩的平均分(同一组中的数据用该组区间的中点值作代表)和第80百分位数(保留一位小数);
(2)以样本频率值作为概率的估计值,若从该市所有参与竞赛的学生中,随机抽取3名学生进行座谈,设抽到60分及以上的学生人数为,求的分布列和数学期望.
【答案】(1)解:平均分
前4组频率之和为,前5组频率之和为,
故第80百分位数位于第5组
设第80百分位数为,则
则该市竞赛成绩的平均分和第80百分位数分别约为67.3和78.6.
(2)解:抽到60分及以上的学生的概率为,
由题意,的可能取值为0,1,2,3,且服从,则
,,
,,
所以的分布列为:
0 1 2 3
所以或.
【知识点】众数、中位数、平均数;离散型随机变量及其分布列;离散型随机变量的期望与方差;二项分布与n次独立重复试验的模型
【解析】【分析】(1)根据平均数以及百分位数的计算公式即可求解出第80百分位数;
(2)根据二项分布即可求解概率,进而可求解出 的分布列和数学期望.
21.(2023·宜宾模拟)2022年中国新能源汽车销量继续蝉联全球第一,以比亚迪为代表的中国汽车交出了一份漂亮的“成绩单”,比亚迪新能源汽车成为2022年全球新能源汽车市场销量冠军,在中国新能源车的销量中更是一骑绝尘,占比约为30%.为了解中国新能源车的销售价格情况,随机调查了10000辆新能源车的销售价格,得到如下的样本数据的频率分布直方图:
(1)估计一辆中国新能源车的销售价格位于区间(单位:万元)的概率,以及中国新能源车的销售价格的众数;
(2)若从中国新能源车中随机地抽出3辆,设这3辆新能源车中比亚迪汽车的数量为,求的分布列与数学期望.
【答案】(1)解:销售价格位于区间(单位:万元)的概率为.
销售价格的众数为
(2)解:的可能取值为,
;;
;,
分布列为:
.
【知识点】众数、中位数、平均数;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)根据频率分布直方图得到概率为,众数为,计算得到答案;
(2)的可能取值为, 计算概率得到分布列,再计算数学期望得到答案.
22.(2023·温州模拟)在一次全市的联考中,某校高三有100位学生选择“物化生”组合,100位学生选择“物化地”组合,现从上述的学生中分层抽取100人,将他们此次联考的化学原始成绩作为样本,分为6组:,得到如图所示的频率分布直方图.
附:,其中.
0.10 0.05 0.01 0.001
2.706 3.841 6.635 10.828
(1)求直方图中的值;
(2)在抽取的100位学生中,规定原始成绩不低于80分为“优秀”,低于80分为“不够优秀",请将下面的列联表补充完整,并判断是否有的把握认为成绩是否优秀与所选的组合有关?
优秀 不够优秀 总计
“物化生”组合 40
“物化地”组合
总计
(3)浙江省高考的选考科目采用等级赋分制,等级赋分的分差为1分,具体操作步骤如下:
第一步:将原始成绩从高到低排列,按人数比例划分为20个赋分区间.
第二步:对每个区间的原始成绩进行等比例转换,公式为:
其中分别是该区间原始成绩的最低分 最高分;分别是该区间等级分的最低分 最高分;为某考生原始成绩,为转换结果.
第三步:将转换结果四舍五入,确定为该考生的最终等级分.
本次联考采用浙江选考等级赋分制,已知全市所有的考生原始成绩从高到低前(最低分为80分)的考生被划分至的赋分区间,甲 乙两位考生的化学原始成绩分别为,最终的等级分为98 99.试问:本次联考全市化学原始成绩的最高分是否可能是91分?请说明理由.
【答案】(1)解:由频率分布直方图得:,解得,
所以直方图中的值是.
(2)解:由频率分布直方图“优秀”人数为人,则不够优秀的为85人,
所以列联表为:
优秀 不够优秀 总计
“合物化生”组 10 40 50
“物化地”组 5 45 50
合总计 15 85 100
零假设:成绩是否优秀与所选的组合无关,
因此,
所以没有的把握认为成绩是否优秀与所选的组合有关.
(3)解:假设本次联考全市化学原始成绩的最高分是91分,
则有,
此时99.73四舍五入后变为100分,与99分矛盾,因此假设不成立,
所以本次联考全市化学原始成绩的最高分不可能是91分.
【知识点】频率分布直方图;独立性检验的基本思想
【解析】【分析】(1)利用频率分布直方图所有小矩形面积和为1列式计算可求出直方图中的值;
(2)利用频率分布直方图求出"优秀”人数,完善 列联表,再求出K2的预测值,可得结论;
(3)假定最高分是91分,求出甲乙的等级分成绩即可判断得结论.
23.(2023·南宁模拟)在某次现场招聘会上,某公司计划从甲和乙两位应聘人员中录用一位,规定从6个问题中随机抽取3个问题作答.假设甲能答对的题目有4道,乙每道题目能答对的概率为,
(1)求甲在第一次答错的情况下,第二次和第三次均答对的概率;
(2)请从期望和方差的角度分析,甲 乙谁被录用的可能性更大?
【答案】(1)解:记“该甲自媒体平台公司第一次答错”为事件A,“该甲自媒体平台公司第二次和第三次均答对”为事件,则,
故甲自媒体平台公司在第一次答错的的条件下,第二次和第三次均答对的概率为
.
(2)解:设甲自媒体平台公司答对的问题数为,则的所有可能取值为.
,
则的分布列为
1 2 3
可得,
;
设乙自媒体平台公司答对的问题数为,则的所有可能取值为.
解法一:,,
,,
则的分布列为:
0 1 2 3
可得,
,
由可得,甲自媒体平台公司竞标成功的可能性更大.
解法二:∵,则,;
由可得,甲自媒体平台公司竞标成功的可能性更大.
【知识点】离散型随机变量及其分布列;离散型随机变量的期望与方差;条件概率与独立事件
【解析】【分析】(1) 记“该甲自媒体平台公司第一次答错”为事件A,“该甲自媒体平台公司第二次和第三次均答对”为事件,求得 ,可求出第二次和第三次均答对的概率;
(2)分别求甲、乙两家公司答对题数的分布列,再求两个随机变量的期望和方差,由此作出判断.
24.(2023·桂林模拟)某互联网公司为了确定下一季度的前期广告投入计划,收集了近个月广告投入量(单位:万元)和收益(单位:万元)的数据如下表:
月份
广告投入量
收益
他们分别用两种模型①,②分别进行拟合,得到相应的回归方程并进行残差分析,得到如下图所示的残差图及一些统计量的值.
附:回归方程中斜率和截距的最小二乘估计公式分别为:,.
(1)根据残差图,比较模型①②的拟合效果,应该选择哪个模型?请说明理由.
(2)残差绝对值大于的数据认为是异常数据,需要剔除.
(i)剔除异常数据后求出(1)中所选模型的回归方程;
(ii)若广告投入量,求该模型收益的预报值是多少?
【答案】(1)解:应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,
所以模型①的拟合精度高,回归方程的预报精度高;
(2)解:(i)剔除异常数据,即月份的数据后,
得,.
,.
,.
所以关于的回归方程为;
(ii)把代入①中所求回归方程得,故预报值为万元.
【知识点】线性回归方程
【解析】【分析】 (1)根据残差图分析,得出模型①残差波动小,故选模型①;
(2)(i)剔除异常数据,计算剩下数据的平均数,求出回归系数,写出回归方程;
(ii)把x=18代入回归方程,即可求得该模型收益的预报值.
25.(2023·宣城模拟)某校在一次庆祝活动中,设计了一个“套圈游戏”,规则如下:每人3个套圈,向,两个目标投掷,先向目标掷一次,套中得1分,没有套中不得分,再向目标连续掷两次,每套中一次得2分,没套中不得分,根据累计得分发放奖品.已知小明每投掷一次,套中目标的概率为,套中目标的概率为,假设小明每次投掷的结果相互独立,累计得分记为.
(1)求小明恰好套中2次的概率;
(2)求的分布列及数学期望.
【答案】(1)解:小明恰好套中2次包括:套中,各一次和未套中,套中两次.
所以套中,各一次的概率为,
未套中,套中两次的概率未,
所以小明恰好套中2次的概率.
(2)解:由题意可得:的可能取值为0,1,2,3,4,5
,,
,,
,.
所以的分布列为
0 1 2 3 4 5
所以.
【知识点】互斥事件的概率加法公式;相互独立事件的概率乘法公式;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1) 利用已知条件结合独立事件乘法求概率公式和互斥事件加法求概率公式,进而得出小明恰好套中2次的概率。
(2) 由题意可得随机变量的可能取值,再利用独立事件乘法求概率公式得出随机变量X的分布列,再结合随机变量的分布列求数学期望公式,进而得出随机变量X的数学期望。
26.(2023·深圳模拟)某食品公司在八月十五来临之际开发了一种月饼礼盒,礼盒中共有7个两种口味的月饼,其中4个五仁月饼和3个枣泥月饼.
(1)一次取出两个月饼,求两个月饼为同一种口味的概率;
(2)依次不放回地从礼盒中取2个月饼,求第1次 第2次取到的都是五仁月饼的概率;
(3)依次不放回地从礼盒中取2个月饼,求第2次取到枣泥月饼的概率.
【答案】(1)解:一次取出2个月饼,共有种方法,其中两个都是五仁的有种方法,两个都是枣泥的有种方法,两个月饼为同一种口味的概率为;
(2)解:依次不放回地从礼盒中取2个月饼,共有种方法,其中求第1次 第2次取到的取到都是五仁月饼的有种方法,所以第1次 第2次取到的都是五仁月饼的概率是;
(3)解:依次不放回地从礼盒中取2个月饼,共有种方法,第1次取五仁 第2次取到枣泥月饼的方法有种,第1次取到枣泥 第2次也取到枣泥月饼的方法有种,所以第2次取到枣泥月饼的概率为.
【知识点】古典概型及其概率计算公式;分类加法计数原理;分步乘法计数原理
【解析】【分析】(1)根据组合知识,利用古典概型概率公式求解即可;
(2)根据两个计数原理以及排列知识,利用古典概型概率公式求解即可;
(3)根据两个计数原理以及排列知识,利用古典概型概率公式求解即可;
27.(2023·广西模拟)2016~2020年广西城乡居民人均可支配收入的柱形图如下图所示.
参考数据:,,.
附:样本的相关系数,
线性回归方程中的系数,.
(1)不考虑价格因素,求广西2020年农村居民人均可支配收入的年增长率(结果精确到0.1%).
(2)现欲了解广西各年城镇居民人均可支配收入y(单位:元)与农村居民人均可支配收入x(单位:元)是否存在较好的线性关系.设广西2016年城镇居民人均可支配收入为元,农村居民人均可支配收入为元,2017年对应的数据分别为,,2018年对应的数据分别为,,2019年对应的数据分别为,,2020年对应的数据分别为,.根据图中的五组数据,得到y关于x的线性回归方程为.试问y关于x的线性相关系数r是否大于0.95,并判断y与x之间是否存在较好的线性关系.
【答案】(1)解:因为广西2020年农村居民人均可支配收入为14815元,广西2019年农村居民人均可支配收入为13676元,
所以广西2020年农村居民人均可支配收入的年增长率为.
(2)解:
y关于x的线性回归方程为,所以,
所以,
,
所以,
所以,
故y与x之间存在较好的线性关系.
【知识点】线性回归方程
【解析】【分析】(1)根据表中数据计算人均可支配收入的年增长率即可;
(2)求出,再由已知 , 求出 , 根据相关系数公式求出 y与x之间存在较好的线性关系.
28.(2023·柳州模拟)随着中国实施制造强国战略以来,中国制造(Made in china)逐渐成为世界上认知度最高的标签之一,企业也越来越重视产品质量的全程控制.某企业从生产的一批产品中抽取40件作为样本,检测其质量指标值,质量指标的范围为,经过数据处理后得到如下频率分布直方图.
(1)求频率分布直方图中质量指标值的平均数和中位数(结果精确到0.1);
(2)为了进一步检验产品质量,在样本中从质量指标在和的两组中抽取2件产品,记取自的产品件数为,求的分布列和数学期望.
【答案】(1)解:设质量指标值的平均数为,中位数为,
则,
因为,,所以中位数位于之间,
则,解得;
(2)解:样本中质量指标在的产品有件,质量指标在的有件,
则可能的取值为,,,
相应的概率为:,
,,
所以随机变量的分布列为
所以随机变量的期望.
【知识点】频率分布直方图;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)由频率分布直方图中平均数和中位数的公式计算即可;
(2)先算出样本中质量指标在[50, 60)的产品有6件,质量指标在[90, 100]的有4件, 可能的取值为,,, 分别求出对应的概率,可得 的分布列 ,再根据数学期望公式可求出数学期望.
29.(2023·蚌埠模拟)某校为了丰富学生课余生活,组建了足球社团.为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各100名进行调查,部分数据如表所示:
喜欢足球 不喜欢足球 合计
男生 40
女生 30
合计
附:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
(1)根据所给数据完成上表,依据的独立性检验,能否认为该校学生喜欢足球与性别有关?
(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球射门.已知这两名男生进球的概率均为,这名女生进球的概率为,每人射门一次,假设各人射门相互独立,求3人进球总次数的分布列和数学期望.
【答案】(1)解:列联表如下:
喜欢足球 不喜欢足球 合计
男生 60 40 100
女生 30 70 100
合计 90 110 200
则,
所以依据的独立性检验,能认为该校学生喜欢足球与性别有关.
(2)解:依题意得3人进球总次数的所有可能取值为,
,
,
,
,
所以的分布列如下:
0 1 2 3
所以的数学期望为.
【知识点】独立性检验的应用;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】 (1)利用已知条件列出 列联表,再利用列联表和独立性检验的方法以及,从而能认为该校学生喜欢足球与性别有关。
(2) 依题意得3人进球总次数的所有可能取值,再利用二项分布求概率公式和互斥事件加法求概率公式,进而得出随机变量X的分布列,再结合随机变量的分布列求数学期望公式,进而得出随机变量X的数学期望。
30.(2023·广东模拟)某商场为了回馈广大顾客,设计了一个抽奖活动,在抽奖箱中放10个大小相同的小球,其中5个为红色,5个为白色.抽奖方式为:每名顾客进行两次抽奖,每次抽奖从抽奖箱中一次性摸出两个小球.如果每次抽奖摸出的两个小球颜色相同即为中奖,两个小球颜色不同即为不中奖.
(1)若规定第一次抽奖后将球放回抽奖箱,再进行第二次抽奖,求中奖次数的分布列和数学期望.
(2)若规定第一次抽奖后不将球放回抽奖箱,直接进行第二次抽奖,求中奖次数的分布列和数学期望.
(3)如果你是商场老板,如何在上述问两种抽奖方式中进行选择?请写出你的选择及简要理由.
【答案】(1)解:若第一次抽奖后将球放回抽奖箱,再进行第二次抽奖,则每次中奖的概率为,
因为两次抽奖相互独立,所以中奖次数服从二项分布,即,
所以的所有可能取值为,则
,
所以的分布列为
0 1 2
所以的数学期望为.
(2)解:若第一次抽奖后不将球放回抽奖箱,直接进行第二次抽奖,中奖次数的所有可能取值为,
则,
,
,
所以的分布列为
0 1 2
所以的数学期望为.
(3)解:因为(1)(2)两问的数学期望相等,第(1)问中两次奖的概率比第(2)问的小,
即,第(1)不中奖的概率比第问小,即,
回答一:若商场老板希望中两次奖的顾客多,产生宣传效应,则选择按第(2)问方式进行抽.
回答二:若商场老板希望中奖的顾客多,则选择按第(1)问方式进行抽奖.
【知识点】离散型随机变量的期望与方差
【解析】【分析】(1)根据古典概型的运算公式,结合二项分布的性质进行求解即可;
(2)根据古典概型的运算公式,结合数学期望公式进行求解即可;
(3)根据数学期望的性质,结合商场老板希望进行判断即可.
31.(2023·吉林模拟)2022年11月20日,卡塔尔足球世界杯正式开幕,世界杯上的中国元素随处可见.从体育场建设到电力保障,从赛场内的裁判到赛场外的吉祥物都是中国制造,为卡塔尔世界杯提供了强有力的支持.国内也再次掀起足球热潮.某地足球协会组建球队参加业余比赛,该足球队教练组为了考查球员甲对球队的贡献,作出如下数据统计(甲参加过的比赛均分出了输赢):
球队输球 球队赢球 总计
甲参加 2 30 32
甲未参加 8 10 18
总计 10 40 50
附:.
参考数据:
a 0.05 0.01 0.005 0.001
3.841 6.635 7.879 10.828
(1)根据小概率值的独立性检验,能否认为该球队赢球与甲球员参赛有关联;
(2)从该球队中任选一人,A表示事件“选中的球员参赛”,B表示事件“球队输球”.与的比值是选中的球员参赛对球队贡献程度的一项度量指标,记该指标为R.
①证明:;
②利用球员甲数据统计,给出,的估计值,并求出R的估计值.
【答案】(1)解:零假设为:该球队胜利与甲球员参赛无关.
,
因为,
所以依据的独立性检验,我们推断不成立,所以认为该球队胜利与甲球员参赛有关,此推断犯错误的概率不大于0.005.
(2)①证明:
②,,
.
【知识点】独立性检验的基本思想;条件概率与独立事件
【解析】【分析】(1)由所给数据结合公式求出 的值, 将其与临界值比较大小,由此确定能否认为该球队赢球与甲球员参赛有关联;
(2)①根据定义结合条件概率公式即可完成证明;
②根据①结合已知数据求出R.
32.(2023·赣州模拟)近年来,我国加速推行垃圾分类制度,全国垃圾分类工作取得积极进展.某城市推出了两套方案,并分别在,两个大型居民小区内试行.方案一:进行广泛的宣传活动,通过设立宣传点、发放宣传单等方式,向小区居民和社会各界宣传垃圾分类的意义,讲解分类垃圾桶的使用方式,垃圾投放时间等,定期召开垃圾分类会议和知识宣传教育活动;方案二:智能化垃圾分类,在小区内分别设立分类垃圾桶,垃圾回收前端分类智能化,智能垃圾桶操作简单,居民可以通过设备进行自动登录、自动称重、自动积分等一系列操作.建立垃圾分类激励机制,比如,垃圾分类换积分,积分可兑换礼品等,激发了居民参与垃圾分类的热情,带动居民积极主动地参与垃圾分类.经过一段时间试行之后,在这两个小区内各随机抽取了100名居民进行问卷调查,记录他们对试行方案的满意度得分(满分100分),将数据分成6组:,,,,,,并整理得到如下频率分布直方图:
(1)请通过频率分布直方图分别估计两种方案满意度的平均得分,判断哪种方案的垃圾分类推广措施更受居民欢迎(同一组中的数据用该组中间的中点值作代表);
(2)以样本频率估计概率,若满意度得分不低于70分说明居民赞成推行此方案,低于70分说明居民不太赞成推行此方案.现从小区内随机抽取5个人,用表示赞成该小区推行方案的人数,求的分布列及数学期望.
【答案】(1)解:设小区方案一的满意度平均分为,
则
设小区方案二的满意度平均分为,
则
∵,
∴方案二的垃圾分类推行措施更受居民欢迎.
(2)解:由题意可知方案二中,
满意度不低于70分的频率为,
低于70分的频率为,
现从小区内随机抽取5个人,的所有可能取值为0,1,2,3,4,5,则
,
,
,
∴的分布列为
0 1 2 3 4 5
期望.
【知识点】频率分布直方图;众数、中位数、平均数;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)利用已知条件结合频率分布直方图求平均数公式,再利用平均数比较法判断出方案二的垃圾分类推行措施更受居民欢迎。
(2) 由题意可知方案二中,再利用频率分布直方图中各小组的矩形的面积等于各小组的频率,进而得出满意度不低于70分的频率和低于70分的频率,现从小区内随机抽取5个人,进而得出随机变量的所有可能取值,则,再利用二项分布求出随机变量X的分布列,再结合随机变量X的分布列求数学期望的方法得出随机变量X的数学期望。
33.(2023·呼和浩特模拟)某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)
(1)应收集多少位女生样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:,,,,,.估计该校学生每周平均体育运动时间超过4个小时的概率.
(3)视样本数据的频率为概率,现从全校取4名学生,记为这四名学生中运动时间超过4小时的人数,求的分布列以及数学期望.
【答案】(1)解:因为男生10500人,女生4500人,
所以抽取女生占总人数的比例为.
又因为分层抽样收集300位学生,
所以女生样本数据应收集为.
(2)解:由频率分布直方图可知,
学生每周平均体育运动时间超过4个小时的频率为.
估计该校学生每周平均体育运动时间超过4个小时的概率0.75.
(3)解:由(2)可知运动时间超过4小时的概率为,则,
所以,
,
,
,
,
则的分布列为:
0 1 2 3 4
则.
【知识点】分层抽样方法;频率分布直方图;离散型随机变量的期望与方差
【解析】【分析】(1) 根据分层抽样的定义即可求解即可;
(2)利用样本频率估计总体概率;
(3) 由(2)可知运动时间超过4小时的概率为,则 ,结合分布列和数学期望的定义求解出 的分布列以及数学期望.
34.(2023·鞍山模拟)甲 乙 丙三人,为了研究某地区高中男生的体重(单位:)与身高(单位:)是否存在较好的线性关系,他们随机调查了6名高中男生身高和体重的数据,得到如下表格:
身高/
体重/
根据表中数据计算得到关于的线性回归方程对应的直线的斜率为.
(1)求关于的线性回归方程;
(2)从该地区大量高中男生中随机抽出位男生,他们身高(单位:)的数据绘制成如图的茎叶图.
①估计体重超过的频率,
②视频率为概率,从该地区大量高中男生中随机选出人,记这人中体重超过的人数为,求的分布列及其数学期望(用(1)中的回归方程估测这位男生的体重).
【答案】(1)解:依题意可知
故关于的线性回归方程为
(2)解:①令得
故这位男生的体重有位体重超过
所以频率
②的可能取值为
则的分布列为
.
【知识点】线性回归方程;古典概型及其概率计算公式;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)利用已知条件结合平均数公式和最小二乘法得出 关于的线性回归方程 。
(2) ① 利用已知条件结合线性回归方程和代入法得出这位男生的体重有位体重超过,再利用频数除以样本容量的方法得出频率。
②利用已知条件得出随机变量X的可能的取值,再结合二项分布求概率公式得出随机变量X的分布列,再利用随机变量的分布列求数学期望公式得出随机变量X的数学期望。
35.(2023·南通模拟)设是一个二维离散型随机变量,它们的一切可能取的值为,其中i,,令,称是二维离散型随机变量的联合分布列.与一维的情形相似,我们也习惯于把二维离散型随机变量的联合分布列写成下表形式:现有个相同的球等可能的放入编号为1,2,3的三个盒子中,记落下第1号盒子的球的个数为X,落入第2号盒子中的球的个数为
(1)当时,求的联合分布列;
(2)设,且,求
【答案】(1)解:由题意知,的可能取值为,的可能取值为
则,
,
,
,
,
,
,
所以的联合分布列为:
(2)解:当时,,
所以
,
所以,
设,则由二项分布的期望公式得.
【知识点】离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】(1)根据题意,由联合分布列的定义,分别求得对应概率即可得到结果;
(2)根据题意,将问题转化为二项分布,然后由二项分布的期望计算公式即可得到结果.
36.(2023·抚顺模拟)学校为提升高一年级学生自主体育锻炼的意识,拟称每周自主进行体育锻炼的时间不低于6小时的同学称为“体育迷”并予以奖励,为了确定奖励方案,先对学生自主体育锻炼的情况进行抽样调查,学校从高一年级随机抽取100名学生,将他们分为男生组、女姓组,对每周自主体育锻炼的时间分段进行统计(单位:小时)第一段,第二段,第三段,第四段,第五段.将男生在各段的频率及女生在各段的频数用折线图表示如下:
(1)求折线图中m的值,并估计该校高一年级学生中“体育迷”所占的比例;
(2)填写下列列联表,并判断是否有95%的把握认为是否为“体育迷”与学生的性别有关?
体育迷 非体育迷 合计
男
女
合计
附:
0.050 0.010 0.001
3.841 6.635 10.828
(3)若中学生每周自主体育锻炼的时间不低于5小时,才能保持身体的良好健康发展,试估计该校高一年级学生的周平均锻炼时间是否达到保持身体良好健康发展的水平?(同一段中的数据用该组区间的中点值代表)
【答案】(1)解:由频率折线图可得
由频数折线图可知女生共有人,其中“体育迷”有人,
故男生共有人,其中“体育迷”有人.
因此估计该校高一学生中“体育迷”所占比例约为.
(2)解:
体育迷 非体育迷 合计
男 30 45 75
女 15 10 25
合计 45 55 100
因为,而,
故没有95%的把握认为是否为“体育迷”与性别有关.
(3)解:由频率折线图可知男生的锻炼时间在每组的频数分别为
,,,,;
故这100名学生每周的锻炼时间在每组的频率分别为
,,,
,.
所以估计该校高一年级学生的周平均锻炼时间为:.
因为,
所以估计该校高一年级学生的周平均锻炼时间达到了保持身体良好健康发展的水平.
【知识点】频率分布折线图、密度曲线;独立性检验的基本思想
【解析】【分析】(1)由折线图的性质可求m ,由频数统计图求女生人数,再求男生人数,和男生和女生中的体育迷的人数,由此可求该校高一年级学生中"体育迷"所占的比例;
(2)由已知数据填写列联表,由公式求K2的值,与临界值比较大小,确定结论;
(3)由已知数据求该校高一年级学生的周平均锻炼时间的估计值,由此确定结论.
37.(2023·包头模拟)新型冠状病毒疫情已经严重影响了我们正常的学习、工作和生活.某市为了遏制病毒的传播,利用各种宣传工具向市民宣传防治病毒传播的科学知识.某校为了解学生对新型冠状病毒的防护认识,对该校学生开展防疫知识有奖竞赛活动,并从女生和男生中各随机抽取30人,统计答题成绩分别制成如下频数分布表和频率分布直方图.规定:成绩在80分及以上的同学成为“防疫标兵”.
名女生成绩频数分布表:
成绩
频数 10 10 6 4
附:
0.100 0.050 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
(1)根据以上数据,完成以下列联表,并判断是否有%的把握认为“防疫标兵”与性别有关;
男生 女生 合计
防疫标兵
非防疫标兵
合计
(2)以样本估计总体,以频率估计概率,现从该校女生中随机抽取人,其中“防疫标兵”的人数为,求随机变量的分布列与数学期望.
【答案】(1)解:由频率分布直方图,可得名男生中成绩大于等于分的频率为,故名男生中“防疫标兵”人数为人,“非防疫标兵”人数为人.
由频数分布表,可得名女生中“防疫标兵”人数为人,“非防疫标兵”人数为人.
男生 女生 合计
防疫标兵 18
非防疫标兵
合计
故,所以有%的把握认为“防疫标兵”与性别有关.
(2)解:名女生样本中有人成绩在分以上,所以女生样本中“防疫标兵”的频率为.用样本估计总体,以频率估计概率,从该校女生中随机抽取人,则“防疫标兵”的人数服从二项分布,即.
X的可能取值为.
,,,,.
所以随机变量的分布列为
X 0 1 2 3 4
P
数学期望为.
【知识点】频率分布直方图;独立性检验的基本思想;离散型随机变量及其分布列;离散型随机变量的期望与方差;二项分布与n次独立重复试验的模型
【解析】【分析】(1)分别分析男女生样本中 “防疫标兵”和“非防疫标兵”人数,完成2 x 2列联表,再计算K2的数值,并与参考数值作比较得出结论;
(2)从该校女生中随机抽取4人,则"防疫标兵”的人数,服从二项分布,分别求出概率从而得到分布列,再计算数学期望.
38.(2023·湖南模拟)直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2022年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示,若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,且“经常使用直播销售用户”中有是“年轻人”.
参考数据:独立性检验临界值表
(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成2×2列联表,根据的独立性检验,能否认为经常使用网络直播销售与年龄有关?
使用直播销售情况与年龄列联表
年轻人 非年轻人 合计
经常使用直播售用户
不常使用直播销售用户
合计
(2)某投资公司在2023年年初准备将1000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:方案一:线下销售 根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不赔不赚,且这三种情况发生的概率分别为.方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.
【答案】(1)解:由图1知,“年轻人”占比为,即有人),“非年轻人”有200人
由图2知,“经常使用直播销售用户”占比为,即有(人),“不常使用直播销售用户”有(人).
“经常使用直播销售用户中的年轻人”有(人),“经常使用直播销售用户中的非年轻人”有120-人.
∴补全的列联表如下:
年轻人 非年轻人 合计
经常使用直播销售用户 100 20 120
不常使用直播销隹用户 60 20 80
合计 160 40 200
零假设:经常使用网络直播销售与年龄相互独立,即经常使用网络直播销售与年龄无关.
于是.
∴.
根据小概率的独立性检验,我们推断成立,
即认为经常使用网络直播销售与年龄无关.
(2)解:若按方案一,设获利万元,则可取的值为,则的分布列为:
300 0
万元.
.(或.)
若按方案二,设获利万元,则可取的值为,则的分布列为:
500 0
万元,
106900.
(或.)
∵.
①方案一与方案二的利润均值差异不大,但方案二的方差要比方案一的方差大得多,从稳定性方面看方案一线下销售更稳妥,故答案为:方案一.
②方案一的利润均值低于方案二,选择方案二.
【知识点】独立性检验的基本思想;离散型随机变量及其分布列;离散型随机变量的期望与方差
【解析】【分析】 (1)由题意填写列联表,计算K2,对照附表得出结;
(2)计算方案一、方案二的期望与方差,比较即可得出结论.
39.(2023·湖北模拟)某市举行招聘考试,共有4000人参加,分为初试和复试,初试通过后参加复试.为了解考生的考试情况,随机抽取了100名考生的初试成绩,并以此为样本绘制了样本频率分布直方图,如图所示.
附:若随机变量X服从正态分布,则:,,.
(1)根据频率分布直方图,试求样本平均数的估计值;
(2)若所有考生的初试成绩X近似服从正态分布,其中为样本平均数的估计值,,试估计初试成绩不低于88分的人数;
(3)复试共三道题,第一题考生答对得5分,答错得0分,后两题考生每答对一道题得10分,答错得0分,答完三道题后的得分之和为考生的复试成绩.已知某考生进入复试,他在复试中第一题答对的概率为,后两题答对的概率均为,且每道题回答正确与否互不影响.记该考生的复试成绩为Y,求Y的分布列及均值.
【答案】(1)解:样本平均数的估计值为.
(2)解:因为学生初试成绩X服从正态分布,其中,,
则,
所以,
所以估计初试成绩不低于88分的人数为人.
(3)解:Y的取值分别为0,5,10,15,20,25,
则,
,
,
,
,
,
故Y的分布列为:
Y 0 5 10 15 20 25
P
所以数学期望为.
【知识点】离散型随机变量及其分布列;离散型随机变量的期望与方差;正态分布曲线的特点及曲线所表示的意义
【解析】【分析】(1)根据频率分布直方图的平均数的估算公式即可求解出样本平均数的估计值;
(2)由 可知 即可求解出初试成绩不低于88分的人数;
(3)根据题意确定 Y的取值分别为0,5,10,15,20,25,利用独立性可求得分布列,进而求得均值.
40.(2023·安庆模拟)为了“锤炼党性修养,筑牢党性根基”,党员教师小A每天自觉登录“学习强国APP”,参加各种学习活动,同时热衷于参与四人赛.每局四人赛是由网络随机匹配四人进行比赛,每题回答正确得20分,第1个达到100分的比赛者获得第1名,赢得该局比赛,该局比赛结束.每天的四人赛共有30局,前2局是有效局,根据得分情况获得相应名次,从而得到相应的学习积分,第1局获得第1名的得3分,获得第2、3名的得2分,获得第4名的得1分;第2局获得第1名的得2分,获得第2、3、4名的得1分;后28局是无效局,无论获得什么名次,均不能获得学习积分.经统计,小A每天在第1局四人赛中获得3分、2分、1分的概率分别为,,,在第2局四人赛中获得2分、1分的概率分别为,.
(1)设小A每天获得的得分为,求的分布列、数学期望和方差;
(2)若小A每天赛完30局,设小A在每局四人赛中获得第1名从而赢得该局比赛的概率为,每局是否赢得比赛相互独立,请问在每天的30局四人赛中,小A赢得多少局的比赛概率最大?
【答案】(1)解:记事件表示第一局获得分,事件表示第二局获得分,这些事件相互独立,由条件知的可能值为5,4,3,2.
其分布列为
5 4 3 2
,
.
(2)解:设小A每天赢得的局数为,则,
于是.
根据条件得,
由①得,得,
同理由②得,所以,
又因为,所以,因此在每天的30局四人赛中,小A赢得10局的比赛概率最大.
【知识点】概率的意义;离散型随机变量及其分布列;离散型随机变量的期望与方差;二项分布与n次独立重复试验的模型
【解析】【分析】(1)利用已知条件得出随机变量X的可能的取值,再结合独立事件乘法求概率公式、互斥事件加法求概率公式,进而得出随机变量X的分布列,再结合随机变量的分布列求数学期望公式得出随机变量X的数学期望,再利用随机变量的数学期望求方差公式得出随机变量X的方差。
(2) 设小A每天赢得的局数为,则,再利用二项分布求概率公式得出,根据条件得,由①结合组合数公式得出实数k的取值范围,同理由②得出实数k的取值范围,再利用,进而得出k的值,因此在每天的30局四人赛中,小A赢得10局的比赛概率最大。
二一教育在线组卷平台(zujuan.21cnjy.com)自动生成 1 / 1