名称 | 新高考数学二轮复习专题五 统计与概率 课时课件(2份打包) | | |
格式 | zip | ||
文件大小 | 2.4MB | ||
资源类型 | 教案 | ||
版本资源 | 通用版 | ||
科目 | 数学 | ||
更新时间 | 2024-03-03 15:00:45 |
k=0,1,2,…,n.如果随机变量X的分布列具有上式形式,则称随机变量X服从二项分布,记作X~B(n,p).
名师点析1.超几何分布的模型是不放回抽样,要注意明确其中参数M,N,n的含义.
2.二项分布的条件是独立性与重复性.
3.离散型随机变量的分布列
一般地,设离散型随机变量X的可能取值为x1,x2,…,xn,称X取每一个值xi的概率P(X=xi)=pi(i=1,2,…,n),可用下表表示.
X x1 x2 x3 … xn
P p1 p2 p3 … pn
概率之和等于1
名师点析1.离散型随机变量的分布列的两个性质:
(1)pi≥0(i=1,2,…,n);(2)p1+p2+…+pn=1.
2.期望公式:E(X)=x1p1+x2p2+…+xnpn= xipi.
关键能力 学案突破
突破点一
古典概型
[例1]河图洛书是华夏文化的源头,两幅图案玄奥神妙,博大精深.它始于上古时期,伏羲就是根据河图推演出了先天八卦图,后写出了《易经》.河图上,排列成数阵的白点和黑点,蕴藏着无穷的奧秘.白点表示奇、阳,黑点表示偶、阴.此一白一黑,既含阴阳、天地运行之道,又寓五行、四象变化之理.一六在后,象北方壬癸水,玄武星象;三八在左,象东方甲乙木,青龙星象;二七在前,象南方丙丁火,朱雀星象;四九在右,象西方庚辛金,白虎星象;五十在中,象中央戊己土,表示时空奇点;而中间五点,又象太极含四象;中一点,又象太极含一气.若从这十个点数中任选两个数,则选取的恰好是两个奇数的概率为( )
答案 D
规律方法古典概型求解的关键点
(1)解答古典概型问题,关键是正确求出样本空间Ω包含的样本点个数和事件A包含的样本点个数,常用到计数原理与排列、组合的相关知识.
(2)在求样本点个数时,要准确理解样本点的构成.
对点练1
(1)甲、乙两人进行扑克牌积分比赛.比赛规则为:甲、乙两人先各抽三张扑克牌,每局比赛双方同时各出一张牌,牌大者得2分,牌小者得0分,牌一样大两人各得1分,每张牌只能出一次,共比赛三局.若甲抽到的三张扑克牌分别是A1,A2,A3,乙抽到的三张扑克牌分别是B1,B2,B3,且这六张扑克牌的大小顺序为A1>B1>B2>A2>A3>B3,则三局比赛结束后甲得4分的概率为( )
(2)已知大于3的素数只分布在{6n-1}和{6n+1}两数列中(其中n为非零自然数),数列{6n-1}中的合数叫阴性合数,其中的素数叫阴性素数;数列{6n+1}中的合数叫阳性合数,其中的素数叫阳性素数.则从30以内的素数中任意取出两个,恰好是一个阴性素数、一个阳性素数的概率是 .
(2)30以内的素数有2,3,5,7,11,13,17,19,23,29共10个.
其中阴性素数有5,11,17,23,29共5个,阳性素数有7,13,19共3个.
突破点二
条件概率及相互独立事件的概率
命题角度1 条件概率
答案 B
规律方法条件概率的3种求法
对点练2
(1)有一批种子的发芽率为0.9,发芽后的幼苗成活率为0.8.在这批种子中,随机抽取一粒,则这粒种子能成长为幼苗的概率是( )
A.0.72 B.0.8
C.0.86 D.0.9
(2)现有红、黄、蓝、绿、紫五只杯子,将它们叠成一叠,在已知黄色杯子和绿色杯子相邻的条件下,黄色杯子和红色杯子也相邻的概率为( )
答案 (1)A (2) C
解析 (1)设“种子发芽”为事件A,“种子成长为幼苗”为事件AB(发芽,并成活而成长为幼苗),则P(A)=0.9.又种子发芽后的幼苗成活率为P(B|A)=0.8,所以P(AB)=P(A)·P(B|A)=0.9×0.8=0.72.
命题角度2 相互独立事件的概率
答案 C
[例2-3]甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是 .
答案 0.18
解析 前四场中有一场客场输,第五场赢时,甲队以4∶1获胜的概率是0.63×0.5×0.5×2=0.108,前四场中有一场主场输,第五场赢时,甲队以4∶1获胜的概率是0.4×0.62×0.52×2=0.072.综上所述,甲队以4∶1获胜的概率是P=0.108+0.072=0.18.
规律方法求相互独立事件和n重伯努利试验的概率的注意点
(1)求复杂事件的概率,要正确分析复杂事件的构成,分析复杂事件能转化为几个彼此互斥事件的“和”事件还是能转化为几个相互独立事件同时发生的“积”事件,然后用概率公式求解.
(2)注意辨别n重伯努利试验的基本特征:①同一个伯努利试验重复做n次;②各次试验的结果相互独立.
对点练3
答案 D
突破点三
随机变量的分布列
命题角度1 超几何分布
[例3-1]为了解学生对食堂用餐满意度情况,某兴趣小组按性别采用分层随机抽样的方法,从全校学生中抽取容量为200的样本进行调查.被抽中的同学分别对食堂进行评分,满分为100分.调查结果显示:最低分为51分,最高分为100分.随后,兴趣小组将男、女生的评分结果按照相同的分组方式分别整理成了频数分布表和频率分布直方图,图表如下:
男生评分结果的频数分布表
分数区间 频数
[50,60) 3
[60,70) 3
[70,80) 16
[80,90) 38
[90,100] 20
女生评分结果的频率分布直方图
为了便于研究,兴趣小组将学生对食堂的评分转换成了“满意度情况”,二者的对应关系如下表所示.
分数 [50,60) [60,70) [70,80) [80,90) [90,100]
满意度情况 不满意 一般 比较满意 满意 非常满意
(1)求a的值;
(2)为进一步改善食堂状况,从评分在[50,70)的男生中随机抽取3人进行座谈,记这3人中对食堂“不满意”的人数为X,求X的分布列;
(3)以调查结果的频率估计概率,从该校所有学生中随机抽取一名学生,求其对食堂“比较满意”的概率.
规律方法求超几何分布的分布列的步骤
第一步,验证随机变量服从超几何分布,并确定参数N,M,n的值;
第二步,根据超几何分布的概率计算公式计算出随机变量取每一个值时的概率;
第三步,用表格的形式列出分布列.
解 (1)因为(0.005+a+0.020+0.040+0.020)×10=1,
所以a=0.015.
(2)依题意,随机变量X的所有可能取值为0,1,2,3.
所以随机变量X的分布列为:
(3)设事件A=“随机抽取一名学生,对食堂‘比较满意’”.
因为样本人数为200,其中男生共有80人,所以样本中女生共有120人.
由频率分布直方图可知,女生对食堂“比较满意”的人数共有120×0.020×10=24,
由频数分布表,可知男生对食堂“比较满意”的共有16人.
对点练4
某中学高一(1)班举行知识竞赛.这次竞赛前21名同学的成绩如下:
男生 203,204,209,212,216,218,218,222,227,228,229,235,237,238.
女生 200+x(0≤x≤9,且x∈Z),212,216,221,228,230,236.
已知前7名女生的平均得分为221分.
(1)①求x的值;
②如果在竞赛成绩高于205分的学生中按性别分层随机抽样抽取6人,再从这6人中任选3人作为下周班会中心发言人,求这3人中有女生的概率;
(2)如果在竞赛成绩高于220分的学生中任选4人参加学校座谈会,用ξ表示4人中成绩超过235分的人数,求ξ的分布列和数学期望.
解 (1)①由题中数据可知,前7名女生的平均得分为
解得x=4.
②竞赛成绩高于205分的女生有6人,男生有12人,
(2)竞赛成绩高于220分的学生共有11人,成绩高于235分的学生共有3人,由题意可知,随机变量ξ的可能取值有0,1,2,3,
所以随机变量ξ的分布列为
命题角度2 二项分布
[例3-2]根据统计,2022年从甲市到乙市乘坐动车和BRT(快速公交), 的人数众多,为了调查乘客对出行方式的满意度,研究人员随机抽取了500名乘客进行调查,所得情况统计如下所示:
满意
程度 30岁以下 30~50岁 50岁及50岁以上
乘坐动车 乘坐BRT 乘坐动车 乘坐BRT 乘坐动车 乘坐BRT
满意 50 5 100 10 100 20
一般 20 15 40 20 20 25
不满意 5 0 20 10 20 20
(1)若从样本中任取1人,求抽取的乘客年龄在30岁及30岁以上的概率;
(2)记满意为10分,一般为5分,不满意为0分,根据表中数据,计算样本中30~50岁乘坐动车乘客满意程度的平均分以及方差;
(3)以样本中这500名乘客属于每个年龄层的频率代替1名乘客属于该年龄层的概率,若从所有乘客中随机抽取4人,记年龄在30~50岁的乘客人数为X,求X的分布列及数学期望.
所以X的分布列为
规律方法破解有关二项分布的“四关”
对点练5
在第七次全国人口普查过程中,普查员对管辖区域内普查对象是否在家、何时在家等情况并不了解,“敲门无人应”成了普查员在工作中面临的最大难题,而国家电网公司在“网上国网”APP中推出的“e普查”辅助工具成为人口普查的“得力助手”.使用“e普查”扫描管辖范围内居民电表,获取该户“用电码”,红、橙、绿三色分别表示近一个月未用电、间歇用电、正常用电,以精准识别空置户、“候鸟”户、正常户三类情况.下表通过“e普查”统计了某小区的情况:
用户用电情况 显示颜色 用户情况 用户数量
未用电 红 空置户 75
间歇用电 橙 “候鸟”户 150
正常用电 绿 正常户 225
若空置户不需要入户调查,普查员甲根据上面的数据,按照显示的橙、绿两色分层抽取该小区5户用户,进行入户核实情况.若普查员甲到每户“候鸟”户中调查一次成功的概率为 ,到每户正常户中调查一次成功的概率为 ,且各户之间调查一次是否成功相互独立.
(1)求普查员甲到这5户中调查一次成功4户的概率;
(2)设普查员甲到这5户中调查一次成功的户数为X,求X的分布列和数学期望E(X).(共40张PPT)
第1讲 统计与统计案例
必备知识 精要梳理
1.抽样方法
(1)从容量为N的总体中抽取容量为n的样本,则每个个体被抽到的概率都为
等可能性,公平性
名师点析简单随机抽样、分层抽样都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.
(2)分层抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本容量.
2.统计中的四个数据特征
(1)众数:在样本数据中,出现次数最多的那个数据.
(2)中位数:在样本数据中,将数据按大小排列,如果数据的个数是奇数,位于最中间的数据作为中位数.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
探究在频率分布直方图中如何确定众数、中位数和平均数
在频率分布直方图中,众数是最高小长方形底边中点的横坐标;中位数左边和右边的小长方形的面积是相等的;平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
3.变量间的相关关系
(1)一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,那么我们称这两个变量线性相关.
当r<0时,称成对样本数据负相关.当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.
名师点析根据经验回归方程进行预测,得到的仅是一个预测值,而不是真实发生的值.
4.独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表如下.
X Y 合计
Y=y1 Y=y2
X=x1 a b a+b
X=x2 c d c+d
合计 a+c b+d n
关键能力 学案突破
突破点一
用样本估计总体
[例1](2021·全国乙,理17)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下.
旧设备 9.8 10.3 10.0 10.2 9.9
新设备 10.1 10.4 10.1 10.0 10.1
旧设备 9.8 10.0 10.1 10.2 9.7
新设备 10.3 10.6 10.5 10.4 10.5
规律方法用样本估计总体的解题步骤
(1)用样本的频率估计总体的步骤
①确定样本容量N;②确定事件发生的次数(频数);③求频率 ;④估计总体.
(2)用样本的数字特征估计总体的步骤
①确定样本;②求样本的平均数、众数、中位数、方差(标准差);③由数字分析样本、估计总体.
对点练1
某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) [0.6,0.7)
频数 1 3 2 4 9 26 5
使用了节水龙头50天的日用水量频数分布表
日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6)
频数 1 5 13 10 16 5
(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水 (一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
解 (1)如图所示.
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.
突破点二
线性回归分析
根据散点图可以看出y与x之间有线性相关关系,但图中有两个异常点,分别为A,B两名考生的成绩.经调查得知,A考生由于重感冒导致物理考试发挥失常,B考生因故未能参加物理考试.为了使分析结果更科学准确,剔除这两
表示这50名考生的数学成绩、物理成绩,i=1,2,…,50,y与x的相关系数r≈0.45.
(1)若不剔除A,B两名考生的数据,用52组数据作回归分析,设此时y与x的相关系数为r0.试判断r0与r的大小关系(不必说明理由);
(2)求y关于x的经验回归方程(系数精确到0.01),并估计如果B考生参加了这次物理考试(已知B考生的数学成绩为125分),物理成绩是多少 (精确到1)
解 (1)r0
将x=125代入,得y=0.36×125+35.89=80.89≈81,
所以估计B考生的物理成绩约为81分.
规律方法求经验回归方程的方法
(2)若所求的经验回归方程是在解答题中,则求经验回归方程的一般步骤如下:
对点练2
(2023·广西桂林、崇左一模)为促进新能源汽车的推广,某市逐渐加大充电基础设施的建设,该市统计了近五年新能源汽车充电站的数量(单位:个),得到如下表格:
年份 2018 2019 2020 2021 2022
年份编号x 1 2 3 4 5
新能源汽车充
电站数量y/个 37 104 147 186 226
(1)已知可用线性回归模型拟合y与x的关系,请用相关系数加以说明;
(2)求y关于x的线性回归方程,并预测2026年该市新能源汽车充电站的数量.
因为0.99>0.75,
所以可用线性回归模型拟合y与x的关系.
突破点三
独立性检验
[例3]为了解空气质量指数(AQI值)与参加户外健身运动的人数之间的关系,某校环保小组在暑假期间(60天)进行了一项统计活动:每天记录到体育公园参加户外健身运动的人数,并与当天AQI值(从气象部门获取)构成60组成对数据(xi,yi)(i=1,2,…,60),其中xi为当天参加户外健身运动的人数,yi为当天的AQI值,并制作了如下散点图:
连续60天参加健身运动人数与AQI值散点图
(1)环保小组准备做y与x的线性回归分析,算得y与x的样本相关系数为r≈-0.58,试分析y与x的线性相关关系.
(2)环保小组还发现散点有分区聚集的特点,尝试做聚类分析.用直线x=100与y=100将散点图分成Ⅰ、Ⅱ、Ⅲ、Ⅳ四个区域(如图),统计得到各区域的点数分别为5,10,10,35,试依据小概率值α=0.005的独立性检验,分析“参加户外健身运动的人数不少于100是否与AQI值不大于100之间有关联”.
α 0.050 0.010 0.005 0.001
xα 3.841 6.635 7.879 10.828
AQI值 人数 合计
人数<100 人数≥100
AQI>100 10 5 15
AQI≤100 10 35 45
总计 20 40 60
解 (1)r≈-0.58,y与x的相关关系为负相关,且|r|<0.75,故线性相关性不强,所以不建议继续做线性回归分析,即使得到经验回归方程,拟合效果也会不理想.
(2)建立2×2列联表如下
零假设为H0:参加户外健身运动的人数不少于100与AQI值不大于100之间无关联.
依据小概率值α=0.005的独立性检验,推断H0不成立,即认为参加户外健身运动的人数不少于100与AQI值不大于100之间有关联.
规律方法独立性检验的一般步骤
(1)提出零假设H0:X和Y相互独立.
(2)根据抽样数据列出2×2列联表.
(3)计算随机变量χ2的值,查表确定临界值xα.
(4)当χ2≥xα时,就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;否则,就没有充分证据推断H0不成立,可以认为X和Y独立.
对点练3
肥胖人群有很大的健康隐患.目前,国际上常用身体质量指数(英文为Body Mass Index,简称BMI)来衡量人体胖瘦程度以及是否健康,其计算公式是 ,中国成人的BMI数值标准为:BMI<18.5为偏瘦,
18.5≤BMI<23.9为正常,24≤BMI<27.9为偏胖,BMI≥28为肥胖.某地区随机调查了6 000名35岁以上成人的身体健康状况,其中有1 000名高血压患者,得到被调查者的频率分布直方图如图.
高血压
非高血压
是否高血压 胖瘦程度 合计
肥胖 不肥胖
高血压
非高血压
合计
(1)求被调查者中肥胖人群的BMI平均值μ;
(2)根据频率分布直方图,完成下面的2×2列联表,依据小概率值α=0.001的独立性检验,分析35岁以上成人患高血压是否与肥胖有关.
α 0.10 0.050 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解 (1)由题图可知,1 000名高血压患者的肥胖情况如下表所示.
BMI [28,30) [30,32) [32,34)
人数 0.100×2×1 000=200 0.050×2×1 000=100 0.025×2×1 000=50
5 000名非高血压患者的肥胖情况如下表所示.
BMI [28,30) [30,32) [32,34)
人数 0.080×2×5 000=800 0.030×2×5 000=300 0.005×2×5 000=50
被调查者中肥胖人群的BMI平均值
(2)由(1)及频率分布直方图知,1 000名高血压患者中有200+100+50=350人肥胖,5 000名非高血压患者中有800+300+50=1 150人肥胖,可得下列列表.
是否高血压 胖瘦程度 合计
肥胖 不肥胖
高血压 350 650 1 000
非高血压 1 150 3 850 5 000
合计 1 500 4 500 6 000
零假设为H0:35岁以上成人患高血压与肥胖无关.