8.3列联表与独立性检验-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册讲义(word含答案)

文档属性

名称 8.3列联表与独立性检验-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册讲义(word含答案)
格式 docx
文件大小 185.8KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-05-12 18:24:12

图片预览

文档简介

1094740010947400158750012357108.3列联表与独立性检验
8.3列联表与独立性检验
309245318135第八章 成对数据的统计分析
第八章 成对数据的统计分析
-146050260350知识点1------分类变量与列联表
知识点1------分类变量与列联表
1.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
2.列联表
假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为
y1
y2
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
3.两个分类变量之间关联关系的定性分析方法
(1)频率分析法:通过对样本的每个分类变量的不同类别事件发生的频率大小进行
比较来分析分类变量之间是否有关联关系.通常通过列联表列出两个分类变量的
频数表来进行分析.
(2)图形分析法:与表格相比,图形更能直观地反映两个分类变量间是否互相影响,常
用等高堆积条形图展示列联表数据的频率特征.
-10922071755知识点2------独立性检验
知识点2------独立性检验
1.临界值
false统计量也可以用来作相关性的度量,false越小说明变量之间越独立,false越大说明变量之间越相关false
.忽略false的实际分布与该近似分布的误差后,对于任何小概率值false,可以找到相应的正实数,使得false成立,我们称false为false的临界值,这个临界值就可作为判断false大小的标准.
2.独立性检验
基于小概丰值false的检验规则是:
当false时,我们就H0推断不成立,即认为X和Y不独立,该推断犯错误的概率不超过false;
当false时,我们没有充分证据推断H0不成立,可以认为X和Y独立
这种利用false的取值推断分类变量X和Y是否独立的方法称为false独立性检验,读作“卡方独立性检验”,简称独立性检验
127000-95885重难点探究
重难点探究
应用独立性检验解决实际问题大致应包括以下几个主要环节:
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值Xa比较;
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规
律.
注意,上述几个环节的内容可以根据不同情况进行调整.例如,在有些时候,分类变量
的抽样数据列联表是问题中给定的.
独立性检验与统计、概率的综合应用
通过频率分布直方图中的统计功能完善2×2列联表,从而对事件进行独立性检
验,准确读取频率分布直方图中的数据,进行分组统计是解题的关键.解决独立性检
验的问题要注意明确两类主体,明确研究的两类问题,再就是准确列出2×2列联表,
准确计算x2.在写出2×2列联表中a,b,c,d的值时,注意一定要按顺序.
x2独立性检验中几个常用的小概率值和相应的临界值.
α
0.1
0.05
0.01
0.005
0.001
Xa
2.706
3.841
6.635
7.879
10.828
-2159059055经典例题
经典例题

例题1.某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的 2×2 列联表.则根据列联表可知(??? )
年轻人
非年轻人
总计
经常用流行用
125
25
150
不常用流行用语
35
15
50
总计
160
40
200
参考公式:独立性检验统计量 X2=n(ad?bc)2(a+b)(c+d)(a+c)(b+d) ,其中 n=a+b+c+d .
下面的临界值表供参考:
P(x2≥x0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
x0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.?有95%的把握认为“经常用流行用语”与“年轻人”有关系
B.?没有95%的把握认为“经常用流行用语”与“年轻人”有关系
C.?有97.5%的把握认为“经常用流行用语”与“年轻人”有关系
D.?有97.5%的把握认为“经常用流行用语”与“年轻人”没有关系
【答案】 A
【解析】 X2=200×(25×15?25×35)2160×40×50×150=4.167>3.841 ,
根据临界值知有95%的把握认为经常用流行语与年轻人有关系,
故答案为:A

例题2.Logistic模型是常用数学模型之一,可应用于流行病学领城.有学者根据公布数据建立了某地区新冠肺炎累计确诊病例数I(t)(t的单位:天)的Logistic模型: I(t)=K1+e?0.23(t?53) ,其中K为最大确诊病例数.当I( t? )=0.95K时,标志着已初步遏制疫情,则 t? 约为(??? )(ln19≈3)
A.?60?????????????????????????????????????????B.?63?????????????????????????????????????????C.?66?????????????????????????????????????????D.?69
【答案】 C
【解析】 ∵I(t)=K1+e?0.23(t?53) ,所以 I(t?)=K1+e?0.23(t??53)=0.95K ,则 e0.23(t??53)=19 ,
所以, 0.23(t??53)=ln19≈3 ,解得 t?≈30.23+53≈66 .
故答案为:C.

例题3.针对偏远地区因交通不便?消息闭塞导致优质农产品藏在山中无人识的现象,各地区开始尝试将电商扶贫作为精准扶贫的重要措施.为了解电商扶贫的效果,某部门随机就100个贫困地区进行了调查,其当年的电商扶贫年度总投入(单位:万元)及当年人均可支配年收入(单位:元)的贫困地区数目的数据如下表:
人均可支配年收入(元)
电商扶贫年度总投入(万元)
(5000,10000]
(10000,15000]
(15000,20000]
(0,500]
5
3
2
(500,1000]
3
21
6
(1000,3000)
2
34
24
附: K2=n(ad?bc)2(a+b)(c+d)(a+c)(b+d) ,其中 n=a+b+c+d .
P(K2≥k)
0.050
0.01
0.005
k
3.841
6.635
7.879
(1)估计该年度内贫困地区人均可支配年收入过万的概率,并求本年度这100个贫困地区的人均可支配年收入的平均值的估计值(同一组数据用该组数据区间的中间值代表);
(2)根据所给数据完成下面的列联表,并判断是否有99%的把握认为当地的人均可支配年收入是否过万与当地电商扶贫年度总投入是否超过千万有关.
人均可支配年收入≤10000元
人均可支配年收入>10000元
电商扶贫年度总投入不超过1000万
电商扶贫年度总投入超过1000万
【答案】 (1)解:由所给数据可得,该年度内贫困地区人均可支配年收入过万的概率的估计值为 1?5+3+2100=0.9 .
本年度这100个贫困地区的人均可支配年收入的平均值的估计值为 5+3+2100×7500+3+21+34100×12500+2+6+24100×17500=13600 (元)
(2)解:列联表如下:
人均可支配年收入≤10000元
人均可支配年收入>10000元
电商扶贫年度总投入不超过1000万
8
32
电商扶贫年度总投入超过1000万
2
58
因为 K2=100×(8×58?2×32)210×90×40×60=20027≈7.407>6.635 ,
所以有99%的把握认为当地的人均可支配年收入是否过万与当地电商扶贫年度总投入是否超过千万有关
【解析】【分析】(1)先求出该年度内贫困地区人均可支配年收入不过万的概率,再利用对立事件的概率公式即可求出结果;利用区间中点值乘以该组的频率,依次相加,即可求出平均值的估计值.
(2)根据题目所给的数据填写2×2列联表,计算K的观测值K2 , 对照题目中的表格,得出统计结论.
例题4.直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有 56 是“年轻人”.
参考数据:独立性检验临界值表
P(K2?k0)
0.15
0.10
0.050
0.025
0.010
k0
2.072
2.706
30841
5.024
6.635
其中, K2=n(ad?bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d .
(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成 2×2 列联表,并根据列联表判断是否有85%的把握认为经常使用网络直播销售与年龄有关?
使用直播销售情况与年龄列联表
年轻人
非年轻人
合计
经常使用直播销售用户
不常使用直播销售用户
合计
(2)某投资公司在2021年年初准备将1000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:
方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不赔不赚,且这三种情况发生的概率分别为 710,15,110 ;
方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为 35,310,110 .
针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.
【答案】 (1)解:由图1知,“年轻人”占比为 45.5%+34.5%=80% ,即有 200×80%=160 (人),“非年轻人”有 200?160=40 (人)
由图2知,“经常使用直播销售用户”占比为 30.1%+19.2%+10.7%=60% ,即有 200×60%=120 (人),“不常使用直播销售用户” 有 200?120=80 (人).
“经常使用直播销售用户的年轻人”有中有 120×56=100 (人),“经常使用直播销售用户的非年轻人”有 120?100=20 (人)
∴ 补全的列联表如下:
年轻人
非年轻人
合计
经常使用直播销售用户
100
20
120
不常使用直播销售用户
60
20
80
合计
160
40
200
于是 a=100,b=20,c=60,d=20 .
∴K2=200×(100×20?60×20)2120×80×160×40=2512≈2.083>2.072 ,
即有85%的把握认为经常使用网络直播销售与年龄有关
(2)解:若按方案一,设获利 X1 万元,则 X1 可取的值为行 300,?150,0 , X1 的分布列为:
X1
300
-150
0
p
710
15
110
E(X1)=300×710+(?150)×15+0×110=180 (万元),
D(X1)=(300?180)2×710+(?150?180)2×15+(0?180)2×110 =1202×710+3302×15+1802×110=35100
若按方案二,设获利 X2 万元,则 X2 可取的值为 500,?300,0 , X2 的分布列为:
X2
500
-300
0
p
35
310
110
E(X2)=500×35+(?300)×310+0×110=210 (万元),
D(X2)=(500?210)2×35+(?300?210)2×310+(0?210)2×110 =2902×35+5102×310+2102×110=132900
∵E(X1)由方案二的方差要比方案一的方差大得多,从稳定性方面看方案一线下销售更稳妥,故答案为:方案一.
【解析】【分析】(1)利用已知条件填写出 2×2 列联表, 再利用独立性检验的方法判断出有85%的把握认为经常使用网络直播销售与年龄有关。
(2) 针对题中的两种销售方案, 结合随机变量的分布列和数学期望公式、方差公式,进而从期望和方差的角度为投资公司选择出一个合理的方案。
例题5.习近平总书记在党的十九大工作报告中提出,永远把人民美好生活的向往作为奋斗目标.在这一号召下,全国人民积极工作,健康生活.当前,“日行万步”正式成为健康生活的代名词.某地一研究团队统计了该地区1000位居民的日行步数,得到如下表格:
日行步数(单位:千步)
[0,2]
(2,4]
(4,6]
(6,8]
(8,10]
(10,12]
(12,14]
人数
20
60
170
200
300
200
50
(1)为研究日行步数与居民年龄的关系,以日行步数是否超过8千步为标准进行分层抽样,从上述1000位居民中抽取200人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有95%的把握认为日行步数与居民年龄超过40岁有关;
日行步数 ≤8 千步
日行步数 >8 千步
总计
40岁以上
100
40岁以下(含40岁)
50
总计
200
(2)以这1000位居民日行步数超过8千步的频率,代替该地区1位居民日行步数超过8千的概率,每位居民日行步数是否超过8千相互独立.为了深入研究,该研究团队随机调查了20位居民,其中日行步数超过8千的最有可能(即概率最大)是多少位居民?
附:
P(K2≥k0)
0.05
0.025
0.010
k0
3.841
5.024
6.635
K2=n(ad?bc)2(a+b)(c+d)(a+c)(b+d) ,其中 n=a+b+c+d .
【答案】 (1)解:1000人中,步数不超过8千步的有 20+60+170+200=450 人,超过8千步有550人,
按分层抽样,抽取的人数中不超过8千步的有90人,超过8千步的有110人,列联表如下:
日行步数 ≤8 千步
日行步数 >8 千步
总计
40岁以上
40
60
100
40岁以下(含 40 岁)
50
50
100
总计
90
110
200
∴K2=200×(40×50?50×60)2100×100×90×110=2.02<3.841
故没有95%的把握认为日行步数与居民年龄超过40岁有关.
(2)解:每位居民步数超过8千的概率为 5501000=1120 ,
设步数超过 8 千的最有可能是 x 位居民,
∴{C20x?(1120)x?(920)20?x≥C20x?1(1120)x?1?(920)21?x?x≤23120C20x?(1120)x?(920)20?x≥C20x+1?(1120)x+1?(920)19?x?x≥21120 , ∴21120≤x≤23120 , ∵x∈Z , ∴x=11 ,即最有可能是11位居民.
【解析】【分析】 (1)根据题目所给的数据填写2×2列联表即可,计算K的观测值K2 , 对照题目中的表格,得出统计结论;
(2)先求出居民日行步数超过8千的概率,由题意得关于x的不等式,解得即可.


00随堂练习
随堂练习
练习1.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算K2=8.01,附表如下:
P(K2≥k0)
0.100
0.050
0.025
0.010
0.001
k0
2.706
3.841
5.024
6.635
10.828
参照附表,得到的正确的结论是( ??)
A.?有99%以上的把握认为“喜欢乡村音乐与性别有关”
B.?有99%以上的把握认为“喜欢乡村音乐与性别无关”
C.?在犯错误的概率不超过0.1%的前提下,认为“喜欢乡村音乐与性别有关”
D.?在犯错误的概率不超过0.1%的前提下,认为“喜欢乡村音乐与性别无关”
练习2.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程 y=3?5x ,变量x增加一个单位时,y平均增加5个单位;③线性回归方程 y=bx+a 必过 (x,y) ;④在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是(?? )
A.?0???????????????????????????????????????????B.?1???????????????????????????????????????????C.?2???????????????????????????????????????????D.?3
练习3.近年来,我国大学生毕业人数基数大而且增长不断加快,大学毕业生的就业压力非常大,大学生就业已经成为社会关注的热点问题.在某大型公司的赞助下,某大学就业部从该大学2019届已就业的 A , B 两个专业的大学本科毕业生中随机抽取了200人进行月薪情况的问卷调查,经统计发现他们的月薪收入在3000元到9000元之间,具体统计数据如下表:
月薪/百元
[30,40)
[40,50)
[50,60)
[60,70)
[70,80)
[80,90)
人数
20
36
44
50
40
10
将月薪不低于7000元的毕业生视为“高薪收入群体”,月薪低于7000元的毕业生视为“非高薪收入群体”,并将频率视为概率,已知该校2019届大学本科毕业生小明参与了本次调查问卷,其月薪为3500元.
附:
P(K2≥k0)
0.025
0.010
0.005
k0
5.024
6.635
7.879
K2=n(ad?bc)2(a+b)(a+c)(c+d)(b+d) ,其中 n=a+b+c+d , 190≈14 .
(1)请根据上述表格中的统计数据填写下面的 2×2 列联表,并通过计算判断,能否在犯错误的概率不超过0.025的前提下认为“高薪收入群体”与所学专业有关.
非高薪收入群体
高薪收入群体
合计
A 专业
B 专业
20
110
合计
(2)经统计发现该大学2019届的大学本科毕业生月薪 X (单位:百元)近似地服从正态分布 N(μ,190) ,其中 μ 近似为样本平均数 x (每组数据取区间的中点值作代表).若 X 落在区间 (μ?2σ,μ+2σ) 外的左侧,则可认为该本科毕业生属于“就业不理想”的学生,学校将联系本人,咨询月薪过低的原因,为以后的毕业生就业提供更好的指导.
①试判断小明是否属于“就业不理想”的学生;
②该大型公司为这次参与调查的大学本科毕业生制定了赠送话费的活动,赠送方式为:月薪低于 μ 的获赠两次随机话费;月薪不低于 μ 的获赠一次随机话费.每次赠送的话费 Z 及对应的概率如下:
赠送话费 Z /元
60
120
180
概率
12
13
16
求小明获得的话费总金额的数学期望.
练习4.探索浩瀚宇宙是全人类的共同梦想,我国广大科技工作者、航天工作者为推动世界航天事业发展付出了艰辛的努力,为人类和平利用太空、推动构建人类命运共同体贡献了中国智慧、中国方案、中国力量.
(参考公式:用最小二乘法求线性回归方程 y=bx+a 的系数公式
b=i=1nxiyi?nx?yi=1nxi2?nx2=i=1n(xi?x)(yi?y)i=1n(xi?x)2 ; a=y?bx .)
(参考数据: i=15xiyi=5×2+20×14+35×24+40×35+50×40=4530 , i=15xi2=52+202+352+402+502=5750 .)
(1)某公司试生产一种航空零件,在生产过程中,当每小时次品数超过 90 件时,产品的次品率会大幅度增加,为检测公司的试生产能力,同时尽可能控制不合格品总量,抽取几组一小时生产的产品数据进行次品情况检查分析,已知在 x (单位:百件)件产品中,得到次品数量 y (单位:件)的情况汇总如下表所示,且 y (单位:件)与 x (单位:百件)线性相关:
x (百件)
5
20
35
40
50
y (件)
2
14
24
35
40
根据公司规定,在一小时内不允许次品数超过 90 件,请通过计算分析,按照公司的现有生产技术设备情况,判断可否安排一小时试生产 10000 件的任务?
(2)“战神”太空空间站工作人员需走出太空站外完成某项试验任务,每次只派一个人出去,且每个人只派出一次,工作时间不超过 10 分钟,如果有人 10 分钟内不能完成任务则撤回,再派下一个人.现在一共有 n 个人可派,工作人员 a1,a2,a3,?,an 各自在 10 分钟内能完成任务的概率分别依次为 p1,p2,p3,?,pn ,且 p1=p2=p3=?=pn=0.5 , n∈N? ,各人能否完成任务相互独立,派出工作人员顺序随机,记派出工作人员的人数为 X , X 的数学期望为 E(X) ,证明: E(X)<2 .
练习5.2020突如其来的疫情让我们经历了最漫长、最特殊的一个假期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后某校进行了摸底考试,某数学教师为了调查高二学生这次摸底考试的数学成绩与每天在线学习数学的时长之间的相关关系,对在校高二学生随机抽取45名进行调查,了解到其中有25人每天在线学习数学的时长不超过1小时,并得到如下的等高条形图:
附临界值表
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
参考公式: K2=n(ad?bc)2(a+b)(c+d)(a+c)(b+d) ,其中 n=a+b+c+d .
(1)根据等高条形图填写下面 2×2 列联表,并根据列联表判断能否在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”;
数学成绩不超过120分
数学成绩超过120分
总计
每天在线学习数学不超过1小时
25
每天在线学习数学超过1小时
总计
45
(2)从被抽查的,且这次数学成绩超过120分的学生中,再随机抽取3人,求抽取的3人中每天在线学习数学的时长超过1小时的人数 ξ 的分布列与数学期望.
00参考答案
参考答案
练习1【答案】 A
【解析】解:: ∵k2=8.01>6.635, ∴在犯错误概率不超过0.1的前提下认为“喜欢乡村音乐与性别有关”,
即有99%以上的把握认为“喜欢乡村音乐与性别有关”.
故答案为:A.
练习2【答案】 C
【解析】由方差的定义与性质可知,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,所以①上正确的;回归方程为 y=3?5x ,变量x增加一个单位时,y平均增加 ?5 个单位,所以②是错误的;线性回归方程 y=bx+a 必过样本中心点 (x,y) ,所以③是正确的;有99%的把握认为吸烟与患肺病有关系时,说某人吸烟,不能认为他有99%的可能患肺病,所以④是错误的;即正确命题有两个,故答案为:C.
练习3【答案】 (1)解: 2×2 列联表如下:
非高薪收入群体
高薪收入群体
合计
A 专业
60
30
90
B 专业
90
20
110
合计
150
50
200
K2=200×(60×20?30×90)2150×50×90×110=20033≈6.061>5.024 ,
所以能在犯错误的概率不超过0.025的前提下认为“高薪收入群体”与所学专业有关
(2)解:①所调查的200名学生的月薪频率分布表如下:
月薪/百元
[30,40)
[40,50)
[50,60)
[60,70)
[70,80)
[80,90)
人数
20
36
44
50
40
10
频率
0.1
0.18
0.22
0.25
0.2
0.05
μ=35×0.1+45×0.18+55×0.22+65×0.25+75×0.2+85×0.05=59.2 .
因为这200名学生的月薪 X~N(μ,190) ,所以 σ2=190 , σ≈14 ,
所以 μ?2σ=59.2?28=31.2 .
因为小明的月薪为3500元=35百元, μ?2σ=59.2?28=31.2 ,
所以小明不属于“就业不理想”的学生
②由①知 μ=59.2 百元 =5920 元,小明的工资为3500元,低于5920元,所以小明可获赠两次随机话费,所获得的话费 Z 的所有可能取值为120,180,240,300,360,
P(Z=120)=12×12=14 , P(Z=180)=C21×12×13=13 ,
P(Z=240)=13×13+C21×12×16=518 , P(Z=300)=C24×13×16=19 ,
P(Z=360)=16×16=136 .
故 Z 的分布列为
Z
120
180
240
300
360
P
14
13
518
19
136
则小明获得的话费总金额的数学期望
E(Z)=120×14+180×13+240×518+300×19+360×136=200 (元)
【解析】(1)作出 2×2 列联表,求出 K2=20033≈6.061>5.024 ,从而能在犯错误的概率不超过0.025的前提下认为“高薪收入群体”与所学专业有关;(2)①由所调查的200名学生的月薪频率分布表求出 μ=59.2 ,由这200名学生的月薪 X~N(μ,190) ,求出 σ≈14 ,从而 μ?2σ=59.2?28=31.2 ,由此可得结论;②小明可获赠两次随机话费,所获和话费 Z 的所有可能取值为120,180,240,300,360,分别求出相应的概率,由此能求出 Z 的分布列和数学期望
练习4【答案】 (1)解:由已知可得: x=5+20+35+40+505=30 ;
y=2+14+24+35+405=23 ;
又因为 i=15xi2=52+202+352+402+502=5750 ;
i=15xiyi=5×2+20×14+35×24+40×35+50×40=4530 ;
由回归直线的系数公式知:
b=i=15xiyi?5x?yi=15xi2?5x2=4530?5×30×23(52+202+352+402+502)?5×302=10801250=0.864
a=y?bx=23?0.864×30=?2.92 ?
所以 y=bx+a=0.864x?2.92
当 x=100 (百件)时, y=0.864×100?2.92=83.48<90 ,符合有关要求
所以按照公司的现有生产技术设备情况,可以安排一小时试生产 10000 件的任务.
(2)解:由题意知: X=1,2,3,?,n ,
P(X=k)=(1?12)k?1×12=12k , k=1,2,3,?,n?1 ;
P(X=n)=(1?12)n?1=12n?1
所以 E(X)=12+222+323+...+n?22n?2+2n?12n?1
E(X)2=122+223+324+...+n?22n?1+2n?12n ?
两式相减得: E(X)2=12+122+123+...+12n?2+n+12n?1?2n?12n
=12+122+...+12n?1+12n ? =1?12n ?
故 E(X)=2?12n?1<2
【解析】(1)求出样本中心的横坐标与纵坐标,结合已知条件求解回归直线的斜率,求出截距,得到回归直线方程,然后代入x=90,求出y^ , 判断即可.
(2)利用独立重复实验,求出期望的表达式,通过错位相减法求解期望即可.
?练习5【答案】 (1)解:根据等高条形图,得 2×2 列联表
数学成绩不超过120分
数学成绩超过120分
总计
每天在线学习数学不超过1小时
15
10
25
每天在线学习数学超过1小时
5
15
20
总计
20
25
45
根据列联表中的数据,得到 K2 的观测值
k=45(15×15?5×10)220×25×25×20=44180=5.5125>3.841 .
所以能在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”.
(2)解:由列联表可得,被抽查学生中这次数学成绩超过120分的有25人,其中,每天在线学习数学的时长超过1小时的有15人,每天在线学习数学的时长不超过1小时的有10人,从中随机抽取3人,则抽取的3人中每天在线学习数学的时长超过1小时的人数 ξ 的可能取值为0,1,2,3.
P(ξ=0)=C150C103C253=6115 , P(ξ=1)=C151C102C253=2792 ,
P(ξ=2)=C152C101C253=2146 , P(ξ=3)=C153C100C253=91460 .
所以 ξ 的分布列为
ξ
0 ?
1
2 ?
3 ?
P
6115 ?
2792 ?
2146 ?
91460 ?
所以 ξ 的数学期望 E(ξ)=0×6115+1×2792+2×2146+3×91460=828460=95 .
【解析】(1)由已知条件的图表中的数据结合观测值的公式计算出结果,再与标准值进行比较即可得出结果。
(2)根据题意即可得出X的取值,再由概率的公式求出对应的X的概率由此得到X的分布列,结合数学期望公式计算出答案即可。