第9章统计 章节复习总结 讲义-【新教材】2020-2021学年人教A版(2019)高中数学必修第二册Word

文档属性

名称 第9章统计 章节复习总结 讲义-【新教材】2020-2021学年人教A版(2019)高中数学必修第二册Word
格式 docx
文件大小 129.2KB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2021-05-18 14:31:27

图片预览

文档简介

1、了解随机抽样
2、掌握用样本估计总体
3、理解统计是实际应用
一、
随机抽样
像人口普查那样,对每一个调查对象都惊醒调查的方法,称为全面调查,又称普查.在一个调查中,我们把调查对象的全体成为总体,组成总体的每一个调查对象成为个体.
像这样,根据一定目的,从总体中抽取-一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.我们把从总体中抽?取的那部分个体称为样本,?样本中包含的个体数称为样本量.调查样本获得的变量值称为样本的观测数据,简称样本数据.
1.简单的随机抽样
一般地,设一个总体含有N?(N为正整数)个个体,从中逐个抽取n?(1≤n如果抽取是不放回的,且每次抽取时总体内未进人样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
2.抽签法
(1)概念
先给总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,知道抽足样本所需要的个数
(2)优缺点
优点:简单易行,当总体较小时,号签搅拌均匀很容易,个体有均等的机会被抽取,从而能保证样本的代表性
缺点:当总体较大时,费时、费力,且号签很难被搅拌均匀,产生的样本代表性差,导致抽样的不公平
3.随机数法
(1)概念
对总体中的N个个体编号,用随机数工具产生编号范围内的整体随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,知道抽足样本所需要的个数,如果生产的随机数有重复,即统一编号被多次抽到,可以剔除重复的编号并产生随机数,直到产生的不同编号个数等于样本所需要的个数
(2)优缺点
优点:简单易行,它很好的解决了抽签法中遇到的当总体个数较多时制签难、号签很难被搅拌均匀的问题
缺点:当总体较大时,需要的样本容量较大时,不太方便
一般地,总体中有N个个体,它们的变量值分别为,,?.,,则称
==
为总体均值,又称总体平均数,如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记?为,,?...,其中;出现的频数:?(i=1,?2,?....k),则总体均值还可以写成加权平均数的形式
=
如果从总体中抽取-一个容量为n的样本,它们的变量值分别?为,,...?,则称
为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数
为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数去估计总体平均数.
4.分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
二、
用样本估计总体
1.总体取值规律的估计
为了探索-组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
在这个实际问题中,因为我们更关心月均用水量在不同范围内的居民用户占全市居民用户的比例,所以选择频率分布表和频率分布直方图来整理和表示数据.与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
1.求极差
极差式一组数据中最大值与最小值的差
2.决定组距与组数
合适的组距与组数对发现数据分布规律有重要意义.组数太多或太少,都会影响我们了解数据的分布情况组距与组数的确定没有固定的标准,常常需要-一个尝试和选择的过?程。数据分组的组数与数据的个数有关,:一般数据的个数越多,所分组数也越多.
3.将数据分组
4.列频率分布表
5.画频率分布直方图
小长方形的面积=组距×
2.总体百分位数的估计
把100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现,区间(13.6,?13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数=13.7,并称此数为这组数据的第80百分位数,或80%分位数.
一般地,一组数据的第p百分位数是这样-一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且少有(100-p)%的数据大于或等于这个值.
可以通过下面的步骤计算一组n个数据的第力百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第力百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.总体集中趋势的估计
(1)平均数:如果给定的一组数是

,…
,则这组数的平均数为

(2)中位数:如果一组数有奇数个数,且按照从小到大排列后为则称为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为则称为这组数的中位数
(3)众数:一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数,若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数
4.总体离散趋势的估计
假设一组数据是,,?..?,用表示这组数据的平均数,则
这组数据的方差.有时为了计算方差的方差,我们还把方差写成以下形式
由于方差的单位是原始数据的单位的平方,与原始数据?不一致.为了使二者单位一致,我们对方差开平方,取它的算术平方根,即
(2)
我们称(2)式为这组数据的标准差.
如果总体中所有个体的变量值分别为总体平均数为,则称
为总体方差,S=为总体标准差.
与总体均值类似,总体方差也可以写成加权的形式。如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为,?其中;出现的频数为(i=1,?2,?.?k),则总体方差为
如果一个样本中个体的变量值分别为样本平均数为则称
为样本方差,s=?为样本标准差.
三、统计案例
公司员工的肥胖情况调查分析
背景与数据
近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数来衡量人体胖瘦程度以及是否健康,其计算公式是
BMI=
中国成人的BMI数值标准为:BM1<18.5为偏瘦;18.5≤BMI<23.9为正常;24≤?BMI<27.9为偏胖;BMI≥28为肥胖.
1.“工资条里显红利,个税新政人民心”,随着2021年新年钟声的敲响,我国自1980年以来,力度最大的一次个人所得税(简称个税)改革至2019年实施以来发挥巨大作用.个税新政主要内容包括:
⑴个税起征点为5000元;
⑵每月应纳税所得额(含税)
收入-个税起征点-专项附加扣除;
⑶专项附加扣除包括住房?子女教育和赡养老人等.新旧个税政策下每月应纳税所得额(含税)计算方法及其对应的税率表如表:
旧个税税率表(税起征点3500元)
新个税税率表(个税起征点5000元)
缴税级数
每月应纳税所得额(含税)
收入-个税起征点
税率(%)
每月应纳税所得额(含税)=收入-个税起征点
专项附加扣除
税率(%)
1
不超过1500元部分
3
不超过3000元部分
3
2
超过1500元至4500元部分
10
超过3000元至12000元部分
10
3
超过4500元至9000元的部分
20
超过12000元至25000元的部分
20
4
超过9000元至35000元的部分
25
超过25000元至35000元的部分
25
5
超过35000元至55000元部分
30
超过35000元至55000元部分
30
随机抽取某市1000名同一收入层级的IT从业者的相关资料,经统计分析,预估他们2021年的人均月收入24000元.统计资料还表明,他们均符合住房专项扣除;同时,他们每人至多只有一个符合子女教育扣除的孩子,并且他们之中既不符合子女教育扣除又不符合赡养老人扣除、只符合子女教育扣除但不符合赡养老人扣除、只符合赡养老人扣除但不符合子女教育扣除、即符合子女教育扣除又符合赡养老人扣除的人数之比是
;此外,他们均不符合其他专项附加扣除.新个税政策下该市的专项附加扣除标准为:住房1000元/月,子女教育每孩1000元/月,赡养老人2000元/月等.假设该市该收入层级的IT从业者都独自享受专项附加扣除,将预估的该市该收入层级的IT从业者的人均月收入视为其个人月收入.根据样本估计总体的思想,解决如下问题:
(1)求该市该收入层级的IT从业者2021年月缴个税的所有可能及其概率.
(2)根据新旧个税方案,估计从2021年1月开始,经过多少个月,该市该收入层级的
从业者各月少缴交的个税之和就超过2019年的月收入?
【答案】
(1)解:由题意,既不符合子女教育扣除又不符合赡养老人扣除、只符合子女教育扣除但不符合赡养老人扣除、只符合赡养老人扣除但不符合子女教育扣除、即符合子女教育扣除又符合赡养老人扣除的人数之比是
.
①既不符合子女教育扣除又不符合赡养老人扣除的人群每月应纳税所得额为
元,
月缴个税为
元,其概率为

②只符合子女教育扣除但不符合赡养老人扣除的人群每月应纳税所得额为
元,
月缴个税为
元,其概率为

③只符合赡养老人扣除但不符合子女教育扣除的人群每月应纳税所得额为
元,
月缴个税为
元,其概率为

④既符合子女教育扣除又符合赡养老人扣除的人群每月应纳税所得额为
元,
月缴个税为
元,其概率为

(2)解:在旧政策下,该收入阶层的
从业者每月应纳税所得额为
元,
故月缴个税为
元,
在新政策下,该收入阶层的
从业者每月应纳税所得额为
元,
每月少缴个税
元,
设经过
个月该市该收入阶层的
从业者各月少缴交的个税之和就超过2019年的月收入,

,又
,解得

所以经过12个月,该市该收入阶层的
从业者各月少缴交的个税之和就超过2019年的月收入.
【考点】简单随机抽样
【解析】
(1)根据题中给出的信息,分四种情况按照条件中的计算公式分别求出月缴个税即可;
(2)计算两种政策下的每月应缴个税额度差,然后列出不等式,求解即可得到答案.
2.“学习强国”学习平台是由中宣部主管,以深入学习宣传习近平新时代中国特色社会主义思想为主要内容,立足全体党员,面向全社会的优质平台,现日益成为老百姓了解国家动态,紧跟时代脉搏的热门
,某市宣传部门为了解全民利用“学习强国”了解国家动态的情况,从全市抽取2000名人员进行调查,统计他们每周利用“学习强国”的时长,下图是根据调查结果绘制的频率分布直方图.
(1)根据下图,求所有被抽查人员利用“学习强国”的平均时长和中位数(精确到小数点后一位);
(2)宣传部为了了解大家利用“学习强国”的具体情况,准备采用分层抽样的方法从

组中抽取50人了解情况,则两组各抽取多少人?再利用分层抽样从抽取的50人中选5人参加一个座谈会.现从参加座谈会的5人中随机抽取两人发言,求
小组中至少有1人发言的概率?
【答案】
(1)解:设抽查人员利用“学习强国”的平均时长为
,中位数为

.
设抽查人员利用“学习强国”的中位数为

,解得
.
即抽查人员利用“学习强国”的平均时长为6.8,中位数为6.7;
(2)解:
的人数为
人,设抽取的人数为

组的人数为
人,设抽取的人数为


,解得


所以在

两组中分别抽取30人和20人,
在抽取5人,两组分别抽取3人和2人,将
组中被抽取的工作人员标记为




中的标记为


设事件
表示从
小组中至少抽取1人,
则抽取的情况如下:









共10种情况,
其中在
中至少抽取1人有7种,则
.
【考点】分层抽样方法,众数、中位数、平均数
【解析】
(1)根据平均数,中位数公式计算;
(2)先根据分层抽样求出每一组抽取的人数,求出抽取总事件,求出概率.
3.某次数学测试后,数学老师对该班n位同学的成绩进行分析,全班同学的成绩都分布在区间
,制成的频率分布直方图如图所示.已知成绩在区间
的有12人.
(1)求n;
(2)根据频率分布直方图,估计本次测试该班的数学平均分(同一组数据用该组数据区间的中点值表示).
(3)现从

两个分数段的试卷中,按分层抽样的方法共抽取了6份试卷.若从这6份试卷中随机选出2份作为优秀试卷,求选出2份优秀试卷中恰有1份分数在
的概率.
【答案】
(1)解:由题可知:
(2)解:
(3)解:由频率分布直方图可知:成绩分布在
有12人,在
有6人,抽取比例为
,所以
内抽取人数为4人,
抽取人数为2人.

中4人为a,b,c,d,记
的2人分别为e,f,
则所有的抽取结果为:(a,b),(a,c),(a,d),(a,e),(a,f),(b,c),(b,d),(b,e),(b,f),(c,d),(c,e),(c,f),(d,e),(d,f),(e,f)共15种.
恰有一份分数段在
有(a,e),(a,f),(b,e),(b,f),(c,e),(c,f),(d,e),(d,f)共8种,
所以,概率
【考点】分层抽样方法,频率分布直方图
【解析】(1)由这组
的频数和频率计算n的值即可;
(2)由频率分布直方图结合平均数的计算公式,得出该学校本次考试数学平均分;
(3)先根据分层抽样计算出
??内抽取人数为4人,??抽取人数为2人,再记??中4人为a,b,c,d,记??的2人分别为e,f,列举出所有的基本事件,再找到满足条件的基本事件,根据概率计算公式计算即可。
4.2021届高考体检工作即将开展,为了了解高三学生的视力情况,某校医务室提前对本校的高三学生视力情况进行调查,在高三年级1000名学生中随机抽取了100名学生的体检数据,并得到如下图的频率分布直方图.
年级名次
是否近视
近视
40
30
不近视
10
20
(1)若直方图中前四组的频数依次成等比数列,试估计全年级高三学生视力的中位数(精确到0.01);
(2)该校医务室发现,学习成绩突出的学生,近视的比较多,为了研究学生的视力与学习成绩是否有关系,对抽取的100名学生名次在
名和
名的学生的体检数据进行了统计,得到表中数据,根据表中的数据,能否在犯错的概率不超过0.05的前提下认为视力与学习成绩有关系?
(3)在(2)中调查的不近视的学生中按照分层抽样抽取了6人,进一步调查他们良好的护眼习惯,求在这6人中任取2人,至少有1人的年级名次在
名的概率.
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
,其中
.
【答案】
(1)解:由图可知,第三组和第六组的频数为

第五组的频数为

所以前四组的频数和为

而前四组的频数依次成等比数列
故第一组的频数为4人,第二组的频数为8人,第四组的频数为32人
所以中位数落在第四组,设为x,
因此有
(或

解得
所以中位数是4.74
(2)解:因为
所以
所以
因此在犯错的概率不超过0.05的前提下认为视力与学习成绩有关系
(3)解:依题意按照分层抽样在不近视的学生中抽取了6人中年级名次在
名和
名的分别有2人和4人
从6人中任意抽取2人的基本事件共15个
至少有1人来自于1~100名的基本事件有9个
所以至少有1人的年级名次在
名的概率为
.
【考点】频率分布直方图,众数、中位数、平均数
【解析】(1)根据频率分布直方图,进行求解即可;
(2)由已知得
,进行计算得
,得出
在犯错的概率不超过0.05的前提下认为视力与学习成绩有关系

(3)根据分层抽样的方法,再跟根据基本事件的概率进行运算即可。
1.某服装生产厂家研发了甲、乙、丙三种新式时装准备投入市场销售.甲时装共加工了1900件,乙时装共加工了1400件,丙时装共加工了900件.在投入市场前,厂家采用分层抽样的方式从三种新式时装中选取210件在小范围内试销售,则应从乙时装中选取开始(???

A.?90件????????????????????????????????????B.?70件????????????????????????????????????C.?60件????????????????????????????????????D.?50件
2.某篮球队有篮球运动员15人,进行投篮训练,每人投篮100个,命中球数如下表:
命中球数
90
95
97
98
100
频数
1
2
3
7
2
则这组数据的中位数和众数分别为(???

A.?97,2????????????????????????????????B.?98,2????????????????????????????????C.?97,98????????????????????????????????D.?98,98
3.为了解汽车通过高速公路上某个地点的车速情况,交警部门通过电子监控随机调查了50辆汽车通过该地点的车速,并绘成如图所示的频率分布直方图,由此可估计通过该地点的汽车车速的众数和中位数分别为(???

A.?80,75????????????????????????????B.?80,77????????????????????????????C.?77.5,75????????????????????????????D.?77.5,77.5
4.某工厂对一批新产品的长度(单位:mm)进行检测,检测结果的频率分布直方图如图所示,据此估计这批产品的中位数为(???

A.?20??????????????????????????????????????B.?25??????????????????????????????????????C.?22.5??????????????????????????????????????D.?22.75
参考答案
1.【答案】
B
【解析】
厂家共加工了新式时装
件,
故应从乙时装中选取
件.
2.【答案】
D
【解析】
这组数据共有15个,中位数是按大小顺序排列后的第8个数,即98,众数是数据中出现次数最多的数,即98.
3.【答案】
D
【解析】
解:由频率分布直方图可知众数的估计值为77.5.设中位数的估计值为
,则
,解得
,即中位数的估计值为77.5.
4.【答案】
C
【解析】
由频率分布直方图得,第一组、第二组的频率为

第三组的频率为
,所以中位数落在第三组并设为

则有
,解得
.