中小学教育资源及组卷应用平台
沪教版数学高二下春季班第十九讲
课题
基本统计方法
单元
第章
学科
数学
年级
十一
学习目标
1.掌握总体与样本的概念.会用样本估计总体,能对样本观测值进行整理和分析;2.掌握随机抽样的方法.
重点
1.总体均值,总体方差,总体标准差;2.抽样方法.
难点
1.总体均值,总体方差,总体标准差;2.抽样方法.
教学安排
版块
时长
1
知识梳理
30
2
例题解析
60
3
巩固训练
20
4
师生总结
10
5
课后练习
30
一、总体和样本
1、总体与个体:在统计问题中,我们把研究对象的全体叫做总体,总体中的每一个对象叫做个体.
2、总体分布:整体取值的概率分布规律.
3、总体均值:如果总体有N个个体,它们的值分别为,那么叫做总体均值.我们用有限总体中所有个体的平均数来表示总体的平均状态.
4、总体中位数:把总体中的各个个体,依由小到大的顺序排列,当N为奇数时,位于该数列正中位置的数叫做总体的中位数,记作m.当N为偶数时,位于该数列正中位置的两个数的平均数叫做总体的中位数.总体中位数也可以用来表示总体的“平均”水平.
5、众数:一组数据中出现次数最多的数据.如:的众数是3.
6、总体方差:设总体有N个个体,它们分别为,那么各个个体与总体平均数的差的平方分别是,我们把它们的平均数叫做总体方差,记作,即,其平方根称为总体标准差.总体方差反映了各个个体偏离平均数的程度.越大,总体中各个个体之间的差别越大;越小,总体中各个个体之间的差别越小.
二、抽样技术
从总体中抽出一部分个体组成的集合叫做样本(也叫做子样),样本中所含个体的个数叫做样本容量,抽取样本的过程叫做抽样.
1、随机抽样:如果在抽样过程中能使总体中的每一个个体都有同样的可能性被选入样本,那么这种抽样叫做随机抽样,所得的样本称为随机子样.在样本容量不大时,随机抽样可以用抽签方法;在样本容量较大时,可以使用随机数表.
2、系统抽样:把总体中的每一个个体编上号,按某种相等的间隔抽取样本的方法,叫做系统抽样.如果总体中个体的总数为N,样本的容量为n,那么间隔.
3、分层抽样:把总体分成若干个部分,然后在每个部分随机抽样的方法,叫做分层抽样.
分层抽样的方法如下:先将总体个数N按要求分成k层,每层的个体数分别记作;在每层中分别随机抽取个个体组成容量为n的样本,使得,,.
三、统计估计
统计估计可分为两类:一类是用样本中某事件出现的频率估计该事件出现的概率,简称概率估计(可能性估计);另一类是用样本的算数平均数和样本标准差估计总体均值和总体标准差,简称参数估计.
总体均值的点估计值:如果样本为,样本的容量为n,那么可以用样本的平均值作为总体均值的点估计值.
总体标准差的点估计值:如果样本为,样本的容量为n,那么可以用样本的标准差作为总体标准差的点估计值.
是总体标准差,s是样本标准差.当样本容量较大时,s可用来估计总体标准差.
一、总体和样本
【例1】对某校高一年级学生的体重作统计,在这个问题中总体是(
)
A.该校全体学生;
B.该校高一全体学生;
C.该校全体学生的体重数;
D.该校高一全体学生的体重数.
【难度】★
【答案】D
【例2】已知以下数据:32,48,27,51,44,36,29,53,49,37,36,25.求:总体平均数,总体中位数,总体众数,总体方差,总体标准差.
【难度】★★
【答案】总体平均数为38.91666667,总体中位数为36.5,总体众数为36,总体方差为88.07638892,总体标准差为9.384902179。
【例3】设有两组数据与,它们的平均数分别为,则新的一组数的平均数是
.
【难度】★★
【答案】平均数为
【例4】某人5次上班途中所花的时间(单位:分钟)分别为.已知这组数据的平均数为10,方差为2,则的值为
.
【难度】★★
【答案】4
【例5】由个整数形成的样本数据中,至少有六个互不相同的整数,若平均数、中位数、唯一的众数和全距(即样本中最大数与最小数之差)都是,则可能成为样本数据中的最大整数是
.
【难度】★★
【答案】13
【例6】已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a,b的取值分别是________________.
【难度】★★
【答案】由中位数意义,可知
INCLUDEPICTURE
"http://static11.photo.sina.com.cn/middle/002xy0Ovzy6IJDbvcUO0a&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDbvcUO0a%26bid=8ac252fb0101g8jj%26uid=2327991035?),依题意,总体中个体的数量为
INCLUDEPICTURE
"http://static7.photo.sina.com.cn/middle/002xy0Ovzy6IJDbznAq26&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDbznAq26%26bid=8ac252fb0101g8jj%26uid=2327991035?),
∴总体平均数
INCLUDEPICTURE
"http://static8.photo.sina.com.cn/middle/002xy0Ovzy6IJDbBhKT87&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDbBhKT87%26bid=8ac252fb0101g8jj%26uid=2327991035?),
于是总体方差
INCLUDEPICTURE
"http://static14.photo.sina.com.cn/middle/002xy0Ovzy6IJDbDkXXad&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDbDkXXad%26bid=8ac252fb0101g8jj%26uid=2327991035?),当且仅当
INCLUDEPICTURE
"http://s7.sinaimg.cn/middle/002xy0Ovzy6IJDbHBSC86&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDbHBSC86%26bid=8ac252fb0101g8jj%26uid=2327991035?)时等号成立。所以
INCLUDEPICTURE
"http://static16.photo.sina.com.cn/middle/002xy0Ovzy6IJDbN4GXff&690"
\
MERGEFORMATINET
(?http:?/??/?static14.photo.sina.com.cn?/?middle?/?002xy0Ovzy6IJDbKpxX3d&690?)。
事实上方差是描述全体数据偏离平均值的程度的量,要使方差最小,只须各数据大小应尽可能地接近,故
INCLUDEPICTURE
"http://static10.photo.sina.com.cn/middle/002xy0Ovzy6IJDbSeeJ29&690"
\
MERGEFORMATINET
(?http:?/??/?s15.sinaimg.cn?/?middle?/?002xy0Ovzy6IJDbPw626e&690?).
【巩固训练】
1.若点上,且数据的方差为8,则数据的方差为
.
【难度】★★
【答案】72
2.已知数据的均值为6,方差为8,则=_____.
【难度】★★
【答案】2
3.已知是这五个数据的中位数,又知这四个数据的平均数为3,则的最小值为_________.
【难度】★★
【答案】由题意可知,,即.
故当时,取最小值,即
4.若,,,…,的方差为,则,,,…,的方差为(
)
A.
B.
C.
D.
【难度】★★
【答案】D
二、抽样技术
【例7】某单位有青年职工人,中年职工人数是老年职工人数的倍,老、中、青职工共有人.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工人,则该样本中的老年职工人数为(
)
A.
B.
C.
D.
【难度】★★
【答案】B
【例8】某中学采用系统抽样的方法从该校高一年级全体名学生中抽取名学生进行体能测试.现将名学生从到进行编号,求得间隔数.若从中随机抽取个数的结果是抽到了,则在编号为的这个学生中抽取的一名学生其编号应该是
___________.
【难度】★★
【答案】
【例9】一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是___________.
【难度】★★
【答案】63
【例10】在下列问题中,各采用什么抽样方法抽取样本较为妥当?
(1)??????从30件产品中抽取5件进行质量检验;
(2)??????某文化宫共有35排座位,每排有42个座位(座位号为1~42),一次报告会坐满了听众,会后为听取意见留下了所有座位号为13的35名听众进行座谈;
(3)??????某公司有200名员工,其中有业务人员135人,管理人员25人,后勤服务人员40人,从中抽取一个容量为5的样本.
【难度】★★
【答案】(1)总体中个体数较小,采用简单随机抽样较为妥当.
(2)因为总体中个数较多,又是“等距离”抽取,所以采用系统抽样较为妥当.
(3)因为总体中个体差异较大,所以采用分层抽样较为妥当.
【例11】某高级中学共有学生2000名,各年级男、女生人数如右表:已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.19.
(1)求x的值;
??
一年级
二年级
三年级
女生
373
INCLUDEPICTURE
"http://static1.photo.sina.com.cn/middle/002xy0Ovzy6IJDd8Ebm50&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDd8Ebm50%26bid=8ac252fb0101g8jj%26uid=2327991035?)
INCLUDEPICTURE
"http://static7.photo.sina.com.cn/middle/002xy0Ovzy6IJDdcSiy26&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDdcSiy26%26bid=8ac252fb0101g8jj%26uid=2327991035?)
男生
377
370
INCLUDEPICTURE
"http://static11.photo.sina.com.cn/middle/002xy0Ovzy6IJDdgYBQca&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDdgYBQca%26bid=8ac252fb0101g8jj%26uid=2327991035?)
(2)现用分层抽样的方法在全校抽取48名学生,问应在高三年级抽取多少名?
(3)已知
INCLUDEPICTURE
"http://static1.photo.sina.com.cn/middle/002xy0Ovzy6IJDdlrSo20&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDdlrSo20%26bid=8ac252fb0101g8jj%26uid=2327991035?),
INCLUDEPICTURE
"http://static7.photo.sina.com.cn/middle/002xy0Ovzy6IJDdpnDg46&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDdpnDg46%26bid=8ac252fb0101g8jj%26uid=2327991035?),求高三年级中女生比男生多的概率.
【难度】★★
【答案】(1)由
INCLUDEPICTURE
"http://static16.photo.sina.com.cn/middle/002xy0Ovzy6IJDdu01Naf&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDdu01Naf%26bid=8ac252fb0101g8jj%26uid=2327991035?),解得
INCLUDEPICTURE
"http://s5.sinaimg.cn/middle/002xy0Ovzy6IJDdyUO824&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDdyUO824%26bid=8ac252fb0101g8jj%26uid=2327991035?).
只要求出高三年级人数即可,由(1)知二年级的女生有380人,那么三年级的学生的人数应该是
INCLUDEPICTURE
"http://s2.sinaimg.cn/middle/002xy0Ovzy6IJDdASSB21&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDdASSB21%26bid=8ac252fb0101g8jj%26uid=2327991035?),设应在高三年级抽取m人,则
INCLUDEPICTURE
"http://static9.photo.sina.com.cn/middle/002xy0Ovzy6IJDdFajuc8&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDdFajuc8%26bid=8ac252fb0101g8jj%26uid=2327991035?),解得
INCLUDEPICTURE
"http://s11.sinaimg.cn/middle/002xy0Ovzy6IJDdJrm28a&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDdJrm28a%26bid=8ac252fb0101g8jj%26uid=2327991035?).???????
(3)设高三年级女生比男生多的事件为
INCLUDEPICTURE
"http://s2.sinaimg.cn/middle/002xy0Ovzy6IJDdNybD01&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDdNybD01%26bid=8ac252fb0101g8jj%26uid=2327991035?),高三年级女生和男生数记为数对
INCLUDEPICTURE
"http://static1.photo.sina.com.cn/middle/002xy0Ovzy6IJDdRDos10&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDdRDos10%26bid=8ac252fb0101g8jj%26uid=2327991035?),
由(2)知
INCLUDEPICTURE
"http://static6.photo.sina.com.cn/middle/002xy0Ovzy6IJDdVMPj95&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDdVMPj95%26bid=8ac252fb0101g8jj%26uid=2327991035?),则基本事件总数有:
INCLUDEPICTURE
"http://static14.photo.sina.com.cn/middle/002xy0Ovzy6IJDdXYmxbd&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDdXYmxbd%26bid=8ac252fb0101g8jj%26uid=2327991035?)
INCLUDEPICTURE
"http://static11.photo.sina.com.cn/middle/002xy0Ovzy6IJDedots5a&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDedots5a%26bid=8ac252fb0101g8jj%26uid=2327991035?)共11个,而事件
INCLUDEPICTURE
"http://static8.photo.sina.com.cn/middle/002xy0Ovzy6IJDeiDhJ97&690"
\
MERGEFORMATINET
(?http:?/??/?static7.photo.sina.com.cn?/?middle?/?002xy0Ovzy6IJDefM2y26&690?)包含的基本事件有:
INCLUDEPICTURE
"http://s10.sinaimg.cn/middle/002xy0Ovzy6IJDelZC9c9&690"
\
MERGEFORMATINET
(?http:?/??/?static6.photo.sina.com.cn?/?middle?/?002xy0Ovzy6IJDek9Mx85&690?)共5个,∴
INCLUDEPICTURE
"http://static12.photo.sina.com.cn/middle/002xy0Ovzy6IJDeq8sP8b&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDeq8sP8b%26bid=8ac252fb0101g8jj%26uid=2327991035?)
【巩固训练】
1.某小镇对学生进行防火安全教育知晓情况调查,已知该小镇的小学生、初中生、高中生分别有1400人、1600人、800人,按小学生抽取70名作调查,进行分层抽样,则在初中生中的抽样人数应该是
.
【难度】★★
【答案】80
2.某学院的,,三个专业共有1200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的专业有380名学生,专业有420名学生,则在该学院的专业应抽取____名学生.
【难度】★★
【答案】40
3.将参加夏令营的600名学生编号为:001,002,…
,600.
采用系统抽样疗法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第I营区,从301到495在第II营区,从496到600在第III营区.三个营区被抽中的人数依次为(
)
A.26,16,8
A.25,17,8
A.25,16,9
A.24,17,9
【难度】★★
【答案】系统抽样后的样本号码组成了一个等差数列,
,公差为,则
由题意,,故选B
4.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是(
)
A.分层抽样法,系统抽样法????????B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法????????D.简单随机抽样法,分层抽样法
【难度】★★
【答案】B
三、统计估计
【例12】某校高一年级128名学生参加某次数学联考,随机抽取该校高一年级其中10名学生的联考数学成绩如下表:
学生
a
b
c
d
e
f
g
h
i
j
成绩
78
68
80
85
82
75
80
92
79
81
该校高一学生数学联考成绩标准差的点估计值等于
.(精确到0.1)
【难度】★★
【答案】
【例13】某质量监测中心在一届学生中随机抽取39人,对本届学生成绩进行抽样分析.统计分析的一部分结果,见下表:
统计组
人数
平均分
标准差
组
组
根据上述表中的数据,可得本届学生方差的估计值为
.(结果精确到0.1)
【难度】★★★
【答案】
【例14】某工厂A、B两个车间包装同一种产品,在自动传送带上每隔30分钟抽一包产品,称其重量是否合格,分别记录抽查结果如下:
A车间:102,101,99,103,98,99,98.
B车间:110,115,90,85,75,115,110.
(1)???????这种抽样是何种抽样方法?
(2)???????估计A、B两车间的均值与方差,并说明哪个车间产品较稳定?
【难度】★★★
【答案】(1)由定义知,这是系统抽样方法.
(2)
INCLUDEPICTURE
"http://s10.sinaimg.cn/middle/002xy0Ovzy6IJDggfSF59&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDggfSF59%26bid=8ac252fb0101g8jj%26uid=2327991035?)
INCLUDEPICTURE
"http://static8.photo.sina.com.cn/middle/002xy0Ovzy6IJDgicoT07&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDgicoT07%26bid=8ac252fb0101g8jj%26uid=2327991035?)
INCLUDEPICTURE
"http://s15.sinaimg.cn/middle/002xy0Ovzy6IJDgkEp06e&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDgkEp06e%26bid=8ac252fb0101g8jj%26uid=2327991035?)
由于
INCLUDEPICTURE
"http://static12.photo.sina.com.cn/middle/002xy0Ovzy6IJDgoS4r8b&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDgoS4r8b%26bid=8ac252fb0101g8jj%26uid=2327991035?),
INCLUDEPICTURE
"http://s3.sinaimg.cn/middle/002xy0Ovzy6IJDgt2dcb2&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDgt2dcb2%26bid=8ac252fb0101g8jj%26uid=2327991035?),故A车间产品较B车间稳定.
【例15】一个容量为的样本,分成若干组,已知某数的频数和频率分别为40,0.125,
则的值为
.
【难度】★★
【答案】320
【例16】为了估计水库中鱼的尾数,可以使用以下方法:先从水库中捕出一定数量的鱼,如2000尾,给每尾鱼做上记号,然后放回水库,经过适当的时间,让其充分混合,再从水库中捕出一定数量的鱼,如500尾,查看其中有记号的鱼有40尾,试根据上述数据,估计水库中鱼的尾数.
【难度】★★
【答案】设水库内鱼的尾数为N,由于每尾鱼被捕到的可能性是一样的,记事件A为“捕到一尾鱼有记号”,于是,
INCLUDEPICTURE
"http://static15.photo.sina.com.cn/middle/002xy0Ovzy6IJDeCCUm4e&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDeCCUm4e%26bid=8ac252fb0101g8jj%26uid=2327991035?),则?
INCLUDEPICTURE
"http://s16.sinaimg.cn/middle/002xy0Ovzy6IJDeGQXB2f&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDeGQXB2f%26bid=8ac252fb0101g8jj%26uid=2327991035?)。
【例17】为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5―18岁的男生体重(kg),得到频率分布直方图如下:
这100名学生中体重在的学生人数是(
)
A.20
B.30
C.40
D.50
【难度】★★
【答案】C
【例18】学校为了解学生在课外读物方面的支出情况,抽取了个同学
进行调查,结果显示这些同学的支出都在(单位:元),其中支出在
(单位:元)的同学有67人,其频率分布直方图如右图所示,则的值为( )
A.100
A.120
A.130
A.390
【难度】★★
【答案】A
【巩固训练】
1.给出下列4个命题,其中正确命题的序号是
.
(1)在大量的试验中,事件A出现的频率可以作为事件A出现的概率的估计值;
(2)样本标准差可以作为总体标准差的点估计值;
(3)随机抽样就是使得总体中每一个个体都有同样的可能性被选入样本的一种抽样方法;
(4)分层抽样就是把总体分成若干部分,然后在每个部分指定某些个体作为样本的一种抽样方法.
【难度】★★
【答案】(1)、(2)、(3)
2.从一堆苹果中任取5只,称得它们的质量分别为(单位:克)、、、、,则该样本方差__________.
【难度】★★
【答案】2
3.某区有200名学生参加数学竞赛,随机抽取10名学生成绩如下:
成绩
40
50
60
70
80
90
人数
1
1
2
2
1
3
则总体标准差的点估计值是
.(精确到0.01)
【难度】★★
【答案】总体均值的点估计值为
则总体标准差的点估计值为
.
4.有一容量为50的样本,数据的分组及各组的频率数如下
INCLUDEPICTURE
"http://s14.sinaimg.cn/middle/002xy0Ovzy6IJDeT9y5ed&690"
\
MERGEFORMATINET
(?http:?/??/?www.xjktyg.com?/?wxc?/??)?
[10,15]4??[30,35
INCLUDEPICTURE
"http://s11.sinaimg.cn/middle/002xy0Ovzy6IJDeXpua1a&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDeXpua1a%26bid=8ac252fb0101g8jj%26uid=2327991035?)9??[15,20
INCLUDEPICTURE
"http://s15.sinaimg.cn/middle/002xy0Ovzy6IJDf2hFc7e&690"
\
MERGEFORMATINET
(?http:?/??/?s11.sinaimg.cn?/?middle?/?002xy0Ovzy6IJDeZY024a&690?)5??[35,40
INCLUDEPICTURE
"http://static7.photo.sina.com.cn/middle/002xy0Ovzy6IJDf7w2y36&690"
\
MERGEFORMATINET
(?http:?/??/?static11.photo.sina.com.cn?/?middle?/?002xy0Ovzy6IJDf4Swida&690?)8?
[20,25
INCLUDEPICTURE
"http://static4.photo.sina.com.cn/middle/002xy0Ovzy6IJDfcotJ83&690"
\
MERGEFORMATINET
(?http:?/??/?s4.sinaimg.cn?/?middle?/?002xy0Ovzy6IJDf9RwDc3&690?)10??[40,45
INCLUDEPICTURE
"http://static9.photo.sina.com.cn/middle/002xy0Ovzy6IJDfhv2od8&690"
\
MERGEFORMATINET
(?http:?/??/?s10.sinaimg.cn?/?middle?/?002xy0Ovzy6IJDfeYt3d9&690?)3??[25,30
INCLUDEPICTURE
"http://s13.sinaimg.cn/middle/002xy0Ovzy6IJDfmGEA1c&690"
\
MERGEFORMATINET
(?http:?/??/?static7.photo.sina.com.cn?/?middle?/?002xy0Ovzy6IJDfjUSGd6&690?)11
(1)列出样本的频率分布表(含累积频率);
(2)画出频率分布直方图和累积频率的分布图.
【难度】★★
【答案】(1)由所给数据,计算得如下频率分布表:
数据段
频数
频率
累积频率
[10,15
INCLUDEPICTURE
"http://s12.sinaimg.cn/middle/002xy0Ovzy6IJDfBuY32b&690"
\
MERGEFORMATINET
(?http:?/??/?static12.photo.sina.com.cn?/?middle?/?002xy0Ovzy6IJDfzaQz1b&690?)
4
0.08
0.08
[15,20
INCLUDEPICTURE
"http://s9.sinaimg.cn/middle/002xy0Ovzy6IJDfGGO4c8&690"
\
MERGEFORMATINET
(?http:?/??/?static10.photo.sina.com.cn?/?middle?/?002xy0Ovzy6IJDfE1olf9&690?)
5
0.10
0.18
[20,25
INCLUDEPICTURE
"http://static7.photo.sina.com.cn/middle/002xy0Ovzy6IJDfLycK76&690"
\
MERGEFORMATINET
(?http:?/??/?static15.photo.sina.com.cn?/?middle?/?002xy0Ovzy6IJDfJ2pM2e&690?)
10
0.20
0.38
[25,30
INCLUDEPICTURE
"http://s2.sinaimg.cn/middle/002xy0Ovzy6IJDfQEmdb1&690"
\
MERGEFORMATINET
(?http:?/??/?static12.photo.sina.com.cn?/?middle?/?002xy0Ovzy6IJDfO0zN6b&690?)
11
0.22
0.60
[30,35
INCLUDEPICTURE
"http://static7.photo.sina.com.cn/middle/002xy0Ovzy6IJDfVL6ud6&690"
\
MERGEFORMATINET
(?http:?/??/?static1.photo.sina.com.cn?/?middle?/?002xy0Ovzy6IJDfSXLO20&690?)
9
0.18
0.78
[35,40
INCLUDEPICTURE
"http://s12.sinaimg.cn/middle/002xy0Ovzy6IJDg0Gp51b&690"
\
MERGEFORMATINET
(?http:?/??/?s14.sinaimg.cn?/?middle?/?002xy0Ovzy6IJDfYkxfcd&690?)
8
0.16
0.94
[40,45
INCLUDEPICTURE
"http://s1.sinaimg.cn/middle/002xy0Ovzy6IJDg5NFC10&690"
\
MERGEFORMATINET
(?http:?/??/?static2.photo.sina.com.cn?/?middle?/?002xy0Ovzy6IJDg3pIJ81&690?)
3
0.06
1
总计
50
1
??
(2)频率分布直方图与累积频率分布图如下:
INCLUDEPICTURE
"http://s14.sinaimg.cn/middle/002xy0Ovzy6IJDgaDQ94d&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDgaDQ94d%26bid=8ac252fb0101g8jj%26uid=2327991035?)
INCLUDEPICTURE
"http://s12.sinaimg.cn/middle/002xy0Ovzy6IJDge2bFcb&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDge2bFcb%26bid=8ac252fb0101g8jj%26uid=2327991035?)
四、实例分析
【例19】检验甲乙两个工人所加工的零件,测得的零件直径的数据如下:(单位)
甲:18.04,19.98,18.00,18.02,17.96,18.00
乙:18.01,18.00,17.95,18.00,18.05,19.99
(1)求每组数据的平均数;
(2)求每组数据的方差;
(3)求每组数据的标准差;
(4)谁加工的零件的直径大小较稳定?
【难度】★★
【答案】(1)
∴甲加工的零件的直径大小较稳定.
【例20】(1)某小区所有263户家庭人口数分组列表如下:
家庭人口数
1
2
3
4
5
6
7
8
9
10
家庭数
20
29
48
50
46
36
19
8
4
3
求总体平均数,总体中位数,总体方差和标准差;
(2)若某小区有2630户,从中抽取263户所得的家庭人口数的分布列同(1)中的表格,求该小区2630户家庭人口数的总体方差.
【难度】★★
【答案】(1)①总体平均数,即平均每户人口数为人.
②是奇数,
那么为数列:的正中位置.
因为,
所以第个数属于每户个的每个组.故总体中位数.
③总体方差:
.
④总体标准差:.
(2)该小区户家庭人口数的总体方差为
.
【例21】一个容量100的样本,其数据的分组与各组的频数如下表:
组别
频数
12
13
24
15
16
13
7
则样本数据落在上的频率为(
)
A.0.13
B.0.39
C.0.52
D.0.64
【难度】★★
【答案】C
【例22】在120个零件中,一级品24个,二级品36个,三级品60个,从中抽取一个容量为20个的样本,分别用三种方法抽样,计算总体中每个个体被抽取的概率,比较这些概率之间的关系.
【难度】★★
【答案】(1)采用简单随机抽样法(抽签法).每个个体被抽取的概率为
INCLUDEPICTURE
"http://static1.photo.sina.com.cn/middle/002xy0Ovzy6IJDgGx1K00&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDgGx1K00%26bid=8ac252fb0101g8jj%26uid=2327991035?).
系统抽样法.将120个零件分成20组,每组6个零件,每组取1个,每个个体被抽取的概率为
INCLUDEPICTURE
"http://static15.photo.sina.com.cn/middle/002xy0Ovzy6IJDgKE7s5e&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDgKE7s5e%26bid=8ac252fb0101g8jj%26uid=2327991035?).(3)分层抽样法.一、二、三级品之比为
INCLUDEPICTURE
"http://static12.photo.sina.com.cn/middle/002xy0Ovzy6IJDgOwPhbb&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDgOwPhbb%26bid=8ac252fb0101g8jj%26uid=2327991035?),
INCLUDEPICTURE
"http://static2.photo.sina.com.cn/middle/002xy0Ovzy6IJDgQIvL21&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDgQIvL21%26bid=8ac252fb0101g8jj%26uid=2327991035?).分别从一、二、三级品中抽取4个,6个,10个,每个个体被抽到的概率分别为
INCLUDEPICTURE
"http://static8.photo.sina.com.cn/middle/002xy0Ovzy6IJDgUPll97&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDgUPll97%26bid=8ac252fb0101g8jj%26uid=2327991035?),
INCLUDEPICTURE
"http://static7.photo.sina.com.cn/middle/002xy0Ovzy6IJDgZ71Q06&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDgZ71Q06%26bid=8ac252fb0101g8jj%26uid=2327991035?),
INCLUDEPICTURE
"http://s10.sinaimg.cn/middle/002xy0Ovzy6IJDh3pj359&690"
\
MERGEFORMATINET
(?http:?/??/?photo.blog.sina.com.cn?/?list?/?blogpic.php?pid=002xy0Ovzy6IJDh3pj359%26bid=8ac252fb0101g8jj%26uid=2327991035?),即都是
INCLUDEPICTURE
"http://static7.photo.sina.com.cn/middle/002xy0Ovzy6IJDh8igu76&690"
\
MERGEFORMATINET
(?http:?/??/?static1.photo.sina.com.cn?/?middle?/?002xy0Ovzy6IJDh5M6k90&690?).所以无论采用哪一种抽样方法,总体的每一个个体被抽到的概率都是
INCLUDEPICTURE
"http://s12.sinaimg.cn/middle/002xy0Ovzy6IJDhdeWf5b&690"
\
MERGEFORMATINET
(?http:?/??/?s6.sinaimg.cn?/?middle?/?002xy0Ovzy6IJDhaQAdb5&690?).
【例23】PISA2012测试上海样本中有42所一般普通高中和32所中等职业技术学校。为了某项问题的研究,用分层抽样的方法需从这两类学校中再抽取额一个容量为37的样本,则应抽取一般普通高中学校数为(
)
A.37
B.5
C.16
D.21
【难度】★★
【答案】D
【例24】一汽车厂生产A、B、C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆)
轿车A
轿车B
轿车C
舒适型
100
150
标准型
300
450
600
按类型分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆.
求的值;
用分层抽样的方法在C类轿车中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2辆,求至少1辆舒适型轿车的概率;
用随机抽样的方法从B类舒适型轿车中抽取8辆,经检测它们的得分如下:9.4,8.6,9.2,9.6,8.7,9.3,9.0,8.2,把这8辆轿车的得分看作一个总体,从中任取一个数,求该数与样本平均数之差的绝对值不超过0.5的概率.
【难度】★★
【答案】(1)400;(2);(3)0.75
【例25】某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是___________.
【难度】★★
【答案】分层抽样
【例26】某班学生在一次数学考试中成绩分布如下表:
分数段
[0,80)
[80,90)
[90,100)
人数
2
5
6
分数段
[100,110)
[110,120)
[120,130)
人数
8
12
6
分数段
[130,140)
[140,150)
人数
4
2
那么分数在[100,110)中的频率和分数不满110分的累积频率分别是_____、_______.(精确到0.01)
【难度】★★
【答案】0.18、0.47
【巩固训练】
年收入范围(万元)
频率
HYPERLINK
"http://www.zxsx.com"
HYPERLINK
"http://www.zxsx.com"
0.60
HYPERLINK
"http://www.zxsx.com"
0.25
HYPERLINK
"http://www.zxsx.com"
0.15
1.已知某企业职工年收入的频率分布如表所示,
试估计该企业职工的平均年收入为__
____.(万元)
【难度】★★
【答案】5.1
2.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如下图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则b的值为_____.
【难度】★★
【答案】78
3.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为
.
【难度】★★
【答案】0.9h
4.气象意义上从春季进入夏季的标志为:“连续天的日平均温度均不低于22
(0C)”.现有甲、乙、丙三地连续天的日平均温度的记录数据(记录数据都是正整数):
①
甲地:个数据的中位数为,众数为;
②
乙地:个数据的中位数为,总体均值为;
③
丙地:个数据中有一个数据是,总体均值为,总体方差为;
则肯定进入夏季的地区有
(
)
.
个
个
个
.个
【难度】★★
【答案】
1.理解总体与样本的概念及关系(用样本的平均值作为总体均值的点估计值,用样本的标准差作为总体标准差的点估计值),理解统计量(平均数、中位数、众数、方差、标准差的意义),并能够熟练利用公式计算。
2.知道随机抽样、系统抽样的含义,重点掌握分层抽样的方法。
1.有甲、乙、丙、丁四人参加广州亚运会某项射击选拔赛的平均成绩依次是8.5、8.8、9.1、9.1,方差依次是1.7、2.1、1.7、2.5,则参加亚运会该项目角逐的最佳人选是
.
【难度】★★
【答案】丙
2.若,,,…,的方差为,则,,,…,的方差为
(
)
A.
B.
C.
D.
【难度】★
【答案】D
3.一组数据为,这组数平均数为10,则方差的最小值为
.
【难度】★★
【答案】
4.某校有学生1400名,从中随机抽出140名,调查他们对某学科是否兴趣,其结果如下:
感兴趣情况
男生
女生
有兴趣
45
25
无兴趣
37
33
估计该校学生中有该学科有兴趣的总人数;
分别估计该校女生与男生对该学科无兴趣人数.
【难度】★★
【答案】(1),所以估计该校有700名学生对该学科有兴趣;
(2)
所以估计该校有370名男生和330名女生对该学科无兴趣。
5.某校选修篮球课程的学生中,高一学生有名,高二学生有名,现用分层抽样的方法在这名学生中抽取一个样本,已知在高一学生中抽取了人,则在高二学生中应抽取__________人.
【难度】★★
【答案】8
6.某学校高一、高二、高三共有2400名学生,为了调查学生的课余学习情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知高一有820名学生,高二有780名学生,则在该学校的高三应抽取____________名学生.
【难度】★★
【答案】40
7.某球队在校际联赛的九场篮球赛中,得分较高的1号和5号球员各场得分情况如下:
1号
21
19
26
23
28
26
27
25
27
2号
21
20
17
32
19
30
24
29
30
假定两人上场比赛时间相同,则最佳得分手为
.
【难度】★★
【答案】比较两人的方差的大小,取小的方差的选手为1号。
8.一个调查机构就某地居民的月收入调查
了10000人,将所得数据分成如下六组:
相应的频率分布直方图如图所示.若按月
收入将这10000人也分成上述六组,并通
过分层抽样抽出100人作进一步调查,则
这一组中应抽出
人.
【难度】★★
【答案】15
9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”
.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是(
)
.甲地:总体均值为3,中位数为4;
.乙地:总体均值为1,总体方差大于0;
.丙地:中位数为2,众数为3
.丁地:总体均值为2,总体方差为3.
【难度】★★★
【答案】
【解析】不一定,因为总体均值和中位数并不能保证某一天新增疑似病例不超过7人;
也不一定,虽然总体均值很小,但方差大于0这一条件并不能对每天的新增疑似病例数有任何限制;(如前9天都是0,而最后一天则出现了10个疑似病例.)
也不一定,中位数只对列于前面的五、六个数字有所限制,众数也只表示出现的次数较多,并没有保证另外有一个特别大的数字;
设第天新增疑似病例数为,则由方差的计算公式得,由此得,于是(因为整数),所以.即每天新增疑似病例不超过7人.故为正确的选项.
10.从总体中抽取的一个样本中共有五个个体,其值分别为,若该样本的平均值为1,则总体方差的点估计值等于( )
A.
B.
C.
D.
【难度】★★★
【答案】A
知识梳理
例题解析
频率/组距
元
0.037
0.023
0.01
10
20
30
40
50
0.3
0.1
4.3
4.4
4.5
4.6
4.7
4.8
4.9
5.0
5.1
5.2
视力
反思总结
课后练习
月收入(元)
eq
\f(频率,组距)
21世纪教育网
www.21cnjy.com
精品试卷·第
2
页
(共
2
页)
HYPERLINK
"http://www.21cnjy.com/"
21世纪教育网(www.21cnjy.com)