(共39张PPT)
4.2 分层随机抽样的均值与方差
4.3 百分位数
自主预习·新知导学
合作探究·释疑解惑
易
错
辨
析
随
堂
练
习
课标定位
素养阐释
1.通过实例理解分层随机抽样的平均数和方差.
2.抽象概括分层随机抽样的平均数和方差公式.
3.理解p分位数的意义,并会求解p分位数.
4.培养数学抽象素养,提升数学运算素养.
自主预习·新知导学
一、分层随机抽样的平均数
【问题思考】
1.某工厂加工一批工艺品,熟练工人日平均加工100个,学徒日平均加工40个.
提示:(1)不能.
(2)不合理,由于熟练工人与学徒所占比例不同,故上述计算方法不合理.
3.对于一般情况下,分层随机抽样的平均数怎样求?
二、分层随机抽样的方差
【问题思考】
分层随机抽样的方差是什么?
三、百分位数
【问题思考】
1.总体的中位数有什么样的特点?
提示:总体数据中的任意一个数小于或等于它的可能性是50%,因此也称中位数是50%分位数.
2.总体的25%分位数有什么样的特点?
提示:总体数据中的任意一个数小于或等于它的可能性是25%.
3.常用的百分位数有哪些?
提示:1%,5%,10%,25%,50%,75%,90%,95%,99%.
4.填空:(1)一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p.
(2)25%,50%,75%分位数是三个常用的百分位数.把总体数据按照从小到大排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是
.因此这三个百分位数也称为总体的四分位数.
5.计算一组n个数据的p分位数的一般步骤是什么?
提示:第一步,按照从小到大排列原始数据;
第二步,计算i=np;
第三步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
【思考辨析】
判断下列说法是否正确,正确的在它后面的括号里画“√”,错误的画“×”.
(1)在分层随机抽样中,仅知样本中每层的平均数,无法得到样本的平均数.(
√
)
(2)一组数据有80个,按从小到大排序,第80百分位数为第64项数据.(
×
)
(3)在频率分布直方图中,样本数据的80%分位数即由小到大分组的累计频率为0.8对应的数据.(
√
)
(4)百分位数用于描述一组数据某一百分位置的水平.(
√
)
合作探究·释疑解惑
探究一
探究二
探究三
探究一
分层随机抽样的平均数与方差
【例1】
某风景区对5个旅游景点的门票价格进行了调整,据统计,调价前后各景点的游客人数基本不变,有关数据如下表:
(1)该风景区称调整后这5个景点门票的平均收费不变,平均日总收入持平,问:风景区是怎样计算的?
(2)另一方面,游客认为调整收费后风景区的平均日收入相对于调价前,实际上增加了约9.4%,问:游客是怎样计算的?
(3)你认为风景区和游客哪一种说法较能反映整体实际?
平均数=各层平均数×比重,然后求和.
【变式训练1】
为了解我国13岁男孩的平均身高(单位:m),从北方抽取了300名男孩,平均身高1.60
m;从南方抽取了200名男孩,平均身高1.5
m,由此可推断我国13岁男孩的平均身高为( )
A.1.54
m
B.1.55
m
C.1.56
m
D.1.57
m
答案:C
探究二
用分层随机抽样的数字特征估计总体的数字特征
【例2】
某高校欲了解在校学生用于课外进修(如各种考证辅导班、外语辅导班等)的开支,在全校8
000名学生中用分层随机抽样方法抽取了一个200人的样本,根据统计,本科生人数为全校学生数的70%,调查最近一个学期课外进修支出(单位:元)的结果如下:
试估计全校学生用于课外进修的平均开支和开支的方差.
由于分层随机抽样,故可以估计全校学生用于课外进修的平均开支为276.2元,开支的方差为1
484.76.
【变式训练2】
某地区有高中生7
200人,初中生11
800人,小学生12
000人.当地教育部门为了了解本地区中小学生的近视率,决定采用分层随机抽样的方法,按高中生、初中生、小学生进行分层,得到高中生、初中生、小学生的近视率分别为80%,70%和36%.
(1)如果总样本量为310,那么在高中生、初中生、小学生中分别抽取了多少人?在这种情况下,请估计该地区全体中小学生的近视率.
(2)如果从高中生、初中生、小学生中抽取的样本量分别为60,100和150,那么在这种情况下,抽取的样本的近视率是多少?该地区全体中小学生的近视率约为多少?
在分层随机抽样中,我们用样本平均数估计总体平均数,
所以可以估计该地区全体中小学生的近视率为59%.
即抽取的样本的近视率约为55%;该地区全体中小学生的近视率约为59%.
探究三
百分位数在具体数据中的应用
【例3】
某中学从高一年级中抽取了30名男生,测量其体重数据(单位:kg)如下:
62 60 59 59 59 58 58 57 57 57
56 56 56 56 56 56 55 55 55 54
54 54 53 53 52 52 51 50 49 48
(1)求这30名男生体重的25%,75%分位数;
(2)估计该校高一男生体重的80%分位数.
解:将样本数据按从小到大排序,可得
48 49 50 51 52 52 53 53 54 54
54 55 55 55 56 56 56 56 56 56
57 57 57 58 58 59 59 59 60 62
(1)由25%×30=7.5,75%×30=22.5,可知这组数据的25%,75%分位数分别是第8,23项数据,从而得到25%分位数为53
kg,75%分位数为57
kg.
(2)由80%×30=24,可知80%分位数为第24项与第25项数据的平均数,
据此可以估计该校高一男生体重的80%分位数为58
kg.
计算一组n个数据的p分位数的一般步骤:
(1)按照从小到大排列原始数据;
(2)计算i=np;
(3)若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
易
错
辨
析
对求p分位数的步骤不明确而致误
【典例】
从某城市随机抽取14台自动售货机,对其销售额进行统计,数据如下:
8,8,10,12,22,23,20,23,32,34,31,34,42,43.
则这14台自动售货机的销售额的50%,80%分位数分别为 , .?
错解
因为14×50%=7,14×80%=11.2≈11,所以50%,80%分位数分别是第7,11项,分别为20,31.
答案
20 31
以上解答过程中都有哪些错误?出错的原因是什么?你如何改正?你如何防范?
提示:上述错解有3处错误,第一,没有把数据按从小到大排序;第二,14×50%=7,为整数,此百分位数应为第7项和第8项数据的平均数;第三,14×80%=11.2,不能四舍五入,此百分位数应取第12项数据.
正解:把14台自动售货机的销售额按从小到大排序,得8,8,10,12,20,22,23,23,31,32,34,34,42,43.
因为14×50%=7,14×80%=11.2,所以50%分位数是第7项和第8项数据的平均数,即
×(23+23)=23,80%分位数是第12项数据34.
答案:23 34
1.明确求p分位数的步骤.
2.注意np的值是整数和非整数时的百分位数的取值情况.
【变式训练】
已知一组数据4.3,6.5,7.8,6.2,9.6,15.9,7.6,
8.1,10,12.3,11,3,则这组数据的75%分位数是 .?
解析:把数据从小到大排序,得3,4.3,6.2,6.5,7.6,7.8,8.1,9.6,10,11,
12.3,15.9,共有12个数.
因为12×75%=9,所以75%分位数是第9项和第10项数据的平均数,即
(10+11)=10.5.
答案:10.5
随
堂
练
习
1.高一(1)班有10名同学,他们的体重(单位:kg)分别为45,53,47,45,58,50,52,55,48,52,则50%分位数是( )
A.50
B.51
C.52
D.53
答案:B
答案:A
答案:A
3.某校高一学生共有1
200人参加英语测验,已知测验成绩的70%分位数是75分,则测验成绩大于或等于75分的学生人数至少是( )
A.348
B.360
C.372
D.384
解析:成绩大于或等于75分的学生人数占考试总人数的30%,所以至少有1
200×30%=360(名).
答案:B
4.某台机床加工的五批次同规格、同数量的产品中,次品数的频率分布如下表所示.
则次品的平均数为( )
A.1.1
B.3
C.1.5
D.2
答案:A
5.一组样本数据分为甲、乙两组,用分层随机抽样的方法从甲组中抽取6个数,其平均数为10,方差为50;从乙组中抽取4个数,其平均数为15,方差为55,则估计这个样本的平均数为 ,方差为 .?
答案:12 58(共42张PPT)
4.1 样本的数字特征
自主预习·新知导学
合作探究·释疑解惑
易
错
辨
析
随
堂
练
习
课标定位
素养阐释
1.通过实例了解样本的数字特征.
2.理解样本的数字特征从不同角度反映数据特点.
3.会求样本的有关数字特征.
4.体会数学数据统计的过程,培养数学运算和数据分析的学科素养.
自主预习·新知导学
一、样本的数字特征
【问题思考】
1.在初中我们已经学均数、中位数、众数的知识,利用已有知识,回答下列问题:
(1)如果5个数x1,x2,x3,x4,x5的平均数为7,那么x1+1,x2+1,x3+1,
x4+1,x5+1这5个数的平均数是多少?
(2)一组数据12,15,24,25,31,31,31,36,36,37,39,44,49,50的中位数是多少?众数是多少?
2.填空:(1)平均数、中位数、众数.
平均数是指这组数据的平均值.一般地,将这组数据按从小到大的顺序排列后,“中间”的那个数据为这组数据的中位数,它使数据被分成的两部分的数据量是一样的.众数是指这组数据中出现次数最多的数据.在统计中,平均数是最常用的量.但有时候,如数据中个别数据特别大或特别小时,用中位数会更合理.
(2)极差、方差、标准差.
极差和方差都刻画数据的离散程度.极差是数据中最大值和最小值的差,它计算简单,但没有充分利用其他数据.方差刻画的是数据偏离平均数的离散程度,由于方差的单位是原始数据单位的平方,而刻画离散程度的一种理想度量应当具有与原始数据相同的单位.为此,计算方差的算术平方根,得
,称之为标准差.
二、数据分析的素养
【问题思考】
1.分析数据一般从哪几个角度分析?
提示:分析数据一般从平均数和标准差两个方面进行分析.
2.如何根据问题的情境选择不同的决策?
提示:根据问题的实际背景,利用数据的数字特征,可以帮助人们进行决策,从而真正发挥数据分析的作用.值得注意的是,不同的标准没有对和错的问题,也不存在所谓唯一解的问题,而是根据需要来选择“好”的决策,而至于决策的好坏,是根据提出的标准而定的.
三、用样本的数字特征估计总体的数字特征
【问题思考】
1.用样本的数字特征估计总体的数字特征时,如何更好地反映总体信息?
提示:如果抽样的方法比较合理,那么样本可以很好地反映总体的信息.虽然从样本数据得到的数字特征并不是总体真正的数字特征,只是总体数字特征的一个估计,但这种估计是合理的.样本容量越大,样本所包含的总体信息就越多,估计的合理性就越充分.
2.做一做:从甲、乙两种玉米苗中各抽10株,分别测得它们的株高(单位:cm)如下:
甲:25,41,40,37,22,14,19,39,21,42;
乙:27,16,44,27,44,16,40,40,16,40.
问:(1)哪种玉米苗长得高?
(2)哪种玉米苗长得齐?
【思考辨析】
判断下列说法是否正确,正确的在它后面的括号里画“√”,错误的画“×”.
(1)一组数据的众数、中位数、平均数可能相等.(
√
)
(2)一组数据的众数不一定唯一.(
√
)
(3)方差或标准差反映数据的离散程度,方差越小,数据越集中,方差越大,数据越分散.(
√
)
(4)方差和标准差具有相同的单位.(
×
)
(5)数据中的每一个数减去同一个非零常数所得的数据的平均数改变,但方差不变.(
√
)
合作探究·释疑解惑
探究一
探究二
探究三
探究一
众数、中位数、平均数的简单应用
【例1】
某公司33名职工的月工资(单位:元)情况如下表:
(1)求该公司职工月工资的平均数、中位数、众数.
(2)如果董事长的工资从7
500元提升到30
000元,副董事长的工资从7
000元提升到20
000元,那么新数据的平均数、中位数、众数又是多少?(精确到1)
(3)你认为哪个数字特征能更好地反映这个公司职工的工资水平?结合此问题谈一谈你的看法.
(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平.因为公司中少数人的月工资与大多数人的月工资差别较大,这样导致平均数与中位数偏差较大,所以平均数不能很好地反映这个公司员工的工资水平.
1.众数、中位数、平均数都是刻画数据特征的,但任何一个样本数据改变都会引起平均数的改变,而众数、中位数不具有这个性质,所以平均数可以反映出更多的关于样本数据全体的信息,它是样本数据的重心.
2.在样本中出现极端值的情况下,众数、中位数能更好地反映样本数据的平均水平.
【变式训练1】
高一(3)班有男同学27名,女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.
(1)求这次测验全班的平均分(精确到0.01);
(2)估计全班成绩在80分以下(含80分)的同学至少有多少人;
(3)分析男同学的平均分与中位数相差较大的主要原因.
解:(1)利用平均数计算公式得
(2)因为男同学成绩的中位数是75分,
所以至少有14人得分不超过75分.
又因为女同学成绩的中位数是80分,
所以至少有11人得分不超过80分.
所以估计全班至少有25人得分在80分以下(含80分).
(3)男同学的平均分与中位数相差较大,说明男同学的成绩两极分化现象严重,有些男同学得分较高,同时也有一半左右的男同学(至少14人)得分不超过75分.
探究二
利用方差分析数据
【例2】
甲、乙两种冬小麦试验品种连续5年的平均单位面积产量(单位:t/hm2)如下:
根据这组数据判断应该选择哪一种小麦进行推广?
分析:从平均数和方差两个角度去考虑.
平均数和方差是样本的两个重要的数字特征,方差越大,表明数据越分散,相反地,方差越小,表明数据越集中稳定;平均数越大,表明数据的平均水平越高;平均数越小,表明数据的平均水平越低.
【变式训练2】
已知母鸡产蛋的最佳温度在10
℃左右,下面是在甲、乙两地六个时间测得的温度,你认为甲、乙两地哪个更适合母鸡产蛋?
显然两地的平均温度相等,乙地温度的标准差较小,说明了乙地温度波动较小,因此,乙地比甲地更适合母鸡产蛋.
探究三
用样本的数字特征估计总体的数字特征
【例3】
甲、乙两台机床同时加工直径为100
mm的零件,为了检验产品的质量,从两台机床生产的产品中分别随机抽取6件进行测量,测得数据(单位:mm)如下:
甲:99,100,98,100,100,103;
乙:99,100,102,99,100,100.
(1)分别计算上述两组数据的平均数和方差;
(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.
分析:利用平均数与方差公式分别进行计算,并作出判断.
平均数描述了数据的平均水平,定量地反映了数据的集中趋势所处的水平.方差描述了一组数据围绕平均数波动的大小.
【变式训练3】
为了选拔一名同学参加全市中学生射击竞赛,某校对甲、乙两名同学的射击水平进行了测试,两人在相同条件下各射靶10次,统计结果如下:
(2)比较甲、乙两名同学的射击水平,谁的成绩更稳定一些?你认为学校派谁参加竞赛更合适?
易
错
辨
析
方差、标准差混淆而致误
【典例】
从某项综合能力测试中抽取100人的成绩,统计数据如表所示,则这100人成绩的标准差为 .?
以上解答过程中都有哪些错误?出错的原因是什么?你如何改正?你如何防范?
提示:错解中求的是方差,而不是标准差.
1.理解方差的加权形式的计算公式.
2.注意方差和标准差的区别与联系,审清题意.
随
堂
练
习
1.已知一个容量为10的样本,其平均数为5.1,方差为0.2,则估计总体的平均数与方差分别是( )
A.5.1,0.2
B.0.2,0.2
C.5.1,2
D.都不能估计
答案:A
2.设矩形的长为a,宽为b,其比满足
,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取的两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,下列结论正确的是( )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定
解析:计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,
0.613,则甲批次的总体平均数与标准值更接近,故选A.
答案:A
3.甲、乙两人在相同的条件下练习射击,每人打5发子弹,命中的环数如下:
甲:6,8,9,9,8; 乙:10,7,7,7,9.
则两人的射击成绩较稳定的是 .?
答案:甲
4.甲电池厂从某日生产的电池中抽取10个进行寿命(单位:h)测试,得到的数据如下:
30,35,25,25,30,34,26,25,29,21,
则估计该电池的平均寿命为 ,方差为 .?
答案:28
h 17.4
h2
5.下面是甲、乙两名同学13次考试的成绩(单位:分):
甲:65 71 76 75 81 86 89 88 95 91 94 107 110
乙:79 71 86 83 88 93 99 98 98 103
101 102 114
(1)分别求出这两名同学考试成绩的平均数和标准差;(平均数精确到1,标准差精确到0.1)
(2)比较这两名同学的成绩,谈谈你的看法.
分析:根据数据,计算平均数,然后求出标准差,最后依据结果比较,可以借助于计算器.
所以甲的学习成绩没有乙的学习成绩好,也没有乙的学习成绩稳定.(共48张PPT)
§3 用样本估计总体分布
自主预习·新知导学
合作探究·释疑解惑
易
错
辨
析
随
堂
练
习
课标定位
素养阐释
1.通过实例了解频数和频率的区别与联系.
2.理解频数、频率在实际问题中如何反映总体.
3.在表示样本数据的过程中,通过实例学会列频率分布表,画频率分布直方图、频率折线图,并体会它们各自的特点.
4.在解决统计实际问题的过程中,体会样本估计总体的思想.
5.培养数学运算、数学建模的学科素养.
自主预习·新知导学
一、频数和频率
【问题思考】
1.阅读下面情境问题,并回答问题.
情境1,某校高一年级学生今天缺勤12人.
情境2,某校高一年级学生今天的缺勤率为1%.
(1)在上述两种情境中,分别从哪个角度来刻画缺勤情况?
(2)频数和频率的区别与联系是什么?
提示:(1)情境1是用频数作为指标来刻画.
情境2是用频率作为指标来刻画.
(2)频数是指一种情况中出现的数量,频率是频数与总数的比值.频数和频率都是用来刻画样本和总体之间的关系,因为总体的数量不同,所以仅用频数来刻画是不够的,用频率能更好地反映样本和总体的相应特征.
2.填空:(1)频率表示频数与总数的比值,能更好地反映样本和总体的相应特征.
(2)频率反映了相对总数而言的相对强度,其所携带的总体信息远超过频数.在实际问题中,如果总体容量比较小,频数也可以较客观地反映总体分布;当总体容量较大时,频率就更能客观地反映总体分布.
3.在统计中,频率有怎样的用途?
提示:在统计中,经常要用样本数据的频率去估计总体中相应的频率,即对总体分布进行估计.
二、频率分布直方图
【问题思考】
1.将一定数量的数据,按从小到大的顺序分组后,如何更直观、形象地来描述它们的分布?
提示:用频率分布直方图来描述.
2.填空:图中每个矩形的底边长是该组的组距,每个小矩形的高是该组的频率与组距的比,从而每个小矩形的面积等于该组的频率,即每个小矩形的面积=组距×
=频率,我们把这样的图叫作频率分布直方图.
频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.
3.频率分布直方图的好处在于什么?
提示:首先,能清楚直观地显示各组频率分布情况及各组频率之间的差别;其次,当考虑数据落在若干个组内的频率之和时,可以用相应的矩形面积之和来表示.
4.画频率分布直方图的步骤是什么?
提示:(1)计算极差;
(2)确定组距与组数;
(3)分组;
(4)列表;
(5)画频率分布直方图.
5.做一做:取100个数据,按从小到大的顺序分成8个组,如下表:
则第6组的频率为( )
A.0.14
B.14
C.0.15
D.15
解析:由题意可得第6组的频数为100-9-14-14-13-12-13-10=15,
答案:C
三、频率分布折线图
【问题思考】
1.填空:
(1)定义:在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
(2)作用:有时也用它来估计总体的分布情况.
2.样本容量的大小与估计总体的分布有什么关系?
提示:一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确.
3.随着样本容量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图会怎样?
提示:越来越接近于一条光滑曲线.
4.是不是样本容量越大就越好?
提示:样本容量越大,工作量就越大,所以实际问题中,一般根据不同的情况,选择适当的样本容量.
【思考辨析】
判断下列说法是否正确,正确的在它后面的括号里画“√”,错误的画“×”.
(1)频率分布直方图的组数越多,越能看出总体数据的分布特点.(
×
)
(2)频率分布直方图中小长方形的高度就是对应组的频率.
(
×
)
(3)同一组数据,组数不同,得到的频率分布直方图的形状也不同.(
√
)
(4)频率分布直方图中的所有小矩形的面积之和等于1.(
√
)
(5)频率分布表和频率分布直方图之间有密切关系,它们是相同数据的两种不同表达方式.(
√
)
合作探究·释疑解惑
探究一
探究二
探究三
探究一
画频率分布直方图
【例1】
某中学同年级40名男生的体重数据(单位:kg)如下:
61 60 59 59 59 58 58 57 57 57
57 56 56 56 56 56 56 56 55 55
55 55 54 54 54 54 53 53 52 52
52 52 52 51 51 51 50 50 49 48
列出样本的频率分布表;画出频率分布直方图.
分析:画频率分布直方图的一般步骤:算极差,确定组距,分组,列频率分布表,画频率分布直方图.
解:(1)计算极差:61-48=13.
所以,共分成7组.
(3)分组:使分组端点比数据多一位小数,并把第1组的分组端点减小0.5,即分成如下7组:
[47.5,49.5),[49.5,51.5),…,[59.5,61.5].
(4)列频率分布表如下:
(5)画出频率分布直方图.
1.组数的确定方法是:当数据在120个以内时,通常按照数据的多少分成5组~12组.
2.分组方法是:若数据为整数,则分组端点减去0.5;若数据的小数点后有一位数,则分组端点减去0.05,以此类推.
【变式训练1】
有一个容量为200的样本,数据的分组以及各组的频数如下:
[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;
[5,10),41;[10,15),20;[15,20],17.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)求样本数据小于0的频率.
解:(1)频率分布表如下:
(2)频率分布直方图如图所示.
?
(3)样本数据小于0的频率为0.035+0.055+0.075+0.200=0.365.
探究二
频率分布直方图的应用
【例2】
为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出的频率分布直方图如图所示,图中从左到右各小矩形面积之比为2∶4∶17∶15∶9∶3,已知第二分组的频数为12.
(1)第二分组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率.
分析:小矩形面积比已知,而各小矩形面积之和为1,故可求得各小矩形的面积,即频率.由第二小组的频数为12,可得样本容量.通过面积之比可求得达标率.
【变式训练2】
某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重数据(单位:g)绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100
g的个数是36,则样本中产品净重大于或等于98
g并且小于104
g的个数是( )
?
A.90
B.75
C.60
D.45
解析:产品净重小于100
g的频率为(0.050+0.100)×2=0.300.已知样本中产品净重小于100
g的个数是36,设样本容量为n,则
,可得n=120.
产品净重大于或等于98
g并且小于104
g的频率为(0.100+0.150+0.125)×2=0.75,所以样本中产品净重大于或等于98
g并且小于104
g的个数是120×0.75=90.故选A.
答案:A
探究三
频率折线图
【例3】
已知50个样本数据的分组以及各组的频数如下:
[153.5,155.5),2
[161.5,163.5),10
[155.5,157.5),7
[163.5,165.5),6
[157.5,159.5),9
[165.5,167.5),4
[159.5,161.5),11
[167.5,169.5],1
(1)列出频率分布表;
(2)画出频率分布直方图和频率折线图.
分析:此题按照频率分布直方图、频率折线图的绘制步骤解决即可.
解:(1)频率分布表如下:
(2)频率分布直方图和频率折线图如图所示.
【变式训练3】
为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:
[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;
[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;
[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2.
(1)列出频率分布表;
(2)画出频率分布直方图以及频率折线图;
(3)根据上述图表,估计数据落在区间[10.95,11.35)内的可能性是百分之几.
解:(1)频率分布表如下:
(2)频率分布直方图及频率折线图如图所示.
?
(3)由上述图表可知,数据落在区间[10.95,11.35)内的频率为0.13+0.16+0.26+0.20=0.75=75%,即数据落在区间[10.95,11.35)内的可能性是75%.
易
错
辨
析
将矩形的高看作频率致误
【典例】
为了解新生儿的体重(单位:g),将所得数据整理后,画出了频率分布直方图,如图所示.新生儿体重在区间
[2
700,3
000)内的频率为 .?
错解
观察可知,新生儿体重在区间[2
700,3
000)内的频率为0.001.
答案
0.001
以上解答过程中都有哪些错误?出错的原因是什么?你如何改正?你如何防范?
提示:频率分布直方图中矩形的高是该组的频率与组距的比,不是频率.
正解:由题图可知,组距=300,
故新生儿体重在区间[2
700,3
000)内的频率为0.001×300=0.3.
答案:0.3
随
堂
练
习
1.关于频率分布直方图中小矩形的高的说法,正确的是( )
A.表示落在该组内的个体在样本中出现的频率
B.表示取某数的频率
C.表示落在该组内的个体数与组距的比值
D.表示落在该组内的个体在样本中出现的频率与组距的比值
答案:D
2.已知样本数据:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,
12,12,则频率为0.3的数据分组是( )
A.[5.5,7.5)
B.[7.5,9.5)
C.[9.5,11.5)
D.[11.5,13.5]
解析:由题意知,样本容量为20.若频率为0.3,则在该组的频数应为20×0.3=6.由数据可知选B.
答案:B
3.某幼儿园对本园“中班”的100名儿童的体重(单位:kg)做了测量,并根据所测量的数据画出了频率分布直方图,如图所示,则体重在区间[18,20)内的儿童人数为( )?
A.15
B.25
C.30
D.75
解析:这100名儿童的体重在区间[18,20)内的频率是0.075×2=0.15,所以体重在区间[18,20)内的儿童人数为100×0.15=15.
答案:A
4.根据部分城市某年6月份的平均气温(单位:℃)数据得到的频率分布直方图,如图所示,其中平均气温的范围是20.5~26.5
℃,样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),
[23.5,24.5),[24.5,25.5),[25.5,26.5].
已知样本中平均气温低于22.5
℃
的城市有11个,则样本中平均气
温不低于25.5
℃的城市个数为
.?
解析:由于组距为1,故样本中平均气温低于22.5
℃的城市的频率为(0.10+0.12)×1=0.22.
因为平均气温低于22.5
℃的城市有11个,
而平均气温不低于25.5
℃的城市的频率为0.18,
所以样本中平均气温不低于25.5
℃的城市个数为50×0.18=9.
答案:9
5.如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:
?
观察图形,回答下列问题:
(1)分数在区间[79.5,89.5)内的频数、频率分别是多少?
(2)估计这次环保知识竞赛的及格率(60分及以上为及格).
解:(1)该组频率为0.025×10=0.25,频数为60×0.25=15.
(2)竞赛的及格率为
0.015×10+0.03×10+0.025×10+0.005×10
=0.75=75%.(共35张PPT)
2.2 分层随机抽样
自主预习·新知导学
合作探究·释疑解惑
随
堂
练
习
课标定位
素养阐释
1.体验试验情景,理解分层随机抽样的概念.
2.掌握用分层随机抽样从总体中抽取样本的方法.
3.理解分层随机抽样的特点.
4.会对分层随机抽样进行相关计算.
5.培养数据分析的数学素养.
自主预习·新知导学
分层随机抽样
【问题思考】
1.某地区有高中生7
100人,初中生10
900人,小学生11
000人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查.
(1)你认为应当怎样抽取样本?为什么?
(2)高中生、初中生、小学生三部分学生都按1%的比例抽取,应各抽取多少人?
提示:(1)应分高中、初中、小学三个层次进行抽取.这样抽取的样本能更好地“代表”总体.
(2)高中生抽取7
100×1%=71(人),
初中生抽取10
900×1%=109(人),
小学生抽取11
000×1%=110(人).
2.填空:将总体按其属性特征分成互不交叉的若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的个体,这种抽样方法通常叫作分层随机抽样.
3.分层随机抽样有什么特点?
提示:①适用于总体由差异明显的几部分组成的情况;
②利用事先掌握的信息,抽取的样本有较好的代表性;
③等可能抽样,每个个体被抽到的可能性相等.
4.分层随机抽样的步骤是什么?
提示:①分层,按某种属性特征将总体分成互不交叉的若干部分(层);
②按所占比例确定每层抽取个体的个数;
③各层分别按简单随机抽样或其他的抽样方法抽取样本;
④综合每层抽样,组成样本.
5.做一做:某社区有500户家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取100户家庭,应采用的抽样方法是( )
A.简单随机抽样
B.分层随机抽样
C.分类抽样
D.使用何种抽样方法都可以
答案:B
【思考辨析】
判断下列说法是否正确,正确的在它后面的括号里画“√”,错误的画“×”.
(1)分层随机抽样适用于总体由差异明显的几部分组成,而层内个体间无明显差异的抽样.(
√
)
(2)在分层随机抽样中,各层抽取的个体数相等.(
×
)
(3)用分层随机抽样的方法,在分层时,每层的各个个体互不交叉,既不重复,又不遗漏.(
√
)
(4)在分层随机抽样中,每个个体被抽到的可能性是相等的,与层数及分层无关.(
√
)
合作探究·释疑解惑
探究一
探究二
探究三
探究一
分层随机抽样中的有关计算
【例1】
某学校有老师200人,男学生1
200人,女学生1
000人.现用分层随机抽样的方法从所有师生中抽取n人,已知从女学生中抽取80人,则n= .?
分析:根据分层随机抽样的特点进行分析计算.
解析:此题已经说明是分层随机抽样,需要计算其中对应的比例,再按比例来进一步计算.
答案:192
【变式训练1】
某大学数学系共有本科生1
000人,其中一、二、三、四年级的人数比为4∶3∶2∶1.若用分层随机抽样的方法从所有本科生中抽取200人,则应抽取三年级的学生人数为( )
A.80
B.40
C.60
D.20
解析:由分层随机抽样的特征可设从一、二、三、四年级中抽取的人数分别为4x,3x,2x,x,则4x+3x+2x+x=200,即x=20.所以应抽取三年级的学生人数为2x=20×2=40.
答案:B
探究二
分层随机抽样抽取样本
【例2】
某单位有2
000名职工,老年职工、中年职工、青年职工分布在管理、技术开发、营销、生产各部门中,如下表所示.
(1)若要抽取40人调查身体状况,应怎样抽取?
(2)若要开一个25人的座谈会,讨论单位发展和薪金调整方面的内容,应怎样抽取参会人?
审题的关键有两点:
(1)对图表中的人员分类情况和数据要审视清楚;
(2)对样本的功能要审视准确.
【变式训练2】
某校老年、中年和青年教师的人数见下表,若采用分层随机抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )
A.90
B.100
C.180
D.300
答案:C
探究三
分层随机抽样的应用
【例3】
某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12
000,其中持各种态度的人数如下表所示.
电视台为了进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应怎样进行抽样?
分析:人数多,差异大→分层随机抽样→确定每层抽取的比例→在各层中分别抽取→合在一起得样本
在分层随机抽样的过程中,为了保证每个个体被抽到的可能性是相等的,要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比.
【变式训练3】
有120件产品,其中一级品有24件,二级品有36件,三级品有60件,用分层随机抽样的方法从中抽取20件,试说明这种抽样方法是公平的.
解:因为一级品、二级品、三级品的数量之比为24∶36∶60
=2∶3∶5,所以应分别从一级品、二级品、三级品中抽取:
120件产品采用分层随机抽样的方法抽取20件,每件产品被抽到的可能性相等,所以这种抽样方法是公平的.
随
堂
练
习
1.已知某单位有职工120人,男职工有90人,现采用分层随机抽样(按男、女分层)抽取一个样本,若已知样本中有27名男职工,则样本容量为( )
A.30
B.36
C.40
D.无法确定
答案:B
2.某学校高一、高二、高三三个年级共有学生3
500人,其中高三学生人数是高一学生人数的两倍,高二学生人数比高一学生人数多300.现在按
的抽样比用分层随机抽样的方法抽取一部分学生,则应抽取高一年级学生人数为( )
A.8
B.11
C.16
D.10
解析:设高一学生人数为x,则高三学生人数为2x,高二学生人数为x+300,所以有x+2x+x+300=3
500,解得x=800,即高一学生人数为800,因此应抽取高一学生人数为
答案:A
3.一个单位有职工120人,其中业务人员60人,管理人员40人,后勤人员20人.为了了解三个部门职工的工作情况,要从中抽取24人,若用分层随机抽样的方法抽取,则应抽取的管理人员人数为( )
A.4
B.12
C.5
D.8
答案:D
4.某学院A,B,C三个专业共有1
200名学生,为了调查这些学生勤工俭学的情况,拟采用分层随机抽样的方法抽取120人.已知该学院的A专业有380名学生,B专业有420名学生,则从该学院的C专业应抽取 名学生.?
答案:40
5.某学校有在编人员200人,其中行政人员20人,教师140人,后勤人员40人.教育部门为了解学校职工对学校机构改革的意见,要从中抽取20人,试确定用何种方法抽样,并写出抽样过程.
分析:因为不同部门的人对机构改革有不同意见,因此可选用分层随机抽样,按分层随机抽样的方法步骤进行即可.(共38张PPT)
2.1 简单随机抽样
自主预习·新知导学
合作探究·释疑解惑
易
错
辨
析
随
堂
练
习
课标定位
素养阐释
1.通过实例了解抽样方法.
2.理解简单随机抽样产生的背景.
3.掌握简单随机抽样的常见方法:抽签法和随机数法.
4.掌握抽签法和随机数法的区别与联系.
5.通过抽样培养数据分析的学科素养.
自主预习·新知导学
一、简单随机抽样
【问题思考】
1.有20台型号相同的电脑,需要抽取2台进行质量检验,采用哪种抽样方法较为合适?
提示:简单随机抽样.
2.填空:(1)在抽样调查中,每个个体被抽到的可能性均相同的抽样方法,称为随机抽样.
(2)一般地,从N(N为正整数)个不同个体构成的总体中,逐个不放回地抽取n(1≤n简单随机抽样.
3.常用的简单随机抽样方法有哪些?
提示:抽签法和随机数法.
4.简单随机抽样的特点是什么?
提示:①总体个体数有限:简单随机抽样要求被抽取样本的总体个体数有限,这样便于通过样本对总体进行分析.
②逐个抽取:简单随机抽样是从总体中逐个进行抽取,这样便于实际操作.
③无放回抽样:简单随机抽样是一种无放回抽样,这样便于样本的获取和一些相关的计算.
④等可能抽样:不仅每次从总体中抽取一个个体时各个个体被抽取的可能性相等,而且在整个抽样过程当中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.
5.做一做:下列抽样方法是简单随机抽样的是( )
A.从50个零件中一次性抽取5个做质量检验
B.从50个零件中拿出指定的5个做质量检验
C.从实数集中逐个抽取10个数分析奇偶性
D.运动员从8个跑道中随机地抽取1个跑道
解析:选项A错在“一次性”抽取;选项B错在“指定的”抽取;选项C错在总体的容量无限;由简单随机抽样的定义知选项D是.
答案:D
二、抽签法
【问题思考】
1.抽签法的实施步骤是什么?
提示:(1)给总体中的每个个体编号;(2)抽签.
2.填空:先把总体中的N(N为正整数)个个体编号,并把编号依次分别写在形状、大小相同的签上(签可以是纸条、卡片或小球等),再将这些号签放在同一个不透明的箱子里搅拌均匀.每次随机地从中抽取一个,然后将箱中余下的号签搅拌均匀,再进行下一次抽取.如此下去,直至抽到预先设定的样本容量.
3.怎样保证抽签的公平性?
提示:将号签搅拌均匀.
4.做一做:下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3
000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3
000件产品中抽取10件进行质量检验
答案:B
三、随机数法
【问题思考】
1.什么是随机数法?
提示:先把总体中的N(N为正整数)个个体依次编码为0,1,…,
N-1,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生0,1,…,N-1中的随机数,产生的随机数是几,就选第几号个体,直至选到预先设定的样本容量.
2.用随机数表进行抽样的步骤是什么?
提示:(1)给总体中的每个个体编号;
(2)在随机数表中随机抽取某行某列作为抽样的起点,并规定读取方向;
(3)依次从随机数表中抽取样本号码,凡是抽到编号范围内的号码,就是样本的号码,并剔除相同的号码,直至抽满为止.
3.在利用随机数表抽取样本时,应注意的问题是什么?
提示:(1)随机地选定开始读取的数字后,读数的方向可以向右,也可以向左、向上或向下.
(2)在位数少的数前添加“0”,凑齐位数,如1,2,…,10可调整为01,02,…,10,为减少位数也可以减1添0,如1,2,…,10可调整为0,1,2,…,9.
4.做一做:某班有51名学生,学号从00到50,数学老师在上统计课时,运用随机数法抽取5名学生提问,老师首先选定随机数表中的第21行第29列数字9开始,然后横向自左向右依次读取两个数字.如果不在50以内或与前面所取数字相同则跳过去,那么被提问的5名学生的学号是 .?
(注:以下是随机数表的第21行和第22行)
第21行:9312 4779 5737 8918 4550 3994 5573 9229
第22行:6111 6098 0965 7352 6847 3034 9977 3770
答案:29,11,09,47,30
【思考辨析】
判断下列说法是否正确,正确的在它后面的括号里画“√”,错误的画“×”.
(1)简单随机抽样是一种简单、基本、不放回的抽样方法.
(
√
)
(2)抓阄法是实际中常用的抽签方法,简单易操作.(
√
)
(3)简单随机抽样适用于总体容量较小,个体没有明显差异的抽样.(
√
)
(4)随机数法是利用转盘、摸球、随机数表或计算机等产生的随机数进行抽样.(
√
)
(5)利用随机数表进行抽样时,当选定第一个随机数后,读数的方向只能按一个方向.(
×
)
合作探究·释疑解惑
探究一
探究二
探究一
简单随机抽样的判断
【例1】
下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)仓库中有1万支铅笔,从中一次性抽取100支铅笔进行质量检查;
(3)某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴某地参加抗震救灾工作;
(4)某彩民选号,从装有36个大小、形状都相同的号签的盒子中不放回地逐个抽出6个号签.
分析:先逐个判断抽样的特点,再与简单随机抽样的定义比较得出结论.
解:(1)不是简单随机抽样.因为简单随机抽样要求被抽取样本的总体的个体数是有限的.
(2)不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.
(3)不是简单随机抽样.虽然这50名官兵是从中挑选出来的,但是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.
(4)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.
要判断所给的抽样方法是不是简单随机抽样,关键是看它们是不是符合简单随机抽样的定义以及简单随机抽样的几个特点.
【变式训练1】
4个人打牌时,将洗好的扑克牌随机确定一张为起始牌,再按次序发牌,对打牌的4个人来说,都是从52张牌(除去大、小王)中抽取13张牌,问这种抽样方法是不是简单随机抽样?为什么?
解:不是.因为简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始牌,其他各张牌虽然是逐张发牌,但是各张在谁手里已经被确定,所以不是简单随机抽样.
探究二
抽样方法的选择
【例2】
选择合适的抽样方法抽样,并写出抽样过程.
(1)从甲厂生产的30个篮球(其中一箱20个,另一箱10个)中抽取3个;
(2)从甲厂生产的300个篮球中,抽取10个.
解:(1)总体容量较小,用抽签法.
第一步:将30个篮球编号,编号为00,01,…,29.
第二步:将以上30个编号依次分别写在大小、形状、质地完全相同的小纸条上,揉成小球,制成号签.
第三步:把所有号签放在一个不透明的箱子里搅拌均匀.
第四步:依次从箱子里随机抽取三个号签,并记录上面的号码.
第五步:找出与这3个号码对应的篮球,即可得到样本.
(2)总体容量较大,样本容量较小,适合用随机数法.
第一步:将300个篮球进行编号,编号为000,001,…,299.
第二步:利用教材P153提供的随机数表随机地确定一个数作为开始数字.如从表中第10行第11列的数字9开始,任选一个方向作为读数方向,如横向自左向右,依次读取三个数字.凡不在000~299范围内的不读取,重复的不读取.
第三步:根据上述原则,依次可以得到198,106,192,202,139,207,170,050,025,078这10个号码,这就是所要抽取的10个样本个体的号码.
第四步:找出与这10个号码对应的篮球,即可得到样本.
1.一个抽样试验能不能用抽签法,关键看两点:一是制签是不是方便;二是号签是不是容易被搅匀.一般地,当总体容量和样本容量都较小时适合用抽签法.
2.利用随机数表抽取样本时,关键是事先确定以表中的哪个数(哪行哪列)作为起点以及读数的方向.同时,读数时结合编号特点进行读取,若编号为两位数,则两位两位地读取;若编号为三位数,则三位三位地读取,若出现重号则跳过,接着读取.
【变式训练2】
选择合适的抽样方法抽样,并写出抽样过程.
(1)某单位支援西部开发,现从报名的18名志愿者中随机选取6人组成志愿小组到西藏工作3年;
(2)现有一批零件,共600个,要从中抽取10个进行质量检查.
解:(1)利用抽签法.
第一步:将18名志愿者编号,编号分别为1,2,…,18;
第二步:将编号依次分别写在18张大小、形状、质地相同的纸条上,揉成小球,制成号签;
第三步:将所有号签放在一个不透明的箱子中搅拌均匀;
第四步:从箱子中逐个随机抽取6个号签,并记录其编号;
第五步:选出与这6个编号对应的志愿者,即可得到样本.
(2)利用随机数法.
第一步:将这批零件编号,编号分别为001,002,…,600;
第二步:在随机数表中任选一数作为开始,任选一方向作为读数方向,比如,选定教材P153随机数表中第5行第2列数字5,横向自左向右读取三个数字,凡不在001~600范围内的不读取,重复的不读取;
第三步:依次可以读取到556,231,243,554,444,526,357,337,091,388;
第四步:将与这10个号码相对应的零件取出就组成了我们所要抽取的样本.
易
错
辨
析
对简单随机抽样的概念不理解致误
【典例】
下列抽取样本的方式是否属于简单随机抽样?如果不是,请说明理由.
(1)从无限多个个体中抽取100个个体作样本;
(2)盒子里共有80个零件,从中抽出5个零件进行质量检验,在进行抽样操作时,从中任意抽出一个零件进行质量检验后再把它放回盒子里.
错解
(1)(2)全为简单随机抽样.
以上解答过程中都有哪些错误?出错的原因是什么?你如何改正?你如何防范?
提示:(1)是从无限多个个体中抽取;(2)是有放回抽取,故(1)(2)均不是简单随机抽样.
正解:(1)不是简单随机抽样.因为被抽取样本的总体的个体数是无限的,而不是有限的.
(2)不是简单随机抽样.因为它是有放回抽取.
理解简单随机抽样概念.
随
堂
练
习
1.关于简单随机抽样的方法,下列说法错误的是( )
A.要求总体的个体数有限
B.从总体中逐个抽取
C.每个个体被抽到的可能性不相等,与先后顺序有关
D.它是一种不放回抽样
答案:C
2.用随机数法从100名学生(男生25人)中抽取20人参加某项活动,某男生被抽到的可能性是( )
答案:C
3.从10个篮球中任取2个,检验其质量,较适合采用的抽样方法为 .(填“抽签法”或“随机数法”)?
答案:抽签法
4.一个布袋中有6个大小、质地完全相同的小球,从中不放回地抽取3个小球.求:
(1)某一指定小球被抽到的可能性;
(2)第三次抽取时,剩余的每个小球被抽到的可能性.(共44张PPT)
§1 获取数据的途径
自主预习·新知导学
合作探究·释疑解惑
易
错
辨
析
随
堂
练
习
课标定位
素养阐释
1.通过实例了解直接获取和间接获取数据的方法.
2.结合实例掌握普查和抽查的区别与联系.
3.理解总体与样本的区别与联系.
4.体会整理数据的过程,提升数据分析的数学素养.
自主预习·新知导学
一、直接获取与间接获取数据
【问题思考】
阅读下面生活中遇到的问题实例,并回答提出的问题.
(1)校园中每天可产生多少可回收垃圾?
(2)食堂有多少人就餐?
(3)城市里车辆有多少?
(4)公共汽车平均每天的载客量是多少?
(5)某旅游旺季有出门旅游意向的人有多少?
1.要回答以上问题,我们先要做什么事情?
提示:要去获取数据.
2.获取数据的方法有哪些?
提示:获取数据的方法有两种:直接获取与间接获取.
3.填空:直接获取是指通过社会调查或观察、试验等途径获取数据.直接获取的数据称为直接数据或一手数据.
间接获取是指借助各种媒介,包括报纸杂志、统计报表和年鉴、广播、电视或互联网等获取数据.间接获取的数据称为间接数据或二手数据.
4.直接获取数据应注意什么?缺点是什么?
提示:直接获取数据应注意数据来源的广泛性、代表性、均衡性.
缺点是如果要获取的数据较多,那么直接获取数据会消耗较多的人力、物力与时间.
5.间接获取数据应注意什么?
提示:(1)对下载的数据进行多方的核实,确保数据的真实性、准确性;
(2)引用间接数据时要注明数据来源,尊重他人的劳动成果,保护他人的知识产权.
二、普查与抽查
【问题思考】
1.在调查过程中,有哪两种获取数据的方法?
提示:有普查和抽查.
2.填空:普查是为了掌握调查对象的整体情况,对全体调查对象进行研究的一种调查方式.很多与国计民生相关的基本数据都需要通过普查的方式获得.
从全体调查对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况.这种抽取一部分对象的调查方式叫作抽样调查,简称抽查.
3.抽查的主要优点是什么?不足之处是什么?
提示:优点:迅速、及时,节约人力、物力和财力.
不足:结果具有不确定性.
4.做一做:下列调查中,调查方式选择最合理的是( )
A.调查“乌金塘水库”的水质情况,采用抽样调查
B.调查一批飞机零件的合格情况,采用抽样调查
C.检验一批进口罐装饮料的防腐剂含量,采用普查
D.企业招聘人员,对应聘人员进行面试,采用抽样调查
解析:A项合理;B项中飞机零件每一件都得合格,故用普查;C项中调查具有破坏性,故用抽样调查;D项中应对每一名应聘人员都进行面试,故采用普查.
答案:A
三、总体和样本
【问题思考】
1.某校期末考试后,为了分析该校高一年级1
000名学生的考试成绩,从中随机抽取了100名学生的考试成绩进行调查分析.
(1)在这一情境中,总体是什么?
(2)样本是什么?样本量是多少?
提示:(1)总体是高一年级1
000名学生的考试成绩.
(2)样本是抽取的100名学生的考试成绩.样本量是100.
2.填空:(1)一般地,当问题明确后,调查对象的范围也就随之确定.调查对象的全体称为总体.
(2)在进行抽样调查时,从总体中抽取的部分称为样本,其过程称为抽样,样本中个体的数目称为样本容量,简称样本量.
(3)总体中各类数据的百分比称为总体的分布.
3.如何求总体的分布?
提示:通常总体中的每个个体可以对应成数值,当知道了这些数值在总体中所占的比例(百分比),就知道了总体的分布.
4.在抽样调查中应注意什么?
提示:首先需要确定调查对象,即明确总体.其次,在抽取样本时,要尽可能地使得样本的分布与总体的分布相同.
5.做一做:下列调查所抽取的样本具有代表性的是( )
A.利用当地7月的日平均最高气温值估计当地全年的日平均最高气温
B.为调查某大型企业员工对企业的满意程度,对企业新进员工进行满意度调查
C.利用一块实验水稻田的亩产量估计某地区水稻的实际亩产量
D.为了了解一批洗衣粉的质量情况,从仓库中任意抽取100袋进行检验
答案:D
【思考辨析】
判断下列说法是否正确,正确的在它后面的括号里画“√”,错误的画“×”.
(1)如果需要获取的数据较多,那么用直接获取数据的方法.
(
×
)
(2)引用间接数据时可以不注明数据的来源.(
×
)
(3)在所有调查中,抽样调查要比普查更好.(
×
)
(4)调查某批袋装牛奶(总体)的细菌超标情况,可以用普查.
(
×
)
(5)调查一个班级的学生每天完成家庭作业所需要的时间适合用普查.(
√
)
合作探究·释疑解惑
探究一
探究二
探究三
探究四
探究一
直接获取与间接获取数据
【例1】
请指出下列获取数据的方式是直接获取还是间接获取.
(1)从中华人民共和国教育部网站获取现在初中学生近视的比例;
(2)用问卷调查的方式调查学生对数学的喜爱程度;
(3)通过报纸报道得知,中国教师有30%感觉压力大;
(4)小李同学从网站上查出某旅游旺季有出门意向的人数.
解:(1)是从中华人民共和国教育部网站获得数据,所以是间接获取;(2)是通过问卷调查的方式获得数据,所以是直接获取;(3)通过报纸报道获得数据是间接获取;(4)从网站上获得数据也是间接获取.
获取数据的方法有两种:直接获取与间接获取.直接获取是指通过社会调查或观察、试验等途径获取数据.间接获取是指借助各种媒介,包括报纸杂志、统计报表和年鉴、
广播、电视或互联网等获取数据.
【变式训练1】
下列关于获取数据的方法,正确的是( )
A.通过问卷调查、试验收集等形式获取的数据是二手数据
B.学校教导处通过问卷调查的形式调查学生听课情况属于间接获取数据
C.引用间接数据时,可以直接引用
D.如果需要获取的数据量比较多,可以恰当地运用间接数据,但要确保数据的真实性、准确性
答案:D
探究二
普查与抽样调查的选择
【例2】
试指出以下情境适合用普查还是抽样调查.
(1)去菜市场买鸡蛋,想知道鸡蛋是否有破损;
(2)去菜市场买韭菜,想知道韭菜是否新鲜;
(3)银行在收进储户现金的时候想知道有没有假钞;
(4)学期临近结束时,英语老师想在课堂上花10
min的时间了解全班54人记忆单词和短语的情况.
分析:普查与抽样调查的区别在于是不是对所有对象进行调查.
解:(1)适合用普查,对于一般家庭而言,每次买的鸡蛋不会很多,逐个检查所需时间不多,且一个鸡蛋破损与否并不能说明其他鸡蛋的破损情况.
(2)适合用抽样调查,因为韭菜较细,每根都查不太可能,且一把韭菜一般都长在相同的生长环境里.
(3)适合用普查,因为一张钞票是否为假钞并不能说明其他钞票的真假情况.
(4)适合用抽样调查,因为每个学期会新学许多单词和短语,且学生较多,要在10
min内检查完,实在太困难,所以老师只能抽取其中的一部分学生来检查.
选择普查和抽样调查的大体标准是:当总体容量很大时,通常是通过科学的抽样方法抽取具有代表性的样本进行抽查;当总体容量较小时,如果所进行的调查没有破坏性,那么可以选择普查,但是,若所进行的调查具有破坏性,无论总体容量是多少,只能选择抽样调查.
选择普查和抽样调查的大体标准是:当总体容量很大时,通常是通过科学的抽样方法抽取具有代表性的样本进行抽查;当总体容量较小时,如果所进行的调查没有破坏性,那么可以选择普查,但是,若所进行的调查具有破坏性,无论总体容量是多少,只能选择抽样调查.
【变式训练2】
在下列问题中为了得到数据应采用普查还是抽样调查?若采用抽样调查,说明原因.
(1)为了买校服,了解每名学生衣服的尺寸;
(2)某养鱼专业户要了解鱼塘中鱼的平均质量;
(3)商检人员在某超市检查出售中的饮料的合格率;
(4)某班拟组织一次春游活动,为了确定春游的地点,向全班同学进行调查.
解:(1)普查.
(2)抽样调查,因为总体容量较大.
(3)抽样调查,调查饮料是否合格会对产品造成一定的破坏.
(4)普查.
探究三
总体和样本
【例3】
为了了解全校240名学生的身高情况,从中抽取40名学生测量其身高,下列说法正确的是( )
A.总体是240
B.个体是每一名学生
C.样本是40名学生
D.总体是全校240名学生的身高
解析:总体是240名学生的身高,所以A项不正确,D项正确;个体是每一名学生的身高,所以B项不正确;样本是40名学生的身高,所以C项不正确.
答案:D
【变式训练3】
为了了解高一年级学生的视力情况,特别是近视率问题,抽测了其中100名学生的视力.在这个过程中,100名学生的视力情况(数据)是( )
A.总体
B.个体
C.样本
D.样本容量
解析:100名学生的视力情况(数据)是从总体中抽取的一部分个体所组成的集合,所以是样本.
答案:C
探究四
设计调查方案
【例4】
你的班主任想全面了解你班学生的学习情况和思想状况,请你帮助班主任设计一个调查方案.
分析:在总体中的对象不是很多的情况下,普查是全面获取信息最可靠的方法.
解:因为一个班的学生人数不是很多,为了帮助班主任全面了解班里学生的学习情况和思想状况,可以采取普查的方法进行调查.先设计一个问卷,包括同学们对学习的各种看法,同学们的爱好、心理和思想状况等,然后发放给每一名学生填写,并全部收回,最后进行统计.这样就可以全面了解每名学生的学习情况和思想状况了.
在进行普查时,一定要注意普查的两个特点:(1)所取得的资料全面、系统;(2)主要调查在特定时段、特定情形下总体的数量.
【变式训练4】
如果要调查你们学校学生的肺活量,你会怎样做?将你的想法写成调查方案,并与同学们交流你的调查方案.
解:方案一:普查.因为各个学校每学期均有体检,所以可利用全校的体检,组织一次普查,将每名学生的体检表收集起来进行统计,最后将数据进行汇总.
方案二:抽样调查.因为有个别学校由于各种原因不能完成体检,所以普查不一定能实现.这时,可以用抽样调查,而全校班级很多,情况也不相同,要得到较准确的数据,可以到学校找出学生的学籍号,每隔一定的人数抽出一名学生进行调查,这样抽出的样本才会有代表性.(答案不唯一)
易
错
辨
析
易错辨析
因对总体、个体、样本的理解不透而致误
【典例】
为了调查参加运动会的1
000名运动员的平均年龄,从中抽取了100名运动员进行调查,下面说法正确的是( )
A.1
000名运动员是总体
B.每名运动员是个体
C.抽取的100名运动员是样本
D.样本容量是100
错解
根据定义,1
000名运动员是总体,所以答案为A.
答案
A
以上解答过程中都有哪些错误?出错的原因是什么?你如何改正?你如何防范?
提示:本题中调查的是运动员的年龄,不是运动员.
正解:根据调查目的可知,总体是这1
000名运动员的年龄,个体是每名运动员的年龄,样本是抽取的100名运动员的年龄,样本容量是100.
答案:D
1.总体是指调查对象的全体,不仅仅是一个数字.
2.样本容量是样本中个体的数目.
随
堂
练
习
1.下面说法错误的是( )
A.某中学数学学习兴趣小组,观察食堂周末就餐人数,比平常食堂就餐人数少三分之一用的是间接获取数据
B.引用间接数据时,要注明数据来源,尊重他人的劳动成果,保护他人的知识产权
C.直接获取数据,虽然具有广泛性、代表性、均衡性,但是会消耗较多的人力、物力和时间
D.学生小张在下午放学阶段,统计在10
min内,通过学校门口的车辆共有324辆是直接获取数据
答案:A
2.若对某校1
200名学生的耐力做调查,抽取其中120名学生,调查他们1
500
m跑步的成绩,得出相应的数值,在这项调查中,样本是指( )
A.120名学生
B.1
200名学生
C.120名学生1
500
m跑步的成绩
D.1
200名学生1
500
m跑步的成绩
答案:C
3.下列调查工作,必须采用抽样调查的是( )
A.调查某城市今年7月的温度变化情况
B.调查某品牌5万包袋装鲜奶是否符合卫生标准
C.调查我国所有城市中哪些是第一批对外开放的沿海城市
D.了解全班50名学生100
m短跑的成绩
答案:B
4.为了了解某地参加计算机水平测试的5
000名学生的成绩,从中抽取了200名学生的成绩进行统计分析,在这个问题中,总体是?
答案:参加计算机水平测试的5
000名学生的成绩
5.为了创建“和谐平安”校园,某校决定在开学前对学校的电灯电路使用情况进行检查,以便排除安全隐患,此检查能否进行普查?为什么?
分析:利用普查的特点进行判断.
解:能.由于一个学校的电灯电路数目不算大,且对创建“和谐平安”校园来说,必须排除任何潜在或已存在的安全隐患,故必须用普查的方式.