《志鸿全优设计》2013-2014学年高中数学北师大版必修三目标导学:第一章 统计(10份,含解析)

文档属性

名称 《志鸿全优设计》2013-2014学年高中数学北师大版必修三目标导学:第一章 统计(10份,含解析)
格式 zip
文件大小 65.7MB
资源类型 教案
版本资源 北师大版
科目 数学
更新时间 2013-09-23 16:18:28

文档简介

§5 用样本估计总体
5.1 估计总体的分布
1.通过实例进一步体会用样本估计总体的意义和作用,在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图,并体会它们各自的特点.
2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,初步体会样本频率分布的随机性.
1.以宽度分组Δxi为底,以各组频率除以Δxi的商为高,分别画成小矩形,小矩形的面积恰为______________,通常这样的图形我们称为__________________.
频率分布直方图中,每个小矩形的面积表示相应组的________,所有小矩形的面积的总和等于______.
频率分布直方图的特征:直观、形象地反映了样本的分布规律;可以清楚地看出数据分布的总体趋势.但是从频率分布直方图得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.
2.在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的________开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条________,我们称之为频率折线图,有时也用它来估计总体的分布情况.
【做一做1】频率分布直方图中,各小矩形面积的和等于(  ).
A.0 B. C.1 D.不确定
【做一做2】在画频率分布直方图时,某组的频数为10,样本容量为50,总体容量为600,则该组的频率是(  ).
A. B.
C. D.不确定
【做一做3】一个容量为20的样本数据,分组后,组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2.则样本在区间(-∞,50]内的频率为______.
1.列频率分布表的步骤是什么?
剖析:(1)计算数据中最大值与最小值的差称为极差,算出极差就知道数据变动的范围.
(2)决定组数与宽度分组Δxi.
(3)决定分点.
(4)列频率分布表,数据落在第i个小组内的个数为频数ni;每小组的频数与数据总数的比值叫做这一小组的频率fi,算出各小组的频率;为画图的方便还需计算出填入表中.
宽度分组(Δxi) 频数(ni) 频率(fi)
频率分布表在数量表示上比较确切,而频率分布直方图比较直观,两者相互补充,使我们对数据的频率分布情况了解得更加清楚.
2.画频率分布直方图要注意什么?
剖析:(1)注意问题:
①频率分布直方图的横轴表示数据,纵轴表示.
②在频率分布直方图中,各小矩形的面积之和等于1.
同样一组数据,分组时组距要相等,每个矩形的高和频率成正比,这点画图时应特别注意.
(2)意义:用图形的面积的大小来表示各区间内取值的频率.
题型一 画频率分布直方图
【例题1】某中学同年级40名男生的体重数据如下(单位:kg):
61 60 59 59 59 58 58 57 57 57
57 56 56 56 56 56 56 56 55 55
55 55 54 54 54 54 53 53 52 52
52 52 52 51 51 51 50 50 49 48
列出样本的频率分布表,画出频率分布直方图.
分析:画频率分布直方图的一般步骤:算极差,找组距,定分点,列频率分布表,画频率分布直方图.
反思:(1)组数的决定方法是:设数据总数目为n,一般地,当n≤50,则分为5组~8组;当50≤n≤100,则分为8组~12组较为合适;
(2)分点的决定方法是:若数据为整数,则分点数据减去0.5;若数据是小数点后一位数,则分点减去0.05,以此类推;
(3)画频率分布直方图中小长方形的高的方法是:假设频数为1的小长方形的高为h,则频数为k的小长方形的高为kh.
题型二 频率分布直方图的应用
【例题2】某工厂对一批产品进行了抽样检测,如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是(  ).
A.90 B.75 C.60 D.45
反思:频率分布直方图的性质:
(1)因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率的大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3)频率=,还要注意此公式的一些变形及应用.
题型三 频率分布折线图
【例题3】已知50个样本数据的分组以及各组的频数如下:
153.5~155.5,2 161.5~163.5,10
155.5~157.5,7 163.5~165.5,6
157.5~159.5,9 165.5~167.5,4
159.5~161.5,11 167.5~169.5,1
(1)列出频率分布表;
(2)画出频率分布直方图和频率分布折线图.
分析:此题按照频率分布直方图的绘制步骤解决即可.
题型四 易错辨析
【例题4】有一个容量为500的样本数据,把它分成7组,它的频率分布直方图如图,根据其频率分布直方图,请你估计数据落在[15.5,24.5)的有________个.
错解:由频率分布直方图可知数据在[15.5,18.5)内的频率为0.054,在[18.5,21.5)内的频率为0.06,在[21.5,24.5)内的频率为0.075,则数据落在[15.5,24.5)内的频率为0.054+0.06+0.075=0.189.
又因为0.189×500=94.5≈95,
所以数据落在[15.5,24.5)内的大约有95个.
错因分析:上面解法的错因就是没有看懂纵坐标所表示的意义,错误地把纵坐标表示的数据看做频率了,其实它表示的是.若要计算频率,则要知道组距为多少,从横坐标中明显可看出组距为3,那么就有频率=×组距.
1当收集到的数据量很大时,比较合适的统计图是(  ).
A.茎叶图 B.频率分布直方图
C.频率分布折线统计图 D.频率分布表
2关于频率分布直方图中小长方形的高的说法,正确的是(  ).
A.表示该组上的个体在样本中出现的频率
B.表示取某数的频率
C.表示该组上的个体数与组距的比值
D.表示该组上的个体在样本中出现的频率与组距的比值
3200辆汽车通过某一段公路时,时速的频率分布直方图如图所示,则时速在[50,70)的汽车大约有(  ).
A.60辆 B.80辆
C.70辆 D.140辆
4(2012浙江名校第一次联考,文13)某班50名学生在一次健康体检中,身高全部介于155 cm与185 cm之间.其身高频率分布直方图如图所示.则该班级中身高在[170,185]之间的学生共有__________人.
5(2011广东汕头期中,16)某校从高一年级期末考试的学生中抽出60名学生,其英语成绩(均为整数)的频率分布直方图如图所示:
(1)估计这次考试的及格率(60分及以上为及格);
(2)估计这次考试的平均分.
答案:
基础知识·梳理
1.相应的频率fi 频率分布直方图 频率 1
2.中点 折线
【做一做1】C
【做一做2】A
【做一做3】0.7 样本在区间(-∞,50]内的频率为=0.7.
典型例题·领悟
【例题1】解:(1)计算最大值与最小值的差:61-48=13.
(2)决定组距与组数,取组距为2,
==6,
所以,共分成7组.
(3)决定分点,使分点比数据多一位小数,并把第1小组的分点减小0.5,即分成如下7组:
47.5~49.5 49.5~51.5 51.5~53.5 53.5~55.5 55.5~57.5 57.5~59.5 59.5~61.5
(4)列出频率分布表如下:
分组 频数 频率
47.5~49.5 2 0.05
49.5~51.5 5 0.125
51.5~53.5 7 0.175
53.5~55.5 8 0.20
55.5~57.5 11 0.275
57.5~59.5 5 0.125
59.5~61.5 2 0.05
合计 40 1.00
(5)画出频率分布直方图(如图所示).
【例题2】A 产品净重小于100克的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n,则=0.300,所以n=120.产品净重大于或等于98克并且小于104克的频率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A.
【例题3】解:(1)频率分布表如下:
分组 频数 频率
153.5~155.5 2 0.04
155.5~157.5 7 0.14
157.5~159.5 9 0.18
159.5~161.5 11 0.22
161.5~163.5 10 0.20
163.5~165.5 6 0.12
165.5~167.5 4 0.08
167.5~169.5 1 0.02
合计 50 1.00
(2)频率分布直方图和频率分布折线图如图所示.
【例题4】正解:由频率分布直方图可知,数据分成7组,其组距为3,所以数据落在[15.5,18.5)内的频率为0.054×3,落在[18.5,21.5)内的频率为0.06×3,落在[21.5,24.5)内的频率为0.075×3,故数据落在[15.5,24.5)内的个数为500×(0.054×3+0.06×3+0.075×3)=283.5≈284.
所以数据落在[15.5,24.5)内的大约有284个.
随堂练习·巩固
1.B 当收集到的数据量很大时,一般用频率分布直方图表示.
2.D 频率分布直方图中小长方形的高是,面积才表示频率.
3.D 时速在[50,70)的频率为(0.03+0.04)×10=0.7,则200辆汽车中时速在[50,70)的汽车大约有0.7×200=140(辆).
4.22
5.解:(1)依题意,60分及以上的分数所在的第三、四、五、六组,频率和为(0.020+0.030+0.025+0.005)×10=0.80,
所以,这次考试的及格率大约是80%.
(2)利用组中值估算抽样学生的平均分:
45·f1+55·f2+65·f3+75·f4+85·f5+95·f6=45×0.05+55×0.15+65×0.2+75×0.3+85×0.25+95×0.05=72.
所以这次考试的平均分约为72分.2.2 分层抽样与系统抽样
1.理解分层抽样与系统抽样的概念.
2.通过对实例的分析,了解分层抽样与系统抽样的方法.
1.分层抽样
(1)定义:将总体按其________分成若干类型(有时称作层),然后在每个类型中按照________随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.
(2)分层抽样的步骤:
①分层:按某种________将总体分成若干部分(层).
②按________确定每层抽取个体的个数.
③各层分别按简单随机抽样或其他的抽样方法抽取样本.
④综合每层抽样,组成样本.
应用分层抽样应遵循以下要求:
(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则,即保证样本结构与总体结构的一致性.
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与该层个体数量的比与样本容量与总体容量的比相等.
(3)当总体个体差异明显时,采用分层抽样.
【做一做1-1】某社区有500户家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本,应采用的抽样方法是(  ).
A.简单随机抽样 B.分层抽样
C.系统抽样 D.分类抽样
【做一做1-2】当前,国家正分批修建经济适用房以解决低收入家庭住房紧张的问题.已知甲、乙、丙三个社区现分别有低收入家庭360户、270户、180户,若第一批经济适用房中有90套住房用于解决这三个社区中90户低收入家庭的住房问题,则应从甲社区中抽取低收入家庭的户数为(  ).
A.40 B.30
C.20 D.36
2.系统抽样
(1)定义:将总体中的个体进行编号,等距分组,在第一组中,按照__________抽取第一个样本,然后按________(称为抽样距)抽取其他样本.这种抽样方法称为系统抽样,有时也叫等距抽样或机械抽样.
(2)注意:编号时要随机编号,否则抽取的样本代表性差.
(3)系统抽样的步骤:
①采用随机抽样的方法将总体中的N个个体________.
②确定分段间隔k(k∈N),将整体按编号进行分段(组).
③在第______段用简单随机抽样确定起始个体的编号l(l∈N,0≤l≤k).
④按照一定的规则抽取样本,通常是将起始编号l______上间隔k得到第2个个体编号l+k,再加上k得到第3个个体编号l+2k,这样继续下去,直到获取整个样本.
系统抽样的特征:
(1)当总体中个体无差异且个体数目较大时,采用系统抽样.
(2)将总体分成均衡的若干部分指的是,将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,间隔一般为k=表示不超过.
(3)预先制定的规则指的是,在第一段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.
【做一做2-1】下列抽样试验中,最适宜用系统抽样法的是(  ).
A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样
B.从某厂生产的2 000个电子元件中随机抽取5个入样
C.从某厂生产的2 000个电子元件中随机抽取200个入样
D.从某厂生产的20个电子元件中随机抽取5个入样
【做一做2-2】一个总体中有1 000个个体,现用系统抽样抽取一个容量为100的样本,则编号后,按从小到大的编号顺序平均分成__________组,每组有__________个个体.
1.系统抽样中如何对总体中的每个个体进行合理分段?
剖析:系统抽样操作的要领是先将个体数较多的总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取1个个体,得到所需样本.由于抽样的间隔相等,因此系统抽样又称为等距抽样(或叫机械抽样),所以系统抽样中必须对总体中的每个个体进行合理(即等距)分段.
若从容量为N的总体中抽取容量为n的样本,用系统抽样时,应先将总体中的各个个体编号,再确定分段间隔k,以便对总体进行分段.
当是整数时,取k=为分段间隔即可,如N=100,n=20,则分段间隔k==5,也就是将100个个体平均每5个分为一段(组).
当不是整数时,应先从总体中随机剔除一些个体,使剩余个体数N′能被n整除,这时分段间隔k=,如N=101,n=20,则应先用简单随机抽样从总体中剔除1个个体,使剩余的总体容量(即100)能被20整除,从而得出分段间隔k==5,也就是说,只需将100个个体平均分为20段(组).
一般地,用简单随机抽样的方法从总体中剔除部分个体,其个数为总体中的个体数除以样本容量所得的余数.
上述过程中,总体中的每个个体被取出(或被剔除)的可能性相等,也就是每个个体不被选取(或不被剔除)的可能性也相等,所以在整个抽样过程中每个个体被抽取的机会仍然都相等,这说明使用系统抽样法抽取样本的过程是公平的.
2.分层抽样中各层入样的个体数应如何确定?
剖析:当总体由差异明显的几部分组成时,应将总体分成互不交叉的几部分,其中所分成的每一部分叫层,然后按照各部分所占的比例,从各部分中独立抽取一定数量的个体,再将各部分抽出的个体合在一起作为样本,这就是分层抽样.
由于层与层之间有明显的区别,而层内个体间差异不明显,为了使样本更能充分地反映总体的情况,抽取样本时,必须照顾到各个层的个体.所以每层中所抽取的个体数应按各层个体数在总体中所占的比例抽取,也就是各层抽取的比例都等于样本容量在总体中的比例,即抽样比=.这样抽取能使所得到的样本结构与总体结构相同,可以提高样本对总体的代表性.
在实际操作时,应先计算出抽样比k=,再按抽样比确定每层需要抽取的个体数:抽样比×该层个体数目=×该层个体数目.
题型一 分层抽样中的计算问题
【例题1】某校共有师生1 600人,其中教师有100人,现用分层抽样的方法,从所有师生中抽取一个容量为80的样本,则抽取的学生数为__________.
反思:一个总体中有m个个体,用分层抽样方法从中抽取一个容量为n(n<m)的样本,某层中含有x(x<m)个个体,在该层中抽取的个体数目为y,则有=y,该等式中含有四个量,已知其中任意三个量,就能求出第四个量.
题型二 分层抽样的应用
【例题2】某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表所示:
很喜爱 喜爱 一般 不喜爱
2 435 4 567 3 926 1 072
电视台为了进一步了解观众的具体想法和意见,打算从中再抽取60人进行更为详细的调查,应怎样进行抽样?
分析:→→→→
反思:在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比.
题型三 为整数的系统抽样问题
【例题3】为了了解某地区今年高一学生期末考试的数学成绩,打算从参加考试的15 000名学生的数学成绩中用系统抽样的方法抽取容量为150的样本,请写出抽取过程.
分析:按照系统抽样的步骤进行.
反思:当总体容量n能被样本容量N整除时,分段间隔k=;当用系统抽样抽取样本时,通常是将起始数s加上间隔k得到第2个个体编号s+k,再加k得到第3个个体编号s+2k,依次进行下去,直到获取整个样本.
题型四 不是整数的系统抽样问题
【例题4】从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.
分析:→→
反思:当总体容量不能被样本容量整除时,可以先从总体中随机剔除几个个体,但要注意的是剔除过程必须是随机的,也就是总体中的每个个体被剔除的机会均等,剔除几个个体后使总体中剩余的个体能被样本容量整除,然后再按系统抽样方法抽取样本.
题型五 易错辨析
【例题5】要从某学校的10 013名学生中抽取100名进行健康检查,采用何种抽样方法较好,并写出过程.
错解:由于总体个数为10 013,数量较大,而且都是学生,差别不大,因而应该采用系统抽样,具体过程如下:由系统抽样的步骤先分为100段,其中前87段每段100人,后13段每段101人,再在第一段中用简单随机抽样确定起始个体编号l;最后将l+100,l+200,…,l+9 913分别抽出得第2,3,…,100组中的编号,从而获得整个样本.
错因分析:上面的解法违背了系统抽样的等距均分原理,抽出的个体不都是处在每段的同一位置上,前87段与后13段各自处的位置不一样,导致抽样的不公平性,所以解法是错误的,必须先要随机地剔除13人.
1下列问题中,最适合用分层抽样抽取样本的是(  ).
A.从10名同学中抽取3人参加座谈会
B.某社区有300户家庭,其中高收入的家庭75户,中等收入的家庭180户,低收入的家庭45户,为了了解生活购买力的某项指标,要从中抽取一个容量为50户的样本
C.从1 000名工人中,抽取100人调查上班途中所用的时间
D.从生产流水线上,抽取样本检查产品质量
2(2011西安市一中月考,1)我校在检查学生作业时,抽出每班学号尾数为5的学生作业进行检查,这里运用的是(  ).
A.分层抽样 B.抽签抽样
C.随机抽样 D.系统抽样
3(2012江苏高考,2)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取__________名学生.
4若总体中含有1 645个个体,采用系统抽样的方法从中抽取容量为35的样本,则编号后确定编号分为__________段,分段间隔k=__________,每段有__________个个体.
5某学校有在编人员200人,其中行政人员20人,教师140人,后勤人员40人,教育部门为了解学校机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽样,并写出抽样过程.
答案:
基础知识·梳理
1.(1)属性特征 所占比例 (2)①特征 ②所占比例
【做一做1-1】B
【做一做1-2】A 抽样比是=,则应从甲社区中抽取低收入家庭的户数为360×=40.
2.(1)简单随机抽样 分组的间隔 (3)①编号 ③一
④加
【做一做2-1】C
【做一做2-2】100 10
典型例题·领悟
【例题1】75 抽样比为=,该校有学生1 600-100=1 500人,则抽取的学生数为1 500×=75.
【例题2】解:采用分层抽样的方法,抽样比为.
“很喜爱”的有2 435人,应抽取2 435×≈12(人);
“喜爱”的有4 567人,应抽取4 567×≈23(人);
“一般”的有3 926人,应抽取3 926×≈20(人);
“不喜爱”的有1 072人,应抽取1 072×≈5(人).
因此,采用分层抽样的方法在“很喜爱”、“喜爱”、“一般”、“不喜爱”的人中分别抽取12人、23人、20人和5人.
【例题3】解:(1)对全体学生的数学成绩进行编号:1,2,3,…,15 000.
(2)分段:由于样本容量与总体容量的比是1∶100,所以我们将总体平均分为150个部分,其中每一部分包括100个个体.
(3)在第一部分即1号到100号用简单随机抽样抽取一个号码,比如是56.
(4)以56作为起始数,再顺次抽取156,256,356,…,14 956,这样就得到一个容量为150的样本.
【例题4】解:由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:
第一步 先从802辆轿车中剔除2辆轿车(剔除方法可用随机数法);
第二步 将余下的800辆轿车编号为1,2,…,800,并均匀分成80段,每段含k==10个个体;
第三步 从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个号(如5)作为起始号;
第四步 从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量为80的样本.
【例题5】正解:由于总体个数为10 013,数量较大,而且都是学生,差别不大,因而应采用系统抽样法,具体过程如下:由系统抽样的步骤可知编号分段时,10 013÷100不为整数,先从总体中随机剔除13人,再按如下步骤操作:
①采用随机的方式将总体中的个体编号为1,2,3,…,10 000;
②把总体分成100段,每段=100人;
③在第一段中用简单随机抽样确定起始个体的编号l;
④将l+100,l+200,…,l+9 900分别抽出得到第2,3,…,100组中的各个编号,从而获得整个样本.
随堂练习·巩固
1.B 2.D
3.15 根据分层抽样的特点,可得高二年级学生人数占学生总人数的,因此在样本中,高二年级的学生所占比例也应该为,故应从高二年级抽取50×=15(名)学生.
4.35 47 47 因为N=1 645,n=35,则编号后确定编号分为35段,且k===47,则分段间隔k=47,每段有47个个体.
5.分析:因为不同部门的人对机构改革有不同意见,因此可选用分层抽样,按分层抽样的方法步骤进行即可.
解:(1)将200人分成行政人员、教师、后勤人员三层.(2)按照=的比例确定各层抽取人数:行政人员:20×=2(人),教师:140×=14(人),后勤人员:40×=4(人).(3)在各层中用简单随机抽样的方法抽取样本.(4)将抽取的20人综合到一起,即得到一个容量为20的样本.§3 统计图表
1.通过实例初步体会分布的意义和作用.
2.在表示数据的过程中,复习几种统计图表(包括条形、扇形、折线统计图),学习茎叶图,体会它们各自的特点和用途.
3.能根据问题的需要选择合适的统计图表,并能用自己的方式进行表示.
统计图表
统计图表是表达和分析________的重要工具,它不仅可以帮助我们从数据中获取有用的信息,还可以帮助我们直观、准确地理解相应的________.统计图表有:________统计图、________统计图、________统计图、茎叶图.
利用科学抽样方法收集了样本数据后,下一步要做的工作就是分析和处理数据,其中较理想的方法是将所得数据进行适当的整理、分析,并转化为直观的图形形式表现出来,以便从中获取相应的信息,帮助我们制定恰当的决策.
1.条形统计图是用____________表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来.其特点是便于看出和比较各种数量的多少,即条形统计图能清楚地表示出每个项目的具体__________.
【做一做1】如图所示是某校八年级学生到校方式的条形统计图,根据图形可得出骑自行车人数占八年级学生总人数的(  ).
A.20% B.30% C.50% D.60%
2.扇形统计图中,用圆面积代表________,圆面中的各个扇形分别代表总体中的不同部分,扇形面积的大小反映____________________.扇形统计图可以很清楚地表示各部分数量同总数之间的关系,即扇形统计图能清楚地表示出各部分在总体中所占的__________.
【做一做2】如图为某校高三(1)班的男女比例图表,已知该班共有学生55人,则该班男生比女生约多(  ).
A.13人 B.21人
C.24人 D.34人
3.折线统计图是用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段顺次连结起来.折线统计图不但可以表示出__________,而且能够清楚地表示__________,即折线统计图能够清晰地反映数据的________情况.
【做一做3】如图是某市5月1日至5月7日每天最高、最低气温的折线统计图,在这7天中,日温差最大的一天是(  ).
A.5月1日 B.5月2日
C.5月3日 D.5月5日
4.茎叶图.
(1)制作方法:将所有两位数的十位数字作为______,个位数字作为______,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).
(2)优点:一是茎叶图上没有________的损失,所有的原始数据都可以从茎叶图中得到;二是茎叶图可以随时________,方便表示与比较.
缺点:当数据量很大或有多组数据时,茎叶图就不那么直观、清晰了.
【做一做4】如图表示8位销售员一个月销售商品数量的茎叶图,则销售数据分别为________________(单位:百件).
如何选择统计图表统计所收集到的数据?
剖析:在统计过程中收集到的数据量较多时,在用统计图表示之前,一般需要先将数据按一定的方式进行整理.在此基础上,再根据不同的需要选择适当的统计图进行表示.
如果只需大致判断一些数据的分布规律,了解数据中各元素所占比例的大小情况可以使用扇形统计图.例如统计一个农村种植的各种农作物的比例.
如果需要根据图表了解各个数据所占的频率可以使用条形统计图.例如统计一批产品中优等品所占频率.
如果要了解数据的增减情况可以采用折线图.例如统计一个人考试成绩变化情况.
如果要了解数据的全部信息可以使用茎叶图.例如篮球比赛的记分.
因此要选择恰当的统计图表直观表达统计的数据,必须把各种统计图表的特点和问题中的需要结合起来,确定选择哪种统计图表.
题型一 条形统计图的应用
【例题1】某班计划开展一些课外活动,全班有40名学生报名参加,他们就乒乓球、足球、跳绳、羽毛球等4项活动的参加人数做了统计,绘制了条形统计图(如图所示),那么参加羽毛球活动的人数的频率是______.
反思:该例题中条形统计图的横轴是分组,纵轴是各组所含的个体数目.
题型二 扇形统计图的应用
【例题2】如图是甲、乙、丙、丁四组人数的扇形统计图的部分结果,根据扇形统计图的情况可以知道丙、丁两组人数和为(  ).
A.250 B.150
C.400 D.300
反思:扇形统计图中各百分比是该组个体数目与总体数目的比,所有组的个体数目之和等于总体数目,所有组的百分比之和等于1.
题型三 折线统计图的应用
【例题3】下表给出了2010年A,B两地的降水量(单位:mm):
1月 2月 3月 4月 5月 6月
A 9.2 4.9 5.4 18.6 38.0 106.3
B 41.4 53.3 178.8 273.5 384.9 432.4
7月 8月 9月 10月 11月 12月
A 54.4 128.9 62.9 73.6 26.2 10.6
B 67.5 228.5 201.4 147.3 28.0 19.1
为了直观表示2010年A,B两地的降水量的差异和变化趋势,请用适当的统计图表示上面的数据.
反思:当两组数据具有可比性时,要想得出两组数据的差异,且能够直观观察出各组数据的分布趋势,常用折线统计图来表示.
题型四 茎叶图的应用
【例题4】某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454;
品种B:363,371,374,383,385,386,391,392,394, 394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.
(1)根据上面数据画出茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
分析:(1)茎是百位和十位,叶是个位;(2)依据茎叶图的优点写出即可;(3)观察出数据的平均水平就是亩产量的近似值,数据分散说明不稳定,数据集中说明稳定.
反思:茎叶图在样本数据较少但较为集中且数据有两位有效数字时比较适用.茎叶图有两个突出的优点,一是统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时随时记录,方便记录和表示.
1当收集到的数据量很大或有多组数据时,需要比较各种数量的多少,用哪种统计图较合适(  ).
A.茎叶图 B.条形统计图
C.折线统计图 D.扇形统计图
2如图是2009年元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,则最低分和最高分分别为(  ).
A.79,93 B.84,87
C.48,78 D.39,97
3某班学生在课外活动中参加文娱、美术、体育小组的人数之比为3∶1∶6,则在扇形统计图中表示参加体育小组人数的扇形圆心角是(  ).
A.108° B.216°
C.60° D.36°
4甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示,则甲班、乙班的最高成绩各是________,从图中看,________班的平均成绩较高.
5某地农村某户农民年收入如下(单位:元):
土地收入 打工收入 养殖收入 其他收入
4 320 3 600 2 357 843
请用不同的统计图来表示上面的数据.
答案:
基础知识·梳理
数据 结果 条形 扇形 折线
1.一个单位长度 数目
【做一做1】B
2.总体 部分占总体的百分比的大小 百分比
【做一做2】A
3.数量的多少 数量增减变化的情况 变化
【做一做3】D
4.(1)茎 叶 (2)信息 记录
【做一做4】45,45,52,56,57,58,60,63 由茎叶图可知销售数据都是两位数,分别为45,45,52,56,57,58,60,63.
典型例题·领悟
【例题1】0.1 参加羽毛球活动的人数是4,则频率为=0.1.
【例题2】A 甲组人数是120,占30%,则总人数是=400.则乙组人数是400×7.5%=30,则丙、丁两组人数和为400-120-30=250.
【例题3】解:用折线统计图表示题中的数据,如图.
其中虚线为B地降水量,实线为A地降水量.
【例题4】解:(1)茎叶图如图所示.
(2)用茎叶图处理现有的数据不仅可以看出数据的分布状况,而且可以看出每组中的具体数据.
(3)通过观察茎叶图,可以发现品种A的产量在420千克以上的亩数比品种B多10亩,而且品种A的产量在390千克以下的亩数与品种B一样多,由此可知,品种A的平均亩产量比品种B的平均亩产量高.但品种A的亩产量不够稳定,而品种B的亩产量比较集中,所以品种B的亩产量比较稳定.
随堂练习·巩固
1. B 由于需要比较各种数量的多少,并且收集到的数据量很大或有多组数据,符合条形统计图的特点.
2.A
3.B 参加体育小组人数占总人数的×100%=60%,则扇形圆心角是360°×60%=216°.
4.96,92 乙
5.分析:题意的要求是将此四个数据用统计图表示出来,可利用条形统计图、折线统计图、扇形统计图来表示.
解:用条形统计图表示,如图所示.
用折线统计图表示,如图所示.
用扇形统计图表示,如图所示.§8 最小二乘估计
1.了解最小二乘法的思想.
2.能根据给出的线性回归方程系数公式建立线性回归方程.
最小二乘法
求线性回归直线方程y=bx+a时,使得样本数据的点到它的__________最小的方法叫做最小二乘法.其中a,b的值由以下公式给出:
a,b是线性回归方程的系数.
线性回归分析涉及大量的计算,形成操作上的一个难点,可以利用计算机非常方便地作散点图、回归直线,并能求出回归直线方程.因此在学习过程中,要重视信息技术的应用.
【做一做】已知某工厂在某年里每月生产产品的总成本y(万元)与该月产量x(万件)之间的回归直线方程为y=0.974+1.215x,计算x=2时,总成本y的估计值为______.
什么是最小二乘法?
剖析:结合最小二乘法的发展过程和在实际生活中的应用来了解最小二乘法.最小二乘法的思想是通过最小化误差的平方和找到一组数据的最佳函数匹配,是用最简单的方法求得一些绝对不可知的真值,而令误差平方之和为最小,是处理各种观测数据,测量方差的一种基本方法,是一种数学优化技术.在统计中,主要是利用最小二乘法求线性回归方程,这是最小二乘法思想的应用.最小二乘法不仅是数理统计中一种常用的方法,在工业技术和其他科学研究中也有广泛应用,比如洪水实时预报等等.
题型一 阅读理解题
【例题1】假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下统计资料:
x 2 3 4 5 6
y 2.2 3.8 5.5 6.5 7.0
若由资料知,y与x线性相关.
(1)求回归直线方程y=bx+a中a与b的值;
(2)估计使用年限为10年时,维修费用是多少?
分析:先求出回归直线方程,若回归直线方程为y=bx+a,则在x=x0处的估计值为y0=bx0+a.
反思:知道x与y线性相关,就无需进行相关性检验,否则,应先进行相关性检验,若两个变量不具备相关关系,或者说,它们之间的线性相关关系不显著,即使求出回归直线方程也是毫无意义的,而且用其估计和预测的量也是不可信的.
题型二信息提炼题
【例题2】某产品的原料中两种有效成分A和B的含量如下表所示:
1 2 3 4 5 6 7 8 9 10
A(%) 24 15 23 19 16 11 20 16 17 13
B(%) 67 54 72 64 39 22 58 43 46 34
用x(%)表示A的含量,y(%)表示B的含量.
(1)作出散点图;
(2)y与x是否线性相关?若线性相关,求出回归直线方程(结果保留到小数点后4位小数).
分析:作出散点图,可判断y与x是否线性相关,如果线性相关,可用计算器求a,b的值.
反思:求回归直线方程,通常是用计算器来完成的.在有的科学计算器中,可通过直接按键得出回归直线方程中的a,b.如果用一般的计算器进行计算,则要先列出相应的表格,有了表格中的相关数据,回归直线方程中的a,b就容易求出来了.
题型三 线性回归分析的应用
【例题3】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
x 3 4 5 6
y 2.5 3 4 4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
分析:(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标在平面直角坐标系内画散点图;(2)应用计算公式求得线性相关系数b,a的值;(3)实际上就是求当x=100时,对应的y的值.
反思:求线性回归直线方程的步骤如下:
①列表表示xi,yi,xiyi;
②计算,,,iyi;
③代入公式计算b,a的值;
④写出线性回归方程.
可以利用线性回归方程进行预测变量的值.
1某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是(  ).
A.y=-10x+200 B.y=10x+200
C.y=-10x-200 D.y=10x-200
2下表是x与y之间的一组数据,则y关于x的回归直线必过点(  ).
x 0 1 2 3
y 1 3 5 7
A.(2,2)   B.(1.5,2)
C.(1,2) D.(1.5,4)
3对有线性相关关系的两个变量建立的回归直线方程y=a+bx中,回归系数b(  ).
A.小于0 B.大于0
C.等于0 D.以上都有可能
4给出下列说法:①回归方程适用于一切样本和总体;
②回归方程一般都有局限性;
③样本取值的范围会影响回归方程的适用范围;
④回归方程得到的预测值是预测变量的精确值.
其中正确的是________(将你认为正确的序号都填上).
5某个服装店经营某种服装,在某周内获纯利润y(元)与该周每天销售这种服装件数x之间的一组数据关系见下表:
x 3 4 5 6 7 8 9
y 66 69 73 81 89 90 91
已知:,,
(1)求,;
(2)画出散点图;
(3)求纯利润y与每天销售件数x之间的回归直线方程.
答案:
基础知识·梳理
距离的平方和  -b
【做一做】3.404 由回归直线方程y=0.974+1.215x得,当x=2时,总成本y的估计值为y=0.974+1.215×2=3.404.
典型例题·领悟
【例题1】解:(1)列表:
i 1 2 3 4 5
xi 2 3 4 5 6
yi 2.2 3.8 5.5 6.5 7.0
xiyi 4.4 11.4 22.0 32.5 42.0
=4,=5xi2=90,xiyi=112.3
其中,b====1.23,a=-b=5-1.23×4=0.08.所以a=0.08,b=1.23.
(2)回归直线方程为y=1.23x+0.08.当x=10时,y=1.23×10+0.08=12.38,即使用年限为10年时,维修费用约为12.38万元.
【例题2】解:(1)散点图如图所示.
(2)因为散点图中各点大致都分布在一条直线附近,所以y与x之间存在线性相关关系.经计算可得=17.4,=49.9,x=3 182,xiyi=9 228,故b==≈3.532 38≈3.532 4,a=-b≈49.9-3.532 38×17.4≈-11.563 4,所以所求回归直线方程为y=3.532 4x-11.563 4.
【例题3】解:(1)散点图如图所示.
(2)由题意,得xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
==4.5,
==3.5,
x=32+42+52+62=86,
∴b===0.7,
a=-b=3.5-0.7×4.5=0.35.
故线性回归方程为y=0.7x+0.35.
(3)根据回归方程可预测,现在生产100吨甲产品的生产能耗为0.7×100+0.35=70.35(吨标准煤),
故预测生产100吨甲产品的生产能耗比技改前减少了90-70.35=19.65(吨标准煤).
随堂练习·巩固
1.A ∵商品销售量y(件)与销售价格x(元/件)负相关,
∴b<0,排除选项B,D.
又∵x=0时,y>0,
∴答案为A.
2.D 回归直线方程必过中心点(,),即(1.5,4),故选D.
3.D
4.②③ 样本或总体具有线性相关关系时,才可求回归方程,而且由回归方程得到的函数值是近似值,而非精确值,因此回归方程有一定的局限性.所以①④错.
5.解:(1)==6(件),
==≈79.86(元).
(2)散点图如下:
(3)由散点图知,y与x有线性相关关系.
设回归直线方程为y=bx+a.
由x=280,xiyi=3 487,=6,=,得
b===4.75,
a=-6×4.75≈51.36,
故回归直线方程为y=4.75x+51.36.§7 相关性
1.通过收集现实问题中两个变量的数据作出散点图,利用散点图直观认识变量间的相关关系.
2.经历用不同的估算方法来描述两个变量相关的过程.
1.散点图
在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所________描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.
在寻找变量之间的相关关系的过程中,统计发挥着非常重要的作用.这就需要通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出正确的判断.
2.变量之间的相关关系
从散点图上看,如果两个变量之间存在着某种关系,这些点会有一个集中的大趋势,这种趋势通常可以用一条光滑的________来近似,这样近似的过程称为曲线拟合.若两个变量x和y的散点图中,所有点看上去都在__________附近波动,则称这两个变量是线性相关的,而若所有点看上去都在某条________(不是一条直线)附近波动,则称此相关为非线性相关.如果所有点在散点图中没有显示________,则称变量间是不相关的.
两变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我们称它们为相关关系;再一类是不相关,即两变量间没有任何关系.
【做一做1】下列两个变量之间的关系是相关关系的是(  ).
A.正方体的棱长与体积
B.单位圆中圆心角的度数与所对弧长
C.单位面积的产量为常数时,土地面积与总产量
D.日照时间与水稻的亩产量
【做一做2】下列说法正确的是(  ).
A.相关关系是函数关系
B.函数关系是相关关系
C.线性相关关系是一次函数关系
D.相关关系有两种,分别是线性相关关系和非线性相关关系
1.函数关系与相关关系有什么区别?
剖析:函数关系是一种因果关系,而相关关系不是因果关系,是伴随关系.例如有人发现,对于在校儿童,身高与阅读技能有很强的相关关系.然而学会新词并不能使儿童马上长高,而是涉及第三个因素——年龄,当儿童长大一些,他们的阅读能力会提高,而且由于长大身高也会高些.
在现实生活中,相关关系大量存在.在某种意义上说,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可使我们处理更为广泛的数学应用问题,还可以使我们对函数关系的认识上升到一个新的高度.
2.散点图有什么作用?
剖析:散点图是表示两个变量之间关系的图,又称相关图,它是用平面直角坐标系上点的散点图形来表示两种事物之间的相关性及联系的模式,用于分析两测定值之间的相关关系.散点图具有直观、简便的优点,通过散点图不但可以从点的位置判断测量值的高低、大小、变动趋势或变化范围,还可以通过观察剔除异常数据,从而提高用计算法估算相关程度的准确性,所以散点图对于探究两种事物、两种现象之间的关系起着重要的作用.
题型一 判断相关关系
【例题1】有下列关系:
①炼钢时钢水的含碳量与冶炼时间的关系;
②曲线上的点与该点的坐标之间的关系;
③柑橘的产量与气温之间的关系;
④森林中的同一种树木,其横断面直径与高度之间的关系.
其中具有相关关系的是____________.
反思:相关关系与函数关系的区别在于是否具有确定性.在区分二者时,如果一个变量每取一个值,另一个变量总有唯一确定的值与之对应,那么这两个变量就是函数关系,不是相关关系;如果一个变量每取一个值,另一个变量的取值带有一定的随机性,并且从总体上来看有关系,但不是确定性关系,那么这两个变量之间就是相关关系,不是函数关系.确定相关关系时有时要依靠生活经验大致确定.
题型二 散点图的画法及应用
【例题2】李老师为了了解学生的计算能力,对某同学进行了10次测验,收集数据如下:
题数x/道 5 10 15 20 25 30 35 40 45 50
做题时间y/分钟 9 19 26 37 48 52 61 73 81 89
画出散点图,并判断它们是否有线性相关关系.
分析:画散点图,利用散点图进行判断.
反思:两个随机变量x和y相关关系的确定方法:
(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;
(2)表格、关系式法:结合表格或关系式进行判断;
(3)经验法:借助积累的经验进行分析判断.
1对于给定的两个变量的统计数据,下列说法正确的是(  ).
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
2下列两个变量间的关系,是相关关系的是(  ).
A.任意实数和它的平方
B.圆的半径和圆的面积
C.正多边形的边数和内角度数之和
D.天空中的云量和下雨
3下列分别是3对变量的散点图,则具有相关关系的是(  ).
A.①②③ B.①③ C.②③ D.②
4下列关系中,属于相关关系的是________.
①正方形的边长与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
5下图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系.
答案:
基础知识·梳理
1.对应的点
2.曲线 一条直线 曲线 任何关系
【做一做1】D 选项A,B,C为函数关系,日照时间与水稻的亩产量有一定的关系,日照时间长,水稻的亩产量就高,但这种情况也不是绝对的,二者是相关关系.
【做一做2】D 函数关系和相关关系互不包含,所以A,B,C三项不正确;根据定义,相关关系有两种,分别是线性相关关系和非线性相关关系,故选D项.
典型例题·领悟
【例题1】①③④ ①炼钢的过程就是一个降低含碳量进行氧化还原的过程,除了与冶炼时间有关外,还受冶炼温度等其他因素的影响,具有相关关系.
②曲线上的点与该点的坐标之间的关系是一一对应的,即是一种确定性关系,不具有相关关系.
③柑橘的产量除了受气温影响以外,还受施肥量以及水分等因素的影响,具有相关关系.
④森林中的同一种树木,其横断面直径随高度的增加而增加,但是还受光照等因素的影响,具有相关关系.
【例题2】解:散点图如图,由散点图可以看出,两者之间具有线性相关关系.
随堂练习·巩固
1.C
2.D 很明显A,B,C三项都是函数关系;根据生活经验,天空中的云量和下雨之间不是确定性关系,虽然有云彩不一定下雨,但是如果没有云彩一定不下雨,这说明它们之间是相关关系,故选D.
3.B
4.②④ 在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.
5.解:观察图像易知散点图散乱地分布在坐标平面内,不能拟合成某条曲线或直线,所以这两个变量不具有相关关系.§1 从普查到抽样
1.了解普查的意义.
2.结合具体的实际问题情境,理解随机抽样的必要性和重要性.
1.普查
普查是为了了解总体的一般情况,对__________都无一例外地进行调查,也称整体调查或全面调查.当普查的对象________时,普查是一项非常好的调查方式,所取得的资料全面、系统;当普查的对象________时,普查的工作量很大,要耗费大量的人力、物力与财力,并且组织工作繁重、时间长.更值得注意的是,在很多情况下,普查工作难以实现.
【做一做1】下列调查中,必须采用“普查”的是(  ).
A.调查某品牌电视机的市场占有率
B.调查某电视连续剧在全国的收视率
C.调查高一一班的男女同学的比例
D.调查某型号炮弹的射程
2.抽样调查
从调查对象中按照一定的方法抽取________,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推断,这种调查方法称为抽样调查.其中,调查对象的________称为总体,被抽取的一部分称为________.
在统计中,有时由于检验对象的量很大,或检验对检验对象具有破坏性,很难做到对所有考查的对象作全面的观测.如测试灯泡的寿命、医生检验人的血液中血脂的含量等调查,这些调查具有破坏性;如人口普查、国民收入统计等调查由于总体数量很大,如果逐一测试,要消耗大量的时间、人力、物力,得不偿失.一个行之有效的方法是从总体中选取部分个体进行调查,并以此调查结果来推断总体的情况,这就是抽样调查.但是抽样调查时,抽样的方法必须科学,抽取的样本必须具有代表性,才能反映总体的基本特征.
抽样调查的优点:(1)_____ _________;(2)______________.
【做一做2-1】下列调查所抽取的样本具有代表性的是(  ).
A.利用当地的七月份的日平均最高气温值估计当地全年的日平均最高气温
B.在农村调查市民的平均寿命
C.利用一块实验水稻田的亩产量估计水稻的实际亩产量
D.为了了解一批洗衣粉的质量情况,从仓库中任意抽取100袋进行检验
【做一做2-2】为了调查全国城镇居民的寿命,抽查了十一个省(市)的2 500名城镇居民.这个问题中“2 500名城镇居民的寿命”是________.
为什么要通过抽取样本来研究总体?
剖析:结合实际认识普查的弊端.
比如检查印刷厂印出的报纸的印刷质量时,总是从中抽取部分报纸检验即可.比如《人民日报》,如果对每一份《人民日报》都进行检查,在理论上是可行的,但是实际上是不可行的.《人民日报》每天的发行量都在300万份以上,那么需要多少人去检查?要花费多少时间?那样等检查完了,这份报纸的新闻就已经过时了,况且也要浪费很多的人力和物力,得不偿失.又比如,检验导弹命中目标的准确率,只能从中抽取具有代表性的几枚导弹检验,因为该项调查具有危险性和破坏性,所以不宜采用普查.检验日光灯的使用寿命也一样.
因此,通常情况下,总是通过抽取样本来研究总体.
题型一 理解统计的有关概念
【例题1】为了了解全校240名学生的身高情况,从中抽取40名学生测量其身高,下列说法正确的是(  ).
A.总体是240
B.个体是每一个学生
C.样本是40名学生
D.总体是全校240名学生的身高
题型二 普查
【例题2】你的班主任想全面了解你班学生的学习和思想状况,请你帮助班主任设计一个调查方案.
分析:在总体中的对象不是很多的情况下,普查是全面获取信息最可靠的方法,它有两个特点:(1)所得资料更加全面、系统;(2)能够得到某个时期的信息总量.
反思:在进行普查时,一定要注意普查的两个特点:(1)所取得的资料全面、系统;(2)主要调查在特定时段、特定情形下总体的数量.
题型三 如何选择调查方式
【例题3】假设你是一名食品卫生工作人员,要对某食品店的一批小包装饼干进行卫生达标检验,应当选用何种调查方式?为什么?
分析:从调查所需时间和费用以及是否具有破坏性考虑选择何种调查方式.
反思:选择普查还是抽样调查的依据是检查的目的以及两种调查方式的优缺点的比较,本题如采用普查既耗时耗力,又具有破坏性,因此,应该选择抽样调查.
普查与抽样调查对照表
1下列调查工作适合采用普查的是(  ).
A.环保部门对淮河水域的水污染情况的调查
B.电视台对某电视节目收视率的调查
C.质检部门对各厂家生产的电池使用寿命的调查
D.企业在给职工做工作服前进行的尺寸大小的调查
2为了了解某校4 500名学生的课外阅读时间情况,从中抽取200名学生进行调查,下列说法正确的是(  ).
A.总体是4 500名学生
B.总体是某校4 500名学生的课外阅读时间
C.样本是200名学生
D.个体是200名学生
3下列调查工作,必须采用“抽样调查”的是(  ).
A.调查某城市今年7月份的温度变化情况
B.调查某一品牌5万包袋装鲜奶是否符合卫生标准
C.调查我国所有城市中哪些是第一批沿海开放城市
D.了解全班50名学生100米短跑的成绩
4下面的各事件中,适合抽样调查的有______.
①调查除夕之夜我国有多少人观看中央电视台春节联欢晚会;
②调查某工厂生产的一万件胶卷中有无不合格产品;
③评价一个班级升学考试的成绩;
④调查当今中学生中,对交通法规的了解情况;
⑤调查山东省初中生每人每周的零花钱数.
5为了创建“和谐平安”校园,某校决定在开学前将学校的电灯电路使用情况进行检查,以便排除安全隐患,此检查能否进行普查,为什么?
答案:
基础知识·梳理
1.所有的对象 很少 很多
【做一做1】C
2.一部分 全体 样本 (1)迅速、及时 (2)节约人力、物力和财力
【做一做2-1】D
【做一做2-2】样本 全国每个城镇居民的寿命都是个体,抽出的2 500名城镇居民的寿命是从总体中抽取的一个样本.
典型例题·领悟
【例题1】D 总体是240名学生的身高,所以A项不正确,D项正确;个体是每一个学生的身高,所以B项不正确;样本是40名学生的身高,所以C项不正确.
【例题2】解:因为一个班的人数不是太多,为了帮助班主任全面了解班里学生的学习和思想状况,可以采取普查的方法进行调查.可以先设计一个问卷,包括同学们对学习的各种看法,同学们的爱好、心理和思想状况等,然后发放给每一个学生,并全部收回,然后进行统计.这样就可以全面了解每个学生的学习和思想状况了.
【例题3】解:应该用抽样调查的方法对该批小包装饼干进行卫生达标检验.
采用普查的方法来检验食品是否卫生达标是不合适的.因为这里检查的目的是决定是否让这批小包装饼干出售,而普查的结果却使得这批小包装饼干完全不能出售,与检查的目的相违背.
一般地,如果检验具有破坏性,则需要通过抽样调查来推断总体的特征.
随堂练习·巩固
1.D 2.B 3.B
4.①②④⑤
5.分析:利用普查的特点进行判断.
解:由于一个学校的电灯电路数目不算大,且对创建“和谐平安”校园来说,必须排除任一潜在或已存在的安全隐患,故必须用普查的方式.§4 数据的数字特征
1.能结合具体情境理解不同数字特征的意义,并能根据问题的需要选择适当的数字特征来表达数据的信息.
2.通过实例理解数据标准差的意义和作用,学会计算数据的标准差.
1.众数
(1)定义:一组数据中出现次数________的数称为这组数据的众数.
(2)特征:一组数据的众数可能________个,也可能没有,它反映了该组数据的________.
众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.
2.中位数
(1)定义:一组数据按从小到大(或从大到小)的顺序排成一列,处于________位置的数称为这组数据的中位数.
(2)特征:一组数据中的中位数是________的,反映了该组数据的________.
中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.
【做一做1】某班50名学生右眼视力的检查结果如下表所示:
视力 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 1.0 1.2 1.5
人数 1 1 3 4 3 4 4 6 8 10 6
则该班学生右眼视力的众数为__________,中位数为__________.
3.平均数
(1)定义:一组数据的和与这组数据的个数的商叫做这组数据的平均数,数据x1,x2,…,xn的平均数为=________________.
(2)特征:平均数对数据有“取齐”的作用,代表该组数据的________.任何一个数据的改变都会引起平均数的变化,这是________和________都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的________,但平均数受数据中的________的影响较大,使平均数在估计总体时可靠性降低.
【做一做2】对甲、乙二人的学习成绩进行抽样分析,各抽4门功课,得到的观测值如下:
甲 65 82 80 85
乙 75 65 70 90
问:甲、乙谁的平均成绩较好?
4.标准差
(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算
s=________________________________________________________________________.
可以用计算器或计算机计算标准差.
(2)特征:标准差描述一组数据围绕________波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较________;标准差较小,数据的离散程度较______.
【做一做3】从某项综合能力测试中抽取100人的成绩如下表,则这100人成绩的标准差为(  ).
分数 5 4 3 2 1
人数 20 10 30 30 10
A. B. C.3 D.
5.方差
(1)定义:标准差的平方,即
s2=________________________________________________________________________.
(2)特征:与标准差的作用________,描述一组数据围绕平均数波动的大小.
(3)取值范围:________.
数据组x1,x2,…,xn的平均数为,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,axn+b(a,b为非零常数)的平均数为a+b,方差为a2s2,标准差为as.
【做一做4】下列能刻画一组数据离散程度的是(  ).
A.平均数 B.方差 C.中位数 D.众数
6.极差
(1)定义:一组数据的最______值与最______值的差称为这组数据的极差.
(2)特征:表示该组数据之间的差异情况.
极差利用了数据组中最大和最小的两个值,对极值过于敏感.但由于只涉及两个数据,便于得到,所以极差在实际中也经常应用.
【做一做5】一组数据3,-1,0,2,x的极差是5,则x=__________.
平均数与标准差(方差)这两个数字特征在实际问题中如何应用?
剖析:平均数反映的是数据的平均水平,在实际应用中,平均数常被理解为平均水平.标准差反映的是数据的离散程度的大小,反映了各个样本数据聚集于样本平均数周围的程度,标准差越小表明在样本平均数的周围越集中;反之,标准差越大,表明各个样本数据在样本平均数的两边越分散.在实际应用中,标准差常被理解为稳定性,常常与平均数结合起来解决问题.
例如,要从甲、乙两名射击运动员中选一名参加2012年伦敦奥运会,如果你是教练,你会制定怎样的选拔标准?制定怎样的选拔方案?
选拔标准是:要考虑射击运动员的射击水平即平均射击环数,再就是考虑射击运动员发挥的稳定性.当射击环数的平均数不相同时,选择平均数较大的运动员;当射击环数的平均数相同时,选择发挥稳定(标准差较小)的运动员.
选拔方案:让这两名运动员在相同的环境中进行相同次数的射击,比如参加射击世锦赛、世界杯、国际邀请赛、热身赛或国内比赛,并记录每次射击的环数.然后计算两名运动员射击环数的平均数和方差,再根据选拔标准作出选择.
题型一 平均数、中位数、众数的应用
【例题1】某公司30名职工的月工资(单位:元)如下:
职务 董事长 副董事长 董事 总经理 经理 管理员 职员
人数 1 1 2 1 2 3 20
工资 5 500 5 000 3 500 3 000 2 500 2 000 1 500
(1)求该公司职工的月工资的平均数、中位数、众数.
(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么该公司职工的月工资的平均数、中位数、众数又是多少?(精确到元)
(3)你认为哪个统计量更能反映这个公司职工的月工资水平?结合此问题谈一谈你的看法.
分析:根据平均数、中位数、众数的概念求解.
反思:平均数是将所有的数据都考虑进去得到的量,它是反映数据集中趋势最常用的量,中位数可靠性较差,当一组数据中个别数据变动较大时,常用中位数表示该组数据的集中趋势.而众数求法较简便,也经常被用到.考查一组数据的特征时,这三个数字特征要结合在一起考虑.
大多情况下人们会把眼光仅停留在工资表中的最大值与最小值处,把最高工资作为一个单位工资的评价,这是一种错误的评价方式.
题型二 标准差、方差的计算
【例题2】已知一个样本为x,1,y,5,其中x,y是方程组的解,则这个样本的标准差是(  ).
A.2 B. C.5 D.
反思:深刻理解平均数、方差的计算公式,灵活应用x+y=2和x2+y2=10进行整体求解是提高解题速度的关键.
题型三 综合应用题
【例题3】对划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大速度(m/s)的数据如下:
甲:27,38,30,37,35,31;
乙:33,29,38,34,28,36.
根据以上数据,试判断他们谁更优秀.
分析:分别计算两组数据的平均值与方差,然后加以比较并作出判断.
反思:判断甲、乙两运动员成绩的优劣,通常用平均数和方差作为标准来比较,当平均数相同时,还应考察他们的成绩波动情况(方差),以达到判断上的合理性和全面性.
1(2011广东汕头期中,6)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是(  ).
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
2甲、乙两台机床同时生产一种零件,现要检验它们的运行情况,统计10天中两台机床每天出的次品数分别为甲:0,1,0,2,2,0,3,1,2,4;乙:2,3,1,1,0,2,1,1,0,1.则出次品数较少的为(  ).
A.甲 B.乙 C.相同 D.不能比较
3已知一个样本中含有5个数据3,5,7,4,6,则样本方差为(  ).
A.1 B.2 C.3 D.4
4已知一组数据x1,x2,…,xn的方差是a,那么另一组数据x1-2,x2-2,…,xn-2的方差是________.
5对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:
甲 60 80 70 90 70
乙 80 60 70 80 75
问:甲、乙谁的平均成绩较好?谁的各门功课发展较平衡?
答案:
基础知识·梳理
1.(1)最多 (2)不止一 集中趋势
2.(1)中间 (2)唯一 集中趋势
【做一做1】1.2 0.8
3.(1) (2)平均水平 众数 中位数
信息 极端值
【做一做2】解:甲=(65+82+80+85)=78,
乙=(75+65+70+90)=75,
∴甲的平均成绩较好.
4.(1)
(2)平均数 大 小
【做一做3】B 这100人的总成绩为5×20+4×10+3×30+2×30+1×10=300,则平均成绩为=3,则这100人成绩的标准差为
=.
5.(1)[(x1-)2+(x2-)2+…+(xn-)2] (2)相同 (3)[0,+∞)
【做一做4】B 方差能刻画一组数据离散程度的大小.
6.(1)大 小
【做一做5】-2或4
典型例题·领悟
【例题1】解:(1)平均数是
=2 050(元),中位数是1 500元,众数是1 500元.
(2)平均数是
≈3 367(元),
中位数是1 500元,众数是1 500元.
(3)在这个问题中,中位数或众数均能反映该公司职工的月工资水平.因为公司中少数人的月工资与大多数人的月工资差别较大,这样导致平均数与职工整体月工资的偏差较大,所以平均数不能反映这个公司职工的月工资水平.
【例题2】D ∵x+y=2,x2+y2=10,
∴=(x+1+y+5)=[(x+y)+6]=2,
s2=[(x-2)2+(1-2)2+(y-2)2+(5-2)2]
=[(x2+y2)-4(x+y)+18]=×20=5,
∴s==.
【例题3】解:甲=×(27+38+30+37+35+31)=33,
s甲2=×[(27-33)2+(38-33)2+…+(31-33)2]
=×94≈15.7,
乙=×(33+29+38+34+28+36)=33,
s乙2=×[(33-33)2+(29-33)2+…+(36-33)2]
=×76≈12.7.
∴甲=乙,s甲2>s乙2.
这说明甲、乙二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.
随堂练习·巩固
1.A =90+(-1-3+3+1+6+4+0+2)=91.5.中位数==91.5.
2.B 甲=1.5,乙=1.2.
3.B ==5,
则方差s2=[(3-5)2+(5-5)2+(7-5)2+(4-5)2+(6-5)2]=2.
4.a 将一组数据同时减去一个数,所得新数据的方差与原数据的方差相等.
5.解:甲=×(60+80+70+90+70)=74;
乙=×(80+60+70+80+75)=73.
s甲2=×(142+62+42+162+42)=104;
s乙2=×(72+132+32+72+22)=56.
∵甲>乙,s甲2>s乙2,
∴甲的平均成绩较好,乙的各门功课发展较平衡.5.2 估计总体的数字特征
1.能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.
2.会用样本的基本数字特征估计总体的基本数字特征;初步体会数字特征的随机性.
1.样本均值和样本标准差
假设通过随机抽样得到的样本为x1,x2,…,xn,则
样本平均数为=__________________,
样本标准差为
s=________________________.
2.估计总体的数字特征
利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个________,但这个估计是合理的,特别是当样本容量________时,它们确实反映了总体的信息.
【做一做】甲、乙两人学习成绩的茎叶图如图所示.
(1)分别求出这两名同学学习成绩的平均数和标准差;
(2)比较这两名同学的成绩,谈谈你的看法.
方差和标准差有什么区别?
剖析:方差和标准差的计算公式是:
一般地,设样本为x1,x2,…,xn,样本的平均数为,则
样本方差s2=.
样本标准差s=.
由计算公式来看样本方差是样本标准差的平方,即样本标准差是样本方差的平方根,这是它们的最本质区别,它们表达的意义和作用完全相同.但是由于标准差的单位与原始数据测量单位相同,在统计中,通常用标准差来刻画数据的离散程度.
题型一 利用方差分析数据
【例题1】甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2):
品种 第一年 第二年 第三年 第四年 第五年
甲 9.8 9.9 10.1 10 10.2
乙 9.4 10.3 10.8 9.7 9.8
根据这组数据判断应该选择哪一种小麦进行推广.
分析:从平均数和方差两个角度去考虑.
反思:平均数和方差是样本的两个重要的数字特征,方差越大,表明数据越分散,相反地,方差越小,数据越集中稳定;平均数越大,表明数据的平均水平越高;平均数越小,表明数据的平均水平越低.
题型二 用样本的数字特征估计总体的数字特征
【例题2】甲、乙两台机床同时加工直径为100 mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算上述两组数据的平均数和方差;
(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.
分析:利用平均数与方差公式分别进行计算,并作出判断.
反思:平均数描述了数据的平均水平,定量地反映了数据的集中趋势所处的水平.方差描述了一组数据围绕平均数波动的大小.
1在统计中,样本的标准差可以近似地反映总体的(  ).
A.平均状态 B.分布规律
C.波动大小 D.最大值和最小值
2用分层抽样抽取了容量为10的样本,其平均数为5.1,方差为0.2,则总体的平均数与方差分别估计是(  ).
A.5.1,0.2 B.0.2,0.2
C.5.1,2 D.都不能估计
3已知一组数据按从小到大的顺序排列为-3,0,5,x,9,16,且这组数据的中位数为7,那么这组数据的众数为(  ).
A.0 B.9 C.16 D.9.5
4已知一个样本为1,3,2,5,x,它的平均数是3,则这个样本的标准差是________.
5下面是某校学生日睡眠时间的抽样频率分布表(单位:h):
日睡眠时间/h 人数 频率
[6,6.5)[6.5,7)[7,7.5)[7.5,8)[8,8.5)[8.5,9) 517333762 0.050.170.330.370.060.02
合计 100 1
试估计该校学生的日平均睡眠时间.
答案:
基础知识·梳理
1. 
2.估计 很大
【做一做】分析:首先由茎叶图读出数据,计算平均数,注意用简便方法,然后求出标准差,最后依据结果比较,可以借助于计算器.
解:(1)甲≈87,s甲≈12.7;乙≈93,s乙≈11.2.
(2)由于甲<乙,s甲>s乙,
所以甲的学习成绩没有乙的学习成绩好,也没有乙的学习成绩稳定.
典型例题·领悟
【例题1】解:甲种冬小麦的平均单位面积产量
甲==10,
乙种冬小麦的平均单位面积产量
乙==10,
则甲、乙两种冬小麦平均单位面积产量相同.
甲种冬小麦平均单位面积产量的方差为
s甲2=×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02,
乙种冬小麦平均单位面积产量的方差为
s乙2=×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244,
则s甲2=0.02<s乙2=0.244,
所以甲种小麦的平均单位面积产量比较稳定.
因此选择甲种小麦进行推广.
【例题2】解:(1)甲==100,
乙==100,
s甲2=[(99-100)2+(100-100)2×3+(98-100)2+(103-100)2]=,
s乙2=[(99-100)2×2+(100-100)2×3+(102-100)2]=1.
(2)因为s甲2>s乙2,说明甲机床加工的这种零件波动比较大,因此乙机床加工的这种零件更符合要求.
随堂练习·巩固
1.C 2.A
3.B 由中位数定义得,=7,∴x=9.∴众数为9,故选B.
4. =3,从而x=4,∴标准差为.
5.分析:利用这个样本来估计该校学生的日平均睡眠时间.要确定这100名学生的日平均睡眠时间,就必须计算总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.
解法一:总睡眠时间约为
6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h).
故平均睡眠时间约为=7.39(h).
解法二:求组中值与对应频率之积的和:
6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).
故该校学生的日平均睡眠时间约为7.39 h.§6 统计活动:结婚年龄的变化
1.经历“确定调查对象——收集数据——整理数据——分析数据——作出推断”的统计活动,体验统计活动的全过程.
2.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.
3.能通过对数据的分析,为合理的决策提供一些依据.
统计活动的步骤
(1)明确调查的目的,确定调查的________.
(2)利用随机抽样抽取样本,收集________.
(3)________数据,用表格来表示数据.
(4)________数据.其方法有两种:一是用统计图表来分析,二是计算数据的数字特征.
(5)作出________.通过分析数据作出推断.
①进行统计活动必须依据统计的基本思想,即用样本估计总体,所以要设计一个统计活动,首先应确定调查的对象,并从中抽取一个合理的样本,也就是收集数据.然后是整理和分析数据,并得出科学合理的推断,进而估计总体的情况.
②抽取样本可按你要调查的对象和调查的内容来确定合适的方法,比如简单随机抽样、分层抽样、系统抽样等,不论用哪种抽样方法,必须保证样本能很好地代表总体.
③整理分析样本数据时,可借助于前面已学的图表直观地表达出来;设计统计活动的方案,可与同学们合作交流,不断改进,以求高效.
【做一做1】给出统计活动的5个步骤,则它们之间正确的顺序是(  ).
①收集数据 ②整理数据 ③确定调查对象 ④分析数据 ⑤作出推断
A.①②③④⑤ B.③①②④⑤
C.③①②⑤④ D.①③②⑤④
【做一做2】为了调查某市高中学生中喜欢数学的学生所占的比例,收集数据后,整理、分析数据的方式是(  ).
A.画频率分布直方图 B.画茎叶图
C.计算平均数和标准差 D.画扇形统计图
1.统计活动中,设计调查表时,要注意哪些问题?
剖析:根据所调查的内容设计调查的具体方式和方法,在真正的操作中往往还要依靠调查者的社会活动能力.最常用的三种调查是邮寄调查、电话调查和个人采访调查,而且每一种调查都需要设计和使用调查表.在使用调查表进行调查时,设计调查表是很关键的问题.设计者必须要抵制想囊括所有要研究问题的诱惑,因为每增加一个问题都会增加调查表的长度.长的调查表不仅使回答者感到疲劳,而且也使采访者感到疲劳,尤其对邮寄和电话调查更是如此.但是,如果用个人采访调查,较长而且复杂的调查表是行得通的.在设计调查表时,关于措词、排序及问题的分组等方面都存在大量的知识,这些问题会在有关抽样调查的更全面的书籍中讨论.
2.统计活动中,为什么需要整理数据?
剖析:统计整理是根据统计研究的目的,将统计调查所取得的原始资料进行科学的汇总和综合,使其系统化,条理化,成为可据以进行统计分析的资料的过程.它在整个统计工作过程中起着承前启后的作用.整理数据的目的是为了后面更方便地表达和分析数据.
题型 统计活动案例
【例题】问题情境:
1987年的春节联欢晚会上,费翔的“冬天里的一把火”点燃了通俗歌曲在我国大陆的流行,成为当时风靡一时的歌曲,也流行了很长一段时间.但是,现在的中学生对这首歌可能就不一定很认同,而更多的是喜欢目前的流行歌曲.
问题:设计统计方案,估计你所在的县(市)的中学生中,喜欢通俗歌曲的学生所占的百分比.
反思:统计活动作出的推断的准确性,决定于抽取的样本是否具有代表性,以及样本容量的大小.一般来说,用科学的抽样方法抽取样本,并且样本容量足够大,这样的统计活动得到的结论大多准确性较高,可信度大,可以作为决策的依据.
1统计活动中,分析数据时(  ).
A.用统计图表
B.计算数据的数字特征
C.随便看看就行
D.用统计图表或计算数据的数字特征
2某校高一年级有43名足球运动员,为了全面调查他们的学习情况,用的调查方式是(  ).
A.普查 B.抽样调查
C.抽签法 D.产生随机数的方法
3某次统计活动得到的结论与实际有较大差别,其原因可能是(  ).
A.调查方式不科学
B.没有选用合适的分析数据的方法
C.确定的调查对象不合要求
D.以上都有可能
4要统计某市2009年A、B两种小麦的平均亩产量,分析数据时,得如下数据:
A B
平均数 1 000 kg 1 200 kg
方差 3.4 2.5
根据以上数据,判断2010年应该推广的小麦品种是______.
5设计统计方案,估计你们学校的高中学生的体重分布情况.
答案:
基础知识·梳理
(1)对象 (2)数据 (3)整理 (4)分析 (5)推断
【做一做1】B
【做一做2】D
典型例题·领悟
【例题】解:可以按照如下的步骤来进行这个统计活动:
(1)确定调查的对象:该县(市)的全体中学生;明确调查的目的:是否喜欢通俗歌曲.
(2)利用随机抽样抽取样本,收集数据.
由于一个县(市)的中学生太多,只能进行抽样调查.由于学校之间存在差别,采用分层抽样在各个中学抽取样本.为了统计的方便,设计如下的调查表,记录下来.
所在学校 喜欢 不喜欢 一般
最好你和你的同学一起完成收集数据的任务.
(3)整理数据,用表格来表示数据.
把所收集到的数据汇总成一个表格,如下表.
喜欢 不喜欢 一般 总计
人数
(4)分析数据.
由于是调查喜欢通俗歌曲的学生所占的百分比,所以选用扇形统计图来表示.
(5)作出推断.通过分析数据作出推断.
根据扇形统计图作出推断.
随堂练习·巩固
1.D
2.A 由于是全面调查,并且人数不多,调查也不具有破坏性,采用普查.
3.D 4.B
5.解:方案不唯一.下列方案仅供参考.
(1)确定调查的对象:全校的全体高中学生;明确调查的目的:体重分布.
(2)利用随机抽样抽取样本,收集数据.
如果你校的高中学生不多,可以采取普查,如果太多,只能进行抽样调查.
由于年级之间存在差别,采用分层抽样在各个年级抽取样本.为了统计的方便,设计如下的调查表,记录下来.
年级 体重
(3)整理数据,用表格来表示数据.
把所收集到的数据汇总成一个表格,如下表.
体重(分组)
人数
(4)分析数据.
由于是估计体重分布情况,建议画频率分布直方图来表示数据.
(5)作出推断.通过分析数据作出推断.§2 抽样方法
2.1 简单随机抽样
1.了解简单随机抽样的定义.
2.在参与解决统计问题的过程中,学会用简单随机抽样方法从总体中抽取样本.
1.简单随机抽样
(1)定义:如果在抽样过程中,________地抽取一部分个体,然后对抽取的对象进行调查,并且能保证每个个体被抽到的________相同,这样的抽样方法就叫做简单随机抽样.
(2)说明:常用到的简单随机抽样方法有两种:________(抓阄法)和________.
简单随机抽样具备下列特点:
①总体中的个体数N是有限的;
②简单随机抽样抽取的样本数n不大于总体中的个体数N;
③简单随机抽样是从总体中逐个抽取的,是一种不放回的抽样,也就是每次从总体中抽取元素后不再将这个元素放回总体;
④简单随机抽样的每个个体入样的可能性均为;
⑤当总体中的个体无差异且个体数目较少时,采用简单随机抽样抽取样本.
【做一做1-1】对于简单随机抽样,每个个体每次被抽到的机会都(  ).
A.相等 B.不相等
C.无法确定 D.无关系
【做一做1-2】下列抽样方法是简单随机抽样的是(  ).
A.从50个零件中一次性抽取5个做质量检验
B.从50个零件中有放回地抽取5个做质量检验
C.从实数集中逐个抽取10个数分析奇偶性
D.运动员从8个跑道中随机地抽取一个跑道
2.抽签法
(1)先把总体中的N个个体编号,并把号签写在________、________相同的签上(签可以是纸条、卡片或小球等),然后将这些号签放在同一个箱子里________搅拌.每次随机地从中抽取______个,然后将号签均匀搅拌,再进行下一次抽取.如此下去,直至抽到预先设定的样本数.根据实际需要,如果每次抽取后再______,就称为有放回抽取;如果每次抽取后________,就称为无放回抽取.
(2)实施步骤:
①给调查对象群体中的每个对象________;
②准备“抽签”的________,实施“抽签”;
③对样本中每一个个体进行测量或调查.
【做一做2】下列抽样实验中,适合用抽签法的有(  ).
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
3.随机数法
(1)定义:可以利用转盘、________、计算机、科学计算器直接产生随机数,也可以利用________来产生随机数.利用产生的随机数来抽取样本,这种方法称为随机数法.
(2)利用随机数表产生随机数的实施步骤:
①将总体中的个体________;
②在随机数表中任选一个数作为开始;
③规定读取数字的方向;
④开始读取数字,若不在编号中,则________,前面已经读过的也跳过,若在编号中,则________,依次取下去,直到取满为止,相同的号只取一次;
⑤根据选定的号码抽取样本.
①抽签法的操作要点是:编号、制签、搅匀、抽取;
随机数法的操作要点是:编号、选起始数、读数、获取样本.
②抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平.
随机数法的优点与抽签法相同,缺点是当总体容量和样本容量都较大时,仍然不是很方便,因此这两种方法只适合于样本容量较小的抽样调查.
【做一做3-1】某工厂的质检人员对生产的100件产品,采用随机数表法抽取10件检查,对100件产品采用下面的编号方法
①1,2,3,…,100;
②001,002,…,100;
③00,01,02,…,99;
④01,02,03,…,100.
其中正确的序号是(  ).
A.②③④ B.③④
C.②③ D.①②
【做一做3-2】下列说法正确的是(  ).
A.抽签法中可一次抽取两个个体
B.随机数法中每次只取一个个体
C.简单随机抽样是放回抽样
D.抽签法中将号签放入箱子中,可以不搅拌直接抽取
应用随机数法抽取样本时,怎样对总体中的个体编号?
剖析:利用随机数法抽取样本时,所有个体的号码位数要一致,若不一致,需先调整到一致再进行抽样.
例如,当总体中有100个个体时,为了操作简便可以选择从00开始编号,那么所有个体的号码都用两位数字表示即可,从00~99号.如果选择从001开始编号,那么所有个体的号码都必须用三位数字表示,从001~100.很明显每次读两个数字要比每次读三个数字节省查取随机数的时间.
题型一 简单随机抽样的判断
【例题1】下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;
(3)某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴青海参加抗震救灾工作;
(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.
分析:先逐个判断抽样的特点,再与简单随机抽样的概念比较得出结论.
反思:要判断所给的抽样方法是否是简单随机抽样,关键是看它们是否符合简单随机抽样的定义以及简单随机抽样的几个特点.
题型二 抽签法抽取样本
【例题2】某单位支援西部开发,现从报名的18名志愿者中选取6人组成志愿小组到西藏工作3年.请用抽签法设计抽样方案.
分析:按照抽签法的一般步骤进行设计,解题的流程为:编号→制签→搅拌均匀→抽签→确定样本.
反思:利用抽签法抽取样本时,编号问题可视情况而定,若已有编号如考号,学号,标签号码等,可不必重新编号,另外号签要求是大小、形状完全相同而且一定要搅拌均匀,从中逐一不放回地抽取.
题型三 随机数法抽取样本
【例题3】现有一批零件,共600个,现从中抽取10个进行质量检查,若用随机数法,怎样设计方案?
分析:本题按随机数法抽样的一般步骤写出抽样方案即可,具体流程为:将个体编号→选定开始的数字→确定读数方向→获取样本号码.
反思:利用随机数法抽取样本时,关键是事先确定以表中的哪个数(哪行哪列)作为起点,以及读数的方向,向左、向右、向上或向下都可以.同时,读数时结合编号特点进行读取,编号为两位,则两位、两位地读取,编号为三位数,则三位、三位地读取,如果出现重号则跳过,接着读取.
题型四 简单随机抽样的应用
【例题4】现有30个零件,需从中抽取10个进行检验,问如何采用简单随机抽样得到一个容量为10的样本?
分析:因为本题的总体容量较小,样本数也较小,所以用抽签法和随机数法皆可.
反思:抽签法虽简单易行,但当总体的容量较大时,费时、费力又不方便.如果号签(标号的纸片或小球等)搅拌得不均匀,可能导致抽样的不公平,对于随机数法,则能有效地避免号签搅拌不均匀的问题,只需给每个个体编号后,按随机数表进行抽取样本即可.对于本题,从以上两种方法可以看出,当总体中个体数较少时,用两种方法都可以,当总体中个体数较多时,解法二优于解法一.
1下列关于简单随机抽样的叙述不正确的是(  ).
A.一定要逐个抽取
B.它是一种最简单、最基本的抽样方法
C.总体中的个数必须是有限的
D.先被抽取的个体被抽到的可能性要大
2下面的抽样方法是简单随机抽样的是(  ).
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,检验其质量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见
D.用抽签法从10件产品中选取3件进行质量检验
3用随机数法进行抽样有以下几个步骤:①将总体中的个体编号 ②获取样本号码 ③选定开始的数字④选定读数的方向
这些步骤的先后顺序应为(  ).
A.①②③④ B.①③④②
C.③②①④ D.④③①②
4常用的简单随机抽样方法有________和________.
5下列抽取样本的方式是否属于简单随机抽样?说明道理.
(1)从无限多个个体中抽取100个个体作样本;
(2)盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意抽出一个零件进行质量检验后再把它放回盒子里,然后再进行抽取.
答案:
基础知识·梳理
1.(1)随机 概率 (2)抽签法 随机数法
【做一做1-1】A 由定义可知选A.
【做一做1-2】D 选项A错在“一次性”抽取;选项B错在“有放回地”抽取;选项C错在总体容量无限.
2.(1)形状 大小 均匀 一 放回 不放回 (2)①编号 ②工具
【做一做2】B
3.(1)摸球 随机数表 (2)①编号 ④跳过 取出
【做一做3-1】C
【做一做3-2】B
典型例题·领悟
【例题1】解:(1)不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.
(2)不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.
(3)不是简单随机抽样.因为这50名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.
(4)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.
【例题2】解:第一步 将18名志愿者编号,号码为1,2,…,18.
第二步 将号码分别写在18张纸条上,揉成团,制成号签.
第三步 将所有号签放入一个箱子中,充分搅匀.
第四步 依次取出6个号签,并记录其编号.
第五步 将对应编号的志愿者选出.
【例题3】解:第一步 将这批零件编号,分别为001,002,…,600;
第二步 在教材表12随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第5行第2个数“5”,向右读;
第三步 从“5”开始向右读,每次读三位,凡不在001~600中的数跳过,前面已读过的也跳过去不读,依次选取可以得:556,231,243,554,444,526,357,337,091,388;
第四步 将与这10个号码相对应的零件抽出就组成了我们所要抽取的样本.
【例题4】解:解法一:(抽签法)先将30个零件编号:1,2,3,…,30,并把号码写在形状、大小相同的号签上(号签可以用小球、纸条等制作),然后将这30个号签放在同一个箱子里搅拌均匀,抽签时,每次从中抽出1个号签,连续抽10次,这10个号码对应的零件就是所要抽取的样本.
解法二:(随机数法)
第一步 将30个零件编号为00,01,02,…,29.
第二步 在教材附录2的随机数表中任选一数作为起始号码,如从第8行第3个数“2”开始,向右读.
第三步 从“2”开始向右读,每次读两位,得到26,继续向右读,由于97>29,跳过;继续向右读,两位数不大于29且不与前面取出的数重复,就把它取出,否则就跳过不取,取到一行末尾时转到下一行从左到右继续读数.如此下去直到得出在00~29之间的10个两位数.这10个号码对应的零件就是所要抽取的样本.
随堂练习·巩固
1.D 2.D 3.B
4.抽签法 随机数法
5.分析:依据简单随机抽样的特点来判断.
解:(1)不是简单随机抽样,由于被抽取样本的总体个体数是无限的,而不是有限的.
(2)不是简单随机抽样,由于它是有放回的抽样.