【学案导学与随堂笔记】2016-2017学年高中数学(人教版A版必修三)配套课件+课时作业与单元检测:第二章 统计 (22份打包)

文档属性

名称 【学案导学与随堂笔记】2016-2017学年高中数学(人教版A版必修三)配套课件+课时作业与单元检测:第二章 统计 (22份打包)
格式 zip
文件大小 8.8MB
资源类型 教案
版本资源 人教新课标A版
科目 数学
更新时间 2016-07-11 22:07:12

文档简介

第二章 统 计(A)
(时间:120分钟 满分:150分)
一、选择题(本大题共12小题,每小题5分,共60分)
1.从某年级1 000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是(  )
A.1 000名学生是总体
B.每个被抽查的学生是个体
C.抽查的125名学生的体重是一个样本
D.抽取的125名学生的体重是样本容量
2.由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于-1,那么对于样本1,x1,-x2,x3,-x4,x5的中位数可以表示为(  )
A.(1+x2) B.(x2-x1)
C.(1+x5) D.(x3-x4)
3.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别应抽取的人数是(  )
A.7,11,19 B.6,12,18
C.6,13,17 D.7,12,17
4.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图2.由这两个散点图可以判断(  )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
5.已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是,那么另一组数3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数,方差分别是(  )
A.2, B.2,1
C.4, D.4,3
6.某学院有4个饲养房,分别养有18,54,24,48只白鼠供实验用.某项实验需抽取24只白鼠,你认为最合适的抽样方法是(  )
A.在每个饲养房各抽取6只
B.把所有白鼠都加上编有不同号码的颈圈,用随机抽样法确定24只
C.从4个饲养房分别抽取3,9,4,8只
D.先确定这4个饲养房应分别抽取3,9,4,8只,再由各饲养房自己加号码颈圈,用简单随机抽样的方法确定
7.下列有关线性回归的说法,不正确的是(  )
A.相关关系的两个变量不一定是因果关系
B.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.任一组数据都有回归直线方程
8.已知施肥量与水稻产量之间的回归直线方程为 =4.75x+257,则施肥量x=30时,对产量y的估计值为(  )
A.398.5 B.399.5
C.400 D.400.5
9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是(  )
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3
10.某高中在校学生2 000人,高一与高二人数相同并都比高三多1人.为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动.每人都参加而且只参与了其中一项比赛,各年级参与比赛人数情况如下表:
高一
高二
高三
跑步
a
b
c
登山
x
y
z
其中a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高二参与跑步的学生中应抽取(  )
A.36人 B.60人
C.24人 D.30人
11.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们所有比赛得分的情况用如右图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为(  )
A.19,13 B.13,19
C.20,18 D.18,20
12.从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下:
分组
[90,100)
[100,110)
[110,120)
[120,130)
[130,140)
[140,150]
频数
1
2
3
10
3
1
则这堆苹果中,质量不小于120克的苹果数约占苹果总数的(  )
A.30% B.70%
C.60% D.50%
题号
1
2
3
4
5
6
7
8
9
10
11
12
答案
二、填空题(本大题共4小题,每小题5分,共20分)
13.甲、乙、丙、丁四名射击手在选拔赛中的平均环数及其标准差s如下表所示,则选送决赛的最佳人选应是________.




7
8
8
7
s
2.5
2.5
2.8
3
14.一组数据23,27,20,18,x,12,它们的中位数是21,即x是________.
15.某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份
2005
2006
2007
2008
2009
收入x
11.5
12.1
13
13.3
15
支出Y
6.8
8.8
9.8
10
12
根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.
16.某单位为了了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与当天气温.
气温(℃)
14
12
8
6
用电量(度)
22
26
34
38
由表中数据得回归直线方程 = x+ 中 =-2,据此预测当气温为5℃时,用电量的度数约为______.
三、解答题(本大题共6小题,共70分)
17.(10分)一批产品中,有一级品100个,二级品60个,三级品40个,用分层抽样的方法,从这批产品中抽取一个容量为20的样本,写出抽样过程.
18.(12分)为了了解学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)学生跳绳次数的中位数落在哪个小组内?
(2)第二小组的频率是多少?样本容量是多少?
(3)若次数在110以上(含110次)为良好,试估计该学校全体高一学生的良好率是多少?
19.(12分)为了研究三月下旬的平均气温(x)与四月棉花害虫化蛹高峰日(y)的关系,某地区观察了2003年至2008年的情况,得到下面数据:
年份
2003
2004
2005
2006
2007
2008
x(℃)
24.4
29.6
32.9
28.7
30.3
28.9
y
19
6
1
10
1
8
已知x与y之间具有线性相关关系,据气象预测该地区在2010年三月下旬平均气温为27℃,试估计2010年四月化蛹高峰日为哪天?
20.(12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程 =x+ ;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
21.(12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下:(单位:cm)
甲:9,10,11,12,10,20
乙:8,14,13,10,12,21.
(1)在右面给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;
(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.
22.(12分)从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.
试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数.
(2)这50名学生的平均成绩.
第二章 统 计(A)
1.C [在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量.”因此题中所指的对象应是体重,故A、B错误,样本容量应为125,故D错误.]
2.C [由题意把样本从小到大排序为x1,x3,x5,1,-x4,-x2,因此得中位数为(1+x5).]
3.B [因27∶54∶81=1∶2∶3,×36=6,×36=12,×36=18.]
4.C [由点的分布知x与y负相关,u与v正相关.]
5.D [因为数据x1,x2,x3,x4,x5的平均数是2,方差是,
所以=2, (xi-2)2=,
因此数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为:
(3xi-2)=3×xi-2=4,
方差为: (3xi-2-)2= (3xi-6)2=9× (xi-2)2=9×=3.]
6.D [因为这24只白鼠要从4个饲养房中抽取,因此要用分层抽样决定各个饲养房应抽取的只数,再用简单随机抽样法从各个饲养房选出所需白鼠.C虽然用了分层抽样,但在每个层中没有考虑到个体的差异,也就是说在各个饲养房中抽取样本时,没有表明是否具有随机性,故选D.]
7.D [根据两个变量具有相关关系的概念,可知A正确,散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B、C正确.只有线性相关的数据才有回归直线方程,所以D不正确.]
8.B [成线性相关关系的两个变量可以通过回归直线方程进行预测,本题中当x=30时, =4.75×30+257=399.5.]
9.D [由于甲地总体均值为3,中位数为4,即中间两个数(第5、6天)人数的平均数为4,因此后面的人数可以大于7,故甲地不符合.乙地中总体均值为1,因此这10天的感染人数总和为10,又由于方差大于0,故这10天中不可能每天都是1,可以有一天大于7,故乙地不符合.丙地中中位数为2,众数为3,3出现的最多,并且可以出现8,故丙地不符合.故丁地符合.]
10.A [由题意知高一、高二、高三的人数分别为667,667,666.
设a=2k,b=3k,c=5k,
则a+b+c=×2 000,即k=120.
∴b=3×120=360.
又2 000人中抽取200人的样本,即每10人中抽取一人,则360人中应抽取36人,故选A.]
11.A [分别将甲、乙两名运动员的得分从小到大排列,中间位置的分数则为中位数.]
12.B [由数据分布表可知,质量不小于120克的苹果有10+3+1=14(个),占苹果总数的×100%=70%.]
13.乙
解析 平均数反映平均水平大小,标准差表明稳定性.标准差越小,稳定性越好.
14.22
15.13 正
16.40
解析 ∵=(14+12+8+6)=10,
=(22+26+34+38)=30,
∴ =- =30+2×10=50.
∴当x=5时, =-2×5+50=40.
17.解 分层抽样方法:
先将总体按其级别分为三层,一级品有100个,产品按00,01,…,99编号,二级品有60个,产品按00,01,…,59编号,三级品有40个,产品按00,01,…,39编号.因总体个数∶样本容量为10∶1,故用简单随机抽样的方法,在一级品中抽10个,二级品中抽6个,三级品中抽4个.这样就可得到一个容量为20的样本.
18.解 (1)∵前三组的频率和为=<,
前四组的频率之和为=>,
∴中位数落在第四小组内.
(2)频率为:=0.08,
又∵频率=,
∴样本容量===150.
(3)由图可估计所求良好率约为:
×100%=88%.
19.解 由题意知:
≈29.13,=7.5,
x=5 130.92,
xiyi=1 222.6,
∴ =≈-2.2,
=- ≈71.6,
∴回归方程为 =-2.2x+71.6.
当x=27时, =-2.2×27+71.6=12.2,据此,可估计该地区2010年4月12日或13日为化蛹高峰日.
20.解 (1)散点图如下:
(2)==4.5,==3.5,
xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
x=32+42+52+62=86,
∴===0.7,
=- =3.5-0.7×4.5=0.35.
∴ =0.7x+0.35.
∴所求的回归直线方程为 =0.7x+0.35.
(3)现在生产100吨甲产品用煤
=0.7×100+0.35=70.35,
∴90-70.35=19.65.
∴生产能耗比技改前降低约19.65吨标准煤.
21.解 (1)茎叶图如图所示:
(2)甲==12,
乙==13,
s=×[(9-12)2+(10-12)2+(11-12)2+(12-12)2+(10-12)2+(20-12)2]≈13.67,
s=×[(8-13)2+(14-13)2+(13-13)2+(10-13)2+(12-13)2+(21-13)2]≈16.67.
因为甲<乙,所以乙种麦苗平均株高较高,又因为s22.解 (1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形框的中间值的横坐标即为所求,所以众数应为75.
由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.
∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,
∴前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,
∴中位数应位于第四个小矩形内.
设其底边为x,高为0.03,
∴令0.03x=0.2得x≈6.7,故中位数约为70+6.7=76.7.
(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.
∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈74.
第二章 统 计(B)
(时间:120分钟 满分:150分)
一、选择题(本大题共12小题,每小题5分,共60分)
1.对于给定的两个变量的统计数据,下列说法正确的是(  )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
2.一组数据中的每一个数据都乘以2,再减去80,得到一组新数据,若求得新的数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是(  )
A.40.6,1.1 B.48.8,4.4
C.81.2,44.4 D.78.8,75.6
3.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如右图,则下面结论中错误的一个是(  )
A.甲的极差是29 B.乙的众数是21
C.甲罚球命中率比乙高 D.甲的中位数是24
4.某学院A,B,C三个专业共有1 200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取的学生人数为(  )
A.30 B.40
C.50 D.60
5.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.4、8.4、9.4、9.9、9.6、9.4、9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(  )
A.9.4,0.484 B.9.4,0.016
C.9.5,0.04 D.9.5,0.016
6.两个变量之间的相关关系是一种(  )
A.确定性关系 B.线性关系
C.非确定性关系 D.非线性关系
7.如果在一次实验中,测得(x,y)的四组数值分别是A(1,3),B(2,3.8),C(3,5.2),D(4,6),则y与x之间的回归直线方程是(  )
A. =x+1.9 B. =1.04x+1.9
C. =0.95x+1.04 D. =1.05x-0.9
8.现要完成下列3项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查.
②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈.
③东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
较为合理的抽样方法是(  )
A.①简单随机抽样,②系统抽样,③分层抽样
B.①简单随机抽样,②分层抽样,③系统抽样
C.①系统抽样,②简单随机抽样,③分层抽样
D.①分层抽样,②系统抽样,③简单随机抽样
9.从存放号码分别为1,2,…,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:
卡片号码
1
2
3
4
5
6
7
8
9
10
取到的次数
13
8
5
7
6
13
18
10
11
9
则取到号码为奇数的频率是(  )
A.0.53 B.0.5
C.0.47 D.0.37
10.某校对高一新生进行军训,高一(1)班学生54人,高一(2)班学生42人,现在要用分层抽样的方法,从两个班中抽出部分学生参加4×4方队进行军训成果展示,则(1)班,(2)班分别被抽取的人数是(  )
A.9人,7人 B.15人,1人
C.8人,8人 D.12人,4人
11.右图是根据《山东统计年鉴2010》中的资料作成的2000年至2009年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到2000年至2009年我省城镇居民百户家庭人口数的平均数为(  )
A.304.6 B.303.6
C.302.6 D.301.6
12.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如表所示:
甲的成绩
环数
7
8
9
10
频数
5
5
5
5
乙的成绩
环数
7
8
9
10
频数
6
4
4
6
丙的成绩
环数
7
8
9
10
频数
4
6
6
4
s1、s2、s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有(  )
A.s3>s1>s2 B.s2>s1>s3
C.s1>s2>s3 D.s2>s3>s1
题号
1
2
3
4
5
6
7
8
9
10
11
12
答案
二、填空题(本大题共4小题,每小题5分,共20分)
13.已知一个回归直线方程为 =1.5x+45(xi∈{1,5,7,13,19}),则=________.
14.若a1,a2,…,a20这20个数据的平均数为,方差为0.21,则a1,a2,…,a20,这21个数据的方差为________.
15.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
16.某公司有员工49人,其中30岁以上的员工有14人,没超过30岁的员工有35人,为了解员工的健康情况,用分层抽样方法抽一个容量为7的样本,其中30岁以上的员工应抽取________人.
三、解答题(本大题共6小题,共70分)
17.(10分)某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:
广告支出x(单位:万元)
1
2
3
4
销售收入y(单位:万元)
12
28
42
56
(1)画出表中数据的散点图;
(2)求出y对x的回归直线方程;
(3)若广告费为9万元,则销售收入约为多少万元?
18.(12分)炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据如下表所示:
x(0.01%)
104
180
190
177
147
134
150
191
204
121
y(min)
100
200
210
185
155
135
170
205
235
125
(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗?
(2)求回归直线方程;
(3)预测当钢水含碳量为160时,应冶炼多少分钟?
19.(12分)甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价.
20.(12分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:
家庭编号
1
2
3
4
5
6
7
8
9
10
xi收入)
千元
0.8
1.1
1.3
1.5
1.5
1.8
2.0
2.2
2.4
2.8
yi(支出)
千元
0.7
1.0
1.2
1.0
1.3
1.5
1.3
1.7
2.0
2.5
(1)判断家庭平均收入与月平均生活支出是否相关?
(2)若二者线性相关,求回归直线方程.
21.(12分)某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类,B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).
(1)A类工人中和B类工人中各抽查多少工人?
(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.
表1
生产能
力分组
[100,110)
[110,120)
[120,130)
[130,140)
[140,150)
人数
4
8
x
5
3
表2
生产能
力分组
[110,120)
[120,130)
[130,140)
[140,150)
人数
6
y
36
18
①先确定x,y,再补全下列频率分布直方图.就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)
图1 A类工人生产能力的频率分布直方图
图2 B类工人生产能力的频率分布直方图
②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).
22.(12分)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验.测得的数据如下:
零件数
x(个)
10
20
30
40
50
60
70
80
90
100
加工时间
y(分)
62
68
75
81
89
95
102
108
115
122
(1)y与x是否具有线性相关关系?
(2)如果y与x具有线性相关关系,求回归直线方程;
(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?
第二章 统 计(B)
1.C [给出一组样本数据,总可以作出相应的散点图,但不一定能分析出两个变量的关系,更不一定符合线性相关或有函数关系.]
2.A
3.D [甲的极差是37-8=29;乙的众数显然是21;甲的平均数显然高于乙,即C成立;甲的中位数应该是=23.]
4.B [由题知C专业有学生1 200-380-420=400(名),那么C专业应抽取的学生数为120×=40名.]
5.D [去掉一个最高分9.9后再去掉一个最低分8.4,剩余的分值为9.4、9.4、9.6、9.4、9.7.
求平均值=9.5,代入方差运算公式可知方差为0.016.]
6.C 7.B
8.A [①总体较少,宜用简单随机抽样;②已分段,宜用系统抽样;③各层间差距较大,宜用分层抽样,故选A.]
9.A [(13+5+6+18+11)=0.53.]
10.A [高一(1)班与(2)班共有学生96人,现抽出16名学生参加方队展示,所以抽取(1)班人数为×54=9(人),抽取(2)班人数为×42=7(人).]
11.B
12.B [∵s=(x+x+…+x)-2,
∴s=(5×72+5×82+5×92+5×102)-8.52=73.5-72.25=1.25=,
∴s1=.同理s2=,s3=,∴s2>s1>s3,故选B.]
13.58.5
解析 回归直线方程为 =1.5x+45经过点(, ),由=9,知=58.5.
14.0.2
15.0.030 3
解析 因5个矩形面积之和为1,即(0.005+0.010+0.020+a+0.035)×10=1,
∴0.070×10+10a=1,∴a=0.030.
由于三组内学生数的频率分别为:0.3,0.2,0.1,所以三组内学生的人数分别为30,20,10.
因此从[140,150]内选取的人数为×18=3.
16.2
17.解 (1)作出的散点图如图所示
(2)观察散点图可知各点大致分布在一条直线附近,列出下表:
序号
x
y
x2
xy
1
1
12
1
12
2
2
28
4
56
3
3
42
9
126
4
4
56
16
224

10
138
30
418
易得=,=,
所以 ===,
=- =-×=-2.
故y对x的回归直线方程为 =x-2.
(3)当x=9时, =×9-2=129.4.
故当广告费为9万元时,销售收入约为129.4万元.
18.解 (1)以x轴表示含碳量,y轴表示冶炼时间,可作散点图如图所示:
从图中可以看出,各点散布在一条直线附近,即它们线性相关.
(2)列出下表,并用科学计算器进行计算:
i
1
2
3
4
5
6
7
8
9
10
xi
104
180
190
177
147
134
150
191
204
121
yi
100
200
210
185
155
135
170
205
235
125
xiyi
10 400
36 000
39 900
32 745
22 785
18 090
25 500
39 155
47 940
15 125
=159.8,=172,
x=265 448,y=312 350,xiyi=287 640
设所求的回归直线方程为 = x+ ,
=≈1.267, =- ≈-30.47.
所求回归直线方程为
=1.267x-30.47.
(3)当x=160时, =1.267×160+(-30.47)=172.25.
即当钢水含碳量为160时,应冶炼约172.25分钟.
19.解 (1)由图象可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
甲==13,
乙==13,
s=[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s=[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s>s可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
20.解 (1)作出散点图:
观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系.
(2)=(0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,
=(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,
xiyi=27.51,x=33.72,
=≈0.813 6,
=1.42-1.74×0.813 6≈0.004 3,
∴回归方程为 =0.813 6x+0.004 3.
21.解 (1)A类工人中和B类工人中分别抽查25名和75名.
(2)①由4+8+x+5+3=25,得x=5,6+y+36+18=75,得y=15.
频率分布直方图如下:
图1 A类工人生产能力的频率分布直方图
图2 B类工人生产能力的频率分布直方图
从直方图可以判断:B类工人中个体间的差异程度更小.
②A=×105+×115+×125+×135+×145=123,
B=×115+×125+×135+×145=133.8,
=×123+×133.8=131.1.
A类工人生产能力的平均数,B类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.
22.解 (1)作出如下散点图:
由图可知,y与x具有线性相关关系.
(2)列出下表
i
1
2
3
4
5
6
7
8
9
10
xi
10
20
30
40
50
60
70
80
90
100
yi
62
68
75
81
89
95
102
108
115
122
xiyi
620
1 360
2 250
3 240
4 450
5 700
7 140
8 640
10 350
12 200
=55,=91.7,
x=38 500,y=87 777,xiyi=55 950,
设所求的回归直线方程为 = x+ ,则有
==≈0.668,
=- =91.7-0.668×55=54.96,
因此,所求的回归直线方程为 =0.668x+54.96.
(3)这个回归直线方程的意义是当x每增加1时,y的值约增加0.668,而54.96是y不随x变化而变化的部分,因此,当x=200时,y的估计值为
=0.668×200+54.96=188.56≈189,
因此,加工200个零件所用的时间约为189分.

第二章 统 计
2.1.1 简单随机抽样
课时目标 1.理解并掌握简单随机抽样的概念、特点和步骤.2.掌握简单随机抽样的两种方法.
1.简单随机抽样的定义
设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
2.简单随机抽样的分类
简单随机抽样
3.简单随机抽样的优点及适用类型
简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.
一、选择题
1.为了了解某种花的发芽天数,种植某种花的球根200个,进行调查发芽天数的试验,样本是(  )
A.200个表示发芽天数的数值
B.200个球根
C.无数个球根发芽天数的数值集合
D.无法确定
答案 A
2.某校有40个班,每班50人,要求每班随机选派3人参加“学生代表大会”.在这个问题中样本容量是(  )
A.40 B.50
C.120 D.150
答案 C
解析 由于样本容量即样本的个数,抽取的样本的个数为40×3=120.
3.抽签法中确保样本代表性的关键是(  )
A.制签 B.搅拌均匀
C.逐一抽取 D.抽取不放回
答案 B
解析 由于此问题强调的是确保样本的代表性,即要求每个个体被抽到的可能性相等.所以选B.
4.下列抽样实验中,用抽签法方便的有(  )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
答案 B
解析 A总体容量较大,样本容量也较大不适宜用抽签法;B总体容量较小,样本容量也较小可用抽签法;C中甲、乙两厂生产的两箱产品有明显区别,不能用抽签法;D总体容量较大,不适宜用抽签法.
5.为调查参加运动会的1 000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是(  )
A.1 000名运动员是总体
B.每个运动员是个体
C.抽取的100名运动员是样本
D.样本容量是100
答案 D
解析 此问题研究的是运动员的年龄情况,不是运动员,故A、B、C错,故选D.
6.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是(  )
A., B.,
C., D.,
答案 A
二、填空题
7.要检查一个工厂产品的合格率,从1 000件产品中抽出50件进行检查,检查者在其中随意抽取了50件,这种抽样法可称为________.
答案 简单随机抽样
解析 由简单随机抽样的特点可知,该抽样方法是简单随机抽样.
8.福利彩票的中奖号码是从1~36个号码中选出7个号码来按规则确定中奖情况,这种从36个号码中选7个号码的抽样方法是________.
答案 抽签法
9.用随机数表法进行抽样,有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定随机数表开始的数字,这些步骤的先后顺序应该是________.(填序号)
答案 ①③②
三、解答题
10.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程.
解 利用抽签法,步骤如下:
(1)将30辆汽车编号,号码是01,02,…,30;
(2)将号码分别写在一张纸条上,揉成团,制成号签;
(3)将得到的号签放入一个不透明的袋子中,并搅拌均匀;
(4)从袋子中依次抽取3个号签,并记录上面的编号;
(5)所得号码对应的3辆汽车就是要抽取的对象.
11.现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验.如何用随机数表法设计抽样方案?
解 (1)将元件的编号调整为010,011,012,…,099,100,…600;
(2)在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7列数“9”,向右读;
(3)从数“9”开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263;
(4)以上号码对应的6个元件就是要抽取的样本.
能力提升
12.在简单随机抽样中,某一个个体被抽到的可能性(  )
A.与第几次抽样有关,第一次抽到的可能性大一些
B.与第几次抽样无关,每次抽到的可能性相等
C.与第几次抽样有关,最后一次抽到的可能性大些
D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不同
答案 B
解析 由简单随机抽样的特点知与第n次抽样无关,每次抽到的可能性相等.
13.某车间工人已加工一种轴50件,为了了解这种轴的直径是否符合要求,要从中抽出5件在同一条件下测量,试用两种方法分别取样.
解 方法一 抽签法.
(1)将50个轴进行编号01,02,…,50;
(2)把编号写在大小、形状相同的纸片上作为号签;
(3)把纸片揉成团,放在箱子里,并搅拌均匀;
(4)依次不放回抽取5个号签,并记下编号;
(5)把号签对应的轴组成样本.
方法二 随机数法
(1)将50个轴进行编号为00,01,…,49;
(2)在随机数表中任意选定一个数并按向右方向读取;
(3)每次读两位,并记下在00~49之间的5个数,不能重复;
(4)把与读数相对应的编号相同的5个轴取出组成样本
1.判断所给的抽样是否为简单随机抽样的依据是随机抽样的特征:
简单随机抽样

如果四个特征有一个不满足就不是简单随机抽样.
2.利用抽签法抽取样本时应注意以下问题:
(1)编号时,如果已有编号(如学号、标号等)可不必重新编号.
(2)号签要求大小、形状完全相同.
(3)号签要搅拌均匀.
(4)要逐一不放回抽取.
3.在利用随机数表法抽样的过程中注意:
(1)编号要求数位相同.
(2)第一个数字的抽取是随机的.
(3)读数的方向是任意的,且事先定好的.
2.1.2 系统抽样
课时目标 1.理解系统抽样的概念、特点.2.掌握系统抽样的方法和操作步骤,会用系统抽样法进行抽样.
1.系统抽样的概念
先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本.
2.系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本,步骤为:
(1)先将总体的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.
(2)确定分段间隔k,对编号进行分段.当(n是样本容量)是整数时,取k=;
(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
一、选择题
1.下列抽样问题中最适合用系统抽样法抽样的是(  )
A.从全班48名学生中随机抽取8人参加一项活动
B.一个城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,要从中抽取一个容量为21的样本
C.从参加模拟考试的1 200名高中生中随机抽取100人分析试题作答情况
D.从参加模拟考试的1 200名高中生中随机抽取10人了解某些情况
答案 C
解析 A中总体容量较小,样本容量也较小,可采用抽签法;B中总体中的个体有明显的差异,也不适宜采用系统抽样;D中总体容量较大,样本容量较小也不适用系统抽样.
2.为了了解参加一次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是(  )
A.2 B.3
C.4 D.5
答案 A
解析 由1 252=50×25+2知,应随机剔除2个个体.
3.某会议室有50排座位,每排有30个座位.一次报告会坐满了听众.会后留下座号为15的所有听众50人进行座谈.这是运用了(  )
A.抽签法 B.随机数表法
C.系统抽样 D.有放回抽样
答案 C
解析 从第1排到第50排每取一个人的间隔人数是相同的,符合系统抽样的定义.
4.要从已经编号(1~50)的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射试验,用系统抽样方法确定所选取的5枚导弹的编号可能是(  )
A.5,10,15,20,25 B.3,13,23,33,43
C.1,2,3,4,5 D.2,4,8,16,32
答案 B
解析 由题意知分段间隔为10.只有选项B中相邻编号的差为10,选B.
5.一个年级有12个班,每个班有50名同学,随机编号1,2,…,50,为了了解他们在课外的兴趣,要求每班第40号同学留下来进行问卷调查,这里运用的抽样方法是(  )
A.抽签法 B.有放回抽样
C.随机数法 D.系统抽样
答案 D
6.总体容量为524,若采用系统抽样,当抽样的间距为下列哪一个数时,不需要剔除个体(  )
A.3 B.4
C.5 D.6
答案 B
解析 由于只有524÷4没有余数,故选B.
二、填空题
7.某班级共有学生52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号为________.
答案 16
解析 用系统抽样的方法是等距离的.42-29=13,故3+13=16.
8.采用系统抽样的方法,从个体数为1 003的总体中抽取一个容量为50的样本,则在抽样过程中,被剔除的个体数为________,抽样间隔为________.
答案 3 20
解析 因为1 003=50×20+3,所以应剔除的个体数为3,间隔为20.
9.采用系统抽样从含有8 000个个体的总体(编号为0000,0001,…,7999)中抽取一个容量为50的样本,则最后一段的编号为____________,已知最后一个入样编号是7894,则开头5个入样编号是__________________.
答案 7840~7999 0054,0214,0374,0534,0694
解析 因8000÷50=160,所以最后一段的编号为编号的最后160个编号.
从7840到7999共160个编号,从7840到7894共55个数,所以从0000到第55个编号应为0054,然后逐个加上160得,0214,0374,0534,0694.
三、解答题
10.某学校有30个班级,每班50名学生,上级要到学校进行体育达标验收.需要抽取10%的学生进行体育项目的测验.请你制定一个简便易行的抽样方案(写出实施步骤).
解 该校共有1 500名学生,需抽取容量为1 500×10%=150的样本.抽样的实施步骤:
可将每个班的学生按学号分成5段,每段10名学生.用简单随机抽样的方法在1~10中抽取一个起始号码l,则每个班的l,10+l,20+l,30+l,40+l(如果l=6,即6,16,26,36,46)号学生入样,即组成一个容量为150的样本.
11.某学校有8 000名学生,需从中抽取100个进行健康检查,采用何种抽样方法较好,并写出过程.
解 总体中个体个数达8 000,样本容量也达到100,用简单随机抽样中的抽签法与随机数法都不易进行操作,所以,采用系统抽样方法较好.于是,我们可以用系统抽样法进行抽样.具体步骤是:
(1)将总体中的个体编号为1,2,3,…,8 000;
(2)把整个总体分成100段,每段长度为k==80;
(3)在第一段1~80中用简单随机抽样确定起始编号l,例如抽到l=25;
(4)将编号为l,l+k,l+2k,l+3k,…,l+99k(即25,105,185,…,7 945)的个体抽出,得到样本容量为100的样本.
能力提升
12.某种体育彩票五等奖的中奖率为10%,已售出1 000 000份,编号为000000~999999,则用简单随机抽样需要随机抽取____________个号码,若要在某晚报上公布获奖号码,约要________版(每版可排100行,每行可排175个数字或空格,每个编号后需留1个空格).而用系统抽样,应该在0~________内随机抽取一个数字,个位数是这个数字的号码中奖.
答案 100 000 40 9
13.下面给出某村委调查本村各户收入情况所作的抽样,阅读并回答问题:
本村人口:1 200人,户数300,每户平均人口数4人;
应抽户数:30户;抽样间隔:=40;
确定随机数字:取一张人民币,编码的后两位数为12;
确定第一样本户:编码的后两位数为12的户为第一样本户;
确定第二样本户:12+40=52,52号为第二样本户;
……
(1)该村委采用了何种抽样方法?
(2)抽样过程中存在哪些问题,并修改.
(3)何处是用简单随机抽样.
解 (1)系统抽样.
(2)本题是对某村各户进行抽样,而不是对某村人口抽样,抽样间隔为:=10,
其他步骤相应改为确定随机数字:取一张人民币,编码的后两位数为02(或其他00~09中的一个),确定第一样本户:编号为02的户为第一样本户;确定第二样本户:02+10=12,编号为12的户为第二样本户;….
(3)确定随机数字用的是简单随机抽样.取一张人民币,编码的后两位数为02.
1.系统抽样的特点
(1)适用于总体中个体数较大且个体差异不明显的情况;
(2)剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系;
(3)是等可能抽样.每个个体被抽到的可能性相等.
2.系统抽样与简单随机抽样之间的关系
(1)系统抽样比简单随机抽样更容易实施,可节约抽样成本;
(2)系统抽样所得样本和具体的编号相联系;而简单随机抽样所得样本的代表性与个体的编号无关;
(3)系统抽样的实质是简单随机抽样.
(4)系统抽样比简单随机抽样的应用更广泛.
3.当总体容量不能被样本容量整除时,可以先从总体中随机剔除几个个体.但要注意的是剔除过程必须是随机的.也就是总体中的每个个体被剔除的机会均等.剔除几个个体后使总体中剩余的个体数能被样本容量整除.
2.1.3 分层抽样
课时目标 1.理解分层抽样的概念.2.掌握分层抽样的使用条件和操作步骤,会用分层抽样法进行抽样.
1.分层抽样的概念
在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
2.分层抽样的适用条件
分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.
一、选择题
1.有40件产品,其中一等品10件,二等品25件,次品5件,现从中抽出8件进行质量分析,问应采取何种抽样方法(  )
A.抽签法 B.随机数表法
C.系统抽样 D.分层抽样
答案 D
2.某城市有学校700所.其中大学20所,中学200所,小学480所,现用分层抽样方法从中抽取一个容量为70的样本,进行某项调查,则应抽取中学数为(  )
A.70 B.20
C.48 D.2
答案 B
解析 由于=10,即每10所学校抽取一所,
又因中学200所,所以抽取200÷10=20(所).
3.某工厂生产A、B、C三种不同型号的产品,产品的数量之比依次为3∶4∶7,现在用分层抽样的方法抽出容量为n的样本,样本中A型号产品有15件,那么样本容量n为(  )
A.50 B.60
C.70 D.80
答案 C
解析 由分层抽样方法得:×n=15,
解得n=70.
4.下列问题中,最适合用分层抽样方法抽样的是(  )
A.某电影院有32排座位,每排有40个座位,座位号是1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检查
C.某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩,现抽取农田480亩估计全乡农田平均产量
D.从50个零件中抽取5个做质量检验
答案 C
解析 A的总体容量较大,宜采用系统抽样方法;B的总体容量较小,用简单随机抽样法比较方便;C总体容量较大,且各类田地的产量差别很大,宜采用分层抽样方法;D与B类似.
5.要从其中有50个红球的1 000个球中,采用按颜色分层抽样的方法抽取100个进行分析,则应抽取红球的个数为(  )
A.5个 B.10个
C.20个 D.45个
答案 A
解析 由题意知每=10(个)球中抽取一个,现有50个红球,应抽取=5(个).
6.某小学三个年级共有学生270人,其中一年级108人,二、三年级各81人,现要用抽样方法抽取10人形成样本,将学生按一、二、三年级依次统一编号为1,2,…,270,如果 抽得号码有下列四种情况:
①5,9,100,107,111,121,180,195,200,265;
②7,34,61,88,115,142,169,196,223,250;
③30,57,84,111,138,165,192,219,246,270;
④11,38,60,90,119,146,173,200,227,254;
其中可能是由分层抽样得到,而不可能是由系统抽样得到的一组号码为(  )
A.①② B.②③
C.①③ D.①④
答案 D
解析 按照分层抽样的方法抽取样本,一、二、三年级抽取的人数分别为:,,,即4人,3人,3人;不是系统抽样即编号的间隔不同,观察①、②、③、④知:①④符合题意,②是系统抽样,③中三年级人数为4人,不是分层抽样.
二、填空题
7.某农场在三种地上种玉米,其中平地210亩,河沟地120亩,山坡地180亩,估计产量时要从中抽取17亩作为样本,则平地、河沟地、山坡地应抽取的亩数分别是________.
答案 7,4,6
解析 应抽取的亩数分别为210×=7,120×=4,180×=6.
8.将一个总体分为A、B、C三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C中抽取________个个体.
答案 20
解析 由题意可设A、B、C中个体数分别为5k,3k,2k,所以C中抽取个体数为×100=20.
9.某工厂生产A、B、C、D四种不同型号的产品,产品数量之比依次为2∶3∶5∶1.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号有16件,那么此样本的容量n为________.
答案 88
解析 在分层抽样中,每一层所抽的个体数的比例与总体中各层个体数的比例是一致的.所以,样本容量n=×16=88.
三、解答题
10.某小学有1 800名学生,6个年级中每个年级的人数大致相同,男女生的比例也大致相同,要从中抽取48名学生,测试学生100米跑的成绩.你认为应该用什么样的方法?怎样抽样?为什么要用这个方法?
解 应该用分层抽样的方法.因为小学的不同年级之间,男女生之间百米跑的成绩有较大差异,所以将1 800名学生按不同年级、性别分成12组,每组随机抽取4名,一共抽取48名学生.这样的抽样方法可使样本的结构与总体的结构保持一致.
11.某工厂有3条生产同一产品的流水线,每天生产的产品件数分别是3 000件,4 000件,8 000件.若要用分层抽样的方法从中抽取一个容量为150件产品的样本,应该如何抽样?
解 总体中的个体数N=3 000+4 000+8 000=15 000,样本容量n=150,抽样比例为==,所以应该在第1条流水线生产的产品中随机抽取3 000×=30(件)产品,在第2条流水线生产的产品中随机抽取4 000×=40(件)产品,在第3条流水线生产的产品中随机抽取8 000×=80(件)产品.这里因为每条流水线所生产的产品数都较多,所以,在每条流水线的产品中抽取样品时,宜采用系统抽样方法.
能力提升
12.某单位有技师18人,技术员12人,工程师6人,需要从这些人中抽取一个容量为n的样本,如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果样本容量增加1,则在采用系统抽样时,需要在总体中剔除1个个体,求样本容量n.
解 因为采用系统抽样和分层抽样时不用剔除个体,所以n是36的约数,且是6的约数,即n又是6的倍数,n=6,12,18或36,又n+1是35的约数,故n只能是4,6,34,综合得n=6,即样本容量为6.
13.选择合适的抽样方法抽样,写出抽样过程.
(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个.
(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个.
(3)有甲厂生产的300个篮球,抽取10个.
(4)有甲厂生产的300个篮球,抽取30个.
解 (1)总体容量较小,用抽签法.
①将30个篮球编号,号码为00,01,…,29;
②将以上30个编号分别写在完全一样的小纸条上,揉成小球,制成号签;
③把号签放入一个不透明的袋子中,充分搅拌;
④从袋子中逐个抽取3个号签,并记录上面的号码;
⑤找出和所得号码对应的篮球即可得到样本.
(2)总体由差异明显的两个层次组成,需选用分层抽样法.
①确定抽取个数.因为=3,所以甲厂生产的应抽取=7(个),乙厂生产的应抽取=3(个);
②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.
(3)总体容量较大,样本容量较小,宜用随机数法.
①将300个篮球用随机方式编号,编号为000,001,…,299;
②在随机数表中随机的确定一个数作为开始,如第8行第29列的数“7”开始.任选一个方向作为读数方向,比如向右读;
③从数“7”开始向右读,每次读三位,凡不在000~299中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到10个号码,这就是所要抽取的10个样本个体的号码.
(4)总体容量较大,样本容量也较大宜用系统抽样法.
①将300个篮球用随机方式编号,编号为001,002,003,…,300,并分成30段,其中每一段包含=10(个)个体;
②在第一段001,002,003,…,010这十个编号中用简单随机抽样抽出一个(如002)作为起始号码;
③将编号为002,012,022,…,292的个体抽出,组成样本
1.分层抽样的概念和特点
当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样.
分层抽样的优点是使样本具有较强的代表性,而且在各层抽样时又可灵活地选用不同的抽样法.
2.三种抽样方法的选择
简单随机抽样、系统抽样及分层抽样的共同特点是在抽样过程中每一个个体被抽取的机会都相等,体现了抽样方法的公平性和客观性.其中简单随机抽样是最基本的抽样方法,在系统抽样和分层抽样中都要用到简单随机抽样.当总体中的个体数较少时,常采用简单随机抽样;当总体中的个体数较多时,常采用系统抽样;当已知总体是由差异明显的几部分组成时,常采用分层抽样.

2.2.1 用样本的频率分布估计总体分布
课时目标 1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.3.能够利用图形解决实际问题.
1.用样本估计总体的两种情况
(1)用样本的____________估计总体的分布.
(2)用样本的____________估计总体的数字特征.
2.数据分析的基本方法
(1)借助于图形
分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中____________,二是利用图形________信息.
(2)借助于表格
分析数据的另一方法是用紧凑的________改变数据的排列方式,此法是通过改变数据的____________,为我们提供解释数据的新方式.
3.频率分布直方图
在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用________________来表示,各小长方形的面积的总和等于____.
4.频率分布折线图和总体密度曲线
(1)频率分布折线图
连接频率分布直方图中各小长方形__________,就得到了频率分布折线图.
(2)总体密度曲线
随着样本容量的增加,作图时所分的____增加,组距减小,相应的频率分布折线图就会越来越接近于一条________,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.
5.茎叶图
(1)适用范围:
当样本数据较少时,用茎叶图表示数据的效果较好.
(2)优点:它不但可以____________,而且可以__________,给数据的记录和表示都带来方便.
(3)缺点:
当样本数据______时,枝叶就会很长,茎叶图就显得不太方便.
一、选择题                 
1.下列说法不正确的是(  )
A.频率分布直方图中每个小矩形的高就是该组的频率
B.频率分布直方图中各个小矩形的面积之和等于1
C.频率分布直方图中各个小矩形的宽一样大
D.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的
2.一个容量为100的样本,其数据的分组与各组的频数如下:
组别
(0,10]
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
(60,70]
频数
12
13
24
15
16
13
7
则样本数据落在(10,40]上的频率为(  )
A.0.13 B.0.39 C.0.52 D.0.64
3.100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有(  )
A.30辆 B.40辆
C.60辆 D.80辆
4.如图是总体密度曲线,下列说法正确的是(  )
A.组距越大,频率分布折线图越接近于它
B.样本容量越小,频率分布折线图越接近于它
C.阴影部分的面积代表总体在(a,b)内取值的百分比
D.阴影部分的平均高度代表总体在(a,b)内取值的百分比
5.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为(  )
A.20% B.69%
C.31% D.27%
6.某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是(  )
A.90 B.75 C.60 D.45
题 号
1
2
3
4
5
6
答 案
二、填空题
7.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.
8.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________.
9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.
三、解答题
10.抽查100袋洗衣粉,测得它们的重量如下(单位:g):
494 498 493 505 496 492 485 483 508
511 495 494 483 485 511 493 505 488
501 491 493 509 509 512 484 509 510
495 497 498 504 498 483 510 503 497
502 511 497 500 493 509 510 493 491
497 515 503 515 518 510 514 509 499
493 499 509 492 505 489 494 501 509
498 502 500 508 491 509 509 499 495
493 509 496 509 505 499 486 491 492
496 499 508 485 498 496 495 496 505
499 505 496 501 510 496 487 511 501
496
(1)列出样本的频率分布表:
(2)画出频率分布直方图,频率分布折线图;
(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.
能力提升
11.在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,你会得到什么结论?
12.某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,
95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表.
(2)作出频率分布直方图.
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
绘制频率分布直方图的具体步骤:①求极差:找出一组数据中的最大值和最小值,最大值与最小值的差是极差(正值).②确定组距与组数:组数与样本容量有关,当样本容量不超过100时,按照数据的多少,常分成5~12组;组距的选择力求“取整”,组数=.③将数据分组:将数据分成互不相交的组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.④列频率分布表:一般分“分组”、“频数累计”、“频数”、“频率”四列,最后一行是合计.注意频数的合计是样本容量,频率的合计是1.⑤绘制频率分布直方图:根据频率分布表绘制频率分布直方图,其中纵轴表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积,即每个矩形的面积=组距×=频率.这样频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,各小矩形的面积的总和等于1.

答案: 2.2.1 用样本的频率分布估计总体分布
知识梳理
1.(1)频率分布 (2)数字特征 2.(1)提取信息 传递 (2)表格 构成形式 3.频率/组距 小长方形的面积 1 4.(1)上端的中点 (2)组数 光滑曲线
5.(2)保留所有信息 随时记录 (3)较多
作业设计
1.A
2.C [样本数据落在(10,40]上的频数为13+24+15=52,故其频率为=0.52.]
3.B [时速在[60,70)的汽车的频率为:
0.04×(70-60)=0.4,
又因汽车的总辆数为100,
所以时速在[60,70)的汽车大约有0.4×100=40(辆).]
4.C
5.C [由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为≈0.31.]
6.A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,
∴样本总数为=120.
∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,
∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.]
7.60
解析 ∵n·=27,
∴n=60.
8.45,46
解析 由茎叶图及中位数的概念可知
x甲中=45,x乙中=46.
9.
解析 =h,故|a-b|=组距==.
10.解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于=8,要分9组,组数合适,于是决定取组距为4 g,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:
[482.5,486.5),[486.5,490.5),…,[514.5,518.5).
列出频率分布表:
分组
个数累计
频数
频率
累积频率
[482.5,486.5)

8
0.08
0.08
[486.5,490.5)
3
0.03
0.11
[490.5,494.5)
正正正
17
0.17
0.28
[494.5,498.5)
正正正正-
21
0.21
0.49
[498.5,502.5)
正正
14
0.14
0.63
[502.5,506.5)

9
0.09
0.72
[506.5,510.5)
正正正
19
0.19
0.91
[510.5,514.5)
正-
6
0.06
0.97
[514.5,518.5]
3
0.03
1.00
合计
100
1.00
(2)频率分布直方图与频率分布折线图如图.
(3)重量在[494.5,506.5]g的频率为:0.21+0.14+0.09=0.44.
设重量不足500 g的频率为b,根据频率分布表,
≈,故b≈0.55.因此重量不足500 g的频率约为0.55.
11.解 (1)
   (2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.
12.解 (1)频率分布表:
分组
频数
频率
[41,51)
2
[51,61)
1
[61,71)
4
[71,81)
6
[81,91)
10
[91,101)
5
[101,111]
2
(2)频率分布直方图如图所示.
(3)答对下述两条中的一条即可:
①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月天数的.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的,超过50%;说明该市空气质量有待进一步改善.
2.2.2 用样本的数字特征估计总体的数字特征
课时目标 1.会求样本的众数、中位数、平均数、标准差、方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.
1.众数、中位数、平均数
(1)众数的定义:
一组数据中重复出现次数________的数称为这组数的众数.
(2)中位数的定义及求法
把一组数据按从小到大的顺序排列,把处于最______位置的那个数称为这组数据的中位数.
①当数据个数为奇数时,中位数是按从小到大顺序排列的__________那个数.
②当数据个数为偶数时,中位数为排列的最中间的两个数的________.
(3)平均数
①平均数的定义:
如果有n个数x1,x2,…,xn,那么=____________,叫做这n个数的平均数.
②平均数的分类:
总体平均数:________所有个体的平均数叫总体平均数.
样本平均数:________所有个体的平均数叫样本平均数.
2.标准差、方差
(1)标准差的求法:
标准差是样本数据到平均数的一种平均距离,一般用s表示.
s=________________________________________________________________________.
(2)方差的求法:
标准差的平方s2叫做方差.
s2=________________________________________________________________________.
一、选择题
1.下列说法正确的是(  )
A.在两组数据中,平均值较大的一组方差较大
B.平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小
C.方差的求法是求出各个数据与平均值的差的平方后再求和
D.在记录两个人射击环数的两组数据中,方差大的表示射击水平高
2.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有(  )
A.a>b>c B.a>c>b
C.c>a>b D.c>b>a
3.甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳定的是(  )
A.甲 B.乙
C.甲、乙相同 D.不能确定
4.一组数据的方差为s2,将这组数据中的每个数据都扩大3倍,所得到的一组数据的方差是(  )
A.s2 B.s2
C.3s2 D.9s2
5.如图是2010年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为(  )
A.84,4.84 B.84,1.6
C.85,1.6 D.85,0.4
6.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB则(  )
A.A>B,sA>sB B.AsB
C.A>B,sA题 号
1
2
3
4
5
6
答 案
二、填空题
7.已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.
8.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):

10
8
9
9
9

10
10
7
9
9
如果甲、乙两人只能有1人入选,则入选的应为________.
9.若a1,a2,…,a20,这20个数据的平均数为x,方差为0.20,则数据a1,a2,…,a20,这21个数据的方差为________.
三、解答题
10.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:
(1)请填写表:
平均数
方差
中位数
命中9环及9环以上的次数


(2)请从下列四个不同的角度对这次测试结果进行分析:
①从平均数和方差相结合看(分析谁的成绩更稳定);
②从平均数和中位数相结合看(分析谁的成绩好些);
③从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);
④从折线图上两人射击命中环数的走势看(分析谁更有潜力).
能力提升
11.下面是一家快餐店所有工作人员(共7人)一周的工资表:
总经理
大厨
二厨
采购员
杂工
服务员
会计
3 000元
450元
350元
400元
320元
320元
410元
(1)计算所有人员一周的平均工资;
(2)计算出的平均工资能反映一般工作人员一周的收入水平吗?
(3)去掉总经理的工资后,再计算剩余人员的平均工资,这能代表一般工作人员一周的收入水平吗?
12.师大附中三年级一班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:
平均成绩
标准差
第一组
90
6
第二组
80
4
求全班的平均成绩和标准差.
1.平均数、众数、中位数都是描述数据的集中趋势的,其中平均数是最重要的量.
众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使得无法客观地反映总体特征;中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也成为缺点,因为这些极端值有时是不能忽视的.
由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.
2.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
3.极差、方差、标准差是描述数据的离散程度的,即各数据与其平均数的离散程度.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
答案:
2.2.2 用样本的数字特征估计总体的数字特征
知识梳理
1.(1)最多 (2)中间 ①中间位置的 ②平均数 (3)① ②总体中 样本中
2.(1) (2)[(x1-)2+(x2-)2+…+(xn-)2]
作业设计
1.B [A中平均值和方差是数据的两个特征,不存在这种关系;C中求和后还需取平均数;D中方差越大,射击越不平稳,水平越低.]
2.D [由题意a=(16+18+15+11+16+18+18+17+15+13)==15.7,
中位数为16,众数为18,即b=16,c=18,
∴c>b>a.]
3.B [方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.
∵5.09>3.72,故选B.]
4.D [s=[9x+9x+…+9x-n(3)2]=9·(x+x+…+x-n 2)=9·s2(s为新数据的方差).]
5.C [由题意=(84+84+86+84+87)=85.
s2=[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=(1+1+1+1+4)==1.6.]
6.B [样本A数据均小于或等于10,样本B数据均大于或等于10,故A又样本B波动范围较小,故sA>sB.]
7.91
解析 由题意得
8.甲
解析 甲=9,=0.4,乙=9,=1.2,故甲的成绩较稳定,选甲.
9.0.19
解析 这21个数的平均数仍为20,从而方差为×[20×0.2+(20-20)2]≈0.19.
10.解 由折线图,知
甲射击10次中靶环数分别为:
9,5,7,8,7,6,8,6,7,7.
将它们由小到大重排为:5,6,6,7,7,7,7,8,8,9.
乙射击10次中靶环数分别为:
2,4,6,8,7,7,8,9,9,10.
也将它们由小到大重排为:2,4,6,7,7,8,8,9,9,10.
(1)甲=×(5+6×2+7×4+8×2+9)=
=7(环),
乙=×(2+4+6+7×2+8×2+9×2+10)=
=7(环),
s=×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]
=×(4+2+0+2+4)
=1.2,
s=×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]
=×(25+9+1+0+2+8+9)
=5.4.
根据以上的分析与计算填表如下:
平均数
方差
中位数
命中9环及9环以上的次数

7
1.2
7
1

7
5.4
7.5
3
(2)①∵平均数相同,
<,
∴甲成绩比乙稳定.
②∵平均数相同,
甲的中位数<乙的中位数,
∴乙的成绩比甲好些.
③∵平均数相同,命中9环及9环以上的次数甲比乙少,
∴乙成绩比甲好些.
④甲成绩在平均数上下波动;而乙处于上升势头,从第四次以后就没有比甲少的情况发生,乙较有潜力.
11.解 (1)平均工资即为该组数据的平均数
=×(3 000+450+350+400+320+320+410)
=×5 250=750(元).
(2)由于总经理的工资明显偏高,所以该值为极端值,因此由(1)所得的平均工资不能反映一般工作人员一周的收入水平.
(3)除去总经理的工资后,其他工作人员的平均工资为:′=×(450+350+400+320+320+410)
=×2 250=375(元).
这个平均工资能代表一般工作人员一周的收入水平.
12.解 设第一组20名学生的成绩为xi(i=1,2,…,20),
第二组20名学生的成绩为yi(i=1,2,…,20),
依题意有:=(x1+x2+…+x20)=90,
=(y1+y2+…+y20)=80,故全班平均成绩为:
(x1+x2+…+x20+y1+y2+…+y20)
=(90×20+80×20)=85;
又设第一组学生成绩的标准差为s1,第二组学生成绩的标准差为s2,则s=(x+x+…+x-202),
s=(y+y+…+y-202)
(此处,=90,=80),又设全班40名学生的标准差为s,平均成绩为(=85),故有
s2=(x+x+…+x+y+y+…+y-402)
=(20s+202+20s+202-402)
=(62+42+902+802-2×852)=51.
s=.
所以全班同学的平均成绩为85分,标准差为.
§2.1 习题课
课时目标 1.从总体上把握三种抽样方法的区别和联系.2.学会根据数据的不同情况,选用适合的抽样方法进行抽样.
1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是(  )
A.总体  B.个体 
C.总体的一个样本 D.样本容量
答案 C
2.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是(  )
A.分层抽样 B.简单随机抽样
C.系统抽样 D.以上都不对
答案 C
解析 按照一定的规律进行抽取为系统抽样.
3.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是(  )
A.简单随机抽样法 B.抽签法
C.随机数法 D.分层抽样法
答案 D
解析 由分层抽样的定义可知,该抽样为按比例的抽样.
4.对于简单随机抽样,下列说法中正确的命题为(  )
①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;
②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;
③它是一种不放回抽样;
④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.
A.①②③ B.①②④
C.①③④ D.①②③④
答案 D
5.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________.
答案 30
解析 由题意,知×n=6,∴n=30.
6.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.
答案 760
解析 设该校女生人数为x,则男生人数为(1 600-x).
由已知,×(1 600-x)-·x=10,解得x=760.故该校的女生人数是760人.
一、选择题
1.下列哪种工作不能使用抽样方法进行(  )
A.测定一批炮弹的射程
B.测定海洋水域的某种微生物的含量
C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度
D.检测某学校全体高三学生的身高和体重的情况
答案 D
2.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为(  )
A.16 B.14
C.28 D.12
答案 A
解析 运动员共计98人,抽取比例为=,因此男运动员56人中抽取16人.
3.下列抽样实验中,最适宜用系统抽样的是(  )
A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样
B.某厂生产的2 000个电子元件中随机抽取5个入样
C.从某厂生产的2 000个电子元件中随机抽取200个入样
D.从某厂生产的20个电子元件中随机抽取5个入样
答案 C
解析 A中总体有明显层次,不适用系统抽样法;B中样本容量很小,适宜用简单随机抽样法中的随机数法;D中总体数很小,故适宜用抽签法,只有C比较适用系统抽样法.
4.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为(  )
A.2个 B.3个
C.5个 D.13个
答案 A
解析 抽取的样本容量与总体的比值为=,
所以抽取的样本中,进口的标志灯抽取的数量为30×=2(个).
5.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是(  )
A.12,24,15,9 B.9,12,12,7
C.8,15,12,5 D.8,16,10,6
答案 D
解析 由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×=8,40×=16,40×=10,40×=6.
6.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是(  )
A.7,4,6 B.9,5,6
C.6,4,9 D.4,5,9
答案 B
解析 各年龄段所选分别为×45=9,×25=5,×30=6.
二、填空题
7.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.
答案 5.7%
解析 ∵990∶99 000=1∶100,∴普通家庭中拥有3套或3套以上住房的大约为50×100=5 000(户).
又∵100∶1 000=1∶10,∴高收入家庭中拥有3套或3套以上住房的大约为70×10=700(户).
∴3套或3套以上住房的家庭约有5 000+700=5 700(户).故=5.7%.
8.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.
答案 37 20
解析 由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37. 40岁以下的年龄段的职工数为200×0.5=100,则应抽取的人数为×100=20(人).
9.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.
性别
人数
生活能否自理



178
278
不能
23
21
则该地区生活不能自理的老人中男性比女性约多________人.
答案 60
解析 由表知500人中生活不能自理的男性比女性多2人,所以该地区15 000位老人生活不能自理的男性比女性多2×=60(人).
三、解答题
10.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:
很喜爱
喜爱
一般
不喜爱
2 435
4 567
3 926
1 072
电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应当怎样进行抽样?
解 可用分层抽样方法,其总体容量为12 000.“很喜爱”占,应取60×≈12(人);“喜爱”占,应取60×≈23(人);“一般”占,应取60×≈20(人);“不喜爱”占,应取60×≈5(人).因此采用分层抽样在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.
11.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?
解 (1)将624名职工用随机方式编号由000至623.
(2)利用随机数法从总体中剔除4人.
(3)将剩下的620名职工重新编号由000至619.
(4)分段,取间隔k==10,将总体分成62组,每组含10人.
(5)从第一段,即为000到009号随机抽取一个号l.
(6)按编号将l,10+l,20+l,…,610+l,共62个号码选出,这62个号码所对应的职工组成样本.
能力提升
12.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为(  )
A.9 B.18 C.27 D.36
答案 B
解析 设该单位老年职工有x人,从中抽取y人.
则160+3x=430?x=90,即老年职工有90人,
则=?y=18.
故选B.
13.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:
学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.
学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.
学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.
请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?
解 学生A的方法得到的样本不能够反映不上网的居民情况,是一种方便样本,所得的结果代表性差,不能很准确地获得平均每户居民的月用水量;学生B的方法实际上是普查,花费的人力物力要多一些,但是如果统计过程不出错,可以准确地得到平均每户居民的月用水量;在小区的每户居民都装有电话的情况下,学生C的方法是一种随机抽样方法,所得的样本具有代表性,可以比较准确地获得平均每户居民的月用水量.
在小区的每户居民都装有电话的情况下,建议用随机抽样的方法获取数据,即用学生C的方法,以节省人力物力,并且可以得到比较精确的结果.
1.抽签法的关键是搅拌均匀,才能达到等概率抽样,抽签法的优点是操作简单、易行、方便,缺点是只适用于总体中个体数较少时.
2.在系统抽样中,遇到(N是总体,n是样本容量)不是整数时,要从总体中剔除多余的个体,使剩余的个体能被样本容量整除,剔除多余个体所用的方法是随机抽样法.
3.分层抽样的步骤是将总体按一定的标准分层,按各层个体占总体的比在每一层进行随机抽取;其特点是适用于总体由差异明显的几部分组成.
4.几种抽样方法的共同特点是它们在抽样过程中,属不放回抽样,且每次抽取时,总体内的各个个体被抽到的机会是相等的.这体现了这些抽样方法的客观性和公平性.

§2.2 习题课
课时目标 1.进一步巩固基础知识,学会用样本估计总体的思想、方法.2.提高学生分析问题和解决实际应用问题的能力.
1.要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的(  )
A.平均数 B.方差
C.众数 D.频率分布
2.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差等于(  )
A.3.5 B.-3 C.3 D.-0.5
3.对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是(  )
A.频率分布直方图与总体密度曲线无关
B.频率分布直方图就是总体密度曲线
C.样本容量很大的频率分布直方图就是总体密度曲线
D.如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近于总体密度曲线
4.容量为100的样本数据,按从小到大的顺序分为8组,如下表:
组号
1
2
3
4
5
6
7
8
频数
10
13
x
14
15
13
12
9
第三组的频数和频率分别是(  )
A.14和0.14 B.0.14和14
C.和0.14 D.和
5.某中学高三(2)班甲、乙两名同学自高中以来每次考试成绩的茎叶图如图,下列说法正确的是(  )
A.乙同学比甲同学发挥稳定,且平均成绩也比甲同学高
B.乙同学比甲同学发挥稳定,但平均成绩不如甲同学高
C.甲同学比乙同学发挥稳定,且平均成绩比乙同学高
D.甲同学比乙同学发挥稳定,但平均成绩不如乙同学高
6.数据70,71,72,73的标准差是________.
一、选择题
1.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000中再用分层抽样方法抽出100人作出一步调查,则在[2 500,3 000](元)/月收入段应抽出的人数为(  )
A.20 B.25 C.40 D.50
2.一组数据的平均数是4.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是(  )
A.55.2,3.6 B.55.2,56.4
C.64.8,63.6 D.64.8,3.6
3.一容量为20的样本,其频率分布直方图如图所示,样本在[30,60)上的频率为(  )
A.0.75 B.0.65 C.0.8 D.0.9
4.甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/km2):
品种
第1年
第2年
第3年
第4年
第5年

9.8
9.9
10.1
10
10.2

9.4
10.3
10.8
9.7
9.8
其中产量比较稳定的小麦品种是(  )
A.甲 B.乙
C.稳定性相同 D.无法确定
5.某校在“创新素质实践行”活动中组织学生进行社会调查,并对学生的调查报告进行了评比,下面是将某年级60篇学生调查报告进行整理,分成5组画出的频率分布直方图(如图所示).已知从左至右4个小组的频率分别为0.05,0.15,0.35,0.30,那么在这次评比中被评为优秀的调查报告有(分数大于或等于80分为优秀且分数为整数)(  )
A.18篇 B.24篇
C.25篇 D.27篇
题 号
1
2
3
4
5
答 案
二、填空题
6.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.
7.将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.
8.某地区为了解中学生的日平均睡眠时间(单位:h),随机选择了n位中学生进行调查,根据所得数据画出样本的频率分布直方图如图所示,且从左到右的第1个、第4个、第2个、第3个小长方形的面积依次相差0.1,又第一小组的频数是10,则n=________.
三、解答题
9.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:

27
38
30
37
35
31

33
29
38
34
28
36
(1)画出茎叶图,由茎叶图你能获得哪些信息?
(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、极差、方差,并判断选谁参加比赛比较合适?
10.潮州统计局就某地居民的月收入调查了10 000人,并根据所得数据画出了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).
(1)求居民月收入在[3 000,3 500)的频率;
(2)根据频率分布直方图算出样本数据的中位数;
(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?
能力提升
11.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95].由此得到频率分布直方图如图,则由此估计该厂工人一天生产该产品数量在[55,70)的人数约占该厂工人总数的百分率是________.
1.方差反映了一组数据偏离平均数的大小,一组数据方差越大,说明这组数据波动越大.即方差反应了样本偏离样本中心(,)的情况.标准差可以使其单位与样本数据的单位一致,从另一角度同样衡量这组数据的波动情况.
2.在求方差时,由于对一组数据都同时加上或减去相同的数只是平均数发生了变化,其方差不变,因此可以转化为一组较简单的新数求方差较为简捷.
答案:
§2.2 习题课
双基演练
1.D [样本的平均数、方差、众数都不能反应样本在某一范围的个数所占样本容量的比例,故选D.]
2.B [少输入90,=3,平均数少3,求出的平均数减去实际的平均数等于-3.]
3.D
4.A [频数为100-(10+13+14+15+13+12+9)=14;频率为=0.14.]
5.A [从茎叶图可知乙同学的成绩在80~90分分数段的有9次,而甲同学的成绩在80~90分分数段的只有7次;再从题图上还可以看出,乙同学的成绩集中在90~100分分数段的最多,而甲同学的成绩集中在80~90分分数段的最多.故乙同学比甲同学发挥较稳定且平均成绩也比甲同学高.]
6.
解析 ==71.5,
s=
=.
作业设计
1.B [由题意可知:在[2 500,3 000](元)/月的频率为0.000 5×500=0.25,故所求的人数为0.25×100=25.]
2.D [每一个数据都加上60时,平均数也应加上60,而方差不变.]
3.B [由图可知,样本在[30,60)上的频率为0.02×10+0.025×10+0.02×10=0.2+0.25+0.2=0.65,故选择B.]
4.A [方法一 甲=×(9.8+9.9+10.1+10+10.2)=10,
乙=×(9.4+10.3+10.8+9.7+9.8)=10,
即甲、乙两种冬小麦的平均单位面积产量的均值都等于10,其方差分别为
s=×(0.04+0.01+0.01+0+0.04)=0.02,
s=×(0.36+0.09+0.64+0.09+0.04)=0.244,
即s方法二 (通过特殊的数据作出合理的推测)表中乙品种在第一年的产量为9.4,在第三年的产量为10.8,其波动比甲品种大得多,所以甲种冬小麦的产量比较稳定.]
5.D [第5个小组的频率为1-0.05-0.15-0.35-0.30=0.15,
∴优秀的频率为0.15+0.30=0.45
∴优秀的调查报告有60×0.45=27(篇).]
6.24 23
解析 甲=(10×2+20×5+30×3+17+6+7)=24,
乙=(10×3+20×4+30×3+17+11+2)=23.
7.60
解析 ∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,
∴前三组频数为·n=27,故n=60.
8.100
解析 设第1个小长方形的面积为S,则4个小长方形的面积之和为S+(S+0.1)+(S+0.2)+(S+0.3)=4S+0.6.由题意知,4S+0.6=1,
∴S=0.1.又=0.1,∴n=100.
9.解 (1)画茎叶图、中间数为数据的十位数.
从茎叶图上看,甲、乙的得分情况都是分布均匀的,只是乙更好一些.乙发挥比较稳定,总体情况比甲好.
(2)甲==33.
乙==33.
s=[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67.
s=[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈12.67.
甲的极差为11,乙的极差为10.
综合比较以上数据可知,
选乙参加比赛较合适.
10.解 (1)月收入在[3 000,3 500)的频率为
0.000 3×(3 500-3 000)=0.15.
(2)∵0.000 2×(1 500-1 000)=0.1,
0.000 4×(2 000-1 500)=0.2,
0.000 5×(2 500-2 000)=0.25,
0.1+0.2+0.25=0.55>0.5.
∴样本数据的中位数为
2 000+=2 000+400=2 400(元).
(3)居民月收入在[2 500,3 000)的频率为
0.000 5×(3 000-2 500)=0.25,
所以10 000人中月收入在[2 500,3 000)的人数为0.25×10 000=2 500(人),
再从10 000人中分层抽样方法抽出100人,则月收入在[2 500,3 000)的这段应抽取100×=25(人).
11.52.5%
解析 结合直方图可以看出:生产数量在[55,65)的人数频率为0.04×10=0.4,生产数量在[65,75)的人数频率为0.025×10=0.25,而生产数量在[65,70)的人数频率约为0.25×=0.125,那么生产数量在[55,70)的人数频率约为0.4+0.125=0.525,即52.5%.
§2.3 变量间的相关关系
课时目标 1.理解两个变量的相关关系的概念.2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.3.会求回归直线方程.
1.相关关系:与函数关系不同,相关关系是一种__________性关系.
2.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________,点散布在从左上角到右下角的区域内,两个变量的相关关系为________.
3.如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量之间具有____________,这条直线叫__________.
4.回归直线方程=x+,其中
是回归方程的斜率,是截距.
5.通过求Q=(yi-bxi-a)2的最小值而得出回归直线的方法,即求出的回归直线使样本数据中的点到它的距离的平方和最小,由于平方又叫二乘方,所以这种使“偏差平方和最小”的方法叫做______________.                  
一、选择题
1.下列两个变量之间的关系,哪个不是函数关系?(  )
A.匀速行驶车辆的行驶距离与时间
B.圆半径与圆的面积
C.正n边形的边数与内角度数之和
D.人的年龄与身高
2.下列有关线性回归的说法,不正确的是(  )
A.变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图
C.回归直线方程最能代表观测值x、y之间的关系
D.任何一组观测值都能得到具有代表意义的回归直线方程
3.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为 =60+90x,下列判断正确的是(  )
A.劳动生产率为1千元时,工资为50元
B.劳动生产率提高1千元时,工资提高150元
C.劳动生产率提高1千元时,工资约提高90元
D.劳动生产率为1千元时,工资90元
4.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是(  )
A. =-10x+200 B. =10x+200
C. =-10x-200 D. =10x-200
5.给出两组数据x、y的对应值如下表,若已知x、y是线性相关的,且回归直线方程:y= + x,经计算知: =-1.4,则 为(  )
x
4
5
6
7
8
y
12
10
9
8
6
A. 17.4 B.-1.74
C.0.6 D.-0.6
6.回归直线方程表示的直线 = + x必经过点(  )
A.(0,0) B.(,0)
C.(,) D.(0,)
题 号
1
2
3
4
5
6
答 案
二、填空题
7.若对某个地区人均工资x与该地区人均消费y进行调查统计得y与x具有相关关系,且回归直线方程 =0.7x+2.1(单位:千元),若该地区人均消费水平为10.5,则估计该地区人均消费额占人均工资收入的百分比约为________.
8.设有一个回归方程 =3-2.5x,当变量x增加一个单位时,变量y________个单位.
9.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的回归直线方程为 =6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差______分.
三、解答题
10.下表是某旅游区游客数量与平均气温的对比表:
平均气温(℃)
-1
4
10
13
18
26
数量(百个)
20
24
34
38
50
64
若已知游客数量与平均气温是线性相关的,求回归方程.
11.5个学生的数学和物理成绩(单位:分)如下表:
学生
学科
A
B
C
D
E
数学
80
75
70
65
60
物理
70
66
68
64
62
画出散点图,判断它们是否具有相关关系,若相关,求出回归方程.
能力提升
12.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:
温度x(℃)
0
10
20
50
70
溶解度y
66.7
76.0
85.0
112.3
128.0
则由此得到回归直线的斜率约为________.
13.20世纪初的一项关于16艘轮船的研究显示,轮船的吨位从192~3 246吨,船员的数目从5~32人,对船员人数关于轮船的吨位数的回归分析得:船员人数=9.5+0.006 2×轮船吨位.
(1)假设两轮船吨位相差1 000吨,船员人数平均相差多少?
(2)对于最小的轮船估计的船员人数是多少?对于最大的轮船估计的船员人数是多少?

1.由最小二乘法得
其中: 是回归方程的斜率, 是截距.
2.回归方程的求解过程
?
3.在回归方程 =bx+a中,当回归系数b>0时,说明两个变量呈正相关关系,它的意义是:当x每增加一个单位时y就增加b个单位;当b<0时,说明两个变量呈负相关关系,它的意义是:当x每增加一个单位时,y就减少b个单位.
答案:
§2.3 变量间的相关关系
知识梳理
1.非确定 2.正相关 负相关 3.线性相关关系 回归直线 4.- 5.最小二乘法
作业设计
1.D [人的年龄与身高具有相关关系.]
2.D [只有所有的数据点都分布在一条直线附近时,才能得到具有代表意义的回归直线.]
3.C [因工人月工资与劳动生产率变化的回归直线方程为 =60+90x,当x由a提高到a+1时, 2- 1=60+90(a+1)-60-90a=90.]
4.A [∵y与x负相关,∴排除B、D,
又∵C项中x>0时 <0不合题意,∴C错.]
5.A [=(4+5+6+7+8)=6,
=(12+10+9+8+6)=9.
=- =9+1.4×6=9+8.4=17.4.]
6.C [由 =- 得= + ,
即点(,)适合方程 = + x.]
7.87.5%
解析 设该地区人均工资收入为,
则=0.7+2.1,
当=10.5时,==12.
×100%=87.5%.
8.减少2.5
解析  ′=3-2.5(x+1)=3-2.5x-2.5= -2.5,
因此,y的值平均减少2.5个单位.
9.20
解析 令两人的总成绩分别为x1,x2.
则对应的数学成绩估计为
=6+0.4x1, 2=6+0.4x2,
所以| 1- 2|=|0.4(x1-x2)|=0.4×50=20.
10.解 ==,==,x=1+16+100+169+324+676=1 286,xiyi=-20+96+340+13×38+18×50+26×64=3 474.
==≈1.68,
=- ≈18.73,
即所求的回归方程为 =1.68x+18.73.
11.解 以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示:
由散点图可知,两者之间具有相关关系,且为线性相关.
列表,计算
i
1
2
3
4
5
xi
80
75
70
65
60
yi
70
66
68
64
62
xiyi
5 600
4 950
4 760
4 160
3 720
x
6 400
5 625
4 900
4 225
3 600
=70,=66,x=24 750,xiyi=23 190
设所求回归方程为 = x+ ,则由上表可得
===0.36, =- =40.8.
∴所求回归方程为 =0.36x+40.8.
12.0.880 9
解析 =30,=93.6,x=7 900,
xiyi=17 035,
所以回归直线的斜率
==≈0.880 9.
13.解 (1)由 =9.5+0.006 2x可知,当x1与x2相差1 000吨时,船员平均人数相差 1- 2=(9.5+0.006 2x1)-(9.5+0.006 2x2)=0.006 2×1000≈6(人).
(2)当取最小吨位192时,预计船员人数为 =9.5+0.006 2×192≈10(人).
当取最大吨位3 246时,预计船员人数为=9.5+0.006 2×3 246≈29(人).
章末复习课
课时目标 1.巩固本章主干知识点.2.提高知识的综合应用能力.
1.某质检人员从编号为1~100这100件产品中,依次抽出号码为3,13,23,…,93的产品进行检验,则这样的抽样方法是(  )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.以上都不对
2.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为(  )
A.7 B.15
C.25 D.35
3.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是(  )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
4.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为(  )
A.1 B.2
C.3 D.4
5.如果数据x1,x2,…,xn的平均数为,方差为s2,则2x1+3,2x2+3,…,2xn+3的平均数和方差分别为(  )
A.和s B.2+3和4s2
C.2+3和s2 D.2+3和4s2+12s+9
6.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有______根棉花纤维的长度小于20 mm.
一、选择题
1.为了调查参加运动会的500名运动员的身高情况,从中抽查了50名运动员的身高,就这个问题来说,下列说法正确的是(  )
A.50名运动员是总体
B.每个运动员是个体
C.抽取的50名运动员是样本
D.样本容量是50
2.某高级中学高一年级有十六个班,812人,高二年级有十二个班,605人,高三年级有十个班,497人,学校为加强民主化管理,现欲成立由76人组成的学生代表会,你认为下列代表产生的办法中,最符合统计抽样原则的是(  )
A.指定各班团支部书记、班长为代表
B.全校选举出76人
C.高三选举出20人,高二选举出24人,高一选举出32人
D.高三20人,高二24人,高一32人均在各年级随机抽取
3.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40和0.125,则n的值是(  )
A.640 B.320
C.240 D.160
4.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000]的频率为(  )
A.0.001 B.0.01
C.0.003 D.0.3
5.在某项体育比赛中,七位裁判为一选手打出的分数如下:
90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(  )
A.92,2 B.92,2.8
C.93,2 D.93,2.8
6.下列图形中具有相关关系的两个变量是(  )
题 号
1
2
3
4
5
6
答 案
二、填空题
7.一个总体中有100个个体,随机编号0,1,2,…,99,依从小到大的编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是________.
8.一个样本容量是100的频率分布如图:
(1)样本落在[60,70)内的频率为________;
(2)样本落在[70,80)内的频数为________;
(3)样本落在[90,100)内的频率是0.16,该小矩形的高是________.
9.某商店统计了最近6个月某商品的进价x与售价y(单位:元)的对应数据如下表:
x
3
5
2
8
9
12
y
4
6
3
9
12
14
假设得到的关于x和y之间的回归直线方程是 = x+ ,那么该直线必过的定点是________.
三、解答题
10.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:

60
80
70
90
70

80
60
70
80
75
分别计算两个样本的平均数和方差s2,并根据计算结果估计甲、乙谁的平均成绩较好?谁的各门功课发展较平衡?
11.下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长度计算的,且对于给定的x,y为正态变量,其方差与x无关.
x(℃)
300
400
500
600
700
800
y(%)
40
50
55
60
67
70
(1)画出散点图;
(2)指出x,y是否线性相关;
(3)若线性相关,求y关于x的回归方程;
(4)估计退水温度是1 000℃时,黄酮延长性的情况.
12.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.
(1)求第二小组的频率,并补全这个频率分布直方图;
(2)求这两个班参赛的学生人数是多少?
(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)
能力提升
13.在一次中学生田径运动会上,参加跳高的17名运动员成绩如下:
成绩
(单位m)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数
2
3
2
3
4
1
1
1
(1)分别求这些运动员成绩的众数、中位数、平均数(保留3个有效数字);
(2)分析这些数据的含义.
14.今年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如下表:(月均用水量的单位:吨)
用水量分组
频数
频率
[0.5,2.5)
12
[2.5,4.5)
[4.5,6.5)
40
[6.5,8.5)
0.18
[8.5,10.5]
6
合计
100
1
(1)请完成该频率分布表,并画出相对应的频率分布直方图和频率分布折线图;
(2)估计样本的中位数是多少?
(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1 200户,请估计上级支援该乡的月调水量是多少吨?
1.三种常用的抽样方法:简单随机抽样、系统抽样和分层抽样.在使用它们的过程中,每一个个体被抽到的可能性是一样的.应用抽样方法抽取样本时,应注意以下几点:
(1)用随机数法抽样时,对个体所编的号码位数是相等的,当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.
(2)用系统抽样法抽样时,如果总体容量N能被样本容量n整除,抽样间隔为k=,如果总体容量N不能被样本容量n整除,先用简单抽样法剔除多余个数、抽样间隔为k=[],([]表示取的整数部分.)
(3)三种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数表法;当总体容量较大,样本容量也较大时,可采用系统抽样法;当总体由差异明显的几部分组成时,可采用分层抽样法.
2.为了从整体上更好地把握总体的规律,可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是把样本数据分成相同数目的两部分,其中一部分比这个数小,另一部分比这个数大的那个数;平均数就是所有样本数据的平均值,用表示;标准差是反映样本数据分散程度大小的最常用统计量,其计算公式如下:
s=.
有时也用标准差的平方s2——方差来代替标准差,实质一样.
3.求回归直线方程的步骤:
(1)先把数据制成表,从表中计算出,,x,y,xiyi;
(2)计算回归系数 , .公式为
(3)写出回归直线方程 = x+ .

答案:
章末复习课
双基演练
1.B
2.B [设样本容量为n,则=,∴n=15.]
3.A
4.D [∵=10,[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]=2,化简得x+y=20,(x-10)2+(y-10)2=8,解得x=12,y=8或x=8,y=12,
∴|x-y|=4.]
5.B [因x1+x2+…+xn=n,
所以
==+3=2+3.
又(x1-)2+(x2-)2+…+(xn-)2=ns2,
所以[2x1+3-(2+3)]2+[2x2+3-(2+3)]2+…+[2xn+3-(2+3)]2=4[(x1-)2+(x2-)2+…+(xn-)2]=4ns2.
所以方差为4s2.]
6.30
解析 纤维长度小于20 mm的频率约为
p=5×0.01+5×0.01+5×0.04=0.3,
∴100×0.30=30.
作业设计
1.D [在这个问题中所要考察的对象是身高,另一方面,样本容量是指样本中的个体数目.]
2.D [以年级为层,按各年级所占的比例进行抽样,为了使抽取的学生具有代表性,应在各年级进行随机抽样.]
3.B [由=0.125,得n=320.]
4.D [频率=×组距,
由图易知:=0.001,组距=3 000-2 700=300,
∴频率=0.001×300=0.3]
5.B [去掉95和89后,剩下5个数据的平均值
==92,
方差s2=[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=2.8.]
6.D [A和B符合函数关系,即对x的每一个值,y都有唯一确定的值与之对应;从C、D散点图来看,D的散点都在某一条直线附近波动,因此两变量具有相关关系.]
7.76
解析 由题意知:m=8,k=8,
则m+k=16,也就是第8组的个位数字为6,
十位数字为8-1=7,故抽取的号码为76.
8.(1)0.2 (2)30 (3)0.016
解析 (1)由×组距=频率,得频率为0.2;
(2)频率为0.3,又由频数=频率×样本容量,得频数为30;
(3)由=高,得小矩形的高是0.016.
9.(6.5,8)
解析 =(3+5+2+8+9+12)=6.5,
=(4+6+3+9+12+14)=8.
由 =- 得= + ,
所以y= x+ 恒过(,),
即过定点(6.5,8).
10.解 甲=(60+80+70+90+70)=74,
乙=(80+60+70+80+75)=73,
s=(142+62+42+162+42)=104,
s=(72+132+32+72+22)=56,
∵甲>乙,s>s;
∴甲的平均成绩较好,乙的各门功课发展较平衡.
11.解 (1)散点图如下.
(2)由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.
(3)列出下表并用科学计算器进行有关计算.
i
1
2
3
4
5
6
xi
300
400
500
600
700
800
yi
40
50
55
60
67
70
xiyi
12 000
20 000
27 500
36 000
46 900
56 000
90 000
160 000
250 000
360 000
490 000
640 000
=550,=57
x2i=1 990 000,xiyi=198 400
于是可得
==≈0.058 86,
=- =57-0.058 86×550=24.627.
因此所求的回归直线方程为
=0.058 86x+24.627.
(4)将x=1 000代入回归方程得
y=0.058 86×1 000+24.627=83.487,
即退水温度是1 000℃时,
黄酮延长性大约是83.487%.
12.解 (1)各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05.
∴第二小组的频率为:
1.00-(0.30+0.15+0.10+0.05)=0.40.
∴落在59.5~69.5的第二小组的小长方形的高===0.04.
则补全的直方图如图所示.
(2)设九年级两个班参赛的学生人数为x人.
∵第二小组的频数为40人,频率为0.40,
∴=0.40,解得x=100(人).
所以九年级两个班参赛的学生人数为100人.
(3)∵0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5,
即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5,所以九年级两个班参赛学生的成绩的中位数应落在第二小组内.
13.解 (1)在17个数据中,1.75出现了4次,次数最多,即众数是1.75;
把成绩从小到大排列,中间一个数即第9个数据是1.70中的一个,即中位数是1.70;
平均数=(1.50×2+1.60×3+…+1.90×1)≈1.69(m)
因此,17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
(2)众数是1.75说明了跳1.75 m的人数最多;中位数是1.70 m说明了1.70 m以下和1.70 m以上的成绩个数相等;平均数是1.69 m说明了所有参赛运动员平均成绩是1.69 m.
14.解 (1)频率分布表与相应的频率分布直方图和频率分布折线图如下:
用水量分组
频数
频率
[0.5,2.5)
12
0.12
[2.5,4.5)
24
0.24
[4.5,6.5)
40
0.40
[6.5,8.5)
18
0.18
[8.5,10.5]
6
0.06
合计
100
1
(2)前两个矩形面积和为0.12+0.24,第三个矩形一半的面积为0.5-(0.12+0.24),则所求的中位数为:4.5+=4.5+0.7=5.2.
(3)该乡每户平均月均用水量估计为
(1.5×12+3.5×24+5.5×40+7.5×18+9.5×6)/100=5.14.
上级支援该乡的月调水量应为5.14×1 200=6 168.
答 上级支援该乡的月调水量是6 168吨.
课件21张PPT。第二章 §2.1 随机抽样2.1.1 简单随机抽样1.体会随机抽样的必要性和重要性;
2.理解随机抽样的目的和基本要求;
3.掌握简单随机抽样中的抽签法、随机数法的一般步骤.问题导学题型探究达标检测学习目标知识点一 随机抽样的必要性及基本概念答案问题导学     新知探究 点点落实抽样的必要性:
第一,要考查的总体中个体数往往 ,而且在时刻变化,逐一调查不可能.第二,考查往往具有 ,所以逐一调查也不可取.这就需要抽查一部分,以此来估计 .
抽样涉及的基本概念:(以某地区高一学生身高为例)很多破坏性答案 因为检测具有破坏性,且耗时费力.思考 要知道一批牛奶是否达标,为什么不采用逐一检测的方法?总体答案为了了解某地区高一学生身高的情况,我们找到了该地区高一八千名学生的体检表,从中随机抽取了150张,表中有体重、身高、血压、肺活量等15类数据,那么总体是指 ,个体是指 , 样本是指 , 样本容量是 .该地区高一八千名学生的身高数据该地区高一某个学生的身高被抽到的150个学生的身高150思考 从含有甲、乙的9件产品中随机抽取一件,总体内的各个个体被抽到的机会相同吗?为什么?甲被抽到的机会是多少?答案答案 总体内的各个个体被抽到的机会是相同的.因为是从9件产品中随机抽取一件,这9件产品每件产品被抽到的机会都是1/9,甲也是1/9.知识点二 简单随机抽样一般地,设一个总体含有N个个体,从中逐个 地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都 ,就把这种抽样方法叫做 .不放回相等简单随机抽样简单随机抽样有操作 的优点,在总体 的情况下是行之有效的.答案简便易行个数不多返回类型一 简单随机抽样的基本思想解析答案反思与感悟例1 人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方式是不是简单随机抽样?为什么?题型探究 重点难点 个个击破解 不是简单随机抽样.因为简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始牌,其他各张牌虽然是逐张搬牌,但是各张在谁手里已被确定,所以不是简单随机抽样.判断一个抽样方式是不是简单随机抽样,就是看这个抽样符不符合简单随机抽样的4个特点,符合就是,否则就不是.跟踪训练1 下列抽样的方式是否属于简单随机抽样?为什么?
(1)从无限多个个体中抽取50个个体作为样本.解析答案解 不是.因为总体的个体数不是有限的.(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子.解 不是.因为抽取是有放回的抽取,不符合简单随机抽样的特点.类型二 抽签法解析答案反思与感悟例2 某卫生单位为了支援抗震救灾,要在18名志愿者中选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.解 方案如下:
第一步,将18名志愿者编号,号码为01,02,03,…,18.
第二步,将号码分别写在相同的纸条上,揉成团,制成号签.
第三步,将得到的号签放到一个不透明的盒子中,充分搅匀.
第四步,从盒子中依次取出6个号签,并记录上面的编号.
第五步,与所得号码对应的志愿者就是医疗小组成员.一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.跟踪训练2 从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴.解 第一步,将20架钢琴编号,号码是01,02,…,20.
第二步,将号码分别写在相同的纸条上,揉成团,制成号签.
第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀.
第四步,从袋子中逐个不放回地抽取5个号签,并记录上面的编号.
第五步,所得号码对应的5架钢琴就是要进行质量检查的对象.解析答案类型三 随机数法解析答案反思与感悟例3 假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,应如何操作?解 第一步,将800袋牛奶编号为000,001,…,799.
第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7).
第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.抽签法和随机数法对个体的编号是不同的,抽签法可以利用个体已有的编号,如学生的学籍号、产品的记数编号等,也可以重新编号,例如总体个数为100,编号可以为1,2,3,…,100.随机数法对个体的编号要看总体的个数,总体数为100,通常为00,01,…,99.总体数大于100小于1 000,从000开始编起,然后是001,002,….跟踪训练3 某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?解析答案返回解 方法一 (抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,搅拌均匀,接着连续不放回地抽取10个号签,然后测量这10个号签对应的轴的直径.
方法二 (随机数法)将100件轴编号为00,01,…,99,在随机数表中选定一个起始位置,如取第21行第1个数开始,向右选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本.1.为了了解某市高三毕业生升学考试中数学成绩的情况,从参加考试的学生中随机地抽查了1 000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是(  )
A.总体指的是该市参加升学考试的全体学生
B.个体指的是1 000名学生中的每一名学生
C.样本容量指的是1 000名学生
D.样本是指1 000名学生的数学成绩解析答案D达标检测     解析 因为是了解学生的数学成绩的情况,因此样本是指1 000名学生的数学成绩,而不是学生.123452.在简单随机抽样中,某个个体被抽中的可能性是(  )
A.与第几次抽样有关,第1次抽中的可能性要大些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽中的可能性大些
D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不
一样B12345解析 简单随机抽样中每个个体被抽取的可能性相等.解析答案3.为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是(  )
A.总体是240
B.个体是每个学生
C.样本是40名学生
D.样本容量是40D12345答案4.用随机数法从100名学生(男生30人)中抽取10人,则某女生被抽到的可能性为(  )D12345答案123455.某校高一共有10个班,编号1至10,某项调查要从中抽取三个班作为样本,现用抽签法抽取样本,每次抽取一个号码,共抽3次,设五班第一次被抽到的可能性为a,第二次被抽到的可能性为b,则(  )D答案返回1.简单随机抽样是一种简单、基本、不放回的抽样方法,常用的简单随机抽样方法有抽签法和随机数法.
2.抽签法的优点是简单易行,缺点是当总体的容量大时,费时、费力,并且标号的签不易搅拌均匀,这样会导致抽样不公平;随机数法的优点也是简单易行,缺点是当总体容量大时,编号不方便.两种方法只适合总体容量较少的抽样类型.
3.简单随机抽样每个个体入样的可能性都相等,均为n/N,但要将每个个体入样的可能性与第n次抽取时每个个体入样的可能性区分开,避免在解题中出现错误.课件21张PPT。2.1.2 系统抽样第二章 §2.1 随机抽样1.理解系统抽样的必要性和适用情境;
2.掌握系统抽样的概念和步骤;
3.了解系统抽样的公平性.问题导学题型探究达标检测学习目标知识点一 系统抽样的概念答案问题导学     新知探究 点点落实?答案 因为个体较多,采用简单随机抽样如制作号签等工作会耗费大量的人力、物力和时间,而且不容易做到“搅拌均匀”,从而使样本的代表性不强.此时就需要用系统抽样.思考 当总体中的个体数较多时,为什么不宜用简单随机抽样?均衡预先制定的规则一个系统抽样?答案知识点二 系统抽样的步骤编号分段随机重新编号简单随机抽样加上间隔k(l+k)kl+2k返回类型一 系统抽样的概念解析答案反思与感悟例1 下列抽样中不是系统抽样的是(  )
A.从标有1~15号的15个小球中任选3个作为样本,按从小号到大号排序,
随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样
B.工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送
带上每隔五分钟抽一件产品检验
C.某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到
事先规定的调查人数为止
D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的
观众留下来座谈题型探究 重点难点 个个击破解析 C不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的比例入样.
答案 C反思与感悟解决该类问题的关键是掌握系统抽样的特点及适用范围.跟踪训练1 为调查公民对中学开设足球选修课的意见,从全体公民中抽取身份证后两位是18的进行调查,这种抽样得到的样本有代表性吗?解析答案解 因为身份证的倒数第二位代表性别,奇数为男性,偶数为女性.所以抽取的个体全部是男性,因此具有明显的偏向,不具有代表性.类型二 系统抽样的实施解析答案反思与感悟例2 某校高中三年级的295名学生已经编号为1,2,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.解 按照1∶5的比例,应该抽取的样本容量为295÷5=59,我们把295名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,第59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5l(l=0,1,2,…,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,…,288,293.解决系统抽样问题的两个关键步骤:
(1)分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本.
(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.跟踪训练2 为了了解参加某种知识竞赛的1 000名学生的成绩,从中抽取一个容量为50的样本,那么采用什么抽样方法比较恰当?简述抽样过程.解 适宜选用系统抽样,抽样过程如下:
(1)随机地将这1 000名学生编号为1,2,3,…,1000.
(2)将总体按编号顺序均分成50个部分,每部分包括20个个体.
(3)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码l.
(4)以l为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:l,l+20,l+40,… ,l+980.解析答案类型三 不能整除的分组方法解析答案反思与感悟例3 在跟踪训练2中,如果总体是1 002,其余条件不变,又该怎么抽样?解 (1)将每个学生编一个号,由1至1 002.
(2)利用随机数法剔除2个号.
(3)将剩余的1 000名学生重新编号1至1 000.
(4) 按编号顺序均分成50个部分,每部分包括20个个体.
(5)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码l.
(6)以l为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:l,l+20,l+40,…,l+980.当总体中的个体数不能被样本容量整除时,需要在总体中剔除一些个体.由于剔除方法采用简单随机抽样,所以即使是被剔除的个体,在整个抽样过程中被抽到的机会和其他个体是一样的.跟踪训练3 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施.解析答案返回?1.系统抽样适用的总体应(  )
A.容量较小 B.容量较大
C.个体数较多但不均衡 D.任何总体答案B达标检测     123452.某商场想通过检查发票及销售记录的2%来快速估计每月的销售金额,采用如下方法:从某本发票的存根中随机抽一张如15号,然后按顺序往后将65号,115号,165号,……发票上的销售金额组成一个调查样本.这种抽取样本的方法是(  )
A.抽签法 B.随机数法
C.系统抽样法 D.其他的抽样法C12345解析 本题所述抽样方法是将发票平均分成若干组,每组50张,从第一组中抽出了15号,以后各组抽15+50n(n为自然数)号,符合系统抽样的特点.解析答案3.为了解1 200名学生对学校食堂饭菜的意见,打算从中抽取一个样本容量为40的样本,考虑采用系统抽样,则分段间隔k为(  )
A.10 B.20 C.30 D.40C12345解析答案4.为了了解参加一次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是( )
A.2 B.3 C.4 D.5A12345解析 由1 252=50×25+2知,应随机剔除2个个体.解析答案123455.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是(  )
A.5,10,15,20,25 B.3,13,23,33,43
C.1,2,3,4,5 D.2,4,6,16,32B解析答案解析 用系统抽样的方法抽取到的导弹编号应该为k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k是1到10中用简单随机抽样方法得到的数,因此只有选项B满足要求,故选B.?返回3.系统抽样的优点是简单易操作,当总体个数较多的时候也能保证样本的代表性;缺点是对存在明显周期性的总体,选出来的个体,往往不具备代表性.从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.课件24张PPT。2.1.3 分层抽样第二章 §2.1 随机抽样1.理解分层抽样的基本思想和适用情形;
2.掌握分层抽样的实施步骤;
3.了解三种抽样方法的区别和联系.问题导学题型探究达标检测学习目标知识点一 分层抽样的基本思想和适用情形答案问题导学     新知探究 点点落实思考 中国共产党第十八次代表大会2 270名代表是从40个单位中产生的,这40个单位分别是1─31为省(自治区、直辖市)、32中央直属机关、33中央国家机关、34全国台联、35解放军、36武警部队、37中央金融系统、38中央企业系统、39中央香港工委、40中央澳门工委.你觉得如果用简单随机抽样或者是系统抽样来产生这些代表怎么样?答案 这40个单位各有各的情况,各有各的意见,存在明显差异.而各单位人数差异很大,如果采用简单随机抽样或者系统抽样,可能有些人员少的单位根本就没有自己的代表,从而使样本没有更好的代表性.所以采用这两种抽样方法都不合适.一般地,当总体是由 的几个部分组成时,往往选用分层抽样的方法.
一般地,在抽样时,将总体分成 的层,然后按照一定的比例,从各层 地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种 .
分层抽样尽量利用了调查者对调查对象(总体)事先所掌握的各种信息,并充分考虑了保持 与 的一致性,这对提高样本的代表性是非常重要的.差异明显互不交叉独立分层抽样样本结构总体结构答案?答案知识点二 分层抽样的实施步骤各层总的个体数×抽样比简单随机抽样答案知识点三 三种抽样方法的比较返回抽样过程中每个个体被抽取的概率相等从总体中逐个不放回抽取简单随机抽样是基础样本空量较小将总体分成均衡几部分,按规则关联抽取用简单随机抽样抽取起始号码总体中的个体数较多,样本容量较大将总体分成几层,按比例分层抽取用简单随机抽样或系统抽样对各层抽样总体由差异明显的几部分组成类型一 分层抽样的适用情景解析答案反思与感悟例1 某地区有高中生2 400人,初中生10 900人,小学生11 000人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?题型探究 重点难点 个个击破解 (1)从总体来看,因为不同年龄阶段的学生的近视情况可能存在明显差异,为了使样本具有较好的代表性,应该分高中、初中、小学三个层次分别抽样.
(2)从三类学生的数量来看,人数较多,所以在各层抽样时可以采用系统抽样.
(3)采用系统抽样分好组之后,确定第一组人选时,可以采用简单随机抽样.分层抽样实质是利用已知信息尽量使样本结构与总体结构相似.在实际操作时,并不排斥与其他抽样方法联合使用.跟踪训练1 某单位有员工500人,其中35岁以下的有125人,35岁~49岁的有280人,50岁以上的有95人.为了调查员工的身体状况,要从中抽取一个容量为100的样本,如何进行抽取?解析答案?类型二 分层抽样的实施步骤解析答案反思与感悟例2 写出跟踪训练1的实施步骤.解 (1)按年龄将500名职工分成三层:35岁以下的职工;35岁~49岁的职工;50岁以上的职工.(3)在各层分别用随机数法抽取样本.
(4)综合每层抽样,组成容量为100的样本.如果总体中的个体有差异,那么就用分层抽样抽取样本.用分层抽样抽取样本时,要把性质、结构相同的个体组成一层.跟踪训练2 某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为2∶3∶5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况,试写出抽样过程.?解析答案类型三 三种抽样方法的比较例3 某高级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;解析答案反思与感悟③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
关于上述样本的下列结论中,正确的是(  )
A.②③都不能为系统抽样
B.②④都不能为分层抽样
C.①④都可能为系统抽样
D.①③都可能为分层抽样?反思与感悟根据样本的号码判断抽样方法时,要紧扣三类抽样方法的特征.利用简单随机抽样抽取的样本号码没有规律性;利用分层抽样抽取的样本号码有规律性,即在每一层抽取的号码个数m等于该层所含个体数目与抽样比的积,并且应该恰有m个号码在该层的号码段内;利用系统抽样取出的样本号码也有规律性,其号码按从小到大的顺序排列,则所抽取的号码是:l,l+k,l+2k,…,l+(n-1)k.其中,l为第一个样本号码(l≤k),n为样本容量(n=1,2,3,…),l是第一组中的号码,k为分段间隔,k=总体容量/样本容量.解析答案返回解析 因为i=6,所以1组抽取号码为10×1+(6+1)=17,2组抽取号码为10×2+(6+2)=28,3组抽取号码为10×3+(6+3)=39,4组抽取号码为10×4+(6+4-10)=40,5组抽取号码为10×5+(6+5-10)=51,6组抽取号码为10×6+(6+6-10)=62,7组抽取号码为10×7+(6+7-10)=73.6,17,28,39,40,51,62,731.为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是(  )
A.简单随机抽样 B.按性别分层抽样
C.按学段分层抽样 D.系统抽样C达标检测     12345解析 由于三个学段学生的视力情况差别较大,故需按学段分层抽样.解析答案2.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为(  )
A.7 B.15
C.25 D.35B12345?解析答案3.简单随机抽样、系统抽样、分层抽样三者的共同特点是(  )
A.将总体分成几部分,按预先设定的规则在各部分抽取
B.抽样过程中每个个体被抽到的机会均等
C.将总体分成几层,然后分层按照比例抽取
D.没有共同点B12345答案4.某工厂有3条生产同一产品的流水线,每天生产的产品件数分别是3 000件,4 000件,8 000件.若要从中抽取一个容量为150的样本来监控产品质量,则简单随机抽样,系统抽样,分层抽样三种抽样方法中,下列说法正确的是(  )
A.用分层抽样就不能用系统抽样
B.用系统抽样就不能用简单随机抽样
C.三条流水线可以各用一种抽样方法
D.三种抽样方法都可能用到D12345答案123455.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为___.12解析答案?1.用分层抽样从个体为N的总体中抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的机会相等.
2.分层抽样是建立在简单随机抽样或系统抽样基础上的,由于它充分利用了已知信息,考虑了保持样本结构与总体结构的一致性,因此它获取的样本更具代表性,在实用中更为广泛.解决分层抽样问题时,注意以下两个关系的应用:返回(2)总体中各层的容量比=对应各层样本数之比.
3.简单随机抽样是基础,系统抽样与分层抽样是补充和发展,三者相辅相成,对立统一.课件35张PPT。第二章 §2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布(一)1.体会分布的意义和作用;
2.学会用频率分布表,画频率分布直方图表示样本数据;
3.能通过频率分布表或频率分布直方图对数据做出总体统计.问题导学题型探究达标检测学习目标知识点一 用样本估计总体答案问题导学     新知探究 点点落实思考 还记得我们抽样的初衷吗?答案 用样本去估计总体,为决策提供依据.(1)用样本的 估计总体的分布.
(2)用样本的 估计总体的数字特征.频率分布数字特征思考 通过抽样获得的原始数据有什么缺点?答案知识点二 数据分析的基本方法答案 因为通过抽样获得的原始数据多而且杂乱,无法直接从中理解它们的含义,并提取信息,也不便于我们用它来传递信息.(1)借助于图形
分析数据的一种基本方法是用图将它们画出来,此方法可以达到两个目的,一是从数据中 信息,二是利用图形 信息.
(2)借助于表格
分析数据的另一种方法是用紧凑的 改变数据的排列方式,此方法是通过改变数据的 ,为我们提供解释数据的新方式.提取传递表格构成形式思考 要做频率分布表,需要对原始数据做哪些工作?答案知识点三 频率分布表与频率分布直方图答案 分组,频数累计,计算频数和频率.再根据频率分布表做频率分布直方图.?频率/组距小长方形的面积1返回类型一 利用原始数据绘制频率分布表例1 从某校高一年级的1 002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,并估计身高不小于170(cm)的同学所占的百分率.题型探究 重点难点 个个击破解析答案反思与感悟解 (1)在全部数据中找出最大值180与最小值151,它们相差(极差)29,决定组距为3;
(2)将区间[150.5,180.5]分成10组;分别是[150.5,153.5),[153.5,156.5),…,[177.5,180.5);
(3)从第一组[150.5,153.5)开始分别统计各组的频数,再计算各组的频率,列频率分布表;解析答案反思与感悟反思与感悟分组时先找到最大值和最小值,以便于确定分组的起点和终点.组距的选择应力求“取整”.区间端点要不重不漏,以便每个数据进且只进一个组.跟踪训练1 有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.
(1)列出学生参加运动队的频率分布表;解析答案解 参加足球队记为1,参加篮球队记为2,参加排球队记为3,参加乒乓球队记为4,得频率分布表如下:(2)画出频率分布条形图.解析答案解 由上表可知频率分布条形图如下:类型二 根据频率分布表绘制频率分布直方图解析答案例2 下表给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).(1)列出样本频率分布表;解 样本频率分布表如下:解析答案(2)画出频率分布直方图;解 其频率分布直方图如下:解析答案反思与感悟(3)估计身高小于134 cm的人数占总人数的百分比.解 由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.跟踪训练2 从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8.
(1)列出样本的频率分布表(含累积频率);解析答案解 频率分布表如下:(2)画出频率分布直方图;解析答案解 频率分布直方图如图所示.(3)估计成绩在[60,90)分的学生比例.解析答案解 成绩在[60,90)分的学生比例,即学生成绩在[60,90)分的频率0.2+0.3+0.24=0.74=74%.所以估计成绩在[60,90)分的学生比例为74%.类型三 频率分布表及频率分布直方图的应用例3 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?解析答案(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?解析答案反思与感悟在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.解析答案跟踪训练3 在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如下表:(1)完成频率分布表,并画出频率分布直方图;解 频率分布表如下:解析答案频率分布直方图如图所示.解析答案返回(2)估计纤度落在[1.38,1.50)内的可能性及纤度小于1.42的可能性各是多少?解 纤度落在[1.38,1.50)的可能性即为纤度落在[1.38,1.50)的频率,即为0.3+0.29+0.10=0.69=69%.
纤度小于1.42的可能性即为纤度小于1.42的频率,即为0.04+0.25+0.30=0.59=59%.1.在用样本的频率分布估计总体的频率分布的过程中,下列说法正确的是(  )
A.总体的容量越大,估计越准确
B.总体的容量越小,估计越准确
C.样本的容量越大,估计越准确
D.样本的容量越小,估计越准确C达标检测     12345答案2.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0.125,则n的值为( )
A.640 B.320 C.240 D.160B12345解析答案3.在第十六届亚运会中,各个国家和地区金牌获得情况统计如图:12345答案从图中可以看出中国所获得金牌数占全部金牌数的比例约是(  )
A.41.7% B.59.8%
C.67.3% D.94.8%A4.在画频率分布直方图时,某组的频数为10,样本容量为50,总体容量为600,则该矩形的面积是(  )A12345答案123455.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的(  )
A.91% B.92% C.95% D.30%A解析答案1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.返回课件23张PPT。2.2.1 用样本的频率分布估计总体分布(二)第二章 §2.2 用样本估计总体1.了解频率折线图和总体密度曲线的定义;
2.理解茎叶图的概念,会画茎叶图;
3.了解频率分布直方图、频率折线图、茎叶图的各自特征,学会选择不同的方法分析样本的分布,从而作出总体估计.问题导学题型探究达标检测学习目标知识点一 频率分布折线图和总体密度曲线答案问题导学     新知探究 点点落实1.频率分布折线图
连接频率分布直方图中各小长方形 ,就得到频率分布折线图.
2.总体密度曲线
随着样本容量的增加,作图时所分的 增加,组距减小,相应的频率折线图会越来越接近于一条 ,统计中称这条光滑曲线为总体密度曲线,它反映了总体在各个范围内取值的百分比.上端的中点组数光滑曲线思考 茎叶图是表示样本数据分布情况的一种方法,那么“茎”、“叶”分别指的是哪些数?答案知识点二 茎叶图答案 茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.优点:它不但可以 ,而且可以 ,给数据的记录和表示都带来方便.
缺点:当样本数据 时,枝叶就会很长,茎叶图就显得不太方便.答案保留所有信息随时记录较多返回类型一 茎叶图的画法解析答案反思与感悟例1 某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,86,91,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,88,110,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.题型探究 重点难点 个个击破解 甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况大致是对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指定区间组的频率.跟踪训练1 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:
甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
试制作茎叶图来对比描述这些数据.解析答案解 以十位数字为茎,个位数字为叶,制作茎叶图如下:类型二 从茎叶图看分布的特征解析答案反思与感悟例2 甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列正确的是(  )
A.x甲>x乙;乙比甲成绩稳定
B.x甲>x乙;甲比乙成绩稳定
C.x甲D.x甲A.5 B.4 C.3 D.2解析答案解析 去掉最低分87,去掉最高分94(假设x≤4),则7×91=80×2+9+8+90×5+2+3+2+1+x,
∴x=2,符合题意.
同理可验证x>4不合题意.D类型三 频数分布直方图与茎叶图的比较例3 从甲、乙两个城市所有的自动售货机中随机抽取16台,记录了上午8∶00~11∶00之间各自的销售情况(单位:元)
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
试用纵坐标为频数的频数分布直方图与茎叶图的方式分别表示上面的数据,并简要说明各自的优点.解析答案反思与感悟解析答案解 方法一 用频数分布直方图表示如图:方法二 茎叶图如图,两竖线中间的数字表示甲、乙销售额的十位数,两边的数字表示甲、乙销售额的个位数.反思与感悟从方法一可以看出频数分布直方图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;从方法二可以看出,用茎叶图表示有关数据,对数据的记录和表示都带来方便.反思与感悟茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录,但样本容量较大,或者需要比较三组以上的数据时,使用茎叶图就不合适;而频率分布表和频率分布直方图可以处理样本容量很大的数据,但损失了样本的原始数据,而且必须在完成抽样后才能制作.解析答案返回跟踪训练3 试比较例3中用到的频数分布直方图和频率分布直方图的区别.解 首先频数分布直方图的纵坐标为频数,因此其顶点纵坐标是非负整数.
频率分布直方图的纵坐标为频率/组距,因此其每个组段的频率就是对应小长方形的面积,且总面积为1.当样本量n增大并且组距越来越小时,相应的小长方形越来越细,其各小长方形上端的中点的连线构成了一条光滑曲线,而这条光滑曲线下的面积为1,这条光滑曲线称为总体密度曲线.1.如图是总体密度曲线,下列说法正确的是(  )
A.组距越大,频率分布折线图越接近于它
B.样本容量越小,频率分布折线图越接近于它
C.阴影部分的面积代表总体在(a,b)内取值的百分比
D.阴影部分的平均高度代表总体在(a,b)内取值的百
分比C达标检测     12345答案2.对一个未知总体,下列方法:①频率分布直方图;②频率分布表;③频率分布折线图;④茎叶图;⑤总体密度曲线
其中可以用来表示样本数据的频率分布的有(  )
A.2种 B.3种 C.4种 D.5种C12345答案3.在茎叶图中比40大的数据有(  )
A.2个 B.3个
C.4个 D.5个B12345答案4.从茎叶图观察比较甲、乙成绩哪个稳定的问题,下列说法正确的是(  )
A.主要看叶,叶越齐越稳定
B.主要看众数,等于众数的数据越多越稳定
C.主要看中位数,中位数越大越稳定
D.主要是看成绩的分布,在中位数附近相对集中,则成绩稳定D12345答案123455.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是(  )
A.91 B.91.5
C.92 D.95答案C1.估计总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录;而频率分布表和频率分布直方图则损失了样本的原始信息,必须在完成抽样后才能制作.返回3.正确利用三种分布的描述方法,都能得到一些有关分布的主要特点(如分布是否具有单峰性、是否具有对称性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响比较小,更接近于总体分布相应的特点.课件27张PPT。2.2.2 用样本的数字特征估计总体的数字
特征(一)第二章 §2.2 用样本估计总体1.会求样本的众数、中位数、平均数;
2.能从频率分布直方图中,估算众数、中位数、平均数;
3.能用样本数字特征估计总体的数字特征,作出合理解释和决策.问题导学题型探究达标检测学习目标知识点一 众数问题导学     新知探究 点点落实定义 在一组数据中,出现次数最多的数据叫做这组数据的众数. 特点 (1)众数是这组数据中出现次数最多的数;(2)众数可以有一个或多个;(3) 众数大致的值就是样本数据的频率分布直方图中最高矩形的中点的横坐标. (4) 用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便.在一组数据中,如果个别数据有很大的变动,而某一数据出现次数又较多时,选择众数表示这组数据的“集中趋势”就比较适合.定义 将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.知识点二 中位数特点 (1)排序后找中位数;(2)中位数只有一个;(3)中位数不一定是这组数据中的数.(4)在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.(5)中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,能更好地反映一组数据的中等水平, 当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势比较合适.知识点三 平均数返回特点 (1)一组数据有且仅有一个平均数.(2)平均数是频率分布直方图的“重心”,是直方图的平衡点,因此,每个小矩形的面积与小矩形底边中点的横坐标的乘积之和为平均数.(3)由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质.也正因如此,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低.答案类型一 众数、中位数和平均数的计算题型探究 重点难点 个个击破解析答案反思与感悟答案 A反思与感悟计算中位数要先对数据排序,计算平均数时,计算机有专门的函数,而手工计算要讲究技巧.跟踪训练1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:解析答案分别求这些运动员成绩的众数、中位数与平均数.解 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75;上表中的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;答 17名运动员成绩的众数,中位数,平均数依次为1.75 m,1.70 m,1.69 m.类型二 在频率分布直方图中估算众数、中位数、平均数例2 以教材2.2.1节调查的100位居民的月均用水量为例,样本数据的频率分布表和频率分布直方图如图所示,试估算月均用水量的中位数.解析答案反思与感悟解 在频率分布直方图中,中位数左边和右边的直方图的面积是相等的,由此可以估计中位数的值.下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02 t.反思与感悟样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.跟踪训练2 一批乒乓球,随机抽取100个进行检查,球的直径频率分布直方图如图.试估计这个样本的众数,中位数和平均数.解析答案四个矩形的面积分别是0.02×5=0.1, 0.02×10=0.2, 0.02×25=0.5, 0.02×10=0.2.平均数=39.96×0.1+39.98×0.2+40×0.5+40.02×0.2=39.996.类型三 众数、中位数、平均数的简单应用例3 某公司的33名职工的月工资(单位:元)如下表:解析答案(1)求该公司职工月工资的平均数、中位数、众数;若把所有数据从大到小排序,则得到:中位数是1 500元,众数是1 500元.(2)若董事长、副董事长的工资分别从5 500元、5 000元提升到30 000元、20 000元,那么公司职工的月工资的新的平均数、中位数和众数又是什么?解析答案中位数是1 500元,众数是1 500元.(3)你认为哪个统计量更能反映这个公司职工的工资水平?解析答案反思与感悟解 在这个问题中,中位数和众数都能反映出这个公司职工的工资水平,因为公司少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司职工的工资水平.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.解析答案跟踪训练3 某课外活动小组对该市空气含尘进行了调查,下面是一天每隔两小时测得的数据:0.03、0.03、0.04、0.05、0.01、0.03(单位:G/M3)
(1)求出这组数据的众数和中位数;解 由题意知,众数是0.03,中位数为0.03.解析答案返回(2)若国标(国家环保局的标准)是平均值不得超过0.025G/M3,问这一天城市空气是否符合国标?解 这一天数据平均数是0.03,∵0.03>0.025,
∴这一天该城市空气不符合国标.1.数据1,2,3,3,4的众数是(  )
A.1 B.2 C.3 D.4C达标检测     1234答案2.若一组数据为2,2,3,4,4,5,5,6,7,8.则中位数为(  )
A.4 B.5 C.4.5 D.5.5C1234答案3.下列说法错误的是(  )
A.在统计里,把所需考察对象的全体叫做总体
B.一组数据的平均数一定大于这组数据中的每个数据
C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势
D.众数是一组数据中出现次数最多的数1234解析答案解析 平均数不大于最大值,不小于最小值.B4.如果n个数x1,x2,x3,…,xn的平均数为1, 则2x1+1,2x2+1,2x3+1,…,2xn+1的平均数为(  )
A.3 B.4 C.5 D.6A1234答案1.一组数据中的众数可能不止一个,众数是一组数据中出现次数最多的数据,而不是该数据出现的次数,如果两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数.
2.一组数据的中位数是唯一的,求中位数时,必须先将这组数据按从小到大(或从大到小)的顺序排列,如果数据的个数为奇数,那么,最中间的一个数据是这组数据的中位数,如果数据的个数为偶数,那么,最中间两个数据的平均数是这组数据的中位数.返回3.利用直方图求数字特征:①众数是最高的矩形的底边的中点.②中位数左右两边直方图的面积应相等.③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.课件26张PPT。2.2.2 用样本的数字特征估计总体的数字
特征(二)第二章 §2.2 用样本估计总体1.理解样本数据方差、标准差的意义,会计算方差、标准差;
2.会用样本的基本数字特征(平均数、标准差)估计总体的基本数字特征;
3.体会用样本估计总体的思想.问题导学题型探究达标检测学习目标知识点一 方差、标准差问题导学     新知探究 点点落实思考 若两名同学的两门学科的平均分都是80分,一名是两门均为80分,另一名是一门40分,一门120分,如何刻画这种差异?答案答案 可以通过考察样本数据的分散程度的大小.一般地,
(1)标准差是样本数据到平均数的一种平均距离,一般用s表示.1.样本的基本数字特征包括 、 、 、 .
2.平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,还需要用标准差来反映数据的 程度.
3.现实中的总体所包含的个体数往往是很多的,虽然总体的平均数与标准差客观存在,但是我们无从知道.所以通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.虽然样本具有 性,不同的样本测得的数据不一样,与总体的数字特征也可能不同,但只要样本的 好,这样做就是合理的,也是可以接受的.知识点二 用样本的基本数字特征估计总体的基本数字特征众数中位数平均数标准差分散随机代表性答案返回类型一 感受数据的离散程度题型探究 重点难点 个个击破解析答案反思与感悟例1 分别计算下列四组样本数据的平均数,并画出条形图,说明它们的异同点.
(1)5,5,5,5,5,5,5,5,5;
(2)4,4,4,5,5,5,6,6,6;
(3)3,3,4,4,5,6,6,7,7;
(4)2,2,2,2,5,8,8,8,8.解 四组样本数据的条形图如下:四组数据的平均数都是5,但数据的离散程度不一样,其中(1)最集中,(4)的离散程度最大.反思与感悟标准差能够衡量样本数据的稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程度就越小,也就越稳定.跟踪训练1 有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
试求出甲、乙两人本次射击的平均成绩, 并画出两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?解析答案条形图如下:通过频率分布条形图直观地看,虽然平均数相同,还是有差异的.甲成绩比较分散,乙成绩相对集中.类型二 方差、标准差的计算例2 从甲、乙两种玉米中各抽10株,分别测得它们的株高如下:
甲:25,41,40,37,22,14,19,39,21,42;
乙:27,16,44,27,44,16,40,40,16,40;
试计算甲、乙两组数据的方差和标准差.解析答案反思与感悟反思与感悟计算方差(或标准差)先要计算平均数.跟踪训练2 求出跟踪训练1中的甲、乙两运动员射击成绩的标准差,结合跟踪训练1的条形图体会标准差的大小与数据离散程度的关系.解析答案同理可得s乙≈1.095.所以s甲>s乙.因此说明离散程度越大,标准差就越大.类型三 标准差及方差的应用例3 甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):

25.46 25.32 25.45 25.39 25.36
25.34 25.42 25.45 25.38 25.42
25.39 25.43 25.39 25.40 25.44
25.40 25.42 25.35 25.41 25.39乙
25.40 25.43 25.44 25.48 25.48
25.47 25.49 25.49 25.36 25.34
25.33 25.43 25.43 25.32 25.47
25.31 25.32 25.32 25.32 25.48
从生产的零件内径的尺寸看,谁生产的质量较高?(结果保留小数点后3位)解析答案反思与感悟从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40mm),差异很小;
从样本标准差看,由于s甲<s乙,因此甲生产的零件内径尺寸比乙的稳定程度高得多.
于是,可以作出判断,甲生产的零件的质量比乙的高一些.反思与感悟比较两组数据的异同点,一般情况是从平均数及标准差这两个方面考虑.其中标准差与样本数据单位一样,比方差更直观地刻画出与平均数的平均距离.解析答案跟踪训练3 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定.解 甲品种的样本平均数为10,样本方差为
[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.
乙品种的样本平均数也为10,样本方差为
[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.244.
因为0.244>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.返回1.下列说法正确的是(  )
A.在两组数据中,平均数较大的一组方差较大
B.平均数反映数据的集中趋势,方差则反映数据离平均数的波动大小
C.方差的求法是求出各个数据与平均数的差的平方后再求和
D.在记录两个人射击环数的两组数据中,方差大的表示射击水平高B达标检测     1234解析 A中平均数和方差是数据的两个特征,不存在这种关系;
C中求和后还需取平均数;
D中方差越大,射击越不平稳,水平越低.解析答案2.将某选手的9个得分(不完全相同)去掉1个最高分,去掉1个最低分,则一定会发生变化的是(  )
A.平均数 B.中位数
C.众数 D.方差D1234答案3.样本101,98,102,100,99的标准差为(  )1234A答案则参加运动会的最佳人选应为(  )
A.甲 B.乙 C.丙 D.丁4.甲、乙、丙、丁四人参加某运动会的射击项目选拔赛,四人的平均成绩和标准差见下表:C1234答案5.某学员在一次射击测试中射靶10次,命中环数如下:
7,8,7,9,5,4,9,10,7,4.
则:(1)平均命中环数为___;解析答案7(2)命中环数的标准差为___.解析答案∴命中环数的标准差为2.21.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.
2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.
3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也具有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.返回课件23张PPT。第二章 §2.3 变量间的相关关系2.3.1 变量之间的相关关系
2.3.2 两个变量的线性相关(一)1.了解相关关系;
2.了解正相关,负相关的概念;
3.会作散点图,并能通过散点图判断两个变量之间是否具有相关关系.问题导学题型探究达标检测学习目标知识点一 相关关系问题导学     新知探究 点点落实思考 数学成绩y与学习数学所用时间t之间的关系,能否用函数关系刻画?答案 一般来说,学数学的时间越长,成绩越好.但用时10小时,数学成绩却不是一个确定的数字.故不能用函数关系刻画.一般地,如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的 性,那么这两个变量之间的关系,叫做相关关系.随机答案1.散点图:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形.
2.正相关与负相关:
(1)正相关:散点图中的点散布在从 到 的区域.
(2)负相关:散点图中的点散布在从 到 的区域.知识点二 散点图与正相关,负相关左下角右上角左上角右下角答案返回类型一 变量之间相关关系的判断题型探究 重点难点 个个击破解析答案反思与感悟例1 在下列两个变量的关系中,哪些是相关关系?
(1)正方形边长与面积之间的关系;
(2)作文水平与课外阅读量之间的关系;
(3)人的身高与年龄之间的关系;
(4)降雪量与交通事故发生率之间的关系.解 两变量之间的关系有:函数关系与带有随机性的相关关系.
(1)正方形的边长与面积之间的关系是函数关系.
(2)作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.
(3)人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具备相关关系.
(4)降雪量与交通事故发生率之间具有相关关系.反思与感悟如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.跟踪训练1 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?有人认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?解析答案解 从已经掌握的知识来看,吸烟会损害身体的健康,
但是除了吸烟之外,还有许多其他的因素影响身体健康,人体健康是很多因素共同作用的结果.
我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,
所以吸烟不一定引起健康问题.
但吸烟引起健康问题的可能性大.
因此“健康问题不一定是由吸烟引起的,
所以可以吸烟”的说法是不对的.类型二 正相关与负相关的理解例2 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:解析答案反思与感悟画出散点图,分析年龄与人体脂肪含量的关系.解 散点图如下;在散点图中,点散布在从左下角到右上角的区域,故人的年龄与人体脂肪含量是正相关关系.反思与感悟画散点图时应注意合理选择单位长度,避免图形过大或过小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.正相关、负相关与函数单调性类似.跟踪训练2 你能列举一些生活中的变量成负相关的实例吗?解析答案解 在一定范围内钢铁的温度与硬度.类型三 散点图在其他领域内的应用例3 下表为我国在1000年到2000年间的人口数量.
(1)试画出散点图;解析答案解 散点图如下:(2)年份与人口是相关关系吗?如果是,是正相关还是负相关?你觉得用什么函数模型模拟效果比较好?解析答案反思与感悟解 由图可知,我国在1000年到2000年间的人口数量与年份呈正相关.
因为增长速度越来越快, 用指数模型模拟效果比较合适.反思与感悟函数关系与相关关系之间有密切联系,可以用函数关系来模拟相关关系,也可借助散点图来发现两变量之间的函数关系,在一定条件下,两种关系还可相互转化.解析答案跟踪训练3 伦敦金属交易所(LME)是世界上最大的有色金属交易所,伦敦金属交易所的价格和库存对世界范围的有色金属生产和销售有着重要的影响.下图是该所给出的库存消费比与铜价的散点图.观察图象,你能得出什么结论?解 由图可知,库存消费比与铜价是负相关关系.返回1.对于给定的两个变量的统计数据,下列说法正确的是(  )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系C达标检测     1234答案52.观察下列散点图,具有相关关系的是(  )D1234答案A.①② B.①③
C.②④ D.②③53.下列语句所表示的事件中的因素不具有相关关系的是(  )
A.瑞雪兆丰年 B.上梁不正下梁歪
C.吸烟有害健康 D.喜鹊叫喜,乌鸦叫丧1234D答案54.下列两个变量之间的关系,哪个不是函数关系(  )
A.匀速行驶的车辆的行驶距离与时间
B.角度和它的正弦值
C.等腰直角三角形的腰长与面积
D.在一定年龄段内,人的年龄与身高D1234解析 在一定年龄段内,人的年龄与身高具有相关关系.解析答案55.下列变量之间的关系是函数关系的是(  )
A.圆的周长与半径
B.施肥量和小麦亩产量
C.降雨量和交通事故发生率
D.学习时间和学习成绩A1234答案51.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关.
2.函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.函数关系是一种因果关系而相关关系不一定是因果关系,也可能是伴随关系,函数关系与相关关系之间有着密切联系,在一定条件下可以互相转化.返回课件30张PPT。2.3.2 两个变量的线性相关(二)第二章 §2.3 变量间的相关关系1.理解两个变量线性相关的概念;
2.了解用最小二乘法建立线性回归方程的思想,会用给出的公式建立回归方程;
3.理解回归直线与观测数据的关系.问题导学题型探究达标检测学习目标知识点一 线性相关问题导学     新知探究 点点落实思考 回顾上一节你看到的散点图,大致呈哪些形状?答案 饼状,曲线状,直线状.
如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系.
两个变量线性相关是相关关系的一种.答案思考 数学上的“回归”是什么意思?知识点二 回归直线的方程答案 “回归”一词最早由英国统计学家(Francils Galton)提出的,本意是子女的身高会向一般人的均值靠拢.现在这个概念引伸到随机变量有向回归线集中的趋势.即观察值不是全落在回归线上,而是散布在回归线周围.但离回归线越近,观察值越多,偏离较远的观察值极少,这种不完全呈函数关系,但又有一定数量关系的现象称回归.答案(1)回归直线:如果散点图中点的分布从整体上看大致在 附近,就称这两个变量之间具有 关系,这条直线叫做回归直线.
(2)回归方程: 对应的方程叫做回归直线的方程,简称回归方程.一条直线线性相关回归直线知识点三 最小二乘法返回思考 具有线性相关关系的散点大致分布在一条直线附近.如何确定这条直线比较合理?答案 应该使散点整体上最接近这条直线.最小二乘法是一种求回归直线的方法,用这种方法求得的回归直线能使样本数据的点到回归直线的距离的平方和最小.答案类型一 线性相关的概念题型探究 重点难点 个个击破解析答案反思与感悟例1 以下是某地搜集到的新房屋的销售价格和房屋面积的数据:画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.解 散点图如下:由上图可看出,销售价格与房屋面积这两个变量是正相关.反思与感悟如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,呈递增趋势,是正相关;反之为负相关.跟踪训练1 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:解析答案(1)画出散点图;解 散点图如下:(2)关于加工零件的个数与加工时间,你能得出什么结论?解析答案解 加工零件的个数与所花费的时间具有正的线性相关关系.类型二 回归方程的求法例2 下表为某地近几年机动车辆数与交通事故数的统计资料.解析答案(1)请判断机动车辆数与交通事故数之间是否具有线性相关关系,如果不具有线性相关关系,说明理由;解 在平面直角坐标系中画出数据的散点图,如图.直观判断散点在一条直线附近,故具有线性相关关系.(2)如果具有线性相关关系,求出回归方程.解析答案跟踪训练2 以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:解析答案(1)画出数据对应的散点图;解 数据对应的散点图如图所示:(2)求回归方程,并在散点图中加上回归直线.解析答案解析答案回归直线如(1)中图所示.类型三 回归方程的应用例3 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:解析答案(1)画出散点图;解 散点图如图所示:(2)从散点图中发现气温与热饮销售杯数之间有什么关系;解析答案解 从上图看到,各点散布在从左上角到右下角的区域里,
因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.(3)求回归方程;解 从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出回归方程的系数.(4)如果某天的气温是2℃,预测这天卖出的热饮杯数;解析答案(5) 气温为2℃时,小卖部一定能够卖出143杯左右热饮吗?为什么?解 小卖部不一定能够卖出143杯左右热饮,原因如下:①回归方程中的截距和斜率都是通过样本估计出来的,存在误差,这种误差可以导致预测结果的偏差.
②即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,能够与实际值y很接近.我们不能保证点(x,y)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近.因此,某天的气温为2℃时,这天大约可以卖出143杯热饮.解析答案跟踪训练3 有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童数,如下表:(1)画出散点图,并判定这两个变量是否具有线性相关关系;解 散点图如图:
根据散点图可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系.解析答案返回(2)通过计算可知这两个变量的回归方程为 =23.25x+102.15,假如一个城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?但381.15是对该城市人均GDP为12万元的情况下所作的一个估计,该城市患白血病的儿童可能超过380人,也可能低于380人.1.下列有关线性回归的说法,不正确的是(  )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的
关系叫做相关关系
B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量
的一组数据的图形叫做散点图
C.回归方程最能代表观测值x、y之间的线性关系
D.任何一组观测值都能得到具有代表意义的回归方程D达标检测     1234答案51234解析 回归直线必过样本点的中心.C解析答案53.某产品的广告费用x与销售额y的统计数据如下表:1234解析答案51234答案 B51234解析答案51234解析 ①回归方程中x的系数为正,不是负相关;
④回归方程中x的系数为负,不是正相关,
故①④一定不正确.
答案 D51234解析答案51234答案 D51.求回归直线方程时应注意的问题
(1)知道x与y成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.返回课件25张PPT。第二章 统计习题课1.从总体上把握三种抽样方法的区别和联系;
2.学会根据不同情况,选用适合的抽样方法;
3.进一步熟练三种抽样方法的操作步骤.问题导学题型探究达标检测学习目标知识点一 抽样答案问题导学     新知探究 点点落实答案 用样本估计总体.思考1 抽样的根本目的是什么?答案 样本的代表性,每个个体被抽到的机会是否均等.思考2 评价抽样方法好坏的首要标准是什么?思考 常用的抽样方法有哪些?怎样选用?知识点二 抽样方法答案 简单随机抽样;系统抽样;分层抽样.
总体中的个体数较少,采用简单随机抽样;个体数较多,采用系统抽样;总体分为差异明显的若干层,采用分层抽样.答案返回类型一 简单随机抽样解析答案反思与感悟题型探究 重点难点 个个击破例1 今用简单随机抽样从含有6个个体的总体中抽取一个容量为2的样本.问:
(1)总体中的某一个体a在第一次抽取时被抽到的可能性是多少?
(2)个体a不是在第1次被抽到,而是在第2次被抽到的可能性是多少?
(3)在整个抽样过程中,个体a被抽到的可能性是多少? ??反思与感悟简单随机抽样的特点:(1)抽取的个体数较少;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.抽签法适于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.解析答案跟踪训练1 某公司甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是(  )
A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法解析 ①因为抽取销售点与地区有关,因此要采用分层抽样法;
②从20个特大型销售点中抽取7个调查,总体和样本都比较少,适合采用简单随机抽样法.
答案 B类型二 系统抽样解析答案反思与感悟例2 某学校有3 004名学生,从中抽取30名学生参加问卷调查,试用系统抽样的方法完成对样本的抽取.解 第一步,将3 004名学生编号为0000,0001,…,3003.
第二步,利用随机数法从中找出4个号,并将对应的4名学生排除.
第三步,将剩余的3 000名学生重新编号为0000,0001,…,2999,并将总体均分成30组,每组含有100名学生.
第四步,在第一组中用简单随机抽样的方法抽取号码l.
第五步,将编号为l,l+100,l+200,…,l+2900对应的学生抽出,组成样本.?跟踪训练2 在120个零件中,一级品24个,二级品36个,三级品60个,用系统抽样方法从中抽取容量为20的样本,则三级品a被抽到的可能性为
___.?解析答案?类型三 分层抽样解析答案反思与感悟例3 某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户.从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户,进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.?反思与感悟分层抽样遵循的原则:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层抽样为保证每个个体等可能入样需遵循每层的抽样比相同,抽样比即样本容量与总体数目的比值.跟踪训练3 将一个总体分为A、B、C三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C中抽取___个个体.解析答案返回?201.抽样方法有(  )
A.抽签法、系统抽样和分层抽样
B.随机数法、抽签法和分层抽样法
C.简单随机抽样、分层抽样和系统抽样
D.系统抽样、分层抽样和随机数法C达标检测     12345解析 我们常用的抽样方法有简单随机抽样、分层抽样和系统抽样,而抽签法和随机数法,只是简单随机抽样的两种不同抽取方法,故选C.解析答案2.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于(  )
A.9 B.10 C.12 D.13D12345解析答案3.下列问题中,最适合用分层抽样的是(  )
A.某电影院有32排座位,每排有40个座位,座位号是1~40.有一次报告会
坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检查
C.某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩,
现抽取农田480亩估计全乡农田平均产量
D.从50个零件中抽取5个做质量检验解析 A的总体容量较大,宜采用系统抽样法;
B的总体容量较小,宜用简单随机抽样法;
C总体容量较大,且各类田地的产量差别很大,宜采用分层抽样法;
D与B类似.解析答案C123454.①教育局到某学校检查工作,打算在每个班各抽调2人参加座谈;②某班期中考试有10人在85分以上,25人在60~84分,5人不及格,欲从中抽出8人参加改进教与学研讨;③某班级举行元旦晚会,要产生两名“幸运者”,则合适的抽样方法分别为(  )
A.系统抽样,系统抽样,简单随机抽样
B.简单随机抽样,分层抽样,简单随机抽样
C.系统抽样,分层抽样,简单随机抽样
D.分层抽样,简单随机抽样,简单随机抽样12345答案C123455.某大型超市销售的乳类商品有4类:鲜奶、酸奶、婴幼儿奶粉、成人奶粉,且分别有45种、10种、25种、20种不同的品牌,现从中抽取一个容量为20的样本进行三聚氰胺的安全检测,若采用分层抽样的方法抽取样本,则抽取的酸奶与成人奶粉品牌数之和是(  )
A.7 B.6 C.5 D.4解析答案B?返回4.几种抽样方法的共同特点是它们在抽样过程中,属不放回抽样,且每次抽取时,总体内的各个个体被抽到的机会是相等的.这体现了这些抽样方法的客观性和公平性.课件41张PPT。第二章 统计章末复习课1.会根据不同的特点选择适当的抽样方法获得样本数据;
2.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计总体;
3.能利用散点图对两个变量是否相关进行初步判断,能用回归方程进行预测.知识整合题型探究达标检测学习目标[知识网络]知识整合     新知探究 点点落实 答案[图表梳理] 最高小长方形底边的中点所对应的数据面积小长方形底边中点的横坐标答案面积答案[知识梳理]1.抽样方法
(1)当总体容量较小,样本容量也较小时,可采用 .
(2)当总体容量较大,样本容量较小时,可用 .
(3)当总体容量较大,样本容量也较大时,可用 .
(4)当总体由差异明显的几部分组成时,可用 .
2.用样本估计总体
用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率
与频率 .当样本只有两组数据且样本容量比较小时,用
刻画数据比较方便.抽签法随机数法系统抽样法分层抽样法分布表分布直方图茎叶图答案3.样本的数字特征
样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括
、 和 ;另一类是反映样本波动大小的,包括 及
.
4.变量间的相关关系
(1) 两个变量之间的相关关系的研究,通常先作变量的 ,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系).众数中位数平均数方差标准差散点图返回类型一 抽样方法的应用解析答案反思与感悟题型探究 重点难点 个个击破例1 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,干事20人,上级机关为了了解机关人员对政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取?解 用分层抽样抽取.即从副处级以上干部中抽取2人,一般干部中抽取14人,干事中抽取4人.
∵副处级以上干部与干事人数都较少,他们分别按1~10编号和1~20编号,然后采用抽签法分别抽取2人和4人,对一般干部采用00,01,…,69编号,然后用随机数法抽取14人.反思与感悟三种抽样方法并非截然分开,它们都能保证个体被抽到的机会相等.解析答案解析 分层抽样的原理是按照各部分所占的比例抽取样本,跟踪训练1 某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为(  )
A.6 B.8 C.10 D.12设从高二年级抽取的学生数为n,B类型二 用样本的频率分布估计总体分布解析答案例2 有1个容量为100的样本,数据(均为整数)的分组及各组的频数如下:
[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;
[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;
[30.5,33.5),8.
(1)列出样本的频率分布表;解 样本的频率分布表如下:解析答案(2)画出频率分布直方图;解 频率分布直方图如下图.解析答案(3)估计数据小于30的数据约占多大百分比.解 小于30的数据占0.06+0.16+0.18+0.22+0.20+0.10=0.92=92%.反思与感悟借助图表,可以把抽样获得的庞杂数据变得直观,凸显其中的规律,便于信息的提取和交流.跟踪训练2 为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为(  )
A.64 B.54 C.48 D.27解析 [4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为1-0.62-0.05-0.11=1-0.78=0.22.
∴a=(0.22+0.32)×100=54.解析答案B类型三 用样本的数字特征估计总体的数字特征解析答案例3 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;解析答案反思与感悟(2)根据计算结果判断哪台机床加工零件的质量更稳定.解 两台机床所加工零件的直径的平均数相同,所以乙机床加工零件的质量更稳定.样本的数字特征就像盲人摸到的象的某一局部特征,只有把它们结合起来才能看到全貌.跟踪训练3 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:解析答案问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?类型四 回归方程的应用解析答案例4 下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;解 散点图如图所示:解析答案解析答案(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?∴预测生产100吨甲产品的生产能耗比技改前降低19.65吨标准煤.反思与感悟散点图经最小二乘法量化为回归方程后,更便于操作(估计、预测),但得到的值仍是估计值.跟踪训练4 2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:解析答案(1)如果已知y与x成线性相关关系,求回归方程;解析答案返回(2)若某家庭年收入为9万元,预测其年饮食支出.1.10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,则数0.4是指1号球占总体分布的(  )
A.频数 B.概率 C.频率 D.累积频率C达标检测     12345答案2.为了了解全校1 320名高一学生的身高情况,从中抽取220名学生进行测量,下列说法正确的是(  )
A.样本容量是220 B.个体是每一个学生
C.样本是220名学生 D.总体是1 32012345解析答案解析 个体是每一个学生的身高;
样本是220名学生的身高;
总体是全校1 320名高一学生的身高.
A3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:12345解析答案则y对x的回归直线方程为(  )C4.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如图,则下面结论中错误的一个是(  )
A.甲的极差是29 B.乙的众数是21
C.甲罚球命中率比乙高 D.甲的中位数是2412345解析 甲的极差是37-8=29;
乙的众数显然是21;
甲的平均数显然高于乙,即C成立;
甲的中位数应该是23.D解析答案12345解析答案解析 由频率分布直方图,得低于60分的频率为(0.01+0.005)×20=0.3.5.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是(  )
A.45 B.50
C.55 D.60B1.应用抽样方法抽取样本时,应注意以下几点:
(1)用随机数法抽样时,对个体所编的号码位数要相等.当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.2.用样本的频率分布估计总体分布
利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体情况作出估计.直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式,这样根据样本的频率分布,我们可以大致估计出总体的分布.但是,当总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增加,频率分布折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体密度曲线,它能给我们提供更加精细的信息.在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留原始信息,而且可以随时记录,这给数据的记录和表示都带来方便.返回3.用样本的数字特征估计总体的数字特征
为了从整体上更好地把握总体的规律, 我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计.平均数就是所有样本数据的平均值,用 表示;标准差是反映样本数据分散程度大小的最常用统计量,有时也用标准差的平方s2—方差来代替标准差,实质一样.
4.回归方程的应用
分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归方程,并利用回归方程进行估计和预测.