2.2.1
一、选择题
1.(2010·金华十校)如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在[15,20)内的频数为( )
A.20 B.30 C.40 D.50
[答案] B
[解析] 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.
2.已知样本:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.
那么频率为0.2的范围是( )
A.5.5~7.5 B.7.5~9.5
C.9.5~11.5 D.11.5~13.5
[答案] D
[解析] 列出频率分布表,依次对照就可以找到答案,频率分布表如下:
分组 频数 频率
5.5~7.5 2 0.1
7.5~9.5 6 0.3
9.5~11.5 8 0.4
11.5~13.5 4 0.2
合计 20 1.0
从表中可以看出频率为0.2的范围是11.5~13.5故选D.
3.(09·福建文)一个容量为100的样本,其数据的分组与各组的频数如下:
组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70]
频数 12 13 24 15 16 13 7
则样本数据落在(10,40]上的频率为( )
A.0.13 B.0.39
C.0.52 D.0.64
[答案] C
[解析] 在(10,40]上的频率为=0.52,故选C.
4.(2010·广州市)根据《中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精浓度在20~80mg/100ml(不含80)之间,属于酒后驾车,处暂扣一个月以上三个月以下驾驶证,并处200元以上500元以下罚款;血液酒精浓度在80mg/100ml(含80)以上时,属醉酒驾车,处十五日以下拘留和暂扣三个月以上六个月以下驾驶证,并处500元以上2000元以下罚款.
据《法制晚报》报道,2009年8月15日至8月28日,全国查处酒后驾车和醉酒驾车共28800人,如图是对这28800人血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为( )
A.2160 B.2880 C.4320 D.8640
[答案] C
[解析] 由图可知,醉驾人数约为
(0.01+0.005)×10×28800=4320人.
5.下列关于频率分布直方图的说法正确的是( )
A.直方图的高表示取某数的频率
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值
D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值
[答案] D
[解析] 要注意频率直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.
[点评] 注意区别直方图与条形图.
6.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿的体重在[2700,3000]的频率为( )
A.0.001 B.0.01
C.0.003 D.0.3
[答案] D
[解析] 频率=×组距,组距=3000-2700=300,
=0.001,∴频率=0.001×300=0.3.
7.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于等于19秒.如图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为( )
A.0.9,35 B.0.9,45
C.0.1,35 D.0.1,45
[答案] A
[解析] 从频率分布直方图可以得到,成绩小于17秒的学生的频率也就是成绩小于17秒的学生所占的百分比,为0.02+0.18+0.34+0.36=0.9,∴x=0.9;成绩大于等于15秒且小于17秒的学生的人数为(0.34+0.36)×50=35,∴y=35.
8.(2010·山东省枣庄市)对某种电子元件进行寿命跟踪调查,所得样本频率分布直方图如图,由图可知:一批电子元件中,寿命在100~300小时的电子元件的数量与寿命在300~600小时的电子元件的数量的比大约是( )
A. B. C. D.
[答案] C
[解析] 寿命在100~300小时的频率为×100=,寿命在300~600小时的频率为1-=,
∴所求比值为=.
二、填空题
9.今年5月海淀区教育网开通了网上教学,某校高一年级(8)班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息,这一天上网学习时间在100~119分钟之间的学生人数是________人,如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?________(填“合理”或“不合理”)
[答案] 14 不合理
[解析] 由频数=样本容量×频率=40×0.35=14(人)
因为该样本的选取只在高一(8)班,不具有代表性,所以这样推断不合理.
10.(09·浙江文)某个容量为100的样本的频率分布直方图如下,则在区间[4,5)上的数据的频数为________.
[答案] 30
[解析] 频数n=(1-0.05-0.10-0.15-0.40)×100=30.
11.下图是高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图.则此班的优秀(120分以上为优秀)率为________.
[答案] 30%
[解析] 优秀率为10×(0.0225+0.005+0.0025)=0.3.
12.(2010·聊城模考)为了解学生参加体育活动的情况,我市对2009年下半年中学生参加体育活动的时间进行了调查统计,设每人平均每天参加体育锻炼时间为x(单位:分钟),按锻炼时间分下列四种情况统计:
①0≤x≤10 ②11≤x≤20
③21≤x≤30 ④x≥30
有10000名中学生参加了此项活动,上图是此次调查中做某一项统计工作时的程序框图,其输出的结果是6200,则平均每天参加体育锻炼的时间不超过20分钟(≤20分钟)的频率是________.
[答案] 0.38
[解析] 程序框图中,T=T+1,T≤10000控制输入10000名学生锻炼时间x的数据;x≤20,S=S+1判断输入的数据若不满足x≤20,则S的值增加1,故输出的S=6200应是10000名学生中,锻炼时间超过20分钟的人数,故不超过20分钟的频率为1-=0.38.
三、解答题
13.某市对上、下班交通情况做抽样调查,上、下班时间各抽取了12辆机动车行驶时速如下(单位:km/h):
上班时间:30,33,18,27,32,40,26,28,21,28,35,20.
下班时间:27,19,32,29,36,29,30,22,25,16,17,30.
用茎叶图表示上面的数据,并求出样本数据的中位数.
[解析] 以十位数为茎,个位数为叶,作出茎叶图
由图可见,上、下班时间行驶时速的中位数都是28.
14.连续抛掷一枚骰子120次,得到1,2,3,4,5,6点的次数分别为18,19,21,22,20,20.
(1)列出样本的频率分布表;
(2)求抛掷一次所得点数小于4的频率.
[解析] (1)频率分布表如下:
点数 频数 频率 累积频率
1 18 0.15 0.15
2 19 0.158 0.308
3 21 0.175 0.483
4 22 0.183 0.666
5 20 0.167 0.833
6 20 0.167 1.000
合计 120 1.000
(2)由频率分布表知抛掷一次所得点数小于4的频率为0.483.
15.为了检测某种产品的质量,抽取了一个容量为100的样本,尺寸数据的分组数如下:
[10.75,10.85),3;[10.85,10.95),9;
[10.95,11.05),13;[11.05,11.15),16;
[11.15,11.25),26;[11.25,11.35),20;
[11.35,11.45),7;[11.45,11.55),4;
[11.55,11.65),2.
(1)列出频率分布表(含累积频率);
(2)画出频率分布直方图;
(3)据上述图表,估计数据落在[10.95,11.35)范围内的可能性是百分之几?
(4)数据小于11.20的可能性是百分之几?
[解析] (1)列出频率分布表:
分组 频数 频率 累积频率
[10.75,10.85) 3 0.03 0.03
[10.85,10.95) 9 0.09 0.12
[10.95,11.05) 13 0.13 0.25
[11.05,11.15) 16 0.16 0.41
[11.15,11.25) 26 0.26 0.67
[11.25,11.35) 20 0.20 0.87
[11.35,11.45) 7 0.07 0.94
[11.45,11.55) 4 0.04 0.98
[11.55,11.65) 2 0.02 1.00
合计 100 1.00
(2)频率分布直方图如图:
(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为:0.87-0.12=0.75=75%即数据落在该区间内的可能性是75%.
(4)数据小于11.20的可能性即数据小于11.20的频率,也就是数据在11.20处的累积频率,设为x
则(x-0.41)÷(11.20-11.15)
=(0.67-0.41)÷(11.25-11.15),所以x=0.54,
从而估计数据小于11.20的可能性是54%.
备选题
1.(07·广东)图(1)是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1,A2,…,A10(如A2表示身高在[150,155)(单位:cm)内的学生人数),图(2)是统计图(1)中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm(含160cm,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是( )
A.i<9 B.i<8
C.i<7 D.i<6
[答案] B
[解析] 符合条件的分别为A4,A5,A6,A7,通过循环框图求出A4,A5,A6,A7的人数和,因为从i=4开始,执行四次循环后i=7,故选B.
2.某机构调查了当地1000居民的月收入,并根据所得数据画出了样本的频率分布直方图如图.为了分析居民的收入与学历等方面的关系,要从这1000人中再用分层抽样方法抽取100人作进一步调查,则在[2500,3000)(元)月收入段应抽取的人数是( )
A.50 B.25
C.10 D.5
[答案] B
[解析] 由图知,收入在[2500,3000)元间的频率为(3000-2500)×0.0005=0.25,故这1000居民中有1000×0.25=250(人).
由分层抽样可知,设100人中抽取x人,则有= x=25(人).
3.抽查100袋洗衣粉,测得它们的重量如下(单位:g):
494 498 493 505 496 492 485 483 508 511 495
494 483 485 511 493 505 485 501 491 493 509
509 512 484 509 510 495 497 498 504 498 483
510 503 497 502 511 497 500 493 509 510 493
491 497 515 503 515 518 510 514 509 499 493
499 509 492 505 489 494 501 509 498 502 500
508 491 509 509 499 495 493 509 496 509 505
499 486 491 492 496 499 508 485 498 496 495
496 505 499 505 493 501 510 496 487 511 501
496
(1)列出样本的频率分布表;
(2)画出频率分布直方图和折线图;
(3)求出重量不足500g的频率.
[解析] (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4g,则由于35÷4=8.75,要分9组,组数合适.于是决定取组距为4g分9组,使分点比数值多一位小数,且把第一组起点稍微减少一点,列出频率分布表如下:
分组 频数 频率 累积频率
[482.5,486.5) 8 0.08 0.08
[486.5,490.5) 3 0.03 0.11
[490.5,494.5) 17 0.17 0.28
[494.5,498.5) 20 0.20 0.48
[498.5,502.5) 14 0.14 0.62
[502.5,506.5) 10 0.10 0.72
[506.5,510.5) 19 0.19 0.91
[510.5,514.5) 6 0.06 0.97
[514.5,518.5) 3 0.03 1.00
合计 100 1.00
(2)频率分布直方图和折线图如下.
(3)重量在[494.5,506.5)g的频率为:
0.20+0.14+0.10=0.44
它等于0.72-0.28.设重量不足500g的频率为b,根据频率分布表,≈,故b≈0.53.因此重量不足500g的频率约为0.53.2.1.2
一、选择题
1.下列抽样中不是系统抽样的是( )
A.从标有1~15号的15个球中,任选3个作样本,按从小号到大号排序,随机选起点i0,以后i0+5,i0+10(超过15则从1再数起)号入样
B.工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品进行检验
C.搞某一市场调查,规定在某一路段随机抽一个人进行询问,直到调查到事先规定调查人数为止
D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
[答案] C
[解析] 抽样方法的实质是:抽样过程中,每个个体被抽取的机会相等,并且抽样前对总体的构成必须心中有数,比如起码知道总体中个体有多少.本题考查系统抽样的有关概念,系统抽样适用于个体较多但均衡的总体,判断是否为系统抽样,应先看是否在抽样前知道总体是由什么构成的,抽样的方法能否保证每个个体等可能入样,再看是否将总体分成几个均衡的部分,每个部分中进行简单随机抽样.而C中因为事先不知道总体,抽样方法不能保证每个个体按事先规定的可能性入样.故C不是系统抽样.
2.从2004名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2004人中剔除4人,剩下的2000人再按系统抽样的方法进行,则每人入选的机会( )
A.不会相等 B.均不相等
C.都相等 D.无法确定
[答案] C
[解析] 由系统抽样的定义知,上述抽样方法为系统抽样,因此,每人入选的机会都相等.
3.为了了解某地参加计算机水平测试的5008名学生的成绩,从中抽取了200名学生的成绩进行统计分析,运用系统抽样方法抽取样本时,每组的容量为( )
A.24 B.25 C.26 D.28
[答案] B
[解析] 5008除以200的整体数商为25,∴选B.
4.要从已编号(1~50)的50枚最新研制的某型导弹中随机抽取5枚来进行发射试验,用系统抽样方法确定所选取的5枚导弹的编号可能是( )
A.5,10,15,20,25 B.3,13,23,33,43
C.1,2,3,4,5 D.2,4,8,16,32
[答案] B
[解析] 间隔距离应为[]=10.
5.从2007名学生中选取50名参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样从2007人中剔除7人,剩下的2000人再按系统抽样的方法抽取,则每人入选的可能性( )
A.不全相等 B.均不相等
C.都相等,且为 D.都相等,且为
[答案] C
6.某班的60名同学已编号1,2,3,…,60,为了解该班同学的作业情况,老师收取了号码能被5整除的12名同学的作业本,这里运用的抽样方法是( )
A.简单随机抽样法 B.系统抽样法
C.抽签法 D.以上都不正确
[答案] B
7.系统抽样又称为等距抽样,从m个个体中抽取n个个体作为样本(m>n),先确定抽样间隔,即抽样距k=的整数部分,从第一段1,2,…,k个号码中随机地抽取一个入样号码i0,则i0,i0+k,…,i0+(n-1)k号码入样构成样本,所以每个个体入样的可能性( )
A.与i0有关 B.与编号有关
C.不一定相等 D.相等
[答案] D
8.总体容量为520,若采用系统抽样法,当抽样间隔为下列哪个值时,不需要剔除个体( )
A.6 B.7 C.8 D.9
[答案] C
二、填空题
9.为了了解某地区癌症的发病情况,从该地区的5000人中抽取200人进行统计分析,在这个问题中5000人是________.
[答案] 总体
[解析] 5000人是总体,5000是总体容量,要注意区别,200人是样本,200是样本容量.
10.为了检验某种产品质量,决定从50件产品中抽取10件进行检查(产品已编号为00~49),运用课本后的随机数表进行抽样时,从第12行第21个数字开始,每两位一组,抽取的样本号码为______________.
[答案] 11,46,32,24,20,14,45,10
11.人们打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌,这时,开始按次序搬牌,对任何一家来说,都是从52张总体中抽取一个13张的样本,问这样抽样方法是否为简单随机抽样(答是或不是)________.
[答案] 不是
[解析] 由系统抽样的特点可知,它是系统抽样.
12.某班共有学生52人,现根据学生的学号,用系统抽样的方法,抽到一个容量为4的样本,已知6号、32号、45号同学在样本中,那么样本中还有一个同学的学号是________.
[答案] 19
[解析] ∵52÷4=13,∴抽样间隔为13,故抽取号码依次为6,19,32,45,故填19.
三、解答题
13.在下列问题中,各采用什么抽样方法抽取样本较为合适?
(1)从20台彩电中抽取4台进行质量检验;
(2)科学会堂有32排座位,每排有40个座位(座位号为1~40).一次报告会坐满了听众,会后为听取意见留下32名听众进行座谈.
[解析] (1)简单随机抽样法 (2)系统抽样法
14.某工厂有1003名工人,从中抽取10人参加体检,试采用系统抽样进行具体实施.
[解析] ①将每个人编一个号,由0001至1003;②利用随机数表法抽取3个号,将这3个号对应的人排除;③重新编号0001至1000;④分段=100.所以0001至0100为第一段;⑤在第一段内用简单随机抽样法抽得一个号k;⑥按编号将k,k+100,k+200,…,k+900共10个号码选出.这10个号码所对应的人组成样本.
15.某单位共有在岗职工624人,为了调查工人上班时,从离开家到来到单位的路上平均所用时间,决定抽取10%的工人调查这一情况,如何采用系统抽样方法完成这一抽样?
[解析] 首先,将在岗的工人624人,用随机方式编号(如按出生年月日顺序),000,001,002,…,623.第二步,由题意知,应抽取62人的样本,因为不是整数,所以应从总体中剔除4人,(剔除方法用随机数表法),将余下的620人,重新编号为000,001,002,…,619,分成62段,每段10人,在第一段000,001,002,…,009这十个编号,随机定一起始号i0,则编号i0,i0+10,i0+20,…,i0+61×10的工人上班所用时间为所抽取的样本.
16.一个总体中的1000个个体编号为0,1,2,…,999,并依次将其分为10个小组,组号为0,1,2,…,9.要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x,那么依次错位地得到后面各组的号码,即第k组中抽取的号码的后两位数为x+33k的后两位数.
(1)当x=24时,写出所抽取样本的10个号码;
(2)若所抽取样本的10个号码中有一个的后两位数是87,求x的取值范围.
[解析] (1)当x=24时,按规则可知所抽取样本的10个号码依次为:24,157,290,323,456,589,622,755,888,921.
(2)当k=0,1,2,…,9时,33k的值依次为0,33,66,99,132,165,198,231,264,297.
又抽取样本的10个号码中有一个的后两位数是87,从而x可以为87,54,21,88,55,22,89,56,23,90.
∴x的取值范围是{21,22,23,54,55,56,87,88,89,90}.2.1.1
一、选择题
1.某校期末考试后,为了分析该校高一年级1000名学生的学习成绩,从中随机抽取了100名学生的成绩单,就这个问题来说,下面说法中正确的是( )
A.1000名学生是总体
B.每名学生是个体
C.每名学生的成绩是所抽取的一个样本
D.样本的容量是100
[答案] D
[解析] 1000名学生的成绩是统计中的总体,每个学生的成绩是个体,被抽取的100名学生的成绩是一个样本,其样本的容量为100.
2.关于简单随机抽样的特点,有以下几种说法,其中不正确的是( )
A.要求总体中的个体数有限
B.从总体中逐个抽取
C.这是一种不放回抽样
D.每个个体被抽到的机会不一样,与先后顺序有关
[答案] D
[解析] 简单随机抽样,除具有A、B、C三个特点外,还具有:是等可能抽样,各个个体被抽取的机会相等,与先后顺序无关.
3.某校高一共有10个班,编号1至10,某项调查要从中抽取三个班作为样本,现用抽签法抽取样本,每次抽取一个号码,共抽3次,设五班第一次被抽到的可能性为a,第二次被抽到的可能性为b,则( )
A.a=,b= B.a=,b=
C.a=,b= D.a=,b=
[答案] C
[解析] 由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,故五班在每次抽样中被抽到的可能性都是.
4.简单随机抽样的结果( )
A.完全由抽样方式所决定
B.完全由随机性所决定
C.完全由人为因素所决定
D.完全由计算方法所决定
[答案] B
[解析] 据简单随机抽样的定义,总体中每个个体被抽到的机会相等,因此抽样结果只与随机性有关,∴选B.
5.在简单随机抽样中,某一个个体被抽中的可能性( )
A.与第几次抽样有关,第1次抽中的可能性要大些
B.与第几次抽样无关,每次抽中的可能性都相等
C.与第几次抽样有关,最后一次抽中的可能性大些
D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不一样
[答案] B
[解析] 据简单随机抽样的定义可知,某一个个体被抽中的可能性与第几次抽样无关,每次都是等可能的抽取,各次抽到的可能性也都相同,∴选B.
6.从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N为( )
A.150 B.200
C.100 D.120
[答案] D
[解析] ∵每个个体被抽到机会相等,都是=0.25,∴N=120.
7.下列抽样方法是简单随机抽样的是( )
A.从整数集中,逐个抽取100个检验是否为奇数
B.从某车间包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人调查对学校机构改革的意见
D.从8台电脑中不放回地随机抽取2台进行质量检验
[答案] D
8.某校有40个班,每班50人,每班选派3人参加“学代会”,在这个问题中样本容量是( )
A.40 B.50
C.120 D.150
[答案] C
二、填空题
9.一次体育运动会,某代表团有6名代表参加,欲从中抽取一人检查是否服用兴奋剂,抽检人员将6名队员名字编号为1~6号,然后抛掷一枚骰子,朝上的一面是几就抽检几号对应的队员,问这种抽检方式是简单随机抽样吗?(答是或不是)________.
[答案] 是
[解析] 抛掷一颗均匀骰子,各面向上的机会是均等的,故每名队员被抽到的机会相等.
10.高一(1)班有50名同学,现要从中抽取6名同学参加一个讨论会,每位同学的机会均等.我们可以把50名同学的学号写在小球上,放在一个不透明的袋子中,充分搅拌后,再从中逐个抽取6个小球,从而抽取6名参加讨论会的同学.这种抽样方法是简单随机抽样吗?(答是或不是)________.
[答案] 是
[解析] 据抽签法的定义知,上述抽样方法是抽签法,
∴是简单随机抽样.
11.某大学为了支援西部教育事业,现从报名的18名志愿者中选取6人组成志愿小组.用抽签法设计抽样方案如下:
S1 将18名志愿者编号,号码为1,2,…,18;
S2 将号码分别写在一张纸条上,揉成团,制成号签;
S3 将号签放入一个不透明的袋子中,并充分搅匀;
S4 ________________________________________;
S5 所得号码对应的志愿者就是志愿小组的成员.
则S4步骤应为______________________________.
[答案] 从袋子中依次抽出6个号签,记录下上面的编号.
三、解答题
12.从30个足球中抽取10个进行质量检测,说明利用随机数法抽取这个样本的步骤及公平性.
[解析] 步骤如下:
第一步:首先将30个足球编号:00,01,02,…,29.
第二步:在随机数表中随机选一数作为开始,如从第9行第17列的数0开始.
第三步:从选定的数0开始向右读(也可以向左、向上、向下等),读取一个二位数字07,由于07<29,将它取出;读取82,由于82>29,将它去掉.按照这种方式继续向右读,取出的二位数字若与前面已有的相同,也将它去掉,这样又得到15,00,13,…,依次下去,直到样本的10个号码全部取出.这样就得到一个容量为10的样本.
公平性在于:(1)随机数表中每个位置上出现哪一个数是等可能的;(2)从30个足球的总体中抽到哪一个个体的号码也是机会均等的.基于以上两点,利用随机数表抽取样本保证了各个个体被抽到的机会是相等的.
13.为了缓解城市的交通拥堵情况,某大城市准备出台限制私家车的政策.为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样?
[解析] 一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益,为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该市的所有市民进行随机地抽样调查,不要只关注到拥有私家车的市民.
14.一个学生在一次竞赛中要回答的8道题是这样产生的:从15道物理题中随机抽3道;从20道化学题中随机抽3道;从12道生物题中随机抽2道.请用随机抽样法确定这个学生所要回答的三门学科的题的序号(物理题的编号为1~15,化学题的编号为16~35,生物题的编号为36~47).
[解析] S1 将物理题编号调整为01,02,03,…,15;其余两种题号不变;
S2 在随机数表中任选一数作为开始,任选一方向作为读数方向;
S3 从选取的数开始,按指定方向,每次读取2位,凡不在01~47之间的数跳过去不读,前面已读过的也跳过去不读,从01~15中,读取3个号码为止,从16~35中,读取3个号码为止,从36~47中读取2个号码为止;
S4 读取号码对应的序号就是所要回答问题的编号.
[点评] (1)选取的初始数字不同,读取号码则不同,方向不同,号码也不同,但都合乎问题要求,如选择第6行第3个数字开始向右读数,号码为06,04,12;22,17,23;39,43.
若选取第3行第5个数字开始向下读取,读到下方后返回从上向下读,则为03,04,12;16,18,15;42,36.
(2)本题用抽签法需将三签符号分开,分别抽取.
15.因为样本是总体的一部分,是由某些个体所组成的,尽管对总体具有一定的代表性,但并不等于总体,为什么不把所有个体考察一遍,使样本就是总体?
[解析] 如果样本就是总体,抽样调查就变成普查了,尽管确实真实地反映了实际情况,但不是统计的基本思想,其操作性、可行性、人力、物力等方面,都会有制约因素存在.何况有些调查是有破坏性的.如考察一批玻璃的抗碎能力、灯泡的使用寿命等,如果进行普查这批玻璃和灯泡就全部报费了,因此为了又能了解总体的真实情况,又不需要把总体中每个个体都调查一番,人们才想到研究统计.
16.现从10架钢琴中抽取4架进行质量检验,写出用抽签法抽样的过程.
[解析] S1 将10架钢琴编号,号码是0,1,…,9;
S2 将号码分别写在一张纸条上,揉成团,制成号签;
S3 将得到的号签放入一个不透明的袋子中,并充分搅匀;
S4 从袋子中依次抽取4个号签,并记录上面的编号;
S5 所得号码对应的4架钢琴就是要抽取的对象.2.2.2
一、选择题
1.某市在非典期间一手抓防治非典,一手抓经济发展,下表是利群超市5月份一周的利润情况记录:
日期 12日 13日 14日 15日 16日 17日 18日
当日利润(万元) 0.20 0.17 0.23 0.21 0.23 0.18 0.25
根据上表你估计利群超市今年五月份的总利润是( )
A.6.51万元 B.6.4万元
C.1.47万元 D.5.88万元
[答案] A
[解析] 从表中一周的利润可得一天的平均利润为
=
=0.21.
又五月份共有31天,
∴五月份的总利润约是0.21×31=6.51(万元).
2.某赛季,甲、乙两名运动员都参加了11场比赛,他们每场比赛得分的茎叶图如下图所示,则甲、乙两名运动员比赛得分的中位数之和是( )
A.32 B.30
C.36 D.41
[答案] A
[解析] 甲得分的中位数为19,乙得分的中位数为13,∴和为32,故选A.
3.已知一个样本x,1,y,5.其中x,y是方程组的解,则这个样本的标准差是( )
A.2 B.
C. D.5
[答案] C
[解析] 解方程组得,或,
∴这个样本为-1,1,3,5,11其平均数为
=(-1+1+3+5)=2,
∴s=
=
=.因此选择答案C.
4.一组数据中的每一个数都减去80得到一组新的数据,如果求得新数据的平均数为1.2,方差为4.4,则原来数据的平均数和方差分别为( )
A.81.2,84.4 B.78.8,4.4
C.81.2,4.4 D.78.8,75.6
[答案] C
[解析] 一般地,数据x1,x2,…,xn的平均数为,方差为S2,则x1+k,x2+k,…,xn+k的平均数为+k,方差仍为S2,故选C.
5.某校学生体检中检查视力的结果如下表,从表中可以看出,全班视力数据的众数是( )
视力 0.5以下 0.7 0.8 0.9 1.0 1.0以上
占全班人数的百分比 2% 6% 3% 20% 65% 4%
A.0.9 B.1.0
C.20% D.65%
[答案] B
[解析] 在一组数据中,出现次数最多的数据叫做这组数据的众数,从上表可以看出,视力以1.0的人数占的百分比最大,所以众数应为1.0.
6.某台机床加工的1000只产品中次品数的频率分布如下表:
次品数 0 1 2 3 4
频率 0.5 0.2 0.05 0.2 0.05
则次品数的众数、平均数依次为( )
A.0,1.1 B.0,1
C.4,1 D.0.5,2
[答案] A
[解析] 数据xi出现的频率为pi(i=1,2,…,n),则x1,x2,…,xn的平均数为x1p1+x2p2+…+xnpn.
7.若有样本容量为8的样本平均数为5,方差为2,现样本中又加入一新数据为4,现样本容量为9,则样本平均数和方差分别为( )
A., B.5,2
C., D.,
[答案] A
[解析] 设原8个数据为x1,x2,…,x8,其平均数为,方差为s2;新加入的数据为x9,平均数为′,方差为s′2,则
=(x1+x2+…+x8),∴x1+x2+…+x8=8=40,
s2=(x+x+…+x)-2,
∴x+x+…+x=8(s2+2)=216,
∴2=(x1+x2+…+x8+x9)=(40+4)=,
s′2=(x+x+…+x+x)-′2
=(216+16)-2=.
8.某班有50名学生,某次数学考试的成绩经计算得到的平均分数是70分,标准差是s,后来发现登录有误,某甲得70分却记为40分,某乙得50分误记为80分,更正后重新计算得标准差为s1,则s与s1之间的大小关系是( )
A.s=s1 B.sC.s>s1 D.不能确定
[答案] C
[解析] 两次误记,分别少记、多记了30分,故更正后平均成绩不变
误记时,s2=[(40-70)2+(80-70)2+(x3-70)2+…+(x50-70)2]=[900+100+(x3-70)2+…+(x50-70)2];
更正后,s=[(70-70)2+(50-70)2+(x3-70)2+…+(x50-70)2]=[0+400+(x3-70)2+…+(x50-70)2],故s2>s,∴s>s1.
9.(2010·陕西文,4)如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为SA和SB,则( )
A.A>B,SA>SB B.ASB
C.A>B,SA[答案] B
[解析] A=(2.5+10+5+7.5+2.5+10)=6.25,
B=(15+10+12.5+10+12.5+10)=≈11.67,
S=[(2.5-6.25)2+(10-6.25)2+(5-6.25)2+(7.5-6.25)2+(2.5-6.25)2+(10-6.25)2]≈9.90
S=(15-)2+(10-)2+(-)2+(10-)2+(-)2+(10-)2=3.47
故ASB.
[点评] 由上面计算过程可见,计算量很大,作为选择题,这样解答显然不合适,应充分利用图形提供的信息作出选择.首先A数据x的最大值为10,B数据x的最小值为10,已知ASB,排除D,故选B.
10.某地教育部门为了了解学生在数学答卷中的有关信息,从上次考试的20000名考生的数学试卷中,用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图如图.则这20000人中数学成绩在[120,150]分数段的人数约是( )
A.10400 B.9600
C.13600 D.6400
[答案] A
[解析] [120,150]所对应的三个长方形的面积和是(0.024+0.02+0.008)×10=0.52,在样本500人中,频数是0.52×500=260人;用样本500人估计总体20000人数学成绩在[120,150]段的人数约是260×=10400人.
二、填空题
11.已知样本101,100,99,a,b的平均数为100,方差为2,这个样本中的数据a与b的取值为________.
[答案] 102,98或98,102
[解析] 由题设知
∴或.
12.若k1,k2,…,k6的方差为3,则2(k1-3),2(k2-3),…,2(k6-3)的方差为________.
[答案] 12
[解析] 设k1,k2,…,k6的平均数为,
则[(k1-)2+(k2-)2+…+(k6-)2]=3,
而2(k1-3),2(k2-3),…,2(k6-3)的平均数为2(-3),则所求方差为:
[4(k1-)2+4(k2-)2+…+4(k6-)2]=4×3=12.
13.(08·上海文)已知总体的各个个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是________.
[答案] a=10.5,b=10.5
[解析] 由题设知,a+b=21.
平均数==10,
由方差公式知,要使方差最小,应使(a-10)2+(b-10)2最小,
令y=(a-10)2+(b-10)2,
∵a+b=21,∴b=21-a,
∴y=(a-10)2+(11-a)2=2(a-10.5)2+
∴当a=10.5时,(a-10)2+(b-10)2取最小值,此时b=10.5.
14.(09·辽宁理)某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1?2?1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980h,1020h,1032h,则抽取的100件产品的使用寿命的平均值为________h.
[答案] 1013
[解析] ∵用分层抽样的方法取100件产品,则一、二、三分厂分别抽取25、50、25件,则平均值为
=1013.
三、解答题
15.某单位工作时间的抽样频数分布如下:(单位:h)
[6,6.5),5人;[6.5,7),17人;[7,7.5),33人;[7.5,8),37人;[8,8.5),6人;[8.5,9),2人.
试估计该单位的平均工作时间.
[解析] 由于每组中的个体都是一个范围,可以用各组区间的中值近似地表示.
平均工作时间约为:
(6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2)÷100=739÷100=7.39(h).
16.有甲、乙两个球队,甲队有6名队员,乙队有20名队员,他们的身高数据如下(单位:cm):
甲队:187 181 175 185 173 179
乙队:180 179 182 184 183 183 183 176 176 181 177 177 178 180 177 184 177 183 177 183
(1)求两队队员的平均身高;
(2)比较甲、乙两队哪一队的身高更整齐些?
[解析] (1)甲=(7+1-5+5-7-1)+180=180(cm),乙=(0-1+2+4+3+3+3-4-4+1-3-3-2+0-3+4-3+3-3+3)+180=180(cm).
(2)s=25,s=8.2,s17.假定下述数据是甲、乙两个供货商的交货天数:
甲:10 9 10 10 11 11 9 11 10 10
乙:8 10 14 7 10 11 10 8 15 12
估计两个供货商的交货情况,并问哪个供货商交货时间短一些,哪个供货商交货时间较具一致性与可靠性.
[解析] 甲=(10+9+…+10)=10.1,
s=(102+92+…+102)-10.12=0.49;
乙=(8+10+…+12)=10.5,
s=(82+…+122)-10.52=6.05>s.
从交货天数的平均值来看,甲供货商的交货天数短一些;从方差来看,甲供货商的交货天数较稳定,因此甲供货商是较具一致性与可靠性的供货商.
备选题
(09·安徽文)某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:357,359,367,368,375,388,392,399,400,405,
412,414,415,421,423,423,427,430,430,434,
443,445,445,451,454
品种B:363,371,374,383,385,386,391,392,394,394,
395,397,397,400,401,401,403,406,407,410,
412,415,416,422,430
(1)完成所附的茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
[解析] (1)
(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了的展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.
(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.2.3. 1
一、选择题
1.对于给定的两个变量的统计数据,下列说法正确的是( )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
[答案] C
[解析] 给出一组样本数据,总可以作出相应的散点图,但不一定分析出两个变量的关系,更不一定符合线性相关或有函数关系.
2.下列两个变量之间的关系,哪个不是函数关系( )
A.正方体的棱长和体积
B.圆半径和圆的面积
C.正n边形的边数和内角度数之和
D.人的年龄和身高
[答案] D
[解析] A、B、C都是函数关系,对于A,V=a3;对于B,S=πr2;对于C,g(n)=(n-2)π.而对于年龄确定的不同的人可以有不同的身高,∴选D.
3.下列变量之间的关系是函数关系的是( )
A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.每亩施肥量和粮食亩产量
[答案] A
[解析] 一般地说,在一定范围内,在其它条件相同的情况下,光照时间长,果树亩产量会增加,它们正相关,但不具有函数关系;同理,每亩施肥量增加,粮食亩产量也会增加,呈正相关趋势,但到达一定程度,则不再正相关,更没有函数关系,同理C也没函数关系,而A中,∵a,c为已知常数,当b确定时,Δ=b2-4ac也随之确定且有唯一值与之对应,∴A为函数关系.
4.某校有行政人员、教学人员和教辅人员共200人,其中教学人员与教辅人员的比为10?1,行政人员有24人,现采取分层抽样的方法抽取容量为50的样本,那么教学人员应抽取的人数为( )
A.30 B.40 C.20 D.36
[答案] B
[解析] 设教辅人员x人,则10x+x+24=200,
∴x=16,
∴教学人员应抽取16×10×=40人.
5.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:
9.4 8.4 9.4 9.9 9.6 9.4 9.7
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A.9.4,0.484 B.9.4,0.016
C.9.5,0.04 D.9.5,0.016
[答案] D
[解析] 数据的平均值==9.5.
方差s2=[(9.4-9.5)2+(9.4-9.5)2+(9.6-9.5)2+(9.4-9.5)2+(9.7-9.5)2]=0.016.故选D.
6.(08·山东)右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为( )
A.304.6 B.303.6 C.302.6 D.301.6
[答案] B
[解析] 由茎叶图知:291,291,295,298,302,306,310,312,314,317知所求平均数为303.6.故选B.
7.已知样本:
10 8 6 10 13 8 10 12 11 7 8 9 11 9
12 9 10 11 12 12
那么频率为0.3的范围是( )
A.5.5~7.5 B.7.5~9.5
C.9.5~11.5 D.11.5~13.5
[答案] B
[解析] 样本容量为20,频率若为0.3,则在此组的频数应为20×0.3=6.[5.5,7.5)2;[7.5,9.5)6;[9.5,11.5)7;[11.5,13.5)5.故选B.
8.下列变量关系是函数关系的是( )
A.三角形的边长与面积之间的关系
B.等边三角形的边长与面积之间的关系
C.四边形的边长与面积之间的关系
D.菱形的边长与面积之间的关系
[答案] B
二、填空题
9.据两个变量x,y之间的观测数据画成散点图如图,这两个变量是否具有线性相关关系(答是与否)________.
[答案] 否
10.如图是一个容量为200的样本的频率分布直方图,请根据图形中的数据填空:
(1)样本数据落在范围[5,9)的频率为________;
(2)样本数据落在范围[9,13)的频数为________.
[答案] (1)0.32 (2)72
[解析] 频率=×组距=0.32;频数=频率×样本总数=72.
11.下列语句中,两个变量具有相关关系的序号是____________.
①任意实数与它的平方
②人的寿命与生辰属相
③匀速行驶车辆的行驶距离与时间
④商品的销售额与广告费支出
⑤家庭用电量与电价间的关系
⑥吸烟与健康的关系
[答案] ④⑤⑥
三、解答题
12.5个学生的数学和物理成绩如下表:
学生学科 A B C D E
数学 80 75 70 65 60
物理 70 66 68 64 62
画出散点图,并判断它们是否有相关关系.
[解析] 把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在直角坐标系中描点(xi,yi)(i=1,2,…,5),作出散点图如图.
从图中可以直观地看出数学成绩和物理成绩具有相关关系,且当数学成绩增大时,物理成绩也在由小变大,即它们正相关.
13.下表是某小卖部6天卖出的热茶的杯数与当天气温的对比表.
气温(℃) 26 18 13 10 4 -1
杯数y 20 24 34 38 50 64
(1)将表中的数据画成散点图;
(2)你能依据散点图指出温度与饮料杯数的关系吗?
(3)如果温度与卖出饮料杯数近似成线性相关关系的话,请画出一条直线来近似地表示这种线性相关关系.
[解析] (1)画出的散点图如图.
(2)从图中可以发现气温和热茶杯数具有相关关系,气温和热茶杯数成负相关,图中的各点大致分布在一条直线的附近,因此气温和杯数近似成线性相关关系.
(3)根据不同的标准,可以画出不同的直线来近似表示这种线性相关关系,如让画出的直线上方的点和下方的点数目相等.如图.
[点评] 这样画出的拟合直线不惟一.
14.如图所示,在考察某个总体时作出了如下直方图.请在此图的基础上作出折线图.
[解析] 第一步,将各小矩形的上底边中点顺次连结.
第二步,把矩形的边去掉便得到折线图.
15.甲、乙两名射手在相同条件下射击10次,环数如下:
甲:7 8 8 9 9 9 9 10 10 10
乙:7 7 8 9 9 9 10 10 10 10
要从这两名射手中选一名参加射击比赛,选谁更合适?
[解析] 可以从平均成绩及方差(或标准差)方面来考察样本数据的平均水平及稳定程度.
解:甲、乙两人的平均成绩:甲=8.9,乙=8.9,
再看方差:s=0.889,s=1.29,
则s∴应选甲参加比赛.
16.某鱼塘放养鱼苗10万条,根据这几年的经验知道,鱼苗成活率为95%,一段时间后准备打捞出售,第一网捞出40条,称得平均每条鱼重2.5kg,第二网捞出25条,称得平均每条鱼重2.2kg,第三网捞出35条,称得平均每条鱼重2.8kg,试估计这时鱼塘中鱼的总重量(保留两个有效数字).
[解析] 样本平均数(加权平均数)为
==2.53(kg),
即样本中平均每条鱼重2.53kg.所以估计鱼塘中鱼的总重量为105×95%×2.53≈2.4×105(kg).
答:估计这时鱼塘中鱼的总重量约为2.4×105kg.2.3. 2
一、选择题
1.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程=bx+a,那么下面说法不正确的是( )
A.直线=bx+a必经过点(,)
B.直线=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
C.直线=bx+a的斜率为
D.直线=bx+a和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差yi-(bxi+a)]2是该坐标平面上所有直线与这些点的偏差中最小的直线.
[答案] B
[解析] 由a=-b 知=-b +bx,∴必定过(,)点.
回归直线方程对应的直线是与样本数据距离最小的,但不一定过原始数据点,只须和这些点很接近即可.
2.设有一个回归方程为=2-1.5x,则变量x增加一个单位时( )
A.y平均增加1.5个单位
B.y平均增加2个单位
C.y平均减少1.5个单位
D.y平均减少2个单位
[答案] C
[解析] 2-1=2-1.5(x+1)-2+1.5x=-1.5.
3.如图是具有相关关系的两个变量的一组数据的散点图和回归直线,去掉哪个点后,剩下的5个点数据的相关系数最大?( )
A.D B.E C.F D.A
[答案] C
[解析] 第F组数据距回归直线最远,所以去掉第F组后剩下的相关系数最大.
4.以下关于线性回归的判断,正确的有________个.( )
①若散点图中所有点都在一条直线附近,则这条直线为回归直线
②散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点.
③已知回归直线方程为=0.50x-0.81,则x=25时,y的估计值为11.69
④回归直线方程的意义是它反映了样本整体的变化趋势
A.0个 B.1个 C.2个 D.3个
[答案] D
[解析] 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a,b得到的直线=ax+b才是回归直线,∴①不对;②正确;将x=25代入=0.50x-0.81,解得=11.69,∴③正确;④正确,∴选D.
5.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地作10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( )
A.直线l1和l2有交点(s,t)
B.直线l1和l2相交,但是交点未必是点(s,t)
C.直线l1和l2由于斜率相等,所以必定平行
D.直线l1和l2必定重合
[答案] A
[解析] 由题意,结合回归直线易知只有选项A符合已知条件.
6.对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是( )
A.频率分布直方图与总体密度曲线无关
B.频率分布直方图就是总体密度曲线
C.样本容量很大的频率分布直方图就是总体密度曲线
D.如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近于总体密度曲线
[答案] D
[解析] 因为如果样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线就是总体密度曲线.
7.济南市某校在“创新素质实践行”活动中,组织学生进行社会调查,并对学生的调查报告进行了评比,如图是将某年级60篇学生的调查报告的成绩进行整理,分成5组画出的频率分布直方图.已知从左往右4个小组的频率分别是0.05,0.15,0.35,0.30,那么在这次评比中被评为优秀的调查报告有(分数大于等于80分为优秀,且分数为整数).( )
A.18篇 B.24篇 C.25篇 D.27篇
[答案] D
[解析] 80分以下的报告有:(0.05+0.15+0.35)×60=33(篇),所以被评为优秀的有:60-33=27(篇).
8.某地共有10万户居民,从中随机调查了1000户,拥有彩电的调查结果如下表:
彩电 城市 农村
有 432 400
无 48 120
若该地区城市与农村住户之比为4?6,估计该地区无彩电的农村总户数约为( )
A.0.923万户 B.1.385万户
C.1.8万户 D.1.2万户
[答案] B
[解析] 根据题意知农村住户有6万.无彩电的农村总户数为6×=1.385(万).
二、填空题
9.一家保险公司调查其总公司营业部的加班速度,收集了10周中每周加班工作时间y(小时)与签发新保单数目x的数据如下表,则用最小二乘法估计求出的回归直线方程是________.
x 825 215 1070 550 480 920 1350 325 670 1215
y 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0
[答案] =0.1022+0.003606x
[解析] =i=762,(xi-)2=1297860,
=2.85,(xi-)(yi-)=4680.6,
b===0.003606,
a=-b =0.1022.
10.(2010·广东文,12)某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份 2005 2006 2007 2008 2009
收入x 11.5 12.1 13 13.3 15
支出Y 6.8 8.8 9.8 10 12
根据统计资料,居民家庭平均收入的中位数是__________,家庭年平均收入与年平均支出有__________线性相关关系.
[答案] 13 正
[解析] 奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.
11.已知两个变量x和y线性相关,5次试验的观测数据如下:
x 100 120 140 160 180
y 45 54 62 75 92
那么变量y关于x的回归方程是________.
[答案] =0.575x-14.9
[解析] 由线性回归参数公式可求出b=0.575,a=-14.9,∴回归方程为=0.575x-14.9.
12.某校为了了解高三一次模拟考试数学质量检测的情况,随机抽取了100名学生的成绩,具体情况如下表:
分数段 (0,80) [80,100) [100,120) [120,150]
频数 15 50 25 10
平均成绩 60 92 110 130
则本次检测中所抽取样本的平均成绩为________.
[答案] 95.5分
[解析] 样本的平均成绩为×(60×15+50×92+25×110+10×130)=95.5(分),
∴平均成绩为95.5分.
三、解答题
13.2008年一项关于16艘轮船的研究中,船的吨位区间从192吨到3246吨,船员的数目从5人到32人.通过对船员人数关于船的吨位的回归分析得到如下结果:船员人数=9.5+0.0062×吨位.
(1)假定两艘轮船吨位相差1000吨,船员平均人数相差多少?
(2)对于最小的船估计的船员数是多少?对于最大的船估计的船员数是多少?
[解析] (1)船员平均人数相差0.0062×1000=6.2(人)
(2)当取最小吨位192时,预计船员数为
9.5+0.0062×192=10.7≈11(人).
当取最大吨位3246吨时,预计船员数为
9.5+0.0062×3246=29.6≈30(人).
14.假设学生在初中和高一数学成绩是线性相关的.若10个学生初中(x)和高一(y)数学成绩如下:
x 74 71 72 68 76 73 67 70 65 74
y 76 75 71 70 76 79 65 77 62 72
试求初中和高一数学成绩间的回归方程.
[解析] 因为=71,=50520,
=72.3,iyi=51467,所以
b=≈1.2182,
a=72.3-1.2182×71=-14.192.故所求回归直线方程为=1.2182x-14.192.
15.某厂某产品的产量x(单位:千件)与单位成本y(单位:万元/千件)的对应数据如下:
x 29 28 28.5 29.5 30 31 30 28
y 500 510 504 494 493 485 492 498
(1)对于变量y与x作出散点图;
(2)若y与x具有线性相关关系,求回归直线方程;
(3)预测产量x=25千件时的单位成本.
[解析] (1)散点图略.
(2)=29.375,=497
=6909,=1976494,iyi=116744,
∴b===-8,
a=497-(-8)×29.375=732,
∴=-8x+732.
(3)当x=25时,=-8×25+732=532万元/千件.
16.某服装店月销售额(单位:万元)如下:
月份 1 2 3 4 5 6 7 8 9 10 11 12
销售额 583 1016 378 438 484 512 470 465 459 517 461 508
(1)试估计该商品月销售额的平均数和标准差s.
(2)有几个月的销售额在(-s,+s)范围内?
[解析] 标准差反映了样本数据距离样本平均数的平均距离,体现了样本数据的波动范围.
(1)=524.25,s=155.70.
(2)落入(-s,+s)即(368.55,679.95)内的数据有11个.
17.某个体服装店经营某种服装在某周内获纯利y(元)与该周每天销售这种服装件数x之间有如下一组数据:
x 3 4 5 6 7 8 9
y 66 69 73 81 89 90 91
已知=280,=45309,iyi=3487.
(1)求,;
(2)求纯利y与每天销售件数x的回归直线方程;
(3)估计每天销售10件这种服装时,纯利润是多少元?
[解析] (1)=(3+4+5+6+7+8+9)=6,
=(66+69+73+81+89+90+91)=79.86.
(2)设回归直线方程为=bx+a,则
b==≈4.75.
a=-b =79.86-4.75×6≈51.36.
∴所求回归直线方程为=4.75x+51.36.
(3)当x=10时,=98.86,估计每天销售这种服装10件可获纯利润98.86元.2.1.3
一、选择题
1.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户.为了调查社会购买力的某项指标,要从中抽取1个容量为100户的样本,记作①;某学校高一年级有12名女排运动员,要从中选出3名调查学习负担情况,记作②.那么完成上述两项调查应采用的抽样方法是( )
A.①用简单随机抽样法;②用系统抽样法
B.①用分层抽样法;②用简单随机抽样法
C.①用系统抽样法;②用分层抽样法
D.①用分层抽样法;②用系统抽样法
[答案] B
[解析] 对于①,总体由高收入家庭、中等收入家庭和低收入家庭差异明显的3部分组成,而所调查的指标与收入情况密切相关,所以应采用分层抽样法.
对于②,总体中的个体数较少,而且所调查内容对12名调查对象是“平等”的,所以适宜采用简单随机抽样法.
2.简单随机抽样、系统抽样和分层抽样之间的共同点是( )
A.都是从总体中逐个抽取
B.将总体分成几部分,按事先确定的规则在各部分抽取
C.抽样过程中每个个体被抽到的机会是相等的
D.将总体分成几层,然后各层按照比例抽取
[答案] C
[解析] 由三种抽样方法的定义可知,在抽样过程中,每个个体被抽到的机会相等,∴选C.
3.(08·重庆文)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )
A.简单随机抽样法 B.抽签法
C.随机数表法 D.分层抽样法
[答案] D
4.一个年级有12个班,每个班同学从1~50排学号,为了交流学习经验,要求每班学号为14的同学参加交流活动,这里运用的是什么抽样方法( )
A.分层抽样 B.抽签法
C.随机数表法 D.系统抽样
[答案] D
[解析] 实际上是把总体分成12个部分,从每个部分都抽取学号为14的学生.这正是系统抽样的方法.
5.某工厂生产A、B、C三种不同型号的产品,产品的数量之比依次为3?4?7.现在用分层抽样的方法抽出容量为n的样本,样本中A号产品有15件,那么样本容量n为( )
A.50 B.60
C.70 D.80
[答案] C
[解析] 由分层抽样定义知,
=,∴n=70,故选C.
6.(09·陕西文)某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工的身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( )
A.9 B.18
C.7 D.36
[答案] B
[解析] 由题意知青、中、老职工的人数分别为160、180、90,
∴三者比为16:18:9,
∵样本中青年职工32人,
∴老年职工人数为18,故选B.
7.2002年某市共有30万公务员参加计算机等级考试,为了分析考试情况,评卷人员对其中1000名公务员的成绩进行分析,下列说法中正确的是( )
A.30万公务员是总体
B.每名参加考试的公务员的考试成绩是个体
C.1000名公务员是总体的一个样本
D.1000名公务员是样本的容量
[答案] B
[解析] 30万公务员的计算机考试成绩是总体,30万是总体容量,其中每名参加考试的公务员的考试成绩是个体,1000名公务员的成绩是样本,1000是样本容量,∴选B.
8.在某班元旦晚会上,现场的一个游戏要求从观众中选出5人参与,下列抽样方法最合适的是( )
A.分层抽样 B.系统抽样
C.随机数表法 D.抽签法
[答案] D
[解析] 元旦晚会上的游戏,该班任何一个人参与都可以,故不需要分层抽样,人数不太多不需要系统抽样,故用简单随机抽样即可,这种情形下,用抽签法更合适.
9.采用分层抽样的方法抽取一个容量为45的样本,高一年级被抽取20人,高三年级被抽取10人,高二年级共有300人,则这个学校共有高中学生____人.( )
A.1350 B.675
C.900 D.450
[答案] C
[解析] 高二年级被抽取的人数为45-20-10=15,则每层的抽样比为15?300=1?20,所以学生总数为45÷=900,即这个学校共有高中学生900人.
10.某单位有老年人28人,中年人54人,青年人81人.为了调查它们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是( )
A.简单随机抽样
B.系统抽样
C.分层抽样
D.先从老年人中剔除1人,再用分层抽样
[答案] D
[解析] 总体总人数为28+54+81=163(人).样本容量为36,由于总体由差异明显的三部分组成,考虑用分层抽样.若按36?163取样本,无法得到整解.故考虑先剔除1人,抽取比例变为36?162=2?9.则中年人取54×=12(人),青年人取81×=18(人),先从老年人中剔除1人,老年人取27×=6(人),组成容量为36的样本.
二、填空题
11.某地区有农民、工人、知识分子家庭共计2004户,其中农民家庭1 600户,工人家庭303户.现要从中抽出容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法中的________.(将你认为正确的选项的序号都填上)
①简单随机抽样 ②系统抽样 ③分层抽样
[答案] ①②③
[解析] 为了保证抽样的合理性,应对农民、工人、知识分子分层抽样;在各层中采用系统抽样和简单随机抽样.抽样时还要先用简单随机抽样剔除多余个体.
12.(08·天津文)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工________人.
[答案] 10
13.(09·广东文)某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.
[答案] 37,20
[解析] 由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第8组抽出的号码为22+(8-5)×5=37.
40岁以下年龄段的职工数为200×0.5=100,则应抽取的人数为×100=20人.
14.(08·湖南文)从某地区15000位老人中随机抽取500人,其生活能否自理的情况如下表所示.
男 女
能 178 278
不能 23 21
则该地区生活不能自理的老人中男性比女性约多________人.
[答案] 60
[解析] 男性比女性多×(23-21)=60(人).
三、解答题
15.某班有40名男生,25名女生,已知男、女身高有明显不同,现欲调查平均身高.准备抽取.采用分层抽样方法,抽取男生1人,女生1人,你认为这种做法妥当否?如果让你来调查,你准备怎样做?
[解析] 由于取样比例数过小,仅抽取2人,很难准确反映总体情况,况且男、女生差异较大,抽取人数相同,也不尽合理,故此法不妥当.抽取人数太多,失去了抽样调查的统计意义,取样太少,不能准确反映真实情况,考虑到本题应采用分层抽样及男、女生各自的人数,故按5?1抽取更妥贴,即男生抽取8人,女生抽取5人,各自用抽签法或随机数法抽取组成样本.
16.某校在校高中学生有1600人,其中高一学生520人,高二学生500人,高三学生580人.如果想通过抽查其中的80人来调查学生的消费情况,考虑到学生的年级高低消费情况有明显差别,而同一年级内消费情况差异较小,问应当采用何种抽样方法?高三学生中应抽查多少人?
[分析] 各部分之间有明显差别是分层抽样的依据.至于各层内用什么方法抽样,是灵活自主的,可系统抽样,也可简单随机抽样.本题只问采用何种抽样方法,而不必答出如何抽样的过程.
[解析] 因为不同年级的学生消费情况有明显的差别,所以应采用分层抽样.由于520∶
500∶580=26∶25∶29,于是将80分成26∶25∶29的三部分,该三部分各抽个体数分别为26x,25x,29x,则26x+25x+29x=80,解得x=1.故高三年级中应抽取29人.
17.一批产品中,有一级品100个,二级品60个,三级品40个,分别用系统抽样法和分层抽样法,从这批产品中抽取一个容量为20的样本.
[解析] (1)系统抽样方法:将200件产品编号为1~200,然后将编号分成20个部分,在第1部分中用简单随机抽样法抽取一件产品.如抽到5号,那么得到的20个编号为5号,15号,25号,…,195号的样本.
(2)分层抽样方法:
因为100+60+40=200,=,
所以100×=10,60×=6,40×=4.
因此在一级品、二级品和三级品中分别抽取10件,6件和4件,即得到所需样本.
18.对某单位1000名职工进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:
任职年限 人数
5年以下 300
5~10年 500
10年以上 200
请根据上述资料,设计一个样本容量为总体容量的的抽样方案.
[解析] 在这个问题中,总体是某单位的1000名职工,并且已经知道人数的分布情况,可以用分层抽样法抽取样本.
把总体分三层,任职5年以下抽取个体数=30,任职5~10年的抽取个体数=50,任职10年以上的抽取个体数200×=20,用系统抽样方法或简单随机抽样方法在各层中抽取以上数目的样本.第二章
章末归纳总结
一、选择题
1.已知样本:10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,12.那么频率为0.2的范围是( )
A.5.5~7.5 B.7.5~9.5
C.9.5~11.5 D.11.5~13.5
[答案] D
[解析] 频率分布表如下:
分组 频数 频率
5.5~7.5 2 0.1
7.5~9.5 6 0.3
9.5~11.5 8 0.4
11.5~13.5 4 0.2
合计 20 1
从表中可以知道频率为0.2的范围是11.5~13.5.
2.某市A、B、C三个区共有高中学生20000人,其中A区高中学生7000人,现采用分层抽样的方法从这三个区所有高中学生中抽取一个容量为600人的样本进行学习兴趣调查,则A区应抽取( )
A.200人 B.205人
C.210人 D.215人
[答案] C
[解析] 根据分层抽样的特点,A区应抽取的人数为
×600=210人.
3.下表是x与y之间的一组数据,则y关于x的线性回归方程=x+必过( )
x 0 1 2 3
y 1 3 5 7
A.点(2,2) B.点(1.5,2)
C.点(1,2) D.点(1.5,4)
[答案] D
[解析] 回归直线必过样本点的中心(,),
∵=1.5,=4,∴选D.
二、填空题
4.如图,从2009年参加奥运知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图所示.观察图形,估计这次奥运知识竞赛的及格率(大于或等于60分为及格)为________.
[答案] 0.75
[解析] 及格率为1-(0.01+0.015)×10=0.75.
5.若a1,a2,…,a100这100个数据的平均数为,方差为0.202,则a1,a2,…,a100,这101个数据的方差为________.
[答案] 0.2
[解析] [(a1-)2+(a2-)2+…+(a100-)2]=0.202,
∴(a1-)2+(a2-)2+…+(a100-)2=20.2.
且a1+a2+…+a100=100,
∴==,
即a1,a2,…,a100,这101个数据的平均数也是.
∴这101个数据的方差s2=[20.2+(-)2]
=0.2.
6.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2?3?5.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号产品有16件.那么此样本的容量n=________.
[答案] 80
[解析] 根据分层抽样比可知=,
∴n=80.
三、解答题
7.下面是水稻产量与施化肥量的一组观测数据:
施化肥量 15 20 25 30 35 40 45
水稻产量 320 330 360 410 460 470 480
(1)将上述数据制成散点图;
(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?
[解析] (1)散点图如下:
(2)从图中可以发现数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.
8.2008年的汶川大地震震撼了大家的心灵.在地震后大家发现,学习了防震知识且训练有素的学校的师生在地震中伤亡很小;相反的,没有这方面准备的学校损失惨重.为了让大家了解更多的防震避灾的知识,某校举行了一次“防震知识竞赛”,共有800名学生参加了这次竞赛.为了了解本次竞赛成绩的情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.但是操作人员不小心将频率分布表局部污损,根据这个污损的表格解答下列问题:
分组 频数 频率
60.5~70.5 0.16
70.5~80.5 10
80.5~90.5 18 0.36
90.5~100.5
合计 50
(1)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,…,799,试写出第二组第一位学生的编号;
(2)填充频率分布表的空格(将答案直接填在表格内),并作出频率分布直方图;
(3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人?
[解析] (1)总共有800名学生,抽取50个样本,共需分50组,每组16人,故第一组的第一个编号为000,第二组第一个的编号为016.
(2)根据表中的频率和频数列表如下:
分组 频数 频率
60.5~70.5 8 0.16
70.5~80.5 10 0.20
80.5~90.5 18 0.36
90.5~100.5 14 0.28
合计 50 1
频率分布直方图:
(3)在被抽到的学生中获二等奖的人数约为9+7=16人,占样本的比例是=0.32,即获二等奖的概率约为32%,所以获二等奖的人数估计为800×32%=256人.
答:获二等奖的学生大约有256人.