2.1.1 简单随机抽样
课时过关·能力提升
1为了测量一批零件的长度,抽测了其中200个零件的长度.在这个问题中,200是( )
A.总体
B.个体
C.总体的一个样本
D.样本容量
答案D
2在简单随机抽样中,某一个个体被抽中的可能性( )
A.与第几次抽样有关,第一次被抽中的可能性大些
B.与第几次抽样无关,每次被抽中的可能性相等
C.与第几次抽样有关,最后一次被抽中的可能性较大
D.与第几次抽样无关,每次都是等可能的抽取,但各次被抽中的可能性不一样
答案B
3用随机数表法进行抽样有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定开始的数字.这些步骤的先后顺序应为( )
A.①②③ B.③②① C.①③② D.③①②
解析随机数表法的步骤可以分为编号、定起点、取号、取样,故本题的顺序应该是①③②.
答案C
4在下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂各取一箱产品,在两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
答案B
5假设要考察某企业生产的袋装牛奶的质量是否达标,现从500袋牛奶中抽取6袋进行检验,利用随机数表法抽取样本时,先将500袋牛奶按000,001,…,499进行编号,使用下面随机数表中各个5位数组的后3位,选定第7行第5组数开始,取出047作为抽取的代号,继续向右读,随后检验的5袋牛奶的号码是(下面摘取了某随机数表第7行至第9行)( )
84421 75331 57245 50688 77047 44767 21763
35025 83921 20676 63016 47859 16955 56719
98105 07185 12867 35807 44395 23879 33211
A.245,331,421,025,016
B.025,016,105,185,395
C.395,016,245,331,185
D.447,176,335,025,212
答案B
6从全年级20个班中任取4个班,再从每班任取20人,考察他们的学习成绩,在这次调查中,样本为 ,样本容量为 .?
解析本题是从全年级所有同学中,一共抽取了80人,考察他们的学习成绩,故样本为80人的学习成绩,样本容量为80.
答案80人的学习成绩 80
7将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查,使用的是 .?
解析抽签法分为编号、制签、取样三步,这里用了学生的学号作为编号,后面的抽取过程符合抽签法的实施步骤,所以采用的是抽签法.
答案抽签法
8用简单随机抽样的方法从含n个个体的总体中,逐个抽取一个容量为3的样本,对其中个体a在第一次就被抽到的概率
解析简单随机抽样时第一次抽样可以理解为从n个个体中抽取一个个体,则每个个体被抽到的概率,n=8;整个抽样过程中每个个体被抽到的概率
答案8
9上海某中学从40名学生中选1人作为上海男篮啦啦队的成员,采用了下面两种选法:
选法一:将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;
选法二:将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为啦啦队成员.
试问:这两种选法是否都是抽签法?为什么?这两种选法有何异同?
解选法一满足抽签法的特征,是抽签法,选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中39个白球无法相互区分.这两种选法相同之处在于每名学生被选中的可能性都相等,均
10高一(3)班有学生60人,为了了解学生对目前高考制度的看法,现要从中抽取一个容量为10的样本,问此样本若采用简单随机抽样,将如何获得?试设计抽样方案.
解常用的简单随机抽样方法有抽签法和随机数表法.注意到该问题中总体的个体数不多,所以采用抽签法或随机数表法都能获取样本,从而有以下两种方法:
(方法一)①将这60名学生按学号编号,分别为1,2,…,60;
②将这60个号码分别写在60张形状、大小相同的纸片上;
③将这60张相同纸片揉成团,放到一个盒子里搅拌均匀;
④抽出一张,记下上面的号码,然后再搅拌均匀,接着抽取第2张,记下号码.重复这个过程直到取到10个号码为止.
这样,与这10个号码对应的10名学生就构成了一个样本.
(方法二)采用课本P51表2-1随机数表
①将60名学生编号,可以编为00,01,02,…,59;
②选定随机数表中的起始数,取数据的后两位,如指定从随机数表中的第2行第2组数12开始;
③从选定的起始数12开始向右读下去,下一个是95,由于95>59,跳过去,继续,得到16,05,40,31,28,下一个是95,由于95>59,跳过去,再下一个是99,由于99>59,再跳过去,继续读,得到下一个20,……如此下去,又得到13,01,59,至此10个样本号码已经取满.
于是所要抽取的样本号码是12,16,05,40,31,28,20,13,01,59,这样,与这10个号码对应的10名学生就构成了一个样本.
★11要在80名女性老人中抽取10名,在600名男性老人中抽取30名进行健康调查.请你选用适当的简单随机抽样的方法完成,并写出抽样过程.
解(1)用抽签法在女性老人中抽取10名,首先把80名老人的姓名编号为1~80,再在80张小纸片上分别写上1,2,3,…,80作为号签(纸片大小、形状相同),然后把纸片放入不透明的箱子里,搅拌均匀,最后从箱子里一次取出1张,共取10次,由纸片上的号码找到要抽取的女性老人.
(2)用随机数表法抽取30名男性老人.
①把600名老人编号分别为000,001,002,…,599.
②在随机数表中任选一个数字作为起始数.例如选第5行第7列的数字“3”(课本P87的随机数表)作为开始.
③在随机数表中向右读,每次取一个三位数字,第一个数为318,依次为351,546,…,对不在000~599间的数跳过,重复的数跳过,最后取够30个数为止.
④由选出的号码对应老人编号即可找到要抽取的30位男性老人.
2.1.2 系统抽样
课时过关·能力提升
1学校在检查学生作业时,抽出每班学号尾数为5的学生作业进行检查,这里运用的是( )
A.分层抽样 B.抽签法
C.随机数表法 D.系统抽样
答案D
2为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况.如果用系统抽样法,那么抽样间隔和随机剔除的个体数分别为( )
A.3,2 B.2,3 C.2,30 D.30,2
解析92-2=90,90÷30=3,因此应剔除2个个体,抽样间隔为3.
答案A
3某中学从已编号(1~60)的60个班级中,随机抽取6个班级进行卫生检查,用每部分选取的号码间隔一样的系统抽样方法确定所选的6个班级的编号可能是( )
A.6,16,26,36,46,56
B.3,10,17,24,31,38
C.4,11,18,25,32,39
D.5,14,23,32,41,50
解析选取的号码间隔一样的系统抽样方法,需把总体分为6段,即1~10,11~20,21~30,31~40,41~50,51~60,题目各选项中既符合间隔为10又符合每一段取一个号的只有A.
答案A
4用系统抽样的方法从个体数为1 003的总体中抽取一个容量为50的样本,在整个抽样过程中每个个体被抽到的可能性为( )
A
C
答案C
5某厂共有64名员工,准备选择4人参加技术评估,现将这64名员工编号,准备运用系统抽样的方法抽取,已知8号,24号,56号在样本中,那么样本中还有一个员工的编号是( )
A.35 B.40
C.45 D.50
解析抽样的间距:8,8+16=24,24+16=40,40+16=56.
答案B
6将参加夏令营的600名学生编号为:001,002,…,600,采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003,这600名学生分住在三个营区,从001到300住第一营区,从301到495住第二营区,从496到600住第三营区,这三个营区被抽中的人数依次为( )
A.26,16,8
B.25,17,8
C.25,16,9
D.24,17,9
解析由系统抽样的特点,从号码003开始每1个,设抽取的第n个号码为an,则an=12n-9(n=1,2,…),由an≤300,得n≤25;由an≤495,得n≤42,42-25=17,50-42=8.故第一营区抽25人,第二营区抽17人,第三营区抽8人.
答案B
7中央电视台“动画城”节目为了对本周的热心小观众给予奖励,要从已确定编号的10 000名小观众中抽出10名幸运小观众.现采用系统抽样的方法抽取,其组容量为 .?
答案1 000
8要从容量为5 003的总体中抽取50个个体作为样本,按系统抽样方法,应从总体中随机剔除几个个体,再将总体分成 个部分,每部分都有 个个体.?
解析5 003-3=5 000,5 000÷50=100,因此应从总体中随机剔除3个个体,再将总体分成50个部分,每部分有100个个体.
答案50 100
9一个总体中共有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样的方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是 .?
解析根据题意可知第7组中的号码是[60,69]内的正整数.
∵m=6,k=7,m+k=13,所抽取的号码的个位数字为3,∴此号码为63.
答案63
10某批产品共有1 564件,产品按出厂顺序编号,号码从1到1564,检测员要从中抽取15件产品作检测,请给出一个系统抽样方案.
解(1)先从1 564件产品中,随机抽取4件产品,将其剔除.
(2)将余下的1 560件产品编号:1,2,3,…,1560.
(3)取k15组,每组含104个个体.
(4)从第一组即1号到104号中随机抽取一个号s.
(5)按编号把s,104+s,208+s,…,1456+s,共15个号选出,这15个号所对应的产品组成一个样本.
★11某单位有技术工人18人,技术员12人,行政人员6人,若从中抽取一个容量为n的样本,用系统抽样时不需要剔除个体;若样本容量为n+1,则需要从总体中剔除1个个体,求n的值.
解因为18,12,6的最大公约数为6,所以n可取2或3或6.总体容量为18+12+6=36.因为样本容量为n+1时,在系统抽样中,需要从总体中剔除1个个体,所以若n=2,则n+1=3,36能被3整除,用系统抽样不用剔除1个个体,故n≠2;若n=3,则n+1=4,36能被4整除,用系统抽样不用剔除1个个体,故n≠3;若n=6,则n+1=7,36不能被7整除,故用系统抽样时,必须先剔除1个个体.综上所述,n=6.
2.1.3 分层抽样
2.1.4 数据的收集
课时过关·能力提升
1某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是 ( )
A.抽签法
B.随机数表法
C.系统抽样法
D.分层抽样法
解析看男、女学生在学习兴趣与业余爱好中是否存在明显差异,宜采用分层抽样.
答案D
2某商场有四类食品,其中粮食类、植物油类、肉食类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( )
A.4 B.5 C.6 D.7
解析设抽取植物油与果蔬类的食品种数分别为x,y,则由分层抽样的性质
故x=2,y=4,即x+y=6.
答案C
3某单位共有老年、中年、青年职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为 ( )
A.9 B.18 C.27 D.36
解析设该单位老年职工有x人,则160+3x=430,解得x=90,即老年职工有90人, ?y=18.
答案B
4某初级中学有学生270人,其中七年级108人,八、九年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案.使用简单随机抽样和分层抽样时,将学生按七、八、九年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
关于上述样本的下列结论中,正确的是( )
A.②③都不可能为系统抽样
B.②④都不可能为分层抽样
C.①④都可能为系统抽样
D.①③都可能为分层抽样
解析对于情况①,可能是系统抽样,也可能是分层抽样(七年级1~108号中抽4人,八年级109~189号中抽3人,九年级190~270号中抽3人);
对于情况②,可能是分层抽样;
对于情况③,可能是系统抽样,也可能是分层抽样;
对于情况④,因为七年级1~108号中只抽3人,不是分层抽样;1~27号中没有抽人,故不是系统抽样.
答案D
5某校对全校男女学生共1 600名进行健康调查,选用分层抽样法抽取一个容量为200的样本.已知女生比男生少抽了10人,则该校的女生人数应是 .?
解析由已知得男生抽了105人,女生抽了95人,设女生人数为x,则x=760.
答案760
6某国有企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为 .?
解析利用分层抽样可知从3个分厂抽出的100件电子产品中,每个厂中的产品件数比也为1∶2∶1,故分别有25件,50件,25件.再由三个厂算出的平均值可得100件产品的总的平均寿命为
013(h).
答案1 013 h
7一批产品中,有一级品100个,二级品60个,三级品40个,分别用系统抽样和分层抽样的方法,从这批产品中抽取一个容量为20的样本,写出抽样过程.
解系统抽样方法:
将200件产品用随机方式编号,并分成20个组,每组10个产品,用抽签的方法从第一组中抽取一个产品,再依次加抽样间距,这样就得到容量为20的一个样本.
分层抽样方法:
∵一、二、三级品的个数比为5∶3∶2,5+3+2=10,
∴需要从一级品中抽),二级品中抽),三级品中抽).
将一级品的100个产品按00,01,…,99编号,将二级品的60个产品按00,01,…,59编号;将三级品的40个产品按00,01,…,39编号,采用随机数表法,分别从中抽取10个、6个、4个,这样就得到一个容量为20的样本.
8某学校高一年级有x名学生,高二年级有300名学生,高三年级有y名学生,采用分层抽样的方法抽取一个容量为45的样本,高一年级被抽取20人,高三年级被抽取10人,问:这个学校共有高中学生多少人?高一、高三年级各有多少人?
解由条件知,高二年级被抽取45-20-10=15(人),设这个学校共有高中学生N人,高一年级有x人,高三年级有y人,则300N=900.
因x=400,y=200.
故全校共有高中学生900人,高一年级有400人,高三年级有200人.
9某电视台在互联网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000,其中持各种态度的人数如下表所示.
很喜爱
喜爱
一般
不喜爱
2 435
4 567
3 926
1 072
电视台为了进一步了解观众的具体想法和意见,打算从中再抽取60人进行更为详细的调查,应怎样进行抽样?
解可用分层抽样法,样本容量与总体容量的比
“很喜爱”的有2 435人,应抽取2 435≈12(人);
“喜爱”的有4 567人,应抽取4 567≈23(人);
“一般”的有3 926人,应抽取3 926≈20(人);
“不喜爱”的有1 072人,应抽取1 072≈5(人).
因此,采取分层抽样法在“很喜爱”“喜爱”“一般”和“不喜爱”的人中分别抽取12人、23人、20人和5人.
★10某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表:
部门
人数
年龄段
管理
技术开发
营销
生产
总计
老年
40
40
40
80
200
中年
80
120
160
240
600
青年
40
160
280
720
1 200
总 计
160
320
480
1 040
2 000
(1)若要抽取40人调查身体情况,则应该怎样抽样?
(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?
解(1)因为身体状况主要与年龄有关,所以应按老年、中年、青年分层进行抽样,要抽取40人,根据老年、中年、青年职工人数比为1∶3∶6,可以在老年、中年、青年职工中分别抽取4人、12人、24人.
(2)因为出席这样的座谈会的人员应该代表各个部门,所以可用按部门分层抽样的方法进行抽样.要抽取25人,根据各部门职工人数比为2∶4∶6∶13可以在管理、技术开发、营销、生产各部门的职工中分别随机抽取2人、4人、6人、13人.
2.2.1 用样本的频率分布估计总体的分布
课时过关·能力提升
1在画频率分布直方图时,样本数据落在某组的频数为10,样本容量为50,总体容量为600,则样本数据落在该组的频率是( )
A
C
解析该组的频率应
答案A
2一组数据的茎叶图如图所示,则其极差为( )
A.8 B.9
C.33 D.312
解析由茎叶图可知极差为41-8=33.
答案C
3为了了解某学校高中男生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图(如图).根据此图,估计该校2 000名高中男生中体重大于或等于70.5 kg的人数为( )
A.300 B.360 C.420 D.450
解析题图中70.5 kg以上(含70.5)的人数的频率为(0.04+0.035+0.015)×2=0.18,则估计该校高中男生体重大于或等于70.5 kg的人数为2 000×0.18=360.
答案B
4某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[ 50,60),[60,70),[70,80),[80,90),[90,100](单位:分)加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )
A.588 B.480 C.450 D.120
解析由题中频率分布直方图知[40,60)分的频率为(0.005+0.015)×10=0.2,故估计不少于60分的学生人数为600×(1-0.2)=480.
答案B
5在一项农业试验中,A,B两种肥料分别被用于同类橘子树的生长.为了了解这两种肥料的效果,试验人员分别从施用这两种肥料的橘子树中随机抽取了12棵,用茎叶图给出了每一棵橘子树的产量(如图,单位:kg):
下列对茎叶图分析正确的是( )
A.施用肥料A的橘子树比施用肥料B的橘子树的平均产量高
B.施用肥料A的橘子树比施用肥料B的橘子树的平均产量低
C.施用肥料A的橘子树与施用肥料B的橘子树的产量相等
D.施用肥料A的橘子树与施用肥料B的橘子树的产量无法比较
解析从茎叶图中我们可以看出,施用肥料A的橘子树的产量分布主要在茎叶图的上方,而施用肥料B的橘子树的产量分布主要在茎叶图的中部,由此我们可以估计:施用肥料A的橘子树的产量的平均数比B的小.施用肥料A的橘子树的产量分布相对较散,而施用肥料B的橘子树的产量分布相对比较集中.
答案B
6根据《中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精含量在80 mg/100 mL以上(含80)时,属醉酒驾车.某地对涉嫌酒后驾车的28 800人进行血液检测,根据检测结果绘制的频率分布直方图如下.则这28 800人中属于醉酒驾车的人数约为( )
A.8 640 B.5 760 C.4 320 D.2 880
解析由题图可知,血液中酒精含量在80 mg/100 mL以上(含80)的频率为0.15,则人数为28 800×0.15=4 320.
答案C
7
某校开展“家乡最美”摄影比赛,9位评委对参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91.复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是( )
A.1 B.2 C.4 D.6
解析若x≤4,因为平均分为91,所以总分应为637,即637=89+89+92+93+92+91+(90+x),所以x=1.若x>4,637≠89+89+92+93+92+91+94=640,不合题意.
答案A
8抽查某种产品,抽查检验结果为一级品30件,二级品40件,三级品10件,则该产品中三级品的频数和频率分别为 , .?
答案10 0.125
9甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图(单位:分):
则甲、乙两班的最高成绩各是 ,从图中看, 班的平均成绩较高.?
答案96,92 乙
10从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a= .若要从身高在[120,130),[130,140),[140, 150]这三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为 .?
解析各矩形的面积和为(0.005+0.035+a+0.020+0.010)×10=1,解得a=0.030.则身高在[120,130),[130,140),[140,150]三组内的学生人数分别为30,20,10,可得这三组内的学生人数的比为3∶2∶1,因此从身高在[140,150]内的学生中选取的人数应为18
答案0.030 3
11中小学生的视力状况受到全社会的广泛关注.某市有关部门对全市4万名初中生的视力状况进行一次抽样调查,所得到的有关数据绘制成频率分布直方图如图所示.从左至右五个小组的频率之比依次是2∶4∶9∶7∶3,第五小组的频数是30.
(1)本次调查共抽取了多少名学生?
(2)如果视力在[4.85,5.45)属正常,那么全市初中生视力正常的约有多少人?
解(1)频率之比等于频数之比.
设第一小组的频数为2k,则其余各组的频数依次为4k,9k,7k,3k,
于是3k=30,解得k=10.
则2k=20,4k=40,9k=90,7k=70,
故本次调查的抽样总人数为20+40+90+70+30=250.
(2)因为视力在[4.85,5.45)范围内的有100人,所以频率40 000×0.4=16 000(人).
12在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,36,23,36,41,27,13,22,23,18,46,32,22.
(1)将这两组数据用茎叶图表示.
(2)将这两组数据进行比较分析,得到什么结论?
解(1)用茎叶图表示如下:
(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物需要通俗易懂.
★13有关部门从甲、乙两个城市所有的自动售货机中各随机抽取了16台,记录下某天上午8:00~11:00各自的销售情况(单位:元):
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
试用两种不同的方式分别表示上面的数据,并简要说明各自的优点.
分析从题目中的数据不易直接看出各自的分布情况,为此,我们将以上数据用条形统计图或茎叶图表示.
解(方法一)条形图如下图.
甲
乙
(方法二)茎叶图如下图.
从方法一可以看出,条形统计图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;从方法二可以看出,用茎叶图表示有关数据,不仅清晰明了地展示了数据的分布,便于比较,而且对数据的记录和表示都带来方便.
2.2.2 用样本的数字特征估计总体的数字特征
课时过关·能力提升
1样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为( )
A
C
解析由题意a=-1,则样本方差为s2D.
答案D
2
如图,茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )
A.2,5 B.5,5 C.5,8 D.8,8
解析由甲组数据中位数为15,可得x=5;而乙组数据的平均数16.8y=8.故选C.
答案C
3若甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和标准差见下表:
甲
乙
丙
丁
平均
8.5
8.8
8.8
8
标准差s
3.5
3.5
2.1
8.7
则参加奥运会的最佳人选应为( )
A.甲 B.乙 C.丙 D.丁
解析从平均数来看,乙、丙的平均值最大.从标准差来看,丙的标准差最小.因此,应选择丙参加比赛.
答案C
4若样本的频率分布直方图如图所示,则样本数据的中位数等于( )
A.30 B.40 C.36.5 D.35
解析设中位数为x,则由题图可知:
0.006×10+0.018×10+(x-30)×0.04=0.5,
解得x=36.5.
答案C
5一组数据的方差是s2,将这组数据中每一个数据都乘2,得到一组新数据的方差是( )
A
解析设一组数据x1,x2,…,xn,将每一个数都乘n后,则平均数变为原来的n倍,方差变为原来的n2倍.
答案C
6某班有48名学生,在一次考试中统计出平均分为70分,方差为75.后来发现有2名同学的分数登记错了,甲实得80分,却记成了50分,乙实得70分,却记成了100分,则更正后的平均分和方差分别是( )
A.70,75 B.70,50
C.75,1.04 D.65,2.35
解析更正后的平均分应为70,所以更正后的方差
答案B
7
某中学高二(9)班甲、乙两名同学自高中以来每次数学考试成绩如图,则甲、乙两名同学数学成绩的中位数分别是 、 .?
答案87 98
8一组数据x1,x2,…,xn的方差为9,则数据3x1,3x2,…,3xn的方差是 ,标准差是 .?
答案81 9
9甲、乙两种水稻试验品种连续4年的单位面积平均产量如下:
品种
第1年
第2年
第3年
第4年
甲
9.8
9.9
10.2
10.1
乙
9.7
10
10
10.3
其中产量比较稳定的水稻品种是 .?
解析甲种水稻单位面积平均产量的平均值为10,则方差10,则方差
∵0.025<0.045,∴甲种水稻产量比较稳定.
答案甲
10对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下表.
甲
27
38
30
37
35
31
乙
33
29
38
34
28
36
(1)画出茎叶图,由茎叶图你能获得哪些信息?
(2)分别求出甲、乙两名自行车赛手最大速度(单位:m/s)数据的平均数、中位数、极差、标准差,并判断选谁参加比赛更合适.
解(1)画出茎叶图如下:
从这个茎叶图上可以看出,甲、乙的得分分布情况都比较均匀;甲的中位数是33,乙的中位数是33.5,因此乙的总体得分情况比甲好.
(2)利用科学计算器≈3.96,s乙≈3.56;甲的中位数是33,极差是11,乙的中位数是33.5,极差是10.
综合比较以上数据可知,选乙参加比赛更合适.
11某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(均为整数)分成六组[40,50),[50,60),…,[90,100]后,画出如下部分频率分布直方图.观察图形的信息,回答下列问题:
(1)求第四小组的频率,并补全这个频率分布直方图;
(2)估计这次考试的及格率(60分及其以上为及格)和平均分.
解(1)因为各组的频率和等于1,所以第四组的频率为
1-(0.025+0.015×2+0.01+0.005)×10=0.3.
补全的频率分布直方图如下图所示.
(2)依题意,60分及其以上的分数在第三、四、五、六组,这四组频率之和为(0.015+0.03+0.025+0.005)×10=0.75.则抽样学生成绩的及格率是75%,利用组中值估计抽样学生的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).
因此,估计这次考试的平均分是71分.
★12为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100支日光灯在必须换掉前的使用天数如下表:
天 数
灯管数
151~180
1
181~210
11
211~240
18
241~270
20
271~300
25
301~330
16
331~360
7
361~390
2
(1)试估计这种日光灯的平均使用寿命;
(2)若定期更换,可选择多长时间统一更换合适?
(注:为了计算方便,天数取每个区间的中点)
解(1)各组的区间中点分别为165,195,225,255,285,315,345,375,由此可估计平均数为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).
(2)将各组的区间中点对比平均数求方差128.60,
则标准差≈46(天).
因此,估计这种日光灯的平均使用寿命为268天,标准差为46天,故可在222天到314天内统一更换较合适.
2.3 变量的相关性
课时过关·能力提升
1下列选项中的两个变量,具有相关关系的是( )
解析由题图易知,A,C描述的是两个变量之间的函数关系,B和D是散点图,其中B中的两个变量具有相关关系,且是线性相关关系,D中的散点图分布没有规律,两个变量不具有相关关系.
答案B
2在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为( )
A
C
解析样本中心点为(2.5,3.5),而回归直线必须经过样本中心点,只有A项符合.
答案A
3某地区调查了2~9岁的儿童的身高,由此建立的身高y(单位:cm)与年龄x(单位:岁)的回归模型为y=8.25x+60.13,下列叙述正确的是( )
A.该地区一个10岁儿童的身高为142.63 cm
B.该地区2~9岁的儿童每年身高约增加8.25 cm
C.该地区9岁儿童的平均身高是134.38 cm
D.利用这个模型可以准确地预算该地区每个2~9岁儿童的身高
解析由y=8.25x+60.13知斜率的估计值为8.25,说明每增加一个单位年龄,约增加8.25个单位身高,故选B.
答案B
4四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关,
②y与x负相关,
③y与x正相关,
④y与x正相关,
其中一定不正确的结论的序号是( )
A.①② B.②③ C.③④ D.①④
解析由正、负相关性的定义知①④一定不正确.故选D.
答案D
5某车间生产一种玩具,为了确定加工这种玩具所需要的时间,进行了10次试验,数据如下:
玩具个数
2
4
6
8
10
12
14
16
18
20
加工时间
4
7
12
15
21
25
27
31
37
41
如果回归直线方程的斜率
A
C
解析
答案B
6登山族为了了解某山高y(单位:km)与气温x(单位:℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:
气温x/℃
18
13
10
-1
山高y/km
24
34
38
64
由表中数据,得到回归直线方∈R),由此估计出山高为72 km处的气温为( )
A.-10 ℃ B.-8 ℃ C.-6 ℃ D.-4 ℃
解析由题意可
答案C
7下列关系是相关关系的是 .(填序号)?
①人的年龄与他拥有的财富之间的关系;
②曲线上的点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一种树木其横断面直径与高度之间的关系;
⑤学生与其学号之间的关系.
答案①③④
8调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程
解析由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254.
答案0.254万元
9在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下表:
温度x
0
10
20
50
70
溶解度y
66.7
76.0
85.0
112.3
128.0
则由此得到回归直线的斜率约为 .?
解析把表中的数据代入公≈0.88.
答案0.88
10假设关于某设备的使用年限x(单位:年)和所支出的维修费用y(单位:万元)有如下的统计数据:
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由数据知y与x之间有线性相关关系.根据最小二乘法求出的线性回归方程为y
解析线性回归直线方程必过样本中心(4,5)代入线性回归直线方程y
答案1. 23
11某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应关系:
x
2
4
5
6
8
y
30
40
60
50
70
(1)假定y与x之间有线性相关关系,求其回归直线方程;
(2)要使实际的销售额y不少于60百万元,则广告费支出x应不少于多少?
解(1)由题意可380,
故所求回归直线方程
(2)由回归直线方程≥60,
即6.5x+17.5≥60,故x≥
故广告费支出x应不少
★12在一段时间内,某种商品价格x(单位:万元)和需求量y(单位:t)之间有如下对应关系:
价格x/万元
1.4
1.6
1.8
2
2.2
需求量y/t
12
10
7
5
3
(1)画出散点图;
(2)求出y对x的回归直线方程,并在(1)的散点图中画出它的图象;
(3)如果价格定为1.9万元,预测需求量大约是多少?
解(1)散点图如图.
(2)采用列表的方法计
序号
x
y
x2
xy
1
1.4
12
1.96
16.8
2
1.6
10
2.56
16
3
1.8
7
3.24
12.6
4
2
5
4
10
5
2.2
3
4.84
6.6
合计
9
37
16.6
62
由表中数据可
回归直线如上图.
(3)当x=1.9时
故价格定为1.9万元时,需求量大约是6.25 t.
★13下表给出了不同类型的某种食品的数据,第一列数据表示此种食品所含热量的百分比,第二列数据表示由一些美食家以百分制给出的对此种食品口味的评分.
品牌
所含热量的百分比
评 分
A
25
89
B
34
89
C
20
80
D
19
78
E
26
75
F
20
71
G
19
65
H
24
62
I
19
60
J
13
52
(1)作出这些数据的散点图.
(2)求出回归直线方程.
(3)关于两个变量之间的关系,你能得出什么结论?
(4)对这种食品,为什么人们更喜欢吃位于回归直线上方的食品而不是下方的?
解(1)散点图如图.
(2085242,
≈1.565≈37.83.
所以回归直线方程
(3)由回归直线方程系数≈1.565,可得食品所含热量每增加1个百分点,评分约多1.565.
(4)因为回归直线上方的食品口味好,即对相同的热量来说,评分高,所以人们更喜欢吃位于回归直线上方的食品.
第二章统计
检测(A)
(时间:90分钟 满分:120分)
一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是( )
A.总体是240 B.个体是每一名学生
C.样本是40名学生 D.样本容量是40
解析总体是全校240名学生的身高,个体是每一名学生的身高,样本是40名学生的身高.
答案D
2一所学校高三年级共有学生200人,其中男生有120人,女生有80人.为了调查高三复习状况,用分层抽样的方法从全体高三学生中抽取一个容量为25的样本,应抽取女生的人数为( )
A.20 B.15
C.12 D.10
解析应抽取女生人数为80
答案D
3下列不具有相关关系的为( )
A.降水量与地下水位
B.人的年龄与血压
C.天气状况与股市涨跌
D.学习时间与成绩
答案C
4某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )
A.45 B.50 C.55 D.60
解析根据题中频率分布直方图,低于60分的人所占频率为(0.005+0.01)×20=0.3,故该班的学生人数B.
答案B
5一个容量为35的样本数据,分组后各组频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率约为( )
A.0.20 B.0.69 C.0.31 D.0.27
解析在区间[20,+∞)上样本的频数为5+4+2=11,
所以频率≈0.31.
答案C
6下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )
A.0.2 B.0.4
C.0.5 D.0.6
解析∵数据总个数n=10,
又落在区间[22,30)内的数据个数为4,
∴所求的频率
答案B
7如图所示的5组数据中,去掉 组数据后剩下的4组数据的线性相关较好.( )?
A.B B.C C.E D.D
解析一般地,设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在通过散点图中心的一条直线附近,我们称这两个变量之间具有线性相关关系,所以从图形直观可知去掉D点后更好.
答案D
8一次选拔运动员,测得7名运动员的身高(单位:cm)分布茎叶图如图,记录的平均身高为177 cm,有一名运动员的身高记录不清楚,其末位数记为x,那么x的值为( )
A.5 B.6 C.7 D.8
解析由题意可知,3+4-7-4+(x-7) +1+2=0,解得x=8.
答案D
9某商场在“五一”促销活动中,对5月1日9时至14时的销售额进行统计,其频率分布直方图如图.已知9时至10时的销售额为2.5万元,则11时至12时的销售额为( )
A.6万元 B.8万元 C.10万元 D.12万元
解析由题中频率分布直方图可知,全部销售额),而11时至12时的销售额占全部销售额25).
答案C
10若数据x1,x2,…,xn的平均数
A
B.
C.
D.
解析因为x1,x2,…,xn的平均数
所以3x1+5,3x2+5,…,3xn+5的平均数
而s'2+(3xn+5-+(xns'=3s.
答案C
二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中的横线上)
11某学院的A,B,C三个专业共有1 200名学生.为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业中应抽取 名学生.?
解析由题知C专业有学生1 200-380-420=400(名),那么C专业应抽取的学生数为120
答案40
12从一堆苹果中任取了20个,并得到它们的质量(单位:g)数据分布表如下:
分
组
[90,
100)
[100,
110)
[110,
120)
[120,
130)
[130,
140)
[140,
150)
频
数
1
2
3
10
1
则这堆苹果中,质量不小于120 g的苹果数约占苹果总数的 .?
解析由题表可知这堆苹果中,质量不小于120 g的苹果数为20-1-2-3=14,故质量不小于120 g的苹果数约占苹果总数
答案70%
13在总体中抽取了一个样本,为了便于统计,将样本中的每个数据除以100后进行分析,得出新样本方差为3,则估计总体的标准差为 .?
解析设这n个数据为x1,x2,…,xn,其平均数
3=
+(xn·3,∴s=10
答案10
14某个容量为100的样本的频率分布直方图如下,则在区间[4,5)上的数据的频数为 .?
解析由题意可知区间[4,5)上的数据频率为1-0.05-0.10-0.15-0.40=0.30,则所求的频数为0.30×100=30.
答案30
15某数学老师身高为176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 .?
解析由题意知父亲身高x cm与儿子身高y cm对应关系如下表:
x
173
170
176
y
170
176
182
因此,回归直线方程
故可估计孙子身高为182+3=185(cm).
答案185 cm
三、解答题(本大题共5小题,共45分.解答时应写出文字说明、证明过程或演算步骤)
16(8分)为了解某市800家企业的管理情况,拟抽取40家企业作为样本进行调查.这800家企业中有外资企业160家,私营企业320家,国有企业240家,其他性质企业80家,如何抽取较合理?
解采用分层抽样方法较合理.
抽样比
外资企业抽取160),私营企业抽取320),国有企业抽取240),其他性质企业抽取80).在每类企业中抽取时,可采用简单随机抽样.
17(8分)
某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.
(1)根据茎叶图计算样本平均数;
(2)日加工零件个数大于样本平均数的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?
解(1)样本平均数
(2)由(1)知样本中优秀工人占的比例12名工人中有12.
18(9分)某统计局就当地居民的月收入调查了10 000人,并根据所得数据画出样本的频率分布直方图如图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).
(1)求居民月收入在[3 000,3 500)的频率;
(2)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样方法抽出100人作进一步分析,则月收入在[2 500,3 000)的应抽取多少人?
解(1)月收入在[3 000,3 500)的频率为0.000 3×(3 500-3 000)=0.15.
(2)居民月收入在[2 500,3 000)的频率为0.000 5×500=0.25,因此,10 000人中用分层抽样方法抽出100人,月收入在[2 500,3 000)的应抽取100×0.25=25(人).
19(10分)对某班50名学生进行智力测验,其得分如下:
48,64,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,47,66,55,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,58.
(1)这次测试成绩的最大值和最小值各是多少?
(2)将[30,100)平分成7个小区间,试画出该班学生智力测验成绩的频率分布直方图.
(3)分析这个频率分布直方图,你能得出什么结论?
分析将[30,100)平分成7个小区间,直接就可列出频率分布表,进而画出频率分布直方图,最后由样本分布估计总体分布.
解(1)最小值是32,最大值是97.
(2)7个区间分别是[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100),每个小区间的长度是10,统计出各小区间内的数据频数,计算出频率,列表如下:
区间
[30,
40)
[40,
50)
[50,
60)
[60,
70)
[70,
80)
[80,
90)
[90,
100)
频数
1
6
12
14
9
6
2
频率
0.02
0.12
0.24
0.28
0.18
0.12
0.04
频率分布直方图如下图所示.
(3)可以看出,该班智力测验成绩大体上呈两头小、中间大、左右对称的钟形状态,说明该班学生智力特别好或特别差的是极少数,而智力一般的是多数,这是一种最常见的分布.
20 (10分)某种产品广告的支出x与销售收入y(单位:万元)之间有下列所示的对应数据.
广告支出x/万元
1
2
3
4
销售收入y/万元
12
28
42
56
(1)画出表中数据的散点图.
(2)求出y与x的回归直线方程.
(3)若广告费为9万元,则销售收入约为多少?
解(1)散点图如图所示.
(2)由散点图可知y与x之间具有线性相关关系.
由题意
x1y1+x2y2+x3y3+x4y4=418,
(3)将x=9代
第二章统计
检测(B)
(时间:90分钟 满分:120分)
一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1在240个零件中,一级品有48个,二级品有72个,三级品有120个,用分层抽样法从中抽取容量为40的样本,则每个个体被抽取的可能性大小是( )
A
解析N=240,n=40,则每个个体被抽取的可能性大小D.
答案D
2若①正相关,②负相关,③不相关,则下列散点图分别反映的变量间的相关关系是( )
A.①②③ B.②③① C.②①③ D.①③②
答案D
3若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数
A
B
C
D
解析+x8)=5,
+x8+5)=5.由方差定义及意义可知加新数据5后,样本数据取值的稳定性比原来强,∴s2<2,故选A.
答案A
4下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨)的几组对应数据:
x
3
4
5
6
y
2.5
t
4
4.5
根据上表的数据,求出y关于x的线性回归方程
A.3 B.3.15 C.3.5 D.4.5
解析由回归直线过样本中心求解.
∵样本中心
t=3.
答案A
5某班有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是 ( )
A.这种抽样方法是一种分层抽样
B.这种抽样方法是一种系统抽样
C.这五名男生成绩的方差大于这五名女生成绩的方差
D.该班男生成绩的平均数小于该班女生成绩的平均数
解析五名男生成绩的平均数
五名女生成绩的平均数
五名男生成绩的方差
=8,
五名女生成绩的方差
所C.
答案C
6对具有线性相关关系的变量x,y,有一组观测数据(xi,yi)(i=1,2,…,8),其回归直线方程
A
C
解析因a
答案B
7某容量为180的样本的频率分布直方图共有n(n>1)个小矩形,若第一个小矩形的面积等于其余(n-1)个小矩形的面积之和
A.20 B.25 C.30 D.35
解析设第一个小矩形的面积为x,则x+5x=1,得x180
答案C
8已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表的数据所得回归直线方程
A
C
解析
b'
答案C
9将某选手的9个得分去掉1个最高分,去掉1个最低分后,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,
在图中以x表示(如图),则7个剩余分数的方差为 ( )
A
解析∵模糊的数为x,则
90+x+87+94+91+90+90+91=91×7,
x=4,
∴7个数分别为90,90,91,91,94,94,87,
方差为s2=
答案B
10两个相关变量满足如下关系:
x
10
15
20
25
30
y
1 003
1 005
1 010
1 011
1 014
两变量的回归直线方程为( )
A
C
解析利用公
则回归直线方程
答案A
二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中的横线上)
11某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本.若用系统抽样方法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号),且第5组抽出的号码为22,则第9组抽出的号码应是 .若用分层抽样方法,则40岁以下年龄段应抽取 .?
解析由题意,知第5组抽出的号码为22,则第9组抽出的号码为22+5×(9-5)=42;若用分层抽样抽取,则40岁以下年龄段应抽).
答案42 20人
12将容量为n的样本数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n= .?
解析因为样本数据的频率之比等于频数之比,故可设第一组至第六组的样本数据的频数分别为2x,3x,4x,6x,4x,x,则2x+3x+4x=27,解得x=3,故n=20x=60.
答案60
13已知回归直线方
解析x每增长1个单位,y增长4.4个单位,故增长的速度之比约为1∶4.4=5∶22.
答案5∶22
14如图所示是某公司(共有员工300人)2015年员工年薪情况的频率分布直方图,由此可知,员工中年薪在1.4万元~1.6万元之间的共有 .?
解析由所给图形可知,员工中年薪在1.4万元~1.6万元之间的频率为1-(0.02+0.08+0.08+0.10+0.10)×2=0.24,则员工中年薪在1.4万元~1.6万元之间的共有300×0.24=72(人).
答案72人
15为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为 .?
解析设5个班级的人数分别为x1,x2,x3,x4,x5,
且样本数据互不相同,故最大的数比7大不能超过3,否则方差超过4,故最大值为10.
答案10
三、解答题(本大题共5小题,共45分.解答时应写出文字说明、证明过程或演算步骤)
16(8分)某单位在岗职工共624人,为了调查职工用于上班途中的时间,决定抽取10%的职工进行调查.如何采用系统抽样方法完成这一抽样?
解第一步,将624名职工用随机方式进行编号;
第二步,从总体中剔除4人(剔除方法可用随机数表法),将剩下的620名职工重新编号,分别为000,001,002,…,619,并平均分成62段;
第三步,在第1段000,001,002,…,009这10个编号中用简单随机抽样法确定起始号码i0;
第四步,将编号为i0,i0+10,i0+20,…,i0+610(0≤i0≤9)的个体抽出,组成样本.
17(8分)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:
(1)若甲校高三年级每位学生被抽取的可能性为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别
解(1)设甲校高三年级学生总人数为n.
由题意n=600.
样本中甲校高三年级学生数学成绩不及格人数为5.据此估计甲校高三年级此次联考数学成绩及格率为1
(2)设甲、乙两校样本平均数分别,
30
因0.5分.
18(9分)某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
解(1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,得x=0.007 5,
所以直方图中x的值是0.007 5.
(2)月平均用电量的众数
因为(0.002+0.009 5+0.011)×20=0.45<0.5,
所以月平均用电量的中位数在[220,240)内,设中位数为a,由(0.002+0.009 5+0.011)×20+0.012 5×(a-220)=0.5,得a=224,
所以月平均用电量的中位数是224.
(3)月平均用电量在[220,240)的用户有0.012 5×20×100=25(户),
月平均用电量在[240,260)的用户有0.007 5×20×100=15(户),
月平均用电量在[260,280)的用户有0.005×20×100=10(户),
月平均用电量在[280,300]的用户有0.002 5×20×100=5(户),抽取比例[220,240)的用户中应抽取25).
19(10分)为检查某工厂生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:h)如下:
248 256 232 243 188 268 278 266 289 312
274 296 288 302 295 228 287 217 329 283
(1)完成下面的频率分布表,并作出频率分布直方图;
(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280 h;
(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.
分 组
频 数
频 率
频率/组距
[180,200)
[200,220)
[220,240)
[240,260)
[260,280)
[280,300)
[300,320)
[320,340)
合 计
0.05
解(1)频率分布表及频率分布直方图如下所示:
分 组
频 数
频 率
频率/组距
[180,200)
1
0.05
0.002 5
[200,220)
1
0.05
0.002 5
[220,240)
2
0.10
0.005 0
[240,260)
3
0.15
0.007 5
[260,280)
4
0.20
0.010 0
[280,300)
6
0.30
0.015 0
[300,320)
2
0.10
0.005 0
[320,340)
1
0.05
0.002 5
合 计
20
1.00
0.05
(2)由题意可得8×(0.30+0.10+0.05)=3.6,则估计8万台电风扇中有3.6万台无故障连续使用时限不低于280 h.
(3)由频率分布直方图可知
269 h.
20(10分)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算
(1)求家庭的月储蓄y对月收入x的线性回归方程y
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
解(1)由题意知n=10
由此
(2)由于变量y的值随x的值增加而增加(因
(3)将x=7代入回归直线方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).