回扣验收特训(一) 统 计
1.某日用品按行业质量标准分成五个等级,等级系数X依次为1,2,3,4,5.现从一批该日用品中随机抽取20件,对其等级系数进行统计分析,得到频率分布表如下:
X
1
2
3
4
5
f
a
0.2
0.45
b
c
若所抽取的20件日用品,等级系数为4的恰有3件,等级系数为5的恰有2件,则a,b,c的值分别为( )
A.无法确定 B.0.2,0.75,0.05
C.0.1,0.15,0.1 D.0.2,0.15,0.1
解析:选C 由频率分布表得a+0.2+0.45+b+c=1,即a+b+c=0.35.因为抽取的20件日用品中,等级系数为4的恰有3件,等级系数为5的恰有2件,所以b==0.15,c==0.1,从而a=0.35-b-c=0.1.所以a=0.1,b=0.15,c=0.1.
2.已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数相同,则图中的m+n=( )
A.3 B.5
C.8 D.11
解析:选D 根据茎叶图,得乙的中位数是33,∴甲的中位数也是33,即m=3;甲的平均数甲=×(27+39+33)=33,乙的平均数是乙=×(20+n+32+34+38)=33,∴n=8,∴m+n=11.故选D.
3.对于下列表格所示的五个散点,已知求得的线性回归直线方程为y=0.8x-155.
x
196
197
200
203
204
y
1
3
6
7
m
则实数m的值为( )
A.8 B.8.2
C.8.4 D.8.5
解析:选A 因为回归直线过样本点的中心(,),
又 =×(196+197+200+203+204)=200,
=×(1+3+6+7+m)=,所以把(,)代入y=0.8x-155可得,=0.8×200-155,解得m=8.
4.某中学高中部有300名学生.为了研究学生的周平均学习时间,从中抽取了60名学生,先统计了他们某学期的周平均学习时间(单位:小时),再将学生的周平均学习时间分成5组:[40,50),[50,60),[60,70),[70,80),[80,90],并加以统计,得到如图所示的频率分布直方图.则高中部学生的周平均学习时间为(同一组中的数据用该组区间的中点值作代表)( )
A.63.5小时 B.62.5小时
C.63小时 D.60小时
解析:选A 在高中部抽取的60名学生中,周平均学习时间分别落在[40,50),[50,60),[60,70),[70,80),[80,90]的人数依次为6,15,24,12,3.
所以高中部学生的周平均学习时间为
(6×45+15×55+24×65+12×75+3×85)÷60=63.5(小时).故选A.
5.某学校随机抽查了本校20名同学平均每天在课外从事体育锻炼的时间(单位:分钟),根据所得数据的茎叶图,以5为组距将数据分为8组,分别是[0,5),[5,10),…,[35,40],作出频率分布直方图如图所示,则原始的茎叶图可能是( )
解析:选B 根据频率分布直方图,样本数据位于区间[15,20)内的有20×0.02×5=2个,位于区间[20,25)内的有20×0.04×5=4个,据此检验只可能是选项B.
6.气象意义上从春季进入夏季的标志为“连续5天的日平均温度均不低于22 ℃”.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数).
①甲地:5个数据的中位数为24,众数为22;
②乙地:5个数据的中位数为27,总体平均数为24;
③丙地:5个数据中有一个数据是32,总体平均数为26,总体方差为10.8.
则肯定进入夏季的地区有( )
A.0个 B.1个
C.2个 D.3个
解析:选C 甲地肯定进入,因为众数为22,所以22至少出现两次,若有一天低于22 ℃,则中位数不可能为24;丙地肯定进入,令x为其中某天的日平均温度,则10.8×5-(32-26)2=18≥(x-26)2,若x≤21,上式显然不成立;乙地不一定进入,如13,23,27,28,29.故选C.
7.为了解某市甲、乙、丙三所学校高三数学模拟考试成绩,采取分层抽样方法,从甲校的1 260份试卷、乙校的720份试卷、丙校的900份试卷中进行抽样调研.若从丙校的900份试卷中抽取了45份试卷,则这次调研共抽查的试卷份数为________.
解析:抽取比例为,故抽取的试卷份数为(1 260+720+900)×=144.
答案:144
8.一组数据中的每一个数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是________,________.
解析:由题意得原来数据的平均数是80+1.2=81.2,方差不变,仍是4.4.
答案:81.2 4.4
9.利用随机数表法对一个容量为500,编号为000,001,002,…,499的产品进行抽样检验,抽取一个容量为10的样本,选取方法是从随机数表第12行第5列、第6列、第7列数字开始由左到右依次选取三个数字(下面摘取了随机数表中的第11行至第12行),根据下表,读出的第3个数是________.
18 18 07 92 45 44 17 16 58 09 79 83 86 19 62 06 76 50 03 10 55 23 64 05 05
26 62 38 97 75 84 16 07 44 99 83 11 46 32 24 20 14 85 88 45 10 93 72 88 71
解析:最先读到的数据的编号是389,向右读下一个数是775,775大于499,故舍去,再下一个数是841,舍去,再下一个数是607,舍去,再下一个数是449,再下一个数是983,舍去,再下一个数是114.故读出的第3个数是114.
答案:114
10.为了了解小学生的体能情况,抽取某校一个年级的部分学生进行一分钟跳绳次数的测试,将数据整理后,画出频率分布直方图(如图所示).已知图中从左到右前三个小组的频率分别为0.1,0.3,0.4,且第一小组的频数为5.
(1)求第四小组的频率;
(2)求参加这次测试的学生的人数;
(3)若一分钟跳绳次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率.
解:(1)第四小组的频率为1-0.1-0.3-0.4=0.2.
(2)设参加这次测试的学生有x人,则0.1x=5,∴x=50,故参加这次测试的学生有50人.
(3)由题意,样本的达标率约为0.3+0.4+0.2=0.9,∴该年级学生跳绳测试的达标率约为90%.
11.甲、乙两位同学进行投篮比赛,每人玩5局,每局在指定线外投篮,若第一次不进,再投第二次,依此类推,但最多只能投6次.当投进时,该局结束,并记下投篮的次数.当6次投不进,该局也结束,记为“×”.第一次投进得6分,第二次投进得5分,第三次投进得4分,依此类推,第6次投不进,得0分.两人的投篮情况如下:
第1局
第2局
第3局
第4局
第5局
甲
5次
×
4次
5次
1次
乙
×
2次
4次
2次
×
请通过计算,判断哪位同学投篮的水平高.
解:依题意,甲、乙的得分情况如下表:
第1局
第2局
第3局
第4局
第5局
甲
2
0
3
2
6
乙
0
5
3
5
0
甲=×(2+0+3+2+6)=2.6,
s甲=
≈1.96,
乙=×(0+5+3+5+0)=2.6,
s乙=
≈2.24,
因为甲得分的平均数为2.6,乙得分的平均数为2.6,
甲得分的标准差约为1.96,乙得分的标准差约为2.24,
所以甲得分的平均数与乙得分的平均数相等.
甲得分的标准差小于乙得分的标准差.
故甲投篮的水平高.
12.某零售店近5个月的销售额和利润额资料如下表:
商店名称
A
B
C
D
E
销售额x/千万元
3
5
6
7
9
利润额y/百万元
2
3
3
4
5
(1)画出散点图,观察散点图,说明两个变量有怎样的相关关系.
(2)用最小二乘法计算利润额y关于销售额x的回归直线方程.
(3)当销售额为4千万元时,利用(2)的结论估计该零售店的利润额(百万元).
解:(1)散点图如图所示,两个变量有线性相关关系.
(2)设回归直线方程是y=bx+a,
由题中的数据可知=6,=3.4.
所以b==
==0.5.
a=-b=3.4-0.5×6=0.4.
所以利润额y关于销售额x的回归直线方程为y=0.5x+0.4.
(3)由(2)知,当x=4时,y=0.5×4+0.4=2.4,所以当销售额为4千万元时,可以估计该商场的利润额为2.4百万元.
阶段质量检测(一) 统 计
(时间120分钟 满分150分)
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.某班的60名同学已编号1,2,3,…,60,为了解该班同学的作业情况,老师收取了号码能被5整除的12名同学的作业本,这里运用的抽样方法是( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.抽签法
答案:B
2.某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家.为了掌握各商店的营业情况,要从中抽取一个容量为20的样本.若采用分层抽样的方法,抽取的中型商店数是( )
A.2 B.3
C.5 D.13
解析:选C 所抽取的中型商店数是20×=5.
3.某学校为调查学生的学习情况,对学生的课堂笔记进行了抽样调查,已知某班级一共有56名学生,随机编号,用系统抽样的方法抽取一个容量为4的样本,已知07号、21号、49号在样本中,那么样本中还有一个学生的号码应是( )
A.14 B.28
C.35 D.42
解析:选C 由系统抽样的原理知抽样的间隔为=14,故第一组的号码应为01~14,所以选取的号码中07应为第一组内选取的样本号码,所以第二组抽取的样本号码应为07+14=21;
第三组抽取的样本号码应为07+2×14=35;
第四组抽取的样本号码应为07+3×14=49.
故另一个学生的号码为35.
4.一组样本数据,容量为150,按从小到大的顺序分成5个组,其频数如下表:
组号
1
2
3
4
5
频数
28
32
28
32
x
那么,第5组的频率为( )
A.120 B.30
C.0.8 D.0.2
解析:选D 易知x=30,故第5组的频率为=0.2.
5.图中的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )
A.2,5 B.5,5
C.5,8 D.8,8
解析:选C 由甲组数据的中位数是15,可得x=5,由乙组数据的平均数为16.8,得y=8.
6.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据
月份x
1
2
3
4
用水量y
4.5
4
3
2.5
用水量y与月份x之间具有线性相关关系,其线性回归方程为y=-0.7x+a,则a的值为( )
A.5.25 B.5
C.2.5 D.3.5
解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a=5.25.
7.为了调查某社区的居民周末娱乐活动,对该社区2 500位居民进行分层抽样调查,若抽取的样本容量为50,相应的条形统计图如图所示.则可估计该社区中上网的居民人数为( )
A.450 B.500
C.900 D.1 200
解析:选C 由图形得,上网的居民的抽样比为=.设该社区中上网的居民人数为x,则=,解得x=900,故选C.
8.设有两组数据x1,x2,…,xn与y1,y2,…,yn,它们的平均数分别是和,则新的一组数据2x1-3y1+1,2x2-3y2+1,…,2xn-3yn+1的平均数是( )
A.2-3 B.2-3+1
C.4-9 D.4-9+1
解析:选B 设zi=2xi-3yi+1(i=1,2,…,n),
则=(z1+z2+…+zn)=(x1+x2+…+xn)-(y1+y2+…+yn)+=2-3+1.
9.某工厂对一批产品进行了抽样检测,如图是根据抽样检测后的产品净重(单位:g)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100 g的个数是36,则样本中净重大于或等于98 g并且小于104 g的产品的个数是( )
A.90个 B.75个
C.60个 D.45个
解析:选A 净重小于100 g的频率是(0.050+0.100)×2=0.3,故这批产品的个数x满足=0.3,即x=120,净重大于或等于98 g且小于104 g的频率是(0.100+0.150+0.125)×2=0.75,故所求产品的个数是120×0.75=90(个).
10.有甲、乙两种水稻,测得每种水稻各10株的分叉数后,计算出样本方差分别为s=11,s=3.4,由此可以估计( )
A.甲种水稻比乙种水稻分叉整齐
B.甲、乙两种水稻分叉整齐程度相同
C.乙种水稻比甲种水稻分叉整齐
D.甲、乙两种水稻分叉整齐程度不能比较
解析:选C 由于方差反映了样本数据的稳定性,且s>s,所以乙种水稻比甲种水稻分叉整齐.
11.某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )
A.这种抽样方法是一种分层抽样
B.这种抽样方法是一种系统抽样
C.这五名男生成绩的方差大于这五名女生成绩的方差
D.该班男生成绩的平均数小于该班女生成绩的平均数
解析:选C 若抽样方法是分层抽样,男生、女生应分别抽取6人、4人,所以A错;由题目看不出是系统抽样,所以B错;这五名男生成绩的平均数1==90,这五名女生成绩的平均数2==91,故这五名男生成绩的方差为[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8,这五名女生成绩的方差为[(88-91)2×2+(93-91)2×3]=6,所以这五名男生成绩的方差大于这五名女生成绩的方差,但该班男生成绩的平均数不一定小于女生成绩的平均数,所以D错.
12.某校有高中生1 470人,现采用系统抽样法抽取49人作问卷调查,将高一、高二、高三学生(高一、高二、高三分别有学生495人、493人、482人)按1,2,3…,1 470编号,若第一组用简单随机抽样的方法抽取的号码为23,则所抽样本中高二学生的人数为( )
A.15 B.16
C.17 D.18
解析:选C 由系统抽样法知,按编号依次每30个编号作为一组,共分为49组,高二学生的编号为496到988,在第17组到第33组内,第17组抽取的编号为16×30+23=503,为高二学生,第33组抽取的编号为32×30+23=983,为高二学生,故所抽样本中高二学生的人数为33-17+1=17,故选C.
二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上)
13.某制药厂月生产A,B,C三种药品共4 000件,为了保证产品质量,省质监局抽样检验,根据分层抽样的结果,省质监局的统计员制作了如下的统计表格:
产品类型
A
B
C
产品数量(件)
1 600
样本容量(件)
160
由于不小心,表格中A,C产品有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多20,根据以上信息,可得C产品的样本容量是________.
解析:因为=,所以样本的总容量是400,设C产品样本容量是x,根据A产品的样本容量比C产品的样本容量多20,则A产品的样本容量是x+20,由x+x+20=240,得x=110.
答案:110
14.如图是根据某中学为地震灾区自愿捐款的情况而制作的统计图,已知该校在校学生3 000人,请根据统计图计算该校共捐款________元.
解析:由扇形统计图可知,该中学高一、高二、高三分别有960人、990人、1 050人,由条形统计图知,该中学高一、高二、高三人均捐款分别为15元、13元、10元,所以共捐款15×960+13×990+10×1 050=14 400+12 870+10 500=37 770(元).
答案:37 770
15.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.
(1)直方图中x的值为________;
(2)在这些用户中,用电量落在区间[100,250)内的户数为________.
解析:(1)根据频率和为1,得(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4.
(2)(0.003 6+0.006 0+0.004 4)×50×100=70.
答案:(1)0.004 4 (2)70
16.某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样的方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为________h.
解析:根据分层抽样知识可知,从3个分厂抽出的100件电子产品中,每个分厂抽取的个数之比也应为1∶2∶1,故从第一、二、三分厂抽取的电子产品的数量分别为25,50,25,则抽取的100件产品的使用寿命的平均值为×(980×25+1 020×50+1 032×25)=1 013 (h).
答案:1 013
三、解答题(本大题共6小题,共70分.解答时应写出必要的文字说明、证明过程或演算步骤)
17.(本小题满分10分)小明家2015年的四个季度的用电量如下表:
季度
用电量(单位:千瓦时)
第一季度
250
第二季度
150
第三季度
400
第四季度
200
其中各种电器用电量如下表:
电器类型
用电量(单位:千瓦时)
空调
250
冰箱
400
照明
100
彩电
150
其他
100
根据如图所示三幅统计图回答:
(1)从哪幅统计图可看出各个季度用电量变化情况?
(2)从哪幅统计图可看出冰箱用电量超过总用电量的?
(3)从哪幅统计图可以清楚地看出空调用电量?
解:三幅统计图分别为折线统计图、扇形统计图和条形统计图,各自的优点如下:
条形
统计图
当数据量很大时,能够直观地反映数据分布的大致情况,并且能清晰地反映各个部分的具体数目
折线
统计图
可以表示数量的多少,直观地反映数量的增减情况,即变化趋势
扇形
统计图
能直观显示总体中各部分的分布情况
综上可得:(1)折线统计图;(2)扇形统计图;(3)条形统计图.
18.(本小题满分12分)从全校参加期末考试的试卷中抽取一个样本,考察成绩(均为整数)的分布,将样本分成5组,绘成频率分布直方图,如下图中从左到右各小组的小矩形的高之比为2∶3∶6∶4∶1,最左边的一组频数是6.
(1)求样本容量;
(2)求105.5~120.5这一组的频数及频率;
(3)如果成绩大于120分为优秀,估计这次考试成绩的优秀率.
解:在直方图中频数之比等于频率之比且样本的所有频率之和等于1.
(1)小矩形的高之比为频率之比,
∴从左到右的频率之比为2∶3∶6∶4∶1.
∴最左的一组所占的频率为=.
∴样本容量===48.
(2)105.5~120.5这一组的频率为=,
∴频数为48×=18.
(3)成绩大于120分所占的比为=,
∴考试成绩的优秀率为=31.25%.
19.(本小题满分12分)某地区农科所为了选择更适应本地区种植的棉花品种,在该地区选择了5块土地,每块土地平均分成面积相等的两部分,分别种植甲、乙两个品种的棉花,收获时测得棉花的亩产量如图所示(单位:kg).
(1)若甲品种的棉花的平均亩产量为103.6 kg,乙品种的棉花的亩产量的中位数是105 kg,求x,y;
(2)若x=5,y=3,则甲、乙两品种棉花哪种亩产量更稳定,并说明理由.
解:(1)由甲品种的棉花的平均亩产量为103.6 kg可知,×(95+102+100+x+107+111)=103.6,解得x=3.由乙品种棉花的亩产量的中位数是105可知,y=5.
(2)当x=5,y=3时,由茎叶图可知甲品种棉花的平均亩产量为甲=×(95+102+105+107+111)=104,方差为s=×[(95-104)2+(102-104)2+(105-104)2+(107-104)2+(111-104)2]=28.8.
乙品种棉花的平均亩产量为乙=×(98+103+103+106+110)=104,方差为s=[(98-104)2+(103-104)2+(103-104)2+(106-104)2+(110-104)2]=15.6.
因为甲=乙,s>s,所以乙品种棉花的平均亩产量更稳定.
20.(本小题满分12分)2016年春节前,公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让过往返乡过年的摩托车驾驶人有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:
(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?
(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?
解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.
(2)从题图中可知,被询问了省籍的驾驶人员中广西籍的有5+20+25+20+30=100(人);
四川籍的有15+10+5+5+5=40(人).
设四川籍的驾驶人员应抽取x人,依题意得=,解得x=2,即四川籍的应抽取2人.
21.(本小题满分12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能使每瓶的含量都不是标准的含量,我们随机抽出了20瓶,测得它们的含量(单位:百毫升)如下:
12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1
12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1
11.4 11.6 11.2 12.2
(1)根据数据列出频率分布表,画出频率分布直方图;
(2)计算出这组数据的平均数和标准差(结果精确到0.01);
(3)结合(1)、(2)的结果,根据实际意义写一个简短的报告(对总体情况作出估计).
解:(1)频率分布表如下:
分组
频数
频率
[11.0,11.5)
3
0.15
[11.5,12.0)
4
0.20
[12.0,12.5)
11
0.55
[12.5,13.0]
2
0.10
频率分布直方图如图所示.
(2)平均数=×(12.1+11.9+12.2+…+12.2)≈12.02.
标准差s≈
≈0.41.
(3)标准差相对于平均数来说比较小.从频率分布直方图中可以看出,每瓶的含量大致位于1 150毫升到1 250毫升之间.因此判断装瓶机工作稳定.
22.(本小题满分12分)下表数据是退火温度x(℃)对黄铜延长性y(%)效应的试验结果,y是以延长度计算的,且对于给定的x,y为正态变量,其方差与x无关.
x(℃)
300
400
500
600
700
800
y(%)
40
50
55
60
67
70
(1)画出散点图;
(2)指出x,y是否线性相关;
(3)若线性相关,求y对x的线性回归方程;
(4)估计退火温度是1 000 ℃时, 黄铜延长性的情况.
解:(1)散点图如下:
(2)由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.
(3)列出下表并用科学计算器进行有关计算.
i
1
2
3
4
5
6
xi
300
400
500
600
700
800
yi
40
50
55
60
67
70
xiyi
12 000
20 000
27 500
36 000
46 900
56 000
x
90 000
160 000
250 000
360 000
490 000
640 000
=550;=57;
=1 990 000;iyi=198 400
于是可得
b==≈0.058 86,
a=-b =57-0.058 86×550≈24.627.
因此所求的线性回归方程为:y=0.058 86x+24.627.
(4)将x=1 000代入线性回归方程得
y=0.058 86×1 000+24.627=83.487,即退火温度是1 000 ℃时,黄铜延长性大约是83.487%.