2.1.1 简单随机抽样
课后篇巩固探究
1.为了了解某次数学竞赛中1 000名学生的成绩,从中抽取一个容量为100的样本,则每名学生成绩入样的机会是( )
A. B. C. D.
解析:每名学生成绩被抽到的机会相等,都是.随机抽样是等可能抽样.
答案:A
2.若对某校1 200名学生的耐力进行调查,抽取其中120名学生,测试他们1 500 m跑步的成绩,得出相应的数值,在这项调查中,样本是指( )
A.120名学生 B.1 200名学生
C.120名学生的成绩 D.1 200名学生的成绩
解析:研究对象是某校1 200名学生的耐力,在这个过程中,1 200名学生的成绩是总体,样本是这120名学生的成绩,故选C.
答案:C
3.用随机数表法进行抽样有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定开始的数字.这些步骤的先后顺序应为( )
A.①②③ B.③②①
C.①③② D.③①②
解析:随机数表法的步骤可以分为编号、定起点、取号、取样,所以本题的顺序应该是①③②.
答案:C
4.下列抽取样本的方式属于简单随机抽样的是( )
①从无限多个个体中抽取100个个体作样本
②盒子里有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里
③从8台电脑中不放回地随机抽取2台进行质量检验(假设8台电脑已编好号,对编号随机抽取)
A.① B.②
C.③ D.以上都不对
解析:①不符合简单随机抽样中个体数是有限的特点;②是有放回的抽样,而简单随机抽样是无放回的;③符合简单随机抽样的特点,所以是简单随机抽样.
答案:C
5.某种球的总数量为M,其中带有标记的有N个,现用简单随机抽样的方法从中抽出一个容量为m的样本,则抽取的m个个体中带有标记的个数估计为( )
A.N· B.m·
C.N· D.N
解析:根据样本中带标记所占比例与总体中带标记的比例近似相等.设m个个体中带标记的为x个,则有 x=.
答案:A
6.导学号17504019假设要考察某企业生产的袋装牛奶的质量是否达标,现从500袋牛奶中抽取6袋进行检验,利用随机数表法抽取样本时,先将500袋牛奶按000,001,…,499进行编号,使用下面随机数表中各个5位数组的后3位,选定第7行第5组数开始,取出047作为抽取的代号,继续向右读,随后检验的5袋牛奶的号码是(下面摘取了某随机数表第7行至第9行)( )
84421 75331 57245 50688 77047 44767 21763
35025 83921 20676 63016 47859 16955 56719
98105 07185 12867 35807 44395 23879 33211
A.245,331,421,025,016 B.025,016,105,185,395
C.395,016,245,331,185 D.447,176,335,025,212
答案:B
7.采用简单随机抽样从含10个个体的总体中抽取一个容量为4的样本,若个体a前两次未被抽到,则第三次被抽到的概率为 .
解析:第三次被抽到与第一次被抽到的概率相等.
答案:
8.将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查,使用的是 法.
解析:抽签法分为编号、制签、取样三步,这里用了学生的学号作为编号,后面的抽取过程符合抽签法的实施步骤,所以采用的是抽签法.
答案:抽签
9.某住宅小区有居民2万户,从中随机抽取200户,调查是否已安装光纤宽带,调查结果如下表所示:
光纤宽带 动迁户 原住户
已安装 65 30
未安装 40 65
则该小区已安装光纤宽带的住户估计有 户.
解析:由表知安装光纤宽带的住户所占的比例为,则该小区已安装光纤宽带的住户估计有20 000×=9 500(户).
答案:9 500
10.导学号17504020为了了解高一(10)班53名同学的牙齿健康状况,需从中抽取10名同学做医学检验,现已对53名同学编号为00,01,02,…,50,51,52.从下面所给的随机数表的第1行第3列的5开始从左向右读下去,则选取的号码依次为多少
随机数表如下:
0154 3287 6595 4287 5346
7953 2586 5741 3369 8324
4597 7386 5244 3578 6241
解:从数5开始从左向右读下去,两位两位地读,把在00~52范围内且前面没出现过的数记下,否则跳过,直到取满10人为止.如下表:
01 54 32 87 65 95 42 87 53 46
79 53 25 86 57 41 33 69 83 24
45 97 73 86 52 44 35 78 62 41
选取的号码依次为32,42,46,25,41,33,24,45,52,44.
11.导学号17504021高一(3)班有学生60人,为了了解学生对目前高考制度的看法,现要从中抽取一个容量为10的样本,问此样本若采用简单随机抽样,将如何获得 试设计抽样方案.
解:简单随机抽样方法有抽签法和随机数表法.注意到该问题中总体的个体数不多,所以采用抽签法或随机数表法都能获取样本,从而有以下两种解法:
(方法一)(抽签法):
①将这60名学生按学号编号,分别为1,2,…,60;
②将这60个号码分别写在60张相同纸片上;
③将这60张相同纸片揉成团,放到一个不透明的盒子里搅拌均匀;
④抽出一张,记下上面的号码,然后再搅拌均匀,接着抽取第2张,记下号码.重复这个过程直到取到10个号码为止.
这样,与这10个号码对应的10名学生就构成了一个简单的随机样本.
(方法二)(随机数表法):采用课本P51表2-1随机数表
①将60名学生编号,可以编为00,01,02,…,59;
②选定随机数表中的起始数,取数据的后两位,如指定从随机数表中的第2行第2组数12开始;
③从选定的起始数12开始向右读下去,下一个是95,由于95>59,跳过去,继续,得到16,05,40,31,28,下一个是95,由于95>59,跳过去,再下一个是99,由于99>59,再跳过去,继续读,得到下一个20,……如此下去,又得到13,01,59,至此10个样本号码已经取满.
于是所要抽取的样本号码是12,16,05,40,31,28,20,13,01,59,这样,与这10个号码对应的10名学生就构成了一个简单的随机样本.2.1.2 系统抽样
课后篇巩固探究
A组
1.一个年级有12个班,每个班有50名学生,按1到50排学号,为了交流学习经验,要求每班学号为14的学生留下进行交流,这里运用的是( )
A.分层抽样 B.抽签法
C.随机数表法 D.系统抽样
解析:符合系统抽样的特点.故选D.
答案:D
2.为了了解1 200名学生对学校某项教学实验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为( )
A.40 B.30
C.20 D.12
解析:由k==40可知.
答案:A
3.下列抽样问题中,最适合用系统抽样法抽样的是( )
A.从全班48名学生中随机抽取8人参加一项活动
B.一个城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,要从中抽取一个容量为21的样本
C.从参加模拟考试的1 200名高中生中随机抽取100人分析试题作答情况
D.从参加模拟考试的1 200名高中生中随机抽取10人了解某些情况
解析:A中总体容量较小,样本容量也较小,可采用抽签法;B中总体中的个体有明显的差异,也不适宜采用系统抽样;D中总体容量较大,样本容量较小,可采用随机数表法.
答案:C
4.某中学从已编号(1~60)的60个班级中,随机抽取6个班级进行卫生检查,用每部分选取的号码间隔一样的系统抽样方法确定所选的6个班级的编号可能是( )
A.6,16,26,36,46,56
B.3,10,17,24,31,38
C.4,11,18,25,32,39
D.5,14,23,32,41,50
解析:选取的号码间隔一样的系统抽样方法,需把总体分为6段,即1~10,11~20,21~30,31~40,41~50,51~60,题目各选项中既符合间隔为10又符合每一段取一个号的只有A.
答案:A
5.(2017湖北部分重点中学高三联考)从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本编号从小到大依次为007,032,…,则样本中最大的编号应该为( )
A.483 B.482
C.481 D.480
解析:间隔为32-7=25,所以每组的容量为25,共有20组,所以样本中最大的编号应该为7+19×25=482.
答案:B
6.某少儿节目为了对本周的热心小观众给予奖励,要从已确定编号的10 000名小观众中抽出10名幸运小观众.现采用系统抽样的方法抽取,每组容量为 .
答案:1 000
7.编号1~15的小球共15个,求总体号码的平均值,试验者从中抽3个小球,以它们的平均数估计总体平均数,以编号2为起点,用系统抽样法抽3个小球,则这3个球的编号平均数是 .
解析:由系统抽样的定义知抽取的三个编号为2,7,12,
所以平均数为7.
答案:7
8.某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编为1~50号,并进行分组,第一组1~5号,第二组6~10号,…,第十组46~50号.若在第三组中抽得号码为12的学生,则在第九组中抽得号码为 的学生.
解析:在第九组中抽得号码为12+(9-3)×5=42.
答案:42
9.导学号17504022某工厂有1 001名工人,从中抽取10人参加体检,试写出系统抽样的具体实施步骤.
解:①将每名工人编一个号,由0001至1001;
②利用随机数表法找到一个号,将这一个号所对应的工人剔除;
③将剩余的1 000名工人重新编号0001至1000;
④分段,取间隔k==100,将总体均分为10组,每组含100名工人;
⑤从第一段即0001号到0100号中随机抽取一个号l;
⑥按编号将l,100+l,200+l,…,900+l共10个号选出.
这10个号所对应的工人即组成样本.
10.为了调查某路口一个月的车流量情况,交警采用系统抽样的方法,样本间距为7,从每周中随机抽取一天,他正好抽取的是星期日,经过调查后做出报告.你认为交警这样的抽样方法有什么问题 应当怎样改进 如果是调查一年的车流量情况呢
解:交警所统计的数据以及由此推断出来的结论,只能代表星期日的车流量情况.由于星期日是休息时间,很多人不上班,不具有代表性.改进的方法可以将所要调查的时间段的每一天先随机地编号,再用系统抽样方法来抽样.或者使用简单随机抽样来抽样亦可.如果是调查一年的交通流量,使用简单随机抽样法显然已不合适,比较简单可行的方法是把样本间距改为8.
B组
1.某厂共有64名员工,准备选择4人参加技术评估,现将这64名员工编号,准备运用系统抽样的方法抽取,已知8号、24号、56号在样本中,那么样本中还有一个员工的编号是( )
A.35 B.40
C.45 D.50
答案:B
2.某单位有840名职工,现采用系统抽样方法,抽取42人进行问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
A.11 B.12
C.13 D.14
解析:采用系统抽样方法,因为从840人中抽取42人,即每20人抽取1人,所以从编号1~480的人中,恰好抽取24人,接着从编号481~720共240人中抽取12人.故选B.
答案:B
3.系统抽样又称为等距抽样,从N个个体中抽取n个个体为样本,先确定抽样间隔,即抽样距k=(取整数部分),从第一段1,2,…,k个号码中随机抽取一个入样号码i0,则i0,i0+k,…,i0+(n-1)k号码均入样构成样本,所以每个个体的入样可能性是( )
A.相等的 B.不相等的
C.与i0有关 D.与编号有关
解析:由系统抽样的定义可知,每个个体入样的可能性相等,与抽样间隔无关,也与第一段入样号码无关,系统抽样所得样本的代表性与具体的编号有关,要求编号不能呈现个体特征随编号周期性变化,各个个体入样可能性与编号无关.
答案:A
4.一个总体中共有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样的方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是 .
解析:根据题意可知第7组中的号码是[60,69]内的正整数,∵m=6,k=7,m+k=13,所抽取的号码的个位数字为3,∴此号码为63.
答案:63
5.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为 .
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
解析:由题意知前5个个体的编号依次为08,02,14,07,01.
答案:01
6.已知标注1~20号的小球有20个,若我们的目的是估计总体号码的平均值,即20个小球号码的平均数.试验者从中抽取4个小球,以这4个小球号码的平均数估计总体号码的平均值,按下面方法抽样(按小号到大号排序):
(1)以编号2为起点,系统抽样抽取4个球,则这4个球的编号的平均值为 ;
(2)以编号3为起点,系统抽样抽取4个球,则这4个球的编号的平均值为 .
解析:20个小球分4组,每组5个,
(1)若以2号为起点,则另外3个球的编号依次为7,12,17,4个球编号平均值为=9.5.
(2)若以3号为起点,则另外3个球的编号依次为8,13,18,4个球编号平均值为=10.5.
答案:(1)9.5 (2)10.5
7.导学号17504023某校有500名高三应届毕业生,在一次模拟考试之后,学校为了了解数学复习中存在的问题,计划抽取一个容量为20的样本,详细进行试卷分析,问使用哪一种抽样方法为宜,并设计出具体操作步骤.
解:使用简单随机抽样、系统抽样,考虑到学生人数和随机数表的限制,可先用系统抽样方法.将500名学生按考试号码顺序分成5组,从每组100人中抽出4人.在第1组00~99号中,用随机数表(教材P87附录)法简单随机抽样.如随意取第6行第13列,对应号码为9,向后读数(两位一读)分别为94,17,49,27,这样在第1组的100名学生中取考号为94,17,49,27的4名(也可向前读,抽出97,59,12,31).其他各组仍可用随机数表法,按照后两位号码抽取.或依系统抽样,其他400名取号码为194,117,149,127,294,217,249,227,394,317,349,327,494,417,449,427的16名,这样连同94,17,49,27号的学生,便抽出了容量为20的样本.
8.导学号17504024某单位有技术工人18人,技术员12人,行政人员6人,若从中抽取一个容量为n的样本,在系统抽样时,不需要剔除个体,如果样本容量为n+1,则需要从总体中剔除1个个体,求n的值.
解:因为18,12,6的最大公约数为6,所以n可取2或3或6.总体容量为18+12+6=36.
因为当样本容量为n+1时,在系统抽样中,需要从总体中剔除1个个体,所以若n=2,则n+1=3,36能被3整除,用系统抽样不用剔除1个个体,故n≠2;若n=3,则n+1=4,36能被4整除,用系统抽样不用剔除1个个体,故n≠3;若n=6,则n+1=7,36不能被7整除,故用系统抽样时,必须先剔除1个个体.综上所述,n=6.2.1.3 分层抽样
2.1.4 数据的收集
课后篇巩固探究
A组
1.某城区有农民、工人、知识分子家庭共计2 007户,其中农民家庭1 600户,工人家庭304户.现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法中的( )
①简单随机抽样 ②系统抽样 ③分层抽样
A.②③ B.①③
C.③ D.①②③
解析:由于各家庭有明显差异,所以首先应用分层抽样的方法分别从三类家庭中抽出若干户,即32户、6户、2户.又由于农民家庭户数较多,宜采用系统抽样法;而工人、知识分子家庭户数较少,宜采用简单随机抽样法.故整个抽样过程要用到①②③三种抽样法.
答案:D
2.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( )
A.6 B.8
C.10 D.12
解析:设在高二年级的学生中抽取x人,
则有,解得x=8.
答案:B
3.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是( )
A.简单随机抽样
B.系统抽样
C.分层抽样
D.先从老年人中剔除1人,再用分层抽样
解析:总体人数为28+54+81=163.
样本容量为36,由于总体由差异明显的三部分组成,考虑用分层抽样.
若按36∶163取样,无法得到整数解,故考虑先剔除1人,抽取比例变为36∶162=2∶9,则中年人取54×=12(人),青年人取81×=18(人),先从老年人中剔除1人,老年人取27×=6(人),组成容量为36的样本.
答案:D
4.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( )
A.4 B.5 C.6 D.7
解析:设抽取植物油与果蔬类的食品数分别为x,y,则由分层抽样的性质可得,
解得x=2,y=4,x+y=6.
答案:C
5.某城市有大型、中型与小型超市共1 500个,它们的个数之比为1∶5∶9,为调查超市每日的零售额情况,需通过分层抽样抽取30个超市进行调查,那么抽取的小型超市个数为( )
A.5 B.9 C.18 D.20
解析:小型超市的总个数占超市总数的,则抽取的小型超市的个数占样本容量的,故抽取的小型超市的个数为30×=18.
答案:C
6.某学校共有师生2 400人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是 .
解析:设教师人数为x,则有,解得x=150.
答案:150
7.某企业三月中旬生产A,B,C三种产品共3 000件,根据分层抽样的结果,该企业统计员制作了如下的统计表:
由于疏忽,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10.根据以上信息,可得C产品有 件.
解析:设出变量,结合分层抽样的特点确定C产品的数量.
设C产品的数量为x,则A产品的数量为(1 700-x),C产品的样本容量为a,则A产品的样本容量为(10+a),由分层抽样的定义可知,解得x=800.
答案:800
8.经问卷调查,某班学生对摄影分别执“喜欢”“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的是5位“喜欢”摄影的同学、1位“不喜欢”摄影的同学和3位执“一般”态度的同学,那全班学生中“喜欢”摄影的比全班学生人数的一半还多 人.
解析:设班里“喜欢”的有y人,“一般”的有x人,“不喜欢”的有(x-12)人,则,解得x=18.
∵,∴y=30.
∴全班共30+18+6=54(人).
又30-=3,
∴“喜欢”的人比全班学生的一半还多3人.
答案:3
9.一批产品中,有一级品100个,二级品60个,三级品40个,分别用系统抽样和分层抽样的方法,从这批产品中抽取一个容量为20的样本,写出抽样过程,并说明采用哪种抽样方法更能反映总体水平.
解:系统抽样方法:
将200件产品用随机方式编号,并分成20个组,每组10个产品,用抽签的方法从第一组中抽取一个产品,再依次加抽样间距,这样就得到容量为20的一个样本.
分层抽样方法:
∵一、二、三级品的个数比为5∶3∶2,
∴需要从一级品中抽取×20=10(个),二级品中抽取×20=6(个),三级品中抽取×20=4(个).
将一级品的100个产品按00,01,…,99编号,将二级品的60个产品按00,01,…,59编号;将三级品的40个产品按00,01,…,39编号,采用随机数表法,分别从中抽取10个、6个、4个,这样就得到一个容量为20的样本.此题中采用分层抽样更好,样本更能反映总体的各类水平.
10.导学号17504025选择合适的抽样方法抽样,写出抽样过程.
(1)30个篮球,其中甲厂生产的有21个,乙厂生产的有9个.抽取10个入样.
(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个.抽取3个入样.
(3)有甲厂生产的300个篮球,抽取10个入样.
(4)有甲厂生产的300个篮球,抽取30个入样.
解:(1)总体由差异明显的几个层次组成,需选用分层抽样法.
S1:确定抽样个数30÷10=3,所以甲厂生产的应抽取21÷3=7(个),乙厂生产的应抽取9÷3=3(个);
S2:用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.
(2)总体容量小,用抽签法.
S1:将30个篮球编号,编号为1,2,…,30;
S2:将以上30个编号分别写在一张小纸条上,揉成小球,制成号签;
S3:把号签放入一个不透明的袋子中,充分搅匀;
S4:从袋子中逐个抽取3个号签,并记录上面的号码;
S5:找出和所得号码对应的篮球.
(3)总体容量较大,样本容量较小宜用随机数表法.
S1:将300个篮球用随机方式编号,编号为001,002,…,300;
S2:给出的随机数表(P87附录)中5个数一组,使用各个5位数的前3位,从各组中任选一个前3位小于或等于300的数作为起始号码向右读.例如从第6行第2组开始,取出的数是132.
S3:从数132开始向右读,凡不在001~300中的数跳过不读,遇到已经读过的数也跳过去,便依次得到262,259,269,215,206,190,138,193,212这9个号码,这就是要抽取的10个样本个体的号码.
(4)总体容量较大,样本容量也较大宜用系统抽样法.
S1:将300个篮球用随机方式编号,编号为1,2,3,…,300,并分成30段;
S2:在第一段1,2,3,…,10这10个编号中用简单随机抽样抽出一个(如2)作为起始号码;
S3:将编号为2,12,22,…,292的个体抽出,组成样本.
B组
1.某社区有600个家庭,其中高收入家庭120户,中等收入家庭420户,低收入家庭60户.为调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,记作①;某学校高中二年级有15名男篮球运动员,要从中选出3人调查学习负担情况,记作②.那么完成上述两项调查应采用的抽样方法是( )
A.①简单随机抽样 ②系统抽样
B.①分层抽样 ②简单随机抽样
C.①系统抽样 ②分层抽样
D.①分层抽样 ②系统抽样
答案:B
2.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( )
A.9 B.18 C.27 D.36
解析:设该单位老年职工有x人,则160+3x=430 x=90,即老年职工有90人,则 y=18.
答案:B
3.某单位有职工161人,其中业务员有104人,管理人员33人,后勤服务人员24人,现用分层抽样法从中抽取一个容量为20的样本,则抽取管理人员( )
A.3人 B.4人
C.5人 D.13人
解析:由于=8,故从管理人员中剔除1人,从而抽样比为,则抽取的管理人员为32×=4(人).
答案:B
4.某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为 h.
解析:利用分层抽样可知从3个分厂抽出的100个电子产品中,每个厂中的产品个数比也为1∶2∶1,故分别有25,50,25个.再由三个厂子算出的平均值可得100件产品的总的平均寿命为=1 013(h).
答案:1 013
5.导学号17504026(2017山东菏泽高三一模)我国全面实施“二孩”政策后,某中学的一个学生社团组织了一项关于生育二孩意愿的调查活动.已知该中学所在的城镇符合“二孩”政策的已婚女性中,30岁以下的约2 400人,30岁至40岁的约3 600人,40岁以上的约6 000人.为了解不同年龄层的女性对生育二孩的意愿是否存在显著差异,该社团用分层抽样的方法从中抽取一个容量为N的样本进行调查,已知从30岁至40岁的女性中抽取的人数为60,则N= .
解析:由题意可得,解得N=200.
答案:200
6.某班有42名男生,30名女生,已知男女身高各有明显不同,现欲调查平均身高,若采用分层抽样方法,抽取男生1人,女生1人,这种做法是否合适,若不合适,应怎样抽取
解:由于取样比例数过小,仅抽取2人,很难准确反映总体情况,又因为男、女生差异较大,抽取人数相同,也不尽合理,故此法不合适,抽取人数过多,失去了抽样调查的统计意义,取样太少,不能准确反映真实情况,考虑到本题应采用分层抽样及男、女生各自的人数,故按6∶1抽取更合适,即男生抽取7人,女生抽取5人,各自用抽签法或随机数表法抽取组成样本.
7.导学号17504027为了对某课题进行讨论研究,用分层抽样的方法从三所高校A,B,C的相关人员中,抽取若干人组成研究小组,有关数据见下表(单位:人):
高校 相关人数 抽取人数
A x 1
B 36 y
C 54 3
(1)求x,y;
(2)若从高校B相关人员中选2人作专题发言,应采用什么抽样法,请写出合理的抽样过程.
解:(1)分层抽样是按各层相关人数和抽取人数的比例进行的,所以有,解得x=18,,解得y=2,故x=18,y=2.
(2)总体容量和样本容量较小,所以应采用抽签法,过程如下:
第一步,将36人随机编号,号码为01,02,03,…,36;
第二步,将号码分别写在相同的纸片上,揉成团,制成号签;
第三步,将号签放入一个不透明的容器中,充分搅匀,依次抽取2个号码,并记录上面的编号;
第四步,把与号码相对应的人抽出,即可得到所要的样本.2.2.1 用样本的频率分布估计总体的分布
课后篇巩固探究
A组
1.从某批零件中随机抽出40个检查,发现合格产品有36个,则该批产品的合格率为( )
A.36% B.72% C.90% D.25%
解析:用样本的合格率近似代替总体的合格率为×100%=90%.考查用样本的合格率估计总体的合格率.
答案:C
2.如图表示甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是( )
A.56分 B.57分
C.58分 D.59分
答案:B
3.为了了解某次英语测试的成绩,我们抽取了三班学生的英语成绩进行分析,各数据段的分布如图(分数取整数),由此估计这次测验的优秀率(不小于80分)为( )
A.0.32 B.0.056 C.0.56 D.0.032
答案:C
4.依据相关法律可知,车辆驾驶员血液酒精浓度在80 mg/100 mL(含80)以上时,属醉酒驾车.某地对涉嫌酒后驾车的28 800人进行血液检测,根据检测结果绘制的频率分布直方图如图所示,则这28 800人中属于醉酒驾车的人数约为( )
A.8 640 B.5 760
C.4 320 D.2 880
解析:由图可知,血液中酒精浓度80 mg/100 mL以上的频率为0.15,则人数为28 800×0.15=4 320.
答案:C
5.(2017全国3,文3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
解析:由题图可知2014年8月到9月的月接待游客量在减少,故A错误.
答案:A
6.如图,在某路段检测点,对200辆汽车的车速进行检测,检测结果表示为如下频率分布直方图,则车速不小于90 km/h 的汽车约有 辆.
解析:频率=×组距=(0.02+0.01)×10=0.3,频数=频率×样本总数=200×0.3=60.
答案:60
7.甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示:则甲、乙两班的最高成绩各是 ,从图中看, 班的平均成绩较高.
答案:96,92 乙
8.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图所示).由图中数据可知a= .若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为 .
解析:由10×(0.005+0.035+a+0.020+0.010)=1,得a=0.03,从而这三组的频数之比为0.03∶0.02∶0.01=3∶2∶1,故从身高在[140,150]内的学生中选取的人数为18×=3.
答案:0.03 3
9.导学号17504028
为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:00间各自的车流量(单位:百辆),得如图所示的统计图,试求:
(1)甲、乙两个交通站的车流量的极差分别是多少
(2)甲交通站的车流量在[10,60]间的频率是多少
(3)甲、乙两个交通站哪个站更繁忙 并说明理由.
解:(1)甲交通站的车流量的极差为73-8=65(百辆),乙交通站的车流量的极差为71-5=66(百辆).
(2)甲交通站的车流量在[10,60]间的频率为.
(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方,从数据的分布情况来看,甲交通站更繁忙.
B组
1.某中学从某次考试成绩中抽取若干名学生的分数,并绘制成如图所示的频率分布直方图,样本数据分组为[50,60),[60,70),[70,80),[80,90),[90,100].若用分层抽样的方法从样本中抽取分数在[80,100]范围内的数据16个,则其中分数在[90,100]范围内的样本数据有( )
A.5个 B.6个
C.8个 D.10个
解析:分数段在[80,100]范围内占所有分数段的百分比为(0.025+0.015)×10=0.4,其中分数在[90,100]范围内的人数占所有分数段的百分比为0.015×10=0.15,因此分数在[90,100]范围内占分数在[80,100]范围内的百分比为,因此分数在[90,100]范围内的样本数据有16×=6,故选B.
答案:B
2.某校100名学生的数学测试成绩的频率分布直方图如图所示,分数不低于a即为优秀,若优秀的人数为20人,则a的估计值是( )
A.130 B.140 C.133 D.137
解析:由已知可以判断a∈(130,140),所以[(140-a)×0.015+0.01×10]×100=20,解得a≈133.
答案:C
3.图①是某市有关部门根据对当地干部的月收入情况调查后画出的样本频率分布直方图,已知图中从左向右第一组的频数为4 000.在样本中记月收入(单位:元)在[1 000,1 500),[1 500,2 000),[2 000,2 500),[2 500,3 000),[3 000,3 500),[3 500,4 000)的人数依次为A1,A2,…,A6.图②是统计月工资收入在一定范围内的人数的算法流程图,则样本的容量n= ,输出的S= .(用数字作答)
图①
图②
解析:∵月收入在[1 000,1 500)的频率为0.000 8×500=0.4,且有4 000人,∴样本的容量n==10 000.
由图②知输出的S=A2+A3+…+A6=10 000-4 000=6 000.
答案:10 000 6 000
4.导学号17504029某电子商务公司对10 000名网络购物者某年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a= ;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 .
解析:由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.
于是消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.
答案:(1)3 (2)6 000
5.导学号17504030有关部门从甲、乙两个城市所有的自动售货机中随机抽取了16台,记录下上午8:00~11:00之间各自的销售情况(单位:元):
甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;
乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.
试用两种不同的方式分别表示上面的数据,并简要说明各自的优点.
分析:从题目中的数据不易直接看出各自的分布情况,为此,我们将以上数据用条形统计图或茎叶图表示.
解:(方法一)条形图如下图.
甲
乙
(方法二)茎叶图如图,两竖线中间的数字表示甲、乙销售额的十位数,两边的数字分别表示甲、乙销售额的个位数.
从解法一可以看出,条形统计图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;从解法二可以看出,用茎叶图表示有关数据,对数据的记录和表示都带来方便.2.2.2 用样本的数字特征估计总体的数字特征
课后篇巩固探究
A组
1.能反映一组数据的离散程度的是( )
A.频数 B.平均数 C.标准差 D.极差
解析:本题考查数据的基本特征量以及它们的含义,因为标准差反映数据的波动大小及离散程度,所以应选C.
答案:C
2.如右的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )
A.2,5 B.5,5 C.5,8 D.8,8
解析:由甲组数据中位数为15,可得x=5;而乙组数据的平均数16.8=,可解得y=8.故选C.
答案:C
3.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,则由此求出的平均数减去实际平均数的值是( )
A.3.5 B.-3 C.3 D.-0.5
答案:B
4.(2017安徽宣城高三模拟)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )
A.8 B.15 C.16 D.32
解析:设样本数据x1,x2,…,x10的平均数为,由方差定义知=64,又数据2x1-1,2x2-1,…,2x10-1的平均数为2-1,则其方差为=4=4×64,
故其标准差为16.
答案:C
5.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
解析:(4+5+6+7+8)=6,
(5×3+6+9)=6,甲的成绩的方差为(22×2+12×2)=2,乙的成绩的方差为(12×3+32×1)=2.4.
答案:C
6.
对某同学的6次物理测试成绩(满分100分)进行统计,作出的茎叶图如图所示,给出关于该同学物理成绩的以下说法:①中位数为84;②众数为85;③平均数为85;④极差为12.其中,正确说法的序号是( )
A.①② B.③④ C.②④ D.①③
解析:中位数是=84,众数为83,平均数是=85,极差是91-78=13,故选D.
答案:D
7.10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设平均数为a,中位数为b,众数为c,则a,b,c的大小顺序为 .
答案:c>b>a
8.一组数据x1,x2,…,xn的方差为9,则数据3x1,3x2,…,3xn的方差是 ,标准差是 .
答案:81 9
9.甲、乙两种水稻试验品种连续4年的单位面积平均产量如下:
品种 第1年 第2年 第3年 第4年
甲 9.8 9.9 10.2 10.1
乙 9.7 10 10 10.3
其中产量比较稳定的水稻品种是 .
解析:甲种水稻单位面积平均产量的平均值为10,则方差为=0.025;乙种水稻单位面积平均产量的平均值为10,则方差为=0.045;
∵0.025<0.045,∴甲种水稻产量比较稳定.
答案:甲
10.导学号17504031甲、乙两位学生参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
(1)用茎叶图表示这两组数据.
(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适 请说明理由.
解:(1)作出茎叶图如下:
(2)派甲参赛比较合适.理由如下:
(70×2+80×4+90×2+8+9+1+2+4+8+3+5)=85,
(70×1+80×4+90×3+5+0+0+3+5+0+2+5)=85,
[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,
[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41,
因为,
所以甲的成绩较稳定,派甲参赛比较合适.
B组
1.已知数据x1,x2,x3,…,xn是某市普通职工n(n≥3,n∈N+)个人的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入xn+1,那么关于这n+1个数据,下列说法中正确的是( )
A.年收入平均数大大增大,中位数一定变大,方差可能不变
B.年收入平均数大大增大,中位数可能不变,方差变大
C.年收入平均数大大增大,中位数可能不变,方差也不变
D.年收入平均数可能不变,中位数可能不变,方差可能不变
答案:B
2.为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的平均气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的平均气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的编号为( )
A.①③ B.①④ C.②③ D.②④
解析:甲地数据为:26,28,29,31,31;乙地数据为:28,29,30,31,32.
所以=29,
=30,
×[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6,
×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2,
所以s甲=,s乙=,s甲>s乙.
即正确的有①④.
答案:B
3.在某地区某高传染性病毒流行期间,为了建立指标来显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5”,根据连续7天的新增病例数计算,下列各选项中,一定符合上述指标的是( )
①平均数x≤3;②标准差s≤2;③平均数x≤3且标准差s≤2;④平均数x≤3且极差小于或等于2;⑤众数等于1且极差小于或等于4.
A.①② B.③④ C.③④⑤ D.④⑤
解析:本题考查平均数、标准差、极差、众数的统计意义.假设连续7天新增病例数为1,2,3,3,3,3,6,易知满足平均数x≤3且标准差s≤2,但是不符合指标,所以①②③错误.若极差等于0或1,在平均数x≤3的条件下显然符合指标;若极差等于2,则极小值与极大值的组合可能有:(1)0,2;(2)1,3;(3)2,4;(4)3,5;(5)4,6.在平均数x≤3的条件下,只有(1)(2)(3)成立,且显然符合指标,所以④正确.又易知⑤正确,故选D.
答案:D
4.如图是一个容量为100的样本的重量频率分布直方图,则由图可估计样本重量的中位数为 .
解析:根据频率分布直方图,得
∵0.06×5=0.3<0.5,0.3+0.1×5>0.5,
令0.3+0.1x=0.5,
解得x=2,∴中位数是10+2=12.
答案:12
5.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标准为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标准的是 .(填序号)
①甲地:总体均值为3,中位数为4
②乙地:总体均值为1,总体方差大于0
③丙地:中位数为2,众数为3
④丁地:总体均值为2,总体方差为3
解析:根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项①中,中位数为4,可能存在大于7的数;同理,在选项③中也有可能;选项②中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项④中,根据方差公式,如果有大于7的数存在,那么方差就大于3,故答案选④.
答案:④
6.据报道,某公司的32名职工的月工资(单位:元)如下:
职务 董事长 副董事长 董事 总经理 经理 管理 职员
人数 1 1 2 1 5 3 20
工资 5 500 5 000 3 500 3 000 2 500 2 000 1 500
(1)求该公司职工工资的平均数、中位数、众数.(精确到1元)
(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数分别是多少 (精确到1元)
(3)你认为哪个统计量更能反映这个公司员工的工资水平 结合此问题谈一谈你的看法.
解:(1)平均数为=≈2 091(元).
中位数是1 500元,众数是1 500元.
(2)平均数为=≈3 288(元).
中位数是1 500元,众数是1 500元.
(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.
7.导学号17504032对某校高三年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图如图所示.
分 组 频数 频率
[10,15) 10 0.25
[15,20) 24 n
[20,25) m p
[25,30] 2 0.05
合 计 M 1
(1)求出表中M,p及图中a的值;
(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;
(3)估计这次学生参加社区服务次数的众数、中位数以及平均数.
解:(1)由分组[10,15)内的频数是10,频率是0.25,知=0.25,所以M=40.
因为频数之和为40,所以10+24+m+2=40,m=4,p==0.10.
因为a是对应分组[15,20)的频率与组距的商,所以a==0.12.
(2)因为该校高三学生有240人,分组在[10,15)内的频率是0.25,所以估计该校高三学生参加社区服务的次数在此区间内的人数为240×0.25=60.
(3)估计这次学生参加社区服务次数的众数是=17.5.因为n==0.6,
所以样本中位数是15+≈17.1,
估计这次学生参加社区服务次数的中位数是17.1,
样本平均数是12.5×0.25+17.5×0.6+22.5×0.1+27.5×0.05=17.25,
估计这次学生参加社区服务人数的平均数是17.25.
8.导学号17504033
在每年的春节后,某市政府都会发动公务员参与到植树绿化活动中去.林业管理部门为了保证树苗的质量,都会在植树前对树苗进行检测.现从甲、乙两种树苗中各抽测了10株树苗,量出它们的高度如下(单位:cm),甲:37,21,31,20,29,19,32,23,25,33;乙:10,30,47,27,46,14,26,10,44,46.
(1)画出两组数据的茎叶图,并根据茎叶图对甲、乙两种树苗的高度作比较,写出两个统计结论;
(2)设抽测的10株甲种树苗高度平均值为x,将这10株树苗的高度依次输入,按程序框图(如图)进行运算,问输出的s的大小为多少 并说明框图中s的统计学意义.
解:(1)茎叶图如图所示(单位:cm):
统计结论:(任意两个即可)
①甲种树苗的平均高度小于乙种树苗的平均高度;
②甲种树苗比乙种树苗长得整齐;
③甲种树苗的中位数为27,乙种树苗的中位数为28.5;
④甲种树苗的高度基本上是匀称的,而且大多数集中在均值附近,乙种树苗的高度分布比较分散.
(2)x=27,s=35,s表示10株甲种树苗高度的方差.2.3 变量的相关性
课后篇巩固探究
A组
1.有五组变量:
①汽车的质量和汽车每消耗1升汽油所行驶的平均路程;
②平均日学习时间和学习成绩;
③某人每日吸烟量和其身体健康情况;
④立方体的棱长和体积;
⑤汽车的质量和行驶100千米的耗油量.
其中两个变量成正相关的是( )
A.①③ B.②④ C.②⑤ D.④⑤
解析:①是负相关;②是正相关;③是负相关;④是函数关系,不是相关关系;⑤是正相关.
答案:C
2.下列有关线性回归的说法中,不正确的是( )
A.变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图
C.线性回归直线方程最能代表观测值x,y之间的关系
D.任何一组观测值都能得到具有代表意义的回归直线方程
解析:只有所有的数据点都分布在一条直线附近时,才能得到回归直线方程.
答案:D
3.近10年来,某市社会商品零售总额与职工工资总额(单位:亿元)数据如下:
工资总额x/亿元 23.8 27.6 31.6 32.4 33.7 34.9 43.2 52.8 63.8 73.4
社会商品零售总额y/亿元 41.4 51.8 61.7 67.9 68.7 77.5 95.9 137.4 155.0 175.0
建立社会商品零售总额y与职工工资总额x的线性回归方程是( )
A.=2.799 1x-27.248 5
B.=2.799 1x-23.549 3
C.=2.699 2x-23.749 3
D.=2.899 2x-23.749 4
解析:利用计算器容易求得,xiyi,代入公式求出得方程为=2.799 1x-23.549 3.
答案:B
4.工人月工资y(单位:元)随劳动生产率x(单位:千元)变化的回归直线方程为=60+90x,下列判断正确的是( )
A.劳动生产率为1 000元时,工资平均为150元
B.劳动生产率提高1 000元时,工资平均提高150元
C.劳动生产率提高1 000元时,工资平均提高90元
D.劳动生产率为1 000元时,工资平均为90元
解析:由表示回归直线=60+90x的斜率,得C正确.
答案:C
5.某车间生产一种玩具,为了要确定加工玩具所需要的时间,进行了10次实验,数据如下:
玩具个数 2 4 6 8 10 12 14 16 18 20
加工时间 4 7 12 15 21 25 27 31 37 41
如果回归方程的斜率是,则它的截距是( )
A.=11-22 B.=22-11
C.=11-22 D.=22-11
解析:由=11,(4+7+12+15+21+25+27+31+37+41)=22,得=22-11.
答案:B
6.(2017湖南株洲二中高三七模)已知x,y如下表所示:
x 1 2 3 4 5
y 2.9 3.7 4.5 5.3 6.1
若x和y线性相关,且线性回归直线方程是x+2.1,则=( )
A.0.7 B.0.8 C.0.9 D.1
解析:根据所给的数据,得到=3,=4.5,
∴这组数据的样本中心点是(3,4.5).
∵线性回归直线的方程一定过样本中心点,
∴4.5=3+2.1,解得=0.8.
答案:B
7.变量x与y具有线性相关关系,当x取值为16,14,12,8时,通过观测得到y的值分别为11,9,8,5.若在实际问题中,y的预测最大取值是10,则x的最大取值不能超过 .
解析:通过计算可求得回归直线方程为=0.728 6x-0.857 1,将y=10代入计算得x=15,从而x的最大取值不能超过15.
答案:15
8.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm,因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm.
解析:设父亲的身高为x cm,儿子身高为y cm,则
x/cm 173 170 176
y/cm 170 176 182
所以=173,=176,=1,=176-1×173=3,
所以=x+3.
当x=182 cm时,=185 cm.
答案:185
9.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应关系:
x/百万元 2 4 5 6 8
y/百万元 30 40 60 50 70
(1)假定y与x之间有线性相关关系,求其回归直线方程;
(2)若实际的销售额不少于60百万元,则广告费支出应不少于多少
解:(1)=5,=50,=145,=13 500,xiyi=1 380,
=6.5,
=50-6.5×5=17.5.
故所求回归直线方程为=6.5x+17.5.
(2)由回归方程得≥60,
即6.5x+17.5≥60,解得x≥.
故广告费支出应不少于百万元.
10.导学号17504034假设关于某设备的使用年限x和所支出的维修费用y(单位:万元)有如下的统计资料:
使用年限x/年 2 3 4 5 6
维修费用y/万元 2.2 3.8 5.5 6.5 7.0
若由资料知y对x呈线性相关关系.试求:
(1)回归方程x+的系数.
(2)使用年限为10年时,试估计维修费用是多少.
解:(1)列表如下:
i 1 2 3 4 5
xi 2 3 4 5 6
yi 2.2 3.8 5.5 6.5 7.0
xiyi 4.4 11.4 22.0 32.5 42.0
4 9 16 25 36
=4,=5,=90,xiyi=112.3
==1.23,
=5-1.23×4=0.08.
(2)回归直线方程是=1.23x+0.08.
当x=10时,=1.23×10+0.08=12.38(万元),
即估计使用10年时维修费用是12.38万元.
B组
1.(2017四川成都高三诊断)某设备的使用年限x(单位:年)与所支付的维修费用y(单位:千元)的几组数据如下表:
使用年限x/年 2 3 4 5
维修费用y/千元 2 3.4 5 6.6
y与x呈线性相关关系,根据上表中数据可得其线性回归直线方程x+中的=1.54,由此预测该设备的使用年限为6年时需支付的维修费用约是( )
A.7.2千元 B.7.8千元 C.8.1千元 D.9.5千元
解析:由题表中数据得=3.5,=4.25,
又因为线性回归直线x+经过(),=1.54,
所以4.25=1.54×3.5+,得=-1.14,
所以回归直线方程为=1.54x-1.14,
当x=6时,维修费用约为=1.54×6-1.14=8.1(千元).故选C.
答案:C
2.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程x+,那么下面说法中不正确的是( )
A.直线x+必经过点()
B.直线x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
C.直线x+的斜率为
D.直线x+和各点(x1,y1),(x2,y2),…,(xn,yn)的总离差[yi-(xi+)]2是该坐标平面上所有直线与这些点的总离差中最小的直线
答案:B
3.为了考察两个变量x和y之间的线性关系,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2.已知两人所得的试验数据中,变量x和y的数据的平均值都相等,且分别都是s,t,则下列说法正确的是( )
A.直线l1和l2一定有公共点(s,t)
B.直线l1和l2相交,但交点不一定是(s,t)
C.必有直线l1∥l2
D.l1和l2必定重合
解析:因为l1,l2均过点(),即(s,t),故l1,l2有公共点(s,t).
答案:A
4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验收集到的数据如下表:
零件数x 10 20 30 40 50
加工时间y/min 62 75 81 89
由最小二乘法求得回归方程为=0.67x+54.9,现发现表中有一个数据模糊不清,请你推断出该数据的值为 .
解析:设表中模糊不清的数据为m,
由表中数据得=30,,
将=30,代入回归直线方程,可解得m=68.
答案:68
5.(2017湖北黄冈高三调研)许多因素都会影响贫穷,教育也许是其中的一个,某机构在研究这两个因素的关系时,收集了某国50个地区的成年人至多受过9年教育的百分比(x%)和收入低于官方规定的贫困线的人数占本地区人数的百分比(y%)的数据,建立的回归直线方程是=0.8x+4.6,这里,斜率的估计0.8说明一个地区受过9年或更少的教育的百分比每增加 ,则收入低于官方规定的贫困线的人数占本地区人数的百分比将增加 左右.
解析:回归直线方程y=0.8x+4.6中,回归系数是0.8,回归截距是4.6,斜率的估计0.8表示一个地区受过9年或更少的教育的百分比每增加1%,则收入低于官方规定的贫困线的人数占本地区人数的百分比将增加0.8%左右.
答案:1% 0.8%
6.(2017安徽安庆高三三模)某电脑公司的三名产品推销员的工作年限与年推销金额数据如下表:
推销员编号 1 2 3
工作年限x/年 3 5 10
年推销金额y/万元 2 3 4
由表中数据算出线性回归直线方程x+中的,若该电脑公司的第四名推销员的工作年限为6年,则估计他的年推销金额为 万元.
解析:由已知可知回归直线方程为x+×(3+5+10)=6,×(2+3+4)=3,代入回归直线方程得,因此他的年推销金额为×6+=3(万元).
答案:3
7.导学号17504035炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,因此必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一些数据,如下表所示:
x/0.01% 104 180 190 177 147 134 150 191 204 121
y/min 100 200 210 185 155 135 170 205 235 125
(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一般规律吗
(2)求回归直线方程.
(3)预测当钢水含碳量为160时,应冶炼多少分钟
解:(1)以x轴表示含碳量,y轴表示冶炼时间,可作散点图如图所示:
从图中可看出,各点散布在一条直线附近,即它们线性相关.
(2)列出下表,并用科学计算器进行计算:
i 1 2 3 4 5 6 7 8 9 10
xi 104 180 190 177 147 134 150 191 204 121
yi 100 200 210 185 155 135 170 205 235 125
xiyi 10 400 36 000 39 900 32 745 22 785 18 090 25 500 39 155 47 940 15 125
=159.8,=172.=265 448,=312 350,xiyi=287 640
设所求的回归直线方程为=bx+a,其中a,b的值使Q=(yi-bxi-a)2的值最小.≈1.267 3,≈-30.514 5,
即所求的回归直线方程为=1.267 3x-30.514 5.
(3)当x=160时,y=1.267 3×160-30.514 5≈172(min),即大约冶炼172 min.第二章 统计
学业质量标准检测
本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分.考试时间120分钟.
第Ⅰ卷(选择题 共60分)
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中只有一个是符合题目要求的)
1.已知x与y之间的一组数据:
x 0 1 2 3
y 1 3 5 7
则y与x的线性回归方程为=x+必过点( D )
A.(2,2) B.(1,2)
C.(1.5,0) D.(1.5,4)
[解析] ==1.5,==4.
∵回归直线过样本的中心点(,),∴回归直线过点(1.5,4),故选D.
2.下列哪种工作不能使用抽样方法进行( D )
A.测定一批炮弹的射程
B.测定海洋某一水域的某种微生物的含量
C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度
D.检测某学校全体高三学生的身高和体重的情况
[解析] 抽样是为了用总体中的部分个体(即样本)来估计总体的情况,选项A、B、C都是从总体中抽取部分个体进行检验,选项D是检测全体学生的身体状况,所以,要对全体学生的身体都进行检验,而不能采取抽样的方法.故选D.
3.高一·一班李明同学进行一项研究,他想得到全班同学的臂长数据,他应选择的最恰当的数据收集方法是( A )
A.做试验 B.查阅资料
C.设计调查问卷 D.一一询问
[解析] 全班人数不是很多,所以做试验最恰当.
4.设有一个回归方程为=2-2.5x,变量x增加一个单位时,变量y( C )
A.平均增加1.5个单位
B.平均增加2个单位
C.平均减少2.5个单位
D.平均减少2个单位
[解析] 因为随变量x增大,y减小,x、y是负相关的,且=-2.5,故选C.
5.学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n且支出在[20,60)元的样本,其频率分布直方图如图所示,根据此图估计学生在课外读物方面的支出费用的中位数为( )元( C )
A.45 B.
C. D.46
[解析] 40+10×=.
6.将1 000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,则抽取的第40个号码为( A )
A.0795 B.0780
C.0810 D.0815
[解析] 由题意可知,该抽样为系统抽样,抽样间隔为20,则抽取的第40个号码为0015+20×39=0795,故选A.
7.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( B )
A.101 B.808
C.1 212 D.2 012
[解析] 根据分层抽样的概念知,=,解得N=808.
8.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( A )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
[解析] 将这组数据从小到大排列,得87、89、90、91、92、93、94、96.
故平均数==
91.5,中位数为=91.5,故选A.
9.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5~18岁的男生体重(单位:kg),得到频率分布直方图如下:
根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是( C )
A.20 B.30
C.40 D.50
[解析] 由题意,知这100名学生中体重在[56.5,64.5)的学生人数所占频率为(0.03+0.05+0.05+0.07)×2=0.4,所以这100名学生中体重在[56.5,64.5)的学生人数是0.4×100=40.
10.网上大型汽车销售某品牌A型汽车,在2016双十一期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系:
价格(万元) 25 23.5 22 20.5
销售量(辆) 30 33 36 39
已知A型汽车的购买量y与价格x符合如下线性回归方程:=x+80,若A型汽车价格降到19万元,预测月销量大约是( B )
A.39 B.42
C.45 D.50
[解析] =(25+23.5+22+20.5)=22.75,
=(30+33+36+39)=34.5,
∵=x+80,∴34.5=×22.75+80,∴≈-2.
∵x=19,∴y=19×(-2)+80=42.
11.数据5,7,7,8,10,11的标准差是( C )
A.8 B.4
C.2 D.1
[解析] ==8,
标准差S=
=2.
12.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中,下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( A )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定
[解析] 本小题主要考查学生的知识迁移能力和统计的有关知识.
甲==0.617,
乙==0.613,
故选A.
第Ⅱ卷(非选择题 共90分)
二、填空题(本大题共4小题,每小题5分,共20分.把答案填写在题中的横线上.)
13.将一个容量为m的样本分成3组,已知第一组频数为8,第二、三组的频率为0.15和0.45,则m=__20__.
[解析] 由题意知第一组的频率为1-(0.15+0.45)=0.4,
∴=0.4,∴m=20.
14.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数.则这10天甲、乙两人日加工零件的平均数分别为__24__和__23__.
[解析] 甲=(10×2+20×5+30×3+17+6+7)=24,乙=(10×3+20×4+30×3+17+11+2)=23.
15.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[45,55)、[55,65)、[65,75)、[75,85)、[85,95),由此得到频率分布直方图如图,则这20名工人中一天生产该产品数量在[55,75)的人数是__13__.
[解析] 由频率分布直方图知[55,75)之间的频率为
(0.040+0.025)×10=0.65,故[55,75)之间的人数为0.65×20=13.
16.某校甲、乙两个班级各有5名编号为1、2、3、4、5的学生进行投篮练习,每人投10次,投中的次数如下表:
学生 1号 2号 3号 4号 5号
甲组 6 7 7 8 7
乙组 6 7 6 7 9
则以上两组数据的方差中较小的一个为s2= .
[解析] 甲==7,
乙==7.
∴s==,
s==,
则两组数据的方差中较小的一个为s=.
三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤)
17.(本题满分10分)下面的抽样方法是简单随机抽样吗?为什么?
(1)某班有40名同学,指定个子最高的5名同学参加学校组织的篮球赛;
(2)一儿童从玩具箱中的20件玩具中随意拿出一件来玩,玩后放回,再拿一件,连续玩了5件;
(3)从200个灯泡中逐个抽取20个进行质量检查.
[解析] (1)不是简单随机抽样,因为这不是等可能抽样.
(2)不是简单随机抽样,因为它是有放回的抽样.
(3)是简单随机抽样,因为它满足简单随机抽样的几个特点.
18.(本题满分12分)有关部门要了解甲型H1N1流感预防知识在学校的普及情况,制作了一份有10道题的问卷到各学校进行问卷调查.某中学A、B两个班各被随机抽取了5名学生接受问卷调查,A班5名学生得分为:5,8,9,9,9;B班5名学生得分为:6,7,8,9,10.(单位:分)
请你估计A、B两个班中哪个班的问卷得分要稳定一些.
[解析] A班的5名学生的平均得分为(5+8+9+9+9)÷5=8(分),
方差s=×[(5-8)2+(8-8)2+(9-8)2+(9-8)2+(9-8)2]=2.4;
B班的5名学生的平均得分为(6+7+8+9+10)÷5=8(分),
方差s=×[(6-8)2+(7-8)2+(8-8)2+(9-8)2+(10-8)2]=2.
∴s>s.
∴B班的预防知识的问卷得分要稳定一些.
19.(本题满分12分)一箱方便面共有50包,从中用随机抽样方法抽取了10包称量其重量(单位:g)结果为:60.5 61 60 60 61.5 59.5 59.5 58 60 60
(1)指出总体、个体、样本、样本容量;
(2)指出样本数据的众数、中位数、平均数;
(3)求样本数据的方差.
[解析] (1)总体是这50包方便面所有的包重,个体是这一箱方便面中每一包的包重,样本是抽取的10包的包重,样本容量为10.
(2)这组样本数据的众数是60,中位数为60,样本平均数=×(60.5+61+60+60+61.5+59.5+59.5+58+60+60)=60.
(3)样本数据的方差为
s2=[(60.5-60)2+(61-60)2+(60-60)2+(60-60)2+(61.5-60)2+(59.5-60)2+(59.5-60)2+(58-60)2+(60-60)2+(60-60)2]=0.8.
20.(本题满分12分)某班的全体学生共有50人,参加数学测试(百分制)成绩的频率分布直方图如图,数据的分组依次为:[20,40)、[40,60)、[60,80)、[80,100].依此表可以估计这一次测试成绩的中位数为70分.
(1)求表中a、b的值;
(2)请估计该班本次数学测试的平均分.
[解析] (1)由中位数为70可得,
0.005×20+0.01×20+a×10=0.5,
解得a=0.02.
又20(0.005+0.01+0.02+b)=1,
解得b=0.015.
(2)该班本次数学测试的平均分的估计值为30×0.1+50×0.2+70×0.4+90×0.3=68分.
21.(本题满分12分)有一容量为50的样本,数据的分组以及各组的频数如下:
[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;
[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5),4.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计,数据落在[15.5,24.5)内的可能性约是多少?
[解析] (1)频率分布表为:
分组 频数 频数 频率
[12.5,15.5) 3 0.06
[15.5,18.5) 8 0.16
[18.5,21.5) 9 0.18
[21.5,24.5) 11 0.22
[24.5,27.5) 10 0.20
[27.5,30.5) 5 0.10
[30.5,33.5) 4 0.08
合计 50 1.00
(2)频率分布直方图如图所示:
(3)数据落在[15.5,24.5)内的可能性为:=0.56.
22.(本题满分12分)以下是某地搜集到的新房屋的销售价格y(单位:万元)和房屋的面积x(单位:m2)的数据:
房屋面积 115 110 80 135 105
销售价格 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
(3)据(2)的结果估计当房屋面积为150 m2时的销售价格(精确到0.1万元).
[解析] (1)数据对应的散点图如图所示.
(2)=i=109,(xi-)2=1570,=23.2,
(xi-)(yi-)=308.
设所求回归直线方程为=x+,则
==≈0.1962,
=-=23.2-0.1962×109=1.8142.
故所求回时直线方程为=0.1962x+1.8142.回归直线如上图.
(3)由(2)得当x=150时,销售价格的估计值为=0.196×150+1.8142=31.2442≈31.2(万元).第2课时 统计
课后篇巩固探究
A组
1.下列不具有相关关系的是( )
A.单产不为常数时,土地面积和总产量
B.人的身高与体重
C.季节与学生的学习成绩
D.学生的学习态度与学习成绩
解析:判断是否具有相关关系关键是看一个变量是否会受到另一个变量的影响.
答案:C
2.某中学采用系统抽样方法,从该校高一年级全体800名学生中抽取50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中抽到的数是39,则在第1小组1~16中随机抽到的数是( )
A.5 B.7 C.11 D.13
解析:间隔数k==16,即每16人抽取一个人.因为39=2×16+7,所以第1小组中抽取的数为7.
答案:B
3.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:
9.4 8.4 9.4 9.9 9.6 9.4 9.7
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A.9.4,0.484 B.9.4,0.016
C.9.5,0.04 D.9.5,0.016
解析:数据的平均值
=9.5.
方差s2=[(9.4-9.5)2+(9.4-9.5)2+(9.6-9.5)2+(9.4-9.5)2+(9.7-9.5)2]=0.016.
答案:D
4.某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家,为了掌握各商店的营业情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的中型商店为( )
A.2家 B.3家
C.5家 D.13家
解析:方法1:在整个抽样过程中,每个个体被抽到的可能性为,则抽取的中型商店为75×=5(家).
方法2:因为大、中、小型商店数的比为30∶75∶195=2∶5∶13,所以抽取的中型商店为20×=5(家).
答案:C
5.
某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率分布直方图如图,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为( )
A.6万元 B.8万元 C.10万元 D.12万元
解析:由频率分布直方图可知,11时至12时的销售额占全部销售额的,即销售额为25×=10(万元).
答案:C
6.从一堆苹果中任取了20个,并得到它们的质量(单位:g)数据分布表如下:
分组 [90,100) [100,110) [110,120) [120,130) [130,140) [140,150)
频数 1 2 3 10 1
则这堆苹果中,质量不小于120 g的苹果数约占苹果总数的 .
解析:由表中可知这堆苹果中,质量不小于120 g的苹果数为20-1-2-3=14.
故约占苹果总数的=0.70=70%.
答案:70%
7.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x/万元 4 2 3 5
销售额y/万元 49 26 39 54
根据上表可得回归方程x+中的为9.4,据此模型预报广告费用为6万元时销售额约为 元.
解析:=3.5,=42,
∴=42-9.4×3.5=9.1,
∴回归方程为=9.4x+9.1,
∴当x=6时,=9.4×6+9.1=65.5.
答案:65.5
8.现有同一型号的电脑96台,为了了解这种电脑每开机一次所产生的辐射情况,从中抽取10台在同一条件下做开机实验,测量开机一次所产生的辐射,得到如下数据:
13.7 12.9 14.4 13.8 13.3
12.7 13.5 13.6 13.1 13.4
(1)写出采用简单随机抽样抽取上述样本的过程;
(2)根据样本,请估计总体平均数与总体标准差的情况.
解:(1)利用随机数表法或抽签法.具体过程如下:
方法一(抽签法):
①将96台电脑随机编号为1~96;
②将以上96个号码分别写在96张相同的小纸条上,揉成小球,制成号签;
③把号签放入一个不透明的容器中,充分搅拌均匀;
④从容器中逐个抽取10个号签,每次取完后再次搅拌均匀,并记录上面的号码;
⑤找出和所得号码对应的10台电脑,组成样本.
方法二(随机数表法):
①将96台电脑随机编号,编号为00,01,02,…,95;
②在随机数表中任选一数作为开始,然后依次向右读,每次读两位,凡不在00~95中的数和前面已读过的数跳过不读,直到读出10个符合条件的数;
③这10个数所对应的10台电脑即是我们所要抽取的样本.
(2)=13.44;
s2=≈0.461.
故总体平均数为13.44,总体标准差约为0.461.
9.对某班50人进行智力测验,其得分如下:
48,64,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,47,66,55,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,58.
(1)这次测试成绩的最大值和最小值各是多少
(2)将[30,100)平分成7个小区间,试画出该班学生智力测验成绩的频数分布图.
(3)分析这个频数分布图,你能得出什么结论
解:(1)最小值是32,最大值是97.
(2)7个区间分别是[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100),每个小区间的长度是10,统计出各小区间内的数据频数,列表如下:
区间 [30,40) [40,50) [50,60) [60,70) [70,80) [80,90) [90,100)
频数 1 6 12 14 9 6 2
频数分布图如下图所示.
(3)可以看出,该班智力测验成绩大体上呈两头小、中间大、左右对称的钟形状态,说明该班学生智力特别好或特别差的是极少数,而智力一般的是多数,这是一种最常见的分布.
10.导学号17504078已知学生的总成绩与数学成绩之间有线性相关关系,下表给出了5名同学在一次考试中的总成绩和数学成绩(单位:分).
学生编号成绩 1 2 3 4 5
总成绩/x 482 383 421 364 362
数学成绩/y 78 65 71 64 61
(1)求数学成绩与总成绩的回归直线方程.
(2)根据以上信息,如果一个学生的总成绩为450分,试估计这个学生的数学成绩;
(3)如果另一位学生的数学成绩为92分,试估计其总成绩是多少
解:(1)列出下表,并进行有关计算.
编号 x y x2 xy
1 482 78 232 324 37 596
2 383 65 146 689 24 895
3 421 71 177 241 29 891
4 364 64 132 496 23 296
5 362 61 131 044 22 082
合计 2 012 339 819 794 137 760
由上表可得,
可得≈0.132,-0.132×≈14.683.
故数学成绩y对总成绩x的回归直线方程为=14.683+0.132x.
(2)由(1)得当总成绩x为450分时,=14.683+0.132×450≈74(分),即数学成绩大约为74分.
(3)若数学成绩为92分,将=92代入回归直线方程=14.683+0.132x中,得x≈586(分).故估计该生的总成绩在586分左右.
B组
1.设样本数据x1,x2,…,x10的均值和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为( )
A.1+a,4 B.1+a,4+a
C.1,4 D.1,4+a
解析:
=+a=1+a.
s2=
=
=4.
答案:A
2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为me,众数为mo,平均值为,则( )
A.me=mo= B.me=mo<
C.me解析:由题目所给的统计图示可知,30个得分中,按大小顺序排好后,中间的两个得分为5,6,故中位数me==5.5,又众数mo=5,平均值(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=,故mo答案:D
3.某市为加强教师基础素质建设,开展了“每月多读一本书,提高自身修养”的读书活动.设该市参加读书活动的教师平均每人每年读书的本数为x(单位:本),按读书本数分下列四种情况统计:①0~10本;②11~20本;③21~30本;④30本以上.现有10 000名教师参加了此项活动,如图是此次调查中某一项的程序框图,其输出的结果为6 200,则该市参加活动的教师中平均每年读书本数在0~20之间的频率是( )
A.3 800 B.6 200 C.0.38 D.0.62
解析:由程序框图知,当x>20时,S=S+1,故输出的S值应是10 000名教师中读书本数大于20的人数,故S=6 200,
∴在0~20之间的频率为=0.38.
答案:C
4.(2017宁夏银川二中高三一模)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为 的学生.
解析:由题意得,在第八组中抽得号码为12+(8-3)×5=37.
答案:37
5.某公司为改善职工的出行条件,随机抽取50名职工,调查他们的居住地与公司的距离d(单位:千米).若样本数据分组为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],由数据绘制的频率分布直方图如图所示,则样本中职工居住地与公司的距离不超过4千米的人数为 .
解析:样本中职工居住地与公司的距离不超过4千米的频率为(0.1+0.14)×2=0.48,所以样本中职工居住地与公司的距离不超过4千米的人数为50×0.48=24.
答案:24
6.导学号17504079从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125)
频数 6 26 38 22 8
(1)作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定
解:(1)
(2)质量指标值的样本平均数为
=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.
7.导学号17504080某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x/元 8 8.2 8.4 8.6 8.8 9
销量y/件 90 84 83 80 75 68
(1)求回归直线方程x+,其中=-20,;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元 (利润=销售收入-成本)
解:(1)=8.5,
=80.
∵=-20,,∴=80+20×8.5=250.
∴回归直线方程为=-20x+250.
(2)设工厂获得的利润为L元,则L=x(-20x+250)-4(-20x+250)=-20(x-8.25)2+361.25,
∴该产品的单价定为8.25元时,工厂获得的利润最大.