2015届高三数学人教B版(通用,理)总复习配套文档:第11章 统计、统计案例(4份)

文档属性

名称 2015届高三数学人教B版(通用,理)总复习配套文档:第11章 统计、统计案例(4份)
格式 zip
文件大小 1.6MB
资源类型 教案
版本资源
科目 数学
更新时间 2014-05-19 10:09:35

文档简介

HYPERLINK "http://www.21cnjy.com"
§11.1 随机抽样
HYPERLINK "http://www.21cnjy.com"
1. 简单随机抽样
(1)定义:从元素个数为N的总体中不放回 ( http: / / www.21cnjy.com )地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样的方法:抽签法和随机数表法.
2. 系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本.
(1)先将总体的N个个体编号;
(2)确定分段间隔k,对编号进行分段,当(n是样本容量)是整数时,取k=;
当不是整数时,可随机地从总体中剔除余数,再确定分段间隔;
(3)在第1段用简单随机抽样确定第一个个体编号s (s≤k);
(4)按照一定的规则抽取样本,通常是将s加 ( http: / / www.21cnjy.com )上间隔k得到第2个个体编号(s+k),再加k得到第3个个体编号(s+2k),依次进行下去,直到获取整个样本.
3. 分层抽样
(1)分层抽样的定义:
在抽样时,将总体中各个个体按某种特征分成若 ( http: / / www.21cnjy.com )干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.
(2)当总体由有明显差异的几部分组成时,往往选用分层抽样.
1. 判断下面结论是否正确(请在括号中打“√”或“×”)
(1)简单随机抽样是一种不放回抽样. ( √ )
(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关. ( × )
(3)系统抽样在起始部分抽样时采用简单随机抽样. ( √ )
(4)要从1 002个学生 ( http: / / www.21cnjy.com )中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平. ( × )
(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关. ( × )
2. 在某班的50名学生中,依次抽取学 ( http: / / www.21cnjy.com )号为5、10、15、20、25、30、35、40、45、50的10名学生进行作业检查,这种抽样方法是 (  )
A.随机抽样 B.分层抽样
C.系统抽样 D.以上都不是
答案 C
3. 将参加英语口语测试的1 00 ( http: / / www.21cnjy.com )0名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为 (  )
A.700 B.669 C.695 D.676
答案 C
解析 由题意可知,第一组随机抽取的编号l=15,
分段间隔数k===20,则抽取的第35个编号为a35=15+(35-1)×20=695.
4. 大、中、小三个盒子中分别装有 ( http: / / www.21cnjy.com )同一种产品120个、60个、20个,现在需从这三个盒子中抽取一个样本容量为25的样本,较为恰当的抽样方法为________________.
答案 简单随机抽样
解析 因为三个盒子中装的是同一种产品,且按比例抽取每盒中抽取的不是整数,所以将三盒中产品放在一起搅匀按简单随机抽样法(抽签法)较为适合.
5. 一支田径队有男运动员48人,女运动员3 ( http: / / www.21cnjy.com )6人.若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.
答案 12
解析 样本的抽取比例为=,
所以应抽取男运动员48×=12(人).
HYPERLINK "http://www.21cnjy.com"
题型一 简单随机抽样
例1 下列抽取样本的方式是否属于简单随机抽样?
(1)从无限多个个体中抽取100个个体作为样本.
(2)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
(3)从20件玩具中一次性抽取3件进行质量检验.
(4)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
思维启迪 判断一个抽样是否为简单随机抽样,要判断是否符合简单随机抽样的特征.
解 (1)不是简单随机抽样.因为被抽取的样本总体的个体数是无限的,而不是有限的.
(2)不是简单随机抽样.因为它是放回抽样.
(3)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.
(4)不是简单随机抽样.因为不是等可能抽样.
思维升华 (1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③是不放回抽取;④是等可能抽取.
(2)简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数表法(适用于个体数较多的情况).
 (2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为(  )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.08 B.07 C.02 D.01
答案 D
解析 从第1行第5列、第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.
题型二 系统抽样
例2 将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为 (  )
A.26,16,8 B.25,17,8
C.25,16,9 D.24,17,9
思维启迪 系统抽样又称“等距抽样”.可以根据“等距”确定各营区被抽中的人数.
答案 B
解析 由题意及系统抽样的定 ( http: / / www.21cnjy.com )义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N+)组抽中的号码是3+12(k-1).
令3+12(k-1)≤300得k≤,因此第Ⅰ营区被抽中的人数是25;
令300<3+12(k-1)≤495得结合各选项知,选B.
思维升华 (1)系统抽样 ( http: / / www.21cnjy.com )的特点——机械抽样,又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取的样本号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.
(2)系统抽样时,如果总体中的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.
 (2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为 (  )
A.11 B.12 C.13 D.14
答案 B
解析 由=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为==12(人).
题型三 分层抽样
例3 (2013·湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于 (  )
A.9 B.10 C.12 D.13
思维启迪 分层抽样,抽样比是一个定值.
答案 D
解析 ∵=,∴n=13.
思维升华 在分层抽样的过程中,为了保证 ( http: / / www.21cnjy.com )每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即ni∶Ni=n∶N.
 某校共有学生2 000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为 (  )
一年级 二年级 三年级
女生 373 x y
男生 377 370 z
A.24 B.18 C.16 D.12
答案 C
解析 依题意我们知道二年级的女生有38 ( http: / / www.21cnjy.com )0人,那么三年级的学生人数应该是2 000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故在分层抽样中应在三年级抽取的学生人数为64×=16.
五审图表找规律
典例:(12分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:
人数 管理 技术开发 营销 生产 共计
老年 40 40 40 80 200
中年 80 120 160 240 600
青年 40 160 280 720 1 200
小计 160 320 480 1 040 2 000
(1)若要抽取40人调查身体状况,则应怎样抽样?
(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?
(3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?
抽取40人调查身体状况
↓(观察图表中的人数分类统计情况)
样本人群应受年龄影响
↓(表中老、中、青分类清楚,人数确定)
要以老、中、青分层,用分层抽样

要开一个25人的座谈会
↓(讨论单位发展与薪金调整)
样本人群应受管理、技术开发、营销、生产方面的影响
↓(表中管理、技术开发、营销、生产分类清楚,人数确定)
要以管理、技术开发、营销、生产人员分层,用分层抽样

要抽20人调查对广州亚运会举办情况的了解
↓可认为亚运会是大众体育盛会,一个单位人员对情况了解相当
将单位人员看作一个整体
↓(从表中数据看总人数为2 000人)
人员较多,可采用系统抽样
规范解答
解 (1)按老年、中年、青年分层,用分层抽样法抽取, [1分]
抽取比例为=. [2分]
故老年人,中年人,青年人各抽取4人,12人,24人. [4分]
(2)按管理、技术开发、营销、生产分层,用分层抽样法抽取, [5分]
抽取比例为=,[6分]
故管理,技术开发,营销,生产各抽取2人,4人,6人,13人. [8分]
(3)用系统抽样,
对全部2 000人随机编号,号码从 ( http: / / www.21cnjy.com )0001~2000,每100号分为一组,从第一组中用随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,共20人组成一个样本.
[12分]
温馨提醒 (1)本题审题的关键有两点,一是对图表中的人员分类情况和数据要审视清楚;二是对样本的功能要审视准确.
(2)本题易错点是,对于第(2)问,由于对样本功能审视不准确,按老、中、青三层分层抽样.
HYPERLINK "http://www.21cnjy.com"
方法与技巧
三种抽样方法的比较
类别 各自特点 相互联系 适用范围 共同点
简单随机抽样 从总体中逐个抽取 最基本的抽样方法 总体中的个体数较少 抽样过程中每个个体被抽到的可能性相等
系统抽样 将总体平均分成几部分,按事先确定的规则分别在各部分中抽取 在起始部分抽样时,采用简单随机抽样 总体中的个体数较多
分层抽样 将总体分成几层,按各层个体数之比抽取 各层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成
失误与防范
进行分层抽样时应注意几点:
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠;
(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同;
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
A组 专项基础训练
(时间:30分钟)
一、选择题
1. (2012·四川)交通管理部门为了 ( http: / / www.21cnjy.com )解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为 (  )
A.101 B.808 C.1 212 D.2 012
答案 B
解析 由题意知抽样比为,而四个社区一共抽取的驾驶员人数为12+21+25+43=101,
故有=,解得N=808.
2. 某校选修乒乓球课程的学生中,高 ( http: / / www.21cnjy.com )一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为 (  )
A.6 B.8 C.10 D.12
答案 B
解析 设样本容量为N,则N×=6,∴N=14,
∴高二年级所抽人数为14×=8.
3. 某单位有职工750人,其中青年职 ( http: / / www.21cnjy.com )工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为 (  )
A.7 B.15 C.25 D.35
答案 B
解析 由题意知青年职工人数∶中年职工人数∶老年职工人数=350∶250∶150=7∶5∶3.由样本中青年职工为7人得样本容量为15.
4. 为规范学校办学,省教育厅 ( http: / / www.21cnjy.com )督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为 (  )
A.13 B.19 C.20 D.51
答案 C
解析 抽样间隔为46-33=13,
故另一位同学的编号为7+13=20,选C.
5. 某学校高一、高二、高三三个年级共 ( http: / / www.21cnjy.com )有学生3 500人,其中高三学生是高一学生的两倍,高二学生比高一学生多300人,现在按的抽样比例用分层抽样的方法抽取样本,则高一学生应抽取的人数为 (  )
A.8 B.11 C.16 D.10
答案 A
解析 设高一学生有x人,则高三学生有2x人 ( http: / / www.21cnjy.com ),高二学生有(x+300)人,学校共有4x+300=3 500(人),解得x=800(人),由此可得按的抽样比例用分层抽样的方法抽取样本,高一学生应抽取的人数为×800=8(人),故应选A.
二、填空题
6. (2012·天津)某地 ( http: / / www.21cnjy.com )区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.
答案 18 9
解析 150×=150×=18,75×=9.
7. 将某班的60名学生编号为01,0 ( http: / / www.21cnjy.com )2,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.
答案 16,28,40,52
8. (2012·福建)一支田径队有男 ( http: / / www.21cnjy.com )女运动员98人,其中男运动员有56人,按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是________.
答案 12
解析 依题意,女运动员有98-56=42(人).
设应抽取女运动员x人,根据分层抽样特点,
得=,解得x=12.
9. 课题组进行城市空气质量调查,按地域 ( http: / / www.21cnjy.com )把24个城市分成甲、乙、丙三组,对应的城市数分别为4,12,8,若用分层抽样抽取6个城市,则丙组中应抽取的城市数为________.
答案 2
解析 由已知得抽样比为=,
∴丙组中应抽取的城市数为8×=2.
10.用系统抽样法要从160名学生中抽取容量 ( http: / / www.21cnjy.com )为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是______________.
答案 11
解析 由题意可知,系统抽样的组数为2 ( http: / / www.21cnjy.com )0,间隔为8,设第1组抽出的号码为x,则由系统抽样的法则可知,第n组抽出个体的号码应该为x+(n-1)×8,所以第16组应抽出的号码为x+(16-1)×8=123,解得x=3,所以第2组中应抽出个体的号码为3+(2-1)×8=11.
B组 专项能力提升
(时间:30分钟)
1. 某初级中学有学生270人,其中一 ( http: / / www.21cnjy.com )年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250
②5,9,100,107,111,121,180,195,200,265
③11,38,65,92,119,146,173,200,227,254
④30,57,84,111,138,165,192,219,246,270
关于上述样本的下列结论中,正确的是 (  )
A.②、③都不能为系统抽样 B.②、④都不能为分层抽样
C.①、④都可能为系统抽样 D.①、③都可能为分层抽样
答案 D
解析 因为③为系统抽样,所以选项A不对;因为②为分层抽样,所以选项B不对;因为④不为系统抽样,所以选项C不对,故选D.
2. (2012·山东)采用系统抽样方法 ( http: / / www.21cnjy.com )从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为 (  )
A.7 B.9 C.10 D.15
答案 C
解析 由系统抽样的特点知:抽取号码 ( http: / / www.21cnjy.com )的间隔为=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n项,显然有729=459+(n-1)×30,解得n=10.所以做问卷B的有10人.
3. 为了解1 200名学生对学校某 ( http: / / www.21cnjy.com )项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为________.
答案 40
4. 200名职工年龄分布如图所示,从中随机抽取40名职工作样本,
采用系统抽样方法,按1~200编号分为40组,分别为1~5,
6~10,…,196~200,第5组抽取号码为22,第8组抽取号码
为______.若采用分层抽样,40岁以下年龄段应抽取______人.
答案 37 20
解析 将1~200编号分为40组,则每 ( http: / / www.21cnjy.com )组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x人,
则=,解得x=20.
5. 一个总体中有90个个体 ( http: / / www.21cnjy.com ),随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是________.
答案 76
解析 由题意知:m=8,k=8,则m+k=16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.
6. 某公路设计院有工程师 ( http: / / www.21cnjy.com )6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n.
解 总体容量为6+12+18=36.
当样本容量是n时,由题意知,系统抽样的间隔 ( http: / / www.21cnjy.com )为,分层抽样的比例是,抽取的工程师人数为×6=,技术员人数为×12=,技工人数为×18=,所以n应是6的倍数,36的约数,即n=6,12,18.
当样本容量为(n+1)时,总体容量是35人,系统抽样的间隔为,因为必须是整数,所以n只能取6.即样本容量n=6.§11.2 用样本估计总体
HYPERLINK "http://www.21cnjy.com"
1. 作频率分布直方图的步骤:
(1)计算极差(即一组数据中最大值与最小值的差).
(2)决定组数与组距.
(3)决定分点.
(4)列频率分布表.
(5)绘制频率分布直方图.
2. 频率分布折线图和总体密度曲线
(1)频率分布折线图:把频率分布直方图中各个长方形上边的中点用线段连接起来,就得到频率分布折线图.
(2)设想如果样本容量不断增大, ( http: / / www.21cnjy.com )分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,它可以用一条光滑曲线y=f(x)来描绘,这条光滑曲线就叫做总体密度曲线.
3. 茎叶图的优点
用茎叶图表示数据有两个突出的优点:
一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;
二是茎叶图可以在比赛时随时记录,方便记录与表示.
4. 样本的数字特征
(1)众数、中位数、平均数
众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
平均数:样本数据的算术平均数,即=(x1+x2+…+xn).
在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(2)样本方差、标准差
设样本的元素为x1,x2,…,xn,样本的平均数为,
①样本方差:
s2=,
②样本标准差:
s=.
1. 判断下面结论是否正确(请在括号中打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. ( √ )
(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论. ( × )
(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了. ( √ )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次. ( × )
2. 某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2=________.
答案 3.2
解析 ==7,
∴s2=[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]==3.2.
3. 一个容量为20的样本,数据的分组及各组的频数如下:
[10,20),2;[20,30),3;[30,40),x;[40,50),5;[50,60),4;
[60,70),2;则x=________;根据样本的频率分布估计,数据落在[10,50)的概率约为________.
答案 4 0.7
解析 x=20-(2+3+5+4+2)=4,
P==0.7或P=1-=0.7.
4. (2012·湖南)如图所示是某学校一名篮球运动员在五场比赛中所得分数的
茎叶图,则该运动员在这五场比赛中得分的方差为________.
(注:方差s2=[(x1-)2+(x2-)2+…+(xn-)2],其中为x1,x2,…,xn的平均数)
答案 6.8
解析 依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为=11.
由方差公式得s2=[(8-11) ( http: / / www.21cnjy.com )2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=(9+4+1+4+16)=6.8.
5. 某中学为了解学生数学 ( http: / / www.21cnjy.com )课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.
HYPERLINK "http://www.21cnjy.com"
答案 600
解析 由直方图易得数学考试中成 ( http: / / www.21cnjy.com )绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,所以所求分数小于60分的学生数为3 000×0.2=600.
HYPERLINK "http://www.21cnjy.com"
题型一 频率分布直方图的绘制与应用
例1 某校从参加高一年级期中考试的学生中随机抽出60名学
生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,
[90,100]后得到如图所示的频率分布直方图,观察图形的信
息,回答下列问题:
(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;
(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.
思维启迪 利用各小长方形的面积和等于1求分数在[70,80)内的频率,再补齐频率分布直方图.
解 (1)设分数在[70,80)内的频率为x ( http: / / www.21cnjy.com ),根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.
HYPERLINK "http://www.21cnjy.com"
(2)平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).
思维升华 频率分布直方图直观形象地表 ( http: / / www.21cnjy.com )示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.
 (2013·陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为 (  )
HYPERLINK "http://www.21cnjy.com"
A.0.09 B.0.20 C.0.25 D.0.45
答案 D
解析 设区间[25,30 ( http: / / www.21cnjy.com ))对应矩形的另一边长为x,则所有矩形面积之和为1,即(0.02+0.04+0.06+0.03+x)×5=1,解得x=0.05.产品为二等品的概率为0.04×5+0.05×5=0.45.
题型二 茎叶图的应用
例2 如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打
出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个
最高分和一个最低分后,甲、乙两名选手得分的平均数分别
为a1、a2,则一定有 (  )
A.a1>a2
B.a2>a1
C.a1=a2
D.a1,a2的大小与m的值有关
思维启迪 去掉的最低分和最高分就是第一行和第三行的数据,剩下的数我们只要计算其叶上数字之和,即可对问题作出结论.
答案 B
解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.故选B.
思维升华 由于茎叶图完全 ( http: / / www.21cnjy.com )反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等.
 (2013·山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为 (  )
A. B. C.36 D.
答案 B
解析 由题意知=91,解得x=4. ( http: / / www.21cnjy.com )所以s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]
=(16+9+1+0+1+9+0)=.
题型三 用样本的数字特征估计总体的数字特征
例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
HYPERLINK "http://www.21cnjy.com"
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价.
思维启迪 (1)先通过图象统计出甲、乙二人的成绩;
(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.
解 (1)由题图象可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
甲==13,
乙==13,
s=[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s=[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s>s可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
思维升华 平均数与方差都是重要的数字特 ( http: / / www.21cnjy.com )征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
 (1)(2012·山东)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是 (  )
A.众数 B.平均数 C.中位数 D.标准差
(2)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):
甲 10 8 9 9 9
乙 10 10 7 9 9
如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.
答案 (1)D (2)甲
解析 (1)对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.
(2)甲=乙=9环,s=[(10-9)2+(8-9)2+(9-9)2+(9-9)2+(9-9)2]=,
s=[(10-9)2+(10-9)2+(7-9)2+(9-9)2+(9-9)2]=>s,故甲更稳定,故填甲.
高考中频率分布直方图的应用
典例:(5分)为了研究大学生就业后的收入 ( http: / / www.21cnjy.com )问题,一个研究机构调查了在2009年已经就业且工作满两年的10 000人,并根据所得数据画了样本的频率分布直方图(如图所示).为了分析其收入与学历、职业、性别等方面的关系,要从这10 000人中再用分层抽样方法抽出200人作进一步调查,其中月收入低于1 500元的称为低收入者,高于3 000元的称为高收入者,则应在低收入者和高收入者中分别抽取的人数是 (  )
HYPERLINK "http://www.21cnjy.com"
A.1 000,2 000 B.40,80
C.20,40 D.10,20
思维启迪 根据频率分布直方图的意义,分 ( http: / / www.21cnjy.com )别计算出低收入者和高收入者的频率即可,为方便直接计算,这个频率分布直方图也可以看作是200个样本的频率分布直方图.
解析 低收入者的频率是0.000 2×500=0.1,故从低收入者中抽取200×0.1=20人;
高收入者的频率是(0.000 3+0.000 1)×500=0.2,
故从高收入者中抽取200×0.2=40人.故选C.
答案 C
温馨提醒 本题的难点是对频率分布直方图意义的 ( http: / / www.21cnjy.com )理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意.
HYPERLINK "http://www.21cnjy.com"
方法与技巧
1. 用样本频率分布来估计总体 ( http: / / www.21cnjy.com )分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.
2. 茎叶图、频率分布表和频率分布 ( http: / / www.21cnjy.com )直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
3. 若取值x1,x2,…, ( http: / / www.21cnjy.com )xn的频率分别为p1,p2,…,pn,则其平均值为x1p1+x2p2+…+xnpn;若x1,x2,…,xn的平均数为,方差为s2,则ax1+b,ax2+b,…,axn+b的平均数为a+b,方差为a2s2.
失误与防范
频率分布直方图的纵坐标为频率/组距,每一个小 ( http: / / www.21cnjy.com )长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
HYPERLINK "http://www.21cnjy.com"
A组 专项基础训练
(时间:40分钟)
一、选择题
1. (2013·重庆)下图是某公司10个 ( http: / / www.21cnjy.com )销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为 (  )
( http: / / www.21cnjy.com )
A.0.2 B.0.4
C.0.5 D.0.6
答案 B
解析 10个数据落在区间[22,30)内的数据有22,22,27,29共4个,因此,所求的频率为=0.4.故选B.
2. (2013·辽宁)某班的全体学生参加英 ( http: / / www.21cnjy.com )语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是 (  )
HYPERLINK "http://www.21cnjy.com"
A.45 B.50 C.55 D.60
答案 B
解析 由频率分布直方图,知低于60分的频率为
(0.01+0.005)×20=0.3.
∴该班学生人数n==50.
3. (2012·陕西)对某商店一个月内每天的顾客人数进行了统计,得到样本的
茎叶图(如图所示),则该样本的中位数、众数、极差分别是 (  )
A.46,45,56 B.46,45,53
C.47,45,56 D.45,47,53
答案 A
解析 由题意知各数为12,15 ( http: / / www.21cnjy.com ),20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,
50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.
4. 为了普及环保知识,增强环保意识,某大学 ( http: / / www.21cnjy.com )随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为mo,平均值为,则(  )
HYPERLINK "http://www.21cnjy.com"
A.me=mo= .me=mo<
C.me<mo< .mo<me<
答案 D
解析 30个数中第15个数是5,第16个数是6,所以中位数me==5.5,众数mo=5,平均值==.
5. 若一个样本容量为8的 ( http: / / www.21cnjy.com )样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为,方差为s2,则 (  )
A.=5,s2<2 B.=5,s2>2
C.>5,s2<2 D.>5,s2>2
答案 A
解析 考查样本数据的平均数及方差.
∵(x1+x2+…+x8)=5,
∴(x1+x2+…+x8+5)=5,
∴=5,由方差定义及意义可知加入新数据5后,样本数据取值的稳定性比原来强,
∴s2<2,故选A.
二、填空题
6. (2013·湖北)某学员在一次射击测试中射靶10次,命中环数如下:
7,8,7,9,5,4,9,10,7,4.
则:(1)平均命中环数为________;
(2)命中环数的标准差为________.
答案 (1)7 (2)2
解析 (1)=(7+8+7+9+5+4+9+10+7+4)==7.
(2)s2=[(7-7) ( http: / / www.21cnjy.com )2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,
∴命中环数的标准差为2.
7. (2012·山东)如图是根据部 ( http: / / www.21cnjy.com )分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.
HYPERLINK "http://www.21cnjy.com"
答案 9
解析 结合直方图和样本数据的特点求解.
最左边两个矩形面积之和为0.10×1+0 ( http: / / www.21cnjy.com ).12×1=0.22,总城市数为11÷0.22=50,最右边矩形面积为0.18×1=0.18,50×0.18=9.
8. 将容量为n的样本中的数据分成 ( http: / / www.21cnjy.com )6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.
答案 60
解析 ∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,
∴前三组频数和为·n=27,故n=60.
三、解答题
9. (2012·安徽)若某产品的 ( http: / / www.21cnjy.com )直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:
分组 频数 频率
[-3,-2) 0.10
[-2,-1) 8
(1,2] 0.50
(2,3] 10
(3,4]
合计 50 1.00
(1)将上面表格中缺少的数据填在相应位置;
(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;
(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.
解 (1)如下表所示频率分布表.
分组 频数 频率
[-3,-2) 5 0.10
[-2,-1) 8 0.16
(1,2] 25 0.50
(2,3] 10 0.20
(3,4] 2 0.04
合计 50 1.00
(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70.
(3)设这批产品中的合格品数为x件,依题意=,解得x=-20=1 980.
所以该批产品的合格品件数大约是1 980件.
10.(2012·广东)某校 ( http: / / www.21cnjy.com )100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
HYPERLINK "http://www.21cnjy.com"
(1)求图中a的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段 [50,60) [60,70) [70,80) [80,90)
x∶y 1∶1 2∶1 3∶4 4∶5
解 (1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005.
(2)由频率分布直方图知这100 ( http: / / www.21cnjy.com )名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).
(3)由频率分布直方图知语文成绩在[ ( http: / / www.21cnjy.com )50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.
由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×=20,30×=40,20×=25.
故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.
B组 专项能力提升
(时间:30分钟)
1. (2013·四川)某学校随机抽 ( http: / / www.21cnjy.com )取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是 (  )
( http: / / www.21cnjy.com )
HYPERLINK "http://www.21cnjy.com"
答案 A
解析 由于频率分布直方图的组距为5,排除C、D,又[0,5),[5,10)两组各一人,排除B,应选A.
2. 为了了解某校高三学生的视力情 ( http: / / www.21cnjy.com )况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图所示.由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为 (  )
HYPERLINK "http://www.21cnjy.com"
A.0.27,78 B.0.27,83
C.2.7,78 D.2.7,83
答案 A
解析 由题意,知4.5到4.6之间的 ( http: / / www.21cnjy.com )频率为0.09,4.6到4.7之间的频率为0.27,后6组的频数成等差数列,设公差为d,则有6×0.27+15d=1-0.01-0.03-0.09,解得d=-0.05,从而求得b=78.
3. 某班有48名学生,在一次考试 ( http: / / www.21cnjy.com )中统计出平均分为70分,方差为75,后来发现有2名同学的分数登错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是 (  )
A.70,75 B.70,50
C.75,1.04 D.62,2.35
答案 B
解析 因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,
则由题意可得:s2=[(x1-70)2+(x2-70)2+…+(80-70)2+(70-70)2+…+(x48-70)2],
而更正前有75=[(x1-70)2+(x2-70)2+…+(50-70)2+(100-70)2+…+(x48-70)2],
化简整理得s2=50.
4. 在样本的频率分布直 ( http: / / www.21cnjy.com )方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{an},已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为________.
答案 160
解析 ∵小长方形的面积由小到大构成等比数列{an},且a2=2a1,
∴样本的频率构成一个等比数列,且公比为2,
∴a1+2a1+4a1+8a1=15a1=300,∴a1=20,
∴小长方形面积最大的一组的频数为8a1=160.
5. 从某小学随机抽取10 ( http: / / www.21cnjy.com )0名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
HYPERLINK "http://www.21cnjy.com"
答案 0.030 3
解析 ∵小矩形的面积等于频率,∴ ( http: / / www.21cnjy.com )除[120,130)外的频率和为0.700,∴a==0.030.由题意知,身高在[120,130),[130,140),[140,150]内的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为=,
∴在[140,150]中选取的学生应为3人.
6. 某高校在2013年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下表所示.
组号 分组 频数 频率
第1组 [160,165) 5 0.050
第2组 [165,170) ① 0.350
第3组 [170,175) 30 ②
第4组 [175,180) 20 0.200
第5组 [180,185] 10 0.100
合计 100 1.00
(1)请先求出频率分布表中①、②位置相应数据,再完成下列频率分布直方图;
HYPERLINK "http://www.21cnjy.com"
(2)为了能选拔出最优秀的学生,高 ( http: / / www.21cnjy.com )校决定在笔试成绩高的第3、4、5组中用分层抽样的方法抽取6名学生进入第二轮面试,则第3、4、5组每组各抽取多少名学生进入第二轮面试?
(3)在(2)的前提下,学校决定在6名学生中随机抽取2名学生接受A考官进行面试,求:第4组至少有一名学生被考官A面试的概率.
解 (1)由题意可知,第2组的频数为0.35×100=35,
第3组的频率为=0.300,
频率分布直方图如图所示:
HYPERLINK "http://www.21cnjy.com"
(2)因为第3、4、5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,每组分别为
第3组:×6=3人,第4组:×6=2人,
第5组:×6=1人.
所以第3、4、5组分别抽取3人、2人、1人.
(3)设第3组的3位同学为A1,A2,A3,
第4组的2位同学为B1,B2,
第5组的1位同学为C1,
则从六位同学中抽两位同学有15种可能如下:
(A1,A2),(A1,A3),(A ( http: / / www.21cnjy.com )1,B1),(A1,B2),(A1,C1),(A2,A3),(A2,B1),(A2,B2),(A2,C1),(A3,B1),(A3,B2),(A3,C1),(B1,B2),(B1,C1),(B2,C1).
其中第4组的2位同学至少有一位同学 ( http: / / www.21cnjy.com )入选的有(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),(B1,C1),(B2,C1)9种可能,
所以第4组的2位同学至少有一位同学入选的概率为=.创新题目技能练——统计、统计案例
A组 专项基础训练
(时间:40分钟)
一、选择题
1. 从2 012名学生中 ( http: / / www.21cnjy.com )选取50名学生参加数学竞赛,若采用下面的方法选取:先用简单随机抽样从2 012人中剔除12人,剩下的2 000人再按系统抽样的方法抽取50人,则在2 012人中,每人入选的概率 (  )
A.不全相等 B.均不相等
C.都相等,且为 D.都相等,且为
答案 C
解析 在各种抽样中,不管是否剔除个体, ( http: / / www.21cnjy.com )也不管抽取的先后顺序,每个个体被抽到的可能性都是相等的,这是各种抽样的一个特点,也说明了抽样的公平性.故本题包括被剔除的12人在内,每人入选的概率是相等的,都是=.
2. 右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其
中左边的数字从左到右分别表示学生身高的百位数字和十位数字,
右边的数字表示学生身高的个位数字,从图中可以得到这10位同
学身高的中位数是 (  )
A.161 cm B.162 cm C.163 cm D.164 cm
答案 B
解析 由给定的茎叶图可知,这10位同学身高的中位数为=162(cm).
3. 已知数组(x1,y1),(x2,y2 ( http: / / www.21cnjy.com )),…,(x10,y10)满足回归直线方程=x+,则“(x0,y0)满足回归直线方程=x+”是“x0=,y0=”的 (  )
A.充分不必要条件 B.必要不充分条件
C.充要条件 D.既不充分也不必要条件
答案 B
解析 x0,y0为这10组数据的平均值,
根据公式计算回归直线方程=x+的以后,
再根据=-(,为样本平均值)求得.
因此(,)一定满足回归直线方程,但满足回归直线方程的除了(,)外,可能还有其他样本点.
4. 在样本频率分布直方图中,共有11个小 ( http: / / www.21cnjy.com )长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的,且样本容量为160,则中间一组的频数为 (  )
A.32 B.0.2 C.40 D.0.25
答案 A
解析 由频率分布直方图的性质,可设中间一组的频率为x,则x+4x=1,
∴x=0.2,故中间一组的频数为160×0.2=32,选A.
5. 若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则
这组数据的中位数和平均数分别是 (  )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
答案 A
解析 中位数为×(91+92)=91.5.
平均数为×(87+89+90+91+92+93+94+96)
=91.5.
二、填空题
6. 某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛
作品A给出的分数如茎叶图所示.记分员在去掉一个最高分
和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)
无法看清,若记分员计算无误,则数字x应该是________.
答案 1
解析 当x≥4时,
=≠91,∴x<4,
则=91,∴x=1.
7. 甲、乙两人在10天中每天加工零件 ( http: / / www.21cnjy.com )的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.
HYPERLINK "http://www.21cnjy.com"
答案 24 23
解析 甲=×(19+18+20+21+23+22+20+31+31+35)=24.
乙=×(19+17+11+21+24+22+24+30+32+30)=23.
8. 如图所示是某公司(员工总人数 ( http: / / www.21cnjy.com )300人)2012年员工年薪情况的频率分布直方图,由此可知,员工中年薪在2.4万元~2.6万元之间的共有________人.
HYPERLINK "http://www.21cnjy.com"
答案 72
解析 由所给图形,可知员工中年薪在2.4 ( http: / / www.21cnjy.com )万元~2.6万元之间的频率为1-(0.02+0.08+0.08+0.10+0.10)×2=0.24,
所以员工中年薪在2.4万元~2.6万元之间的共有300×0.24=72(人).
三、解答题
9. 某个体服装店经营某种服装,一周内获纯利y(元)与该周每天销售这种服装的件数x之间的一组数据如下:
x 3 4 5 6 7 8 9
y 66 69 73 81 89 90 91
已知:x=280,y=45 309,xiyi=3 487.
(1)求,;
(2)判断纯利润y与每天销售件数x之间是否线性相关,如果线性相关,求出回归直线方程.
解 (1)=(3+4+5+6+7+8+9)=6,
=(66+69+73+81+89+90+91)≈79.86.
(2)根据已知x=280,y=45 309,xiyi=3 487,得相关系数
r=≈0.973.
由于0.973>0.754,所以纯利润y与每天销售件数x之间具有显著的线性相关关系.
利用已知数据可求得回归直线方程为=4.75x+51.36.
10.某初级中学共有学生2 000名,各年级男、女生人数如表:
初一年级 初二年级 初三年级
女生 373 x y
男生 377 370 z
已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.
(1)求x的值;
(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?
(3)已知y≥245,z≥245,求初三年级中女生比男生多的概率.
解 (1)因为=0.19,所以x=380.
(2)初三年级人数为y+z=2 000-(373+377+380+370)=500,
现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为500×=12.
(3)设“初三年级中女生比男生多”的事件为A,初三年级中女生、男生人数记为(y,z);
由(2),知y+z=500 ( http: / / www.21cnjy.com ),且y,z∈N,基本事件空间包含的基本事件有(245,255)、(246,254)、(247,253)、…、(255,245)共11个,
事件A包含的基本事件有(251,249)、(252,248)、(253,247)、(254,246)、(255,245)共5个,
所以P(A)=.
B组 专项能力提升
(时间:30分钟)
1. 某地区选出600名消防官 ( http: / / www.21cnjy.com )兵参与灾区救援,将其编号为001,002,…,600.为打通生命通道,先采用系统抽样方法抽出50名为先遣部队,且随机抽得的号码为003.这600名官兵来源于不同的县市,从001到300来自A市,从301到495来自B市,从496到600来自C市,则三个市被抽中的人数依次为 (  )
A.26,16,8 B.25,17,8
C.25,16,9 D.24,17,9
答案 B
解析 依题意可知,在随机 ( http: / / www.21cnjy.com )抽样中,首次抽到003号,以后每隔12个号抽到一个人,则分别是003、015、027、039、051、063、075、…,容易知道抽到的编号构成以3为首项,12为公差的等差数列,故被抽到的第n名消防官兵的编号为an=3+(n-1)×12=12n-9,由1≤12nA-9≤300,则1≤nA≤25,因此抽取到的A市的人数为25人.
同理可知其他两市的人数为17和8.故选B.
2. 在2012年3月15日那天,南昌市物价 ( http: / / www.21cnjy.com )部门对本市5家商场某商品的一天销售量及其价格进行了调查,5家商场的售价x元和销售量y件之间的一组数据如表所示:
价格x 9 9.5 10 10.5 11
销售量y 11 10 8 6 5
通过散点图,可知销售量y与价格x之间有较好的线性相关关系,其回归直线方程是=-3.2x+,则等于 (  )
A.-24 B.35.6 C.40.5 D.40
答案 D
解析 由题意,得=×(9+9.5+10+10.5+11)=10,
=×(11+10+8+6+5)=8,
且回归直线必经过点(,)即点(10,8),
则有8=-3.2×10+ ,解得=40.
3. 已知某商场新进3 000袋 ( http: / / www.21cnjy.com )奶粉,为检查其三聚氰胺是否达标,现采用系统抽样的方法从中抽取150袋进行检查,若第一组抽出的号码是11,则第六十一组抽出的号码为________.
答案 1211
解析 每组袋数d==20,由题意知抽 ( http: / / www.21cnjy.com )出的这些号码是以11为首项,20为公差的等差数列,故第六十一组抽出的号码为11+60×20=1211.
4. 有同学在用电子邮件时发现了 ( http: / / www.21cnjy.com )一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少.为了研究国籍与邮箱名称是否含有数字有关,于是我们共收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.那么认为“国籍和邮箱名称里是否含有数字有关”的把握性为________.(用百分数表示)
P(χ2≥k0) 0.25 0.15 0.10 0.05 0.025 0.010
k0 1.323 2.072 2.706 3.841 5.024 6.635
答案 97.5%
解析 
中国人 外国人 总计
有数字 43 27 70
无数字 21 33 54
总计 64 60 124
由表中数据,得χ2=≈6.201,
∵χ2≥5.024,∴有97.5%的把握认为“国籍和邮箱名称里是否含有数字有关”.
5. 某校高三数学竞赛初赛后,对考 ( http: / / www.21cnjy.com )生成绩进行统计(考生成绩均不低于90分,满分150分),将成绩按如下方式分成六组,第一组[90,100),第二组[100,110),……,第六组[140,150].如图所示为其频率分布直方图的一部分,第四组,第五组,第六组的人数依次成等差数列,且第六组有4人.
HYPERLINK "http://www.21cnjy.com"
(1)请补充完整频率分布直方图,并估计这组数据的平均数M;(计算时可以用组中值代替各组数据的平均值)
(2)现根据初赛成绩从第四组和第六组中 ( http: / / www.21cnjy.com )任意选2人,记他们的成绩分别为x,y,若|x-y|≥10,则称此2人为“黄金帮扶组”,试求选出的2人为“黄金帮扶组”的概率.
解 (1)设第四组,第五组的频率分别为m,n,
则2n=m+0.005×10, ①
m+n=1-(0.005+0.015+0.020+0.035)×10, ②
由①②解得m=0.15,n=0.1,
从而得出频率分布直方图(如图所示).
HYPERLINK "http://www.21cnjy.com"
M=95×0.2+105×0.15+115×0.35+125×0.15+135×0.1+145×0.05=114.5.
(2)依题意,知第四组人数为4×=12,而第六组有4人,所以第四组和第六组一共有16人,从中任选2人,一共有C=120(种)选法,若满足|x-y|≥10,则一定是分别从两个小组中各选1人,因此有CC=48(种)选法,
所以选出的2人为“黄金帮扶组”的概率P==.§11.3 变量间的相关关系、统计案例
HYPERLINK "http://www.21cnjy.com"
1. 变量间的相关关系
( http: / / www.21cnjy.com )
2. 散点图
以一个变量的取值为横坐标,另一个变量的相应取值为纵坐标,在直角坐标系中描点,这样的图形叫做散点图.
3. 回归直线方程与回归分析
(1)直线方程 =a+bx,叫做Y对x的回归直线方程,b叫做回归系数.要确定回归直线方程,只要确定a与回归系数b.
(2)用最小二乘法求回归直线方程中的a,b有下列公式
=, =- ,其中的 , 表示是求得的a,b的估计值.
(3)相关性检验
①计算相关系数r,r有以下性质:|r|≤1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱;
②|r|>r0.05,表明有95%的把握认为变量x与Y直线之间具有线性相关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义.
4. 独立性检验
(1)2×2列联表:
B 合计
A n11 n12 n1+
n21 n22 n2+
合计 n+1 n+2 n
其中n1+=n11+n12,n2+=n21+n22,n+1=n11+n21,n+2=n12+n22,n=n11+n21+n12+n22.
(2)χ2统计量:
χ2=.
(3)两个临界值:3.841与6.635
当χ2>3.841时,有95%的把握说事件A与B有关;
当χ2>6.635时,有99%的把握说事件A与B有关;
当χ2≤3.841时,认为事件A与B是无关的.
1. 判断下面结论是否正确(请在括号中打“√”或“×”)
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系. ( × )
(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √ )
(3)只有两个变量有相关关系,所得到的回归模型才有预测价值. ( √ )
(4)某同学研究卖出的热饮杯数y与气温x ( http: / / www.21cnjy.com )(℃)之间的关系,得回归方程=-2.352x+147.767,则气温为2℃时,一定可卖出143杯热饮. ( × )
(5)事件X,Y关系越密切,则由观测数据计算得到的χ2的值越大. ( √ )
(6)由独立性检验可知,有99%的把握 ( http: / / www.21cnjy.com )认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀. ( × )
2. 下面哪些变量是相关关系 (  )
A.出租车车费与行驶的里程
B.房屋面积与房屋价格
C.身高与体重
D.铁块的大小与质量
答案 C
3. 为了评价某个电视栏目的改革效果, ( http: / / www.21cnjy.com )在改革前后分别从居民点抽取了100位居民进行调查,经过计算χ2≈0.99,根据这一数据分析,下列说法正确的是 (  )
A.有99%的人认为该电视栏目优秀
B.有99%的人认为该电视栏目是否优秀与改革有关系
C.有99%的把握认为该电视栏目是否优秀与改革有关系
D.没有理由认为该电视栏目是否优秀与改革有关系
答案 D
解析 只有χ2≥6.635才能有 ( http: / / www.21cnjy.com )99%的把握认为该电视栏目是否优秀与改革有关系,而既使χ2≥6.635也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,与是否有99%的人等无关.故只有D正确.
4. 在一项打鼾与患心脏病 ( http: / / www.21cnjy.com )的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(填“有关”或“无关”).
答案 有关
5. 某医疗研究所为了检验某种血清 ( http: / / www.21cnjy.com )预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,已知P(χ2≥3.841)≈0.05.对此,四名同学作出了以下的判断:
p:有95%的把握认为“这种血清能起到预防感冒的作用”;
q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒;
r:这种血清预防感冒的有效率为95%;
s:这种血清预防感冒的有效率为5%.
则下列结论中,正确结论的序号是________.
①p∧綈q;②綈p∧q;③(綈p∧綈q)∧(r∨s);
④(p∨綈r)∧(綈q∨s).
答案 ①④
解析 本题考查了独立性检验的 ( http: / / www.21cnjy.com )基本思想及常用逻辑用语.由题意,得χ2≈3.918,P(χ2≥3.841)≈0.05,所以,只有第一位同学的判断正确,即有95%的把握认为“这种血清能起到预防感冒的作用”.由真值表知①④为真命题.
HYPERLINK "http://www.21cnjy.com"
题型一 相关关系的判断
例1 5个学生的数学和物理成绩如下表:
 学生学科   A B C D E
数学 80 75 70 65 60
物理 70 66 68 64 62
画出散点图,并判断它们是否具有相关关系.
思维启迪 将每个学生的数学成绩和物理成绩分别作为点的横坐标和纵坐标,作散点图,然后根据散点图判断两个变量是否存在相关关系.
解 以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示.
HYPERLINK "http://www.21cnjy.com"
由散点图可知,各组数据对应点大致在一条直线附近,所以两者之间具有相关关系,且为正相关.
思维升华 判断变量之间有无相关关系,一 ( http: / / www.21cnjy.com )种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关性,是不是存在线性相关关系,是正相关还是负相关,相关关系是强还是弱.
 (1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图②,由这两个散点图可以判断(  )
HYPERLINK "http://www.21cnjy.com"
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
答案 C
(2)(2012·课标全国)在一组样本数据 ( http: / / www.21cnjy.com )(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为 (  )
A.-1 B.0
C. D.1
答案 D
解析 利用相关系数的意义直接作出判断.
样本点都在直线上时,其数据的估计值与真实值是相等的,即yi=,代入相关系数公式r==1.
题型二 线性回归分析
例2 某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:
零件的个数x(个) 2 3 4 5
加工的时间y(小时) 2.5 3 4 4.5
(1)在给定的坐标系中画出表中数据的散点图;
HYPERLINK "http://www.21cnjy.com"
(2)求出y关于x的回归直线方程=x+,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少小时?
(注:=,=- )
思维启迪 求回归直线方程的系数时,为防止出错,应分别求出公式中的几个量,再代入公式.
解 (1)散点图如图.
HYPERLINK "http://www.21cnjy.com"
(2)由表中数据得:iyi=52.5,
=3.5,=3.5,=54,
∴ =0.7,∴ =1.05,
∴ =0.7x+1.05,回归直线如图所示.
HYPERLINK "http://www.21cnjy.com"
(3)将x=10代入回归直线方程,得 =0.7×10+1.05=8.05,
故预测加工10个零件约需要8.05小时.
思维升华 (1)回归直线方程 =x+必过样本点的中心(,).
(2)在分析两个变量的相 ( http: / / www.21cnjy.com )关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过回归直线方程估计和预测变量的值.
 为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:
时间x 1 2 3 4 5
命中率y 0.4 0.5 0.6 0.6 0.4
小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.
答案 0.5 0.53
解析 小李这5天的平均投篮命中率
==0.5,可求得小李这5天的平均打篮球 ( http: / / www.21cnjy.com )时间=3.根据表中数据可求得 =0.01, =0.47,故回归直线方程为 =0.47+0.01x,将x=6代入得6号打6小时篮球的投篮命中率约为0.53.
题型三 独立性检验
例3 为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
 性别是否需要志愿者       男 女
需要 40 30
不需要 160 270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.
(2)能否有99.5%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.
思维启迪 直接计算χ2的值,然后利用表格下结论.
解 (1)调查的500位老年人 ( http: / / www.21cnjy.com )中有70位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为×100%=14%.
(2)χ2=≈9.967.
由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.
(3)由(2)的结论知,该地区老年人是否 ( http: / / www.21cnjy.com )需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样方法更好.
思维升华 (1)根据样本估计总体是抽样分析的一个重要内容.要使估计的结论更加准确,抽样取得的样本很关键.
(2)根据独立性检验知,需要提供服务的老人与性别有关,因此在调查时,采取男、女分层抽样的方法更好,从而看出独立性检验的作用.
 某中学对“学生性别和是否喜欢看NBA比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看NBA的人数占男生人数的,女生喜欢看NBA的人数占女生人数的.
(1)若被调查的男生人数为n,根据题意建立一个2×2列联表;
(2)若有95%的把握认为是否喜欢看NBA和性别有关,求男生至少有多少人?
解 (1)由已知得:
喜欢看NBA 不喜欢看NBA 总计
男生 n
女生
总计 n
(2)χ2==n.
若有95%的把握认为是否喜欢看NBA和性别有关,
则χ2>3.841,即n>3.841,n>10.24.
∵,为整数,∴n最小值为12.
即:男生至少12人.
统计中的数形结合思想
典例:(12分)某地10户家庭的年收入和年饮食支出的统计资料如表所示:
年收入x(万元) 2 4 4 6 6 6 7 7 8 10
年饮食支出y(万元) 0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3
(1)根据表中数据,确定家庭的年收入和年饮食支出的相关关系;
(2)如果某家庭年收入为9万元,预测其年饮食支出.
思维启迪 可以画出散点图,根据图中点的分布判断家庭年收入和年饮食支出的线性相关性.
规范解答
解 (1)由题意,知年收入x为解释变量,年饮食支出y为预报变量,作散点图如图所示.
HYPERLINK "http://www.21cnjy.com"
[3分]
从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用回归直线方程刻画它们之间的关系. [4分]
因为=6,=1.83,=406,=35.13,
iyi=117.7,
所以=≈0.172,
=-≈1.83-0.172×6=0.798.
从而得到回归直线方程为=0.172x+0.798.[8分]
(2)=0.172×9+0.798=2.346(万元).
所以家庭年收入为9万元时,可以预测年饮食支出约为2.346万元.[12分]
温馨提醒 (1)在统计中,用样本 ( http: / / www.21cnjy.com )的频率分布表、频率分布直方图、统计图表中的茎叶图、折线图、条形图,去估计总体的相关问题,以及用散点图判断相关变量的相关性等都体现了数与形的完美结合.借助于形的直观,去统计数据,分析数据,无不体现了数形结合的思想.
(2)本题利用散点图分析两变量间的相关关系,充分体现了数形结合思想的应用.
(3)本题易错点为散点图画的不准确,导致判断错误.
HYPERLINK "http://www.21cnjy.com"
方法与技巧
1. 求回归方程,关键在于 ( http: / / www.21cnjy.com )正确求出系数 , ,由于 , 的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中一次项系数为 ,常数项为 ,这与一次函数的习惯表示不同.)
2. 回归分析是处理变量相关关系的一 ( http: / / www.21cnjy.com )种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出回归直线方程.
3. 根据χ2的值可以判断两个分类变量有关的可信程度.
失误与防范
1. 相关关系与函数关系的区别
相关关系与函数关系不同.函数 ( http: / / www.21cnjy.com )关系中的两个变量间是一种确定性关系.例如正方形面积S与边长x之间的关系S=x2就是函数关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例如商品的销售额与广告费是相关关系.两个变量具有相关关系是回归分析的前提.
2. 回归分析是对具有相关关系的两个变量进 ( http: / / www.21cnjy.com )行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
HYPERLINK "http://www.21cnjy.com"
A组 专项基础训练
(时间:40分钟)
一、选择题
1. 某地区调查了2~9岁的 ( http: / / www.21cnjy.com )儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为=8.25x+60.13,下列叙述正确的是 (  )
A.该地区一个10岁儿童的身高为142.63 cm
B.该地区2~9岁的儿童每年身高约增加8.25 cm
C.该地区9岁儿童的平均身高是134.38 cm
D.利用这个模型可以准确地预算该地区每个2~9岁儿童的身高
答案 B
2. 设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,
直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),
以下结论中正确的是 (  )
A.直线l过点(,)
B.x和y的相关系数为直线l的斜率
C.x和y的相关系数在0到1之间
D.当n为偶数时,分布在l两侧的样本点的个数一定相同
答案 A
解析 因为相关系数是表示两个变 ( http: / / www.21cnjy.com )量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以B、C错误.D中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以D错误.根据线性回归直线一定经过样本点中心可知A正确.
3. (2012·湖南)设某大学的女 ( http: / / www.21cnjy.com )生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是 (  )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
答案 D
解析 由于回归直线方程中x的系数为0.85,
因此y与x具有正的线性相关关系,故A正确.
又回归直线方程必过样本点中心(,),因此B正确.
由回归直线方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确.
当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确.
4. 通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男 女 总计
爱好 40 20 60
不爱好 20 30 50
总计 60 50 110
计算可得χ2=≈7.8.
附表:
P(χ2≥k) 0.050 0.010
k 3.841 6.635
参照附表,得到的正确结论是 (  )
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
答案 A
解析 根据独立性检验的定义,由χ2≈7.8>6.635可知我们有99%以上的把握认为“爱好该项运动与性别有关”,故选A.
5. (2013·大连模拟)某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元) 4 2 3 5
销售额y(万元) 49 26 39 54
根据上表可得回归直线方程 = x+ 中的 为9.4,据此模型预报广告费用为6万元时销售额为 (  )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
答案 B
解析 ∵==,==42,
又 = x+ 必过(,),
∴42=×9.4+ ,∴ =9.1.
∴回归直线方程为 =9.4x+9.1.
∴当x=6时, =9.4×6+9.1=65.5(万元).
二、填空题
6. 以下四个命题,其中正确的序号是________.
①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
②两个随机变量相关性越强,则相关系数的绝对值越接近于1 ;
③在回归直线方程 =0.2x+12中,当解释变量x每增加一个单位时,预报变量 平均增加0.2个单位;
④对分类变量X与Y,它们的随机变量χ2来说,χ2越小,“X与Y有关系”的把握程度越大.
答案 ②③
解析 ①是系统抽样;对于④,随机变量χ2越小,说明两个相关变量有关系的把握程度越小.
7. 已知回归方程=4.4x+838.19,则可估计x与y的增长速度之比约为________.
答案 5∶22
解析 x每增长1个单位,y增长4.4个单位,故增长的速度之比约为1∶4.4=5∶22.
事实上所求的比值为回归直线方程斜率的倒数.
8. 某数学老师身高176 cm, ( http: / / www.21cnjy.com )他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm.
答案 185
解析 儿子和父亲的身高可列表如下:
父亲身高 173 170 176
儿子身高 170 176 182
设回归直线方程为 = + x,由表中 ( http: / / www.21cnjy.com )的三组数据可求得 =1,故 =- =176-173=3,故回归直线方程为 =3+x,将x=182代入得孙子的身高为185 cm.
9. 某企业有两个分厂生产某种零件 ( http: / / www.21cnjy.com ),按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
甲厂:
( http: / / www.21cnjy.com )
乙厂:
( http: / / www.21cnjy.com )
(1)试分别估计两个分厂生产的零件的优质品率;
(2)由以上统计数据填下面2×2列联表,问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?
甲厂 乙厂 合计
优质品
非优质品
合计
解 (1)甲厂抽查的500件产品中有360件优质品,从而估计甲厂生产的零件的优质品率为=72%;
乙厂抽查的500件产品中有320件优质品,从而估计乙厂生产的零件的优质品率为=64%.
(2)完成的2×2列联表如下:
甲厂 乙厂 合计
优质品 360 320 680
非优质品 140 180 320
合计 500 500 1 000
由表中数据计算
χ2=≈7.35>6.635,
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.
10.(2013·重庆)从某居民区随机 ( http: / / www.21cnjy.com )抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,iyi=184,=720.
(1)求家庭的月储蓄 对月收入x的回归直线方程 = x+ ;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:回归直线方程 = x+ 中, =, =- ,其中,为样本平均值.
解 (1)由题意知n=10,=i==8,
=i==2,
又lxx=-n 2=720-10×82=80,
lxy=iyi-n =184-10×8×2=24,
由此得 ===0.3,
=- =2-0.3×8=-0.4,
故所求回归直线方程为 =0.3x-0.4.
(2)由于变量y的值随x值的增加而增加( =0.3>0),故x与y之间是正相关.
(3)将x=7代入回归方程可以预测该家庭的月储蓄为 =0.3×7-0.4=1.7(千元).
B组 专项能力提升
(时间:30分钟)
1. 下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②设有一个回归方程 =3-5x,变量x增加一个单位时,y平均增加5个单位;
③回归方程 = x+ 必过(,);
④有一个2×2列联表中,由计算得χ2=13.079,则有99%的把握确认这两个变量间有关系.
其中错误的个数是 (  )
A.0 B.1
C.2 D.3
答案 B
解析 一组数据都加上或减去同一个 ( http: / / www.21cnjy.com )常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程 =3-5x,当x增加一个单位时,y平均减少5个单位,②错误;由回归直线方程的定义知,回归直线方程 = x+ 必过点(,),③正确;因为χ2=13.079>6.635,故有99%的把握确认这两个变量有关系,④正确.故选B.
2. (2013·福建)已知x与y之间的几组数据如下表:
x 1 2 3 4 5 6
y 0 2 1 3 3 4
假设根据上表数据所得线性回归直线方程 ( http: / / www.21cnjy.com ) = x+ ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是 (  )
A. >b′, >a′ B. >b′, C. a′ D. 答案 C
解析 b′=2,a′=-2,由公式 =求得.
=, =- =-×=-,
a′.选C.
3. 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:
优秀 非优秀 总计
甲班 10 b
乙班 c 30
合计
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是(  )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”
答案 C
解析 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,
所以c=20,b=45,选项A、B错误.
根据列联表中的数据,得到χ2=≈6.6>3.841,
因此有95%的把握认为“成绩与班级有关系”.
4. 某车间为了规定工时定 ( http: / / www.21cnjy.com )额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.
零件数x(个) 10 20 30 40 50
加工时间y(min) 62 75 81 89
现发现表中有一个数据看不清,请你推断出该数据的值为________.
答案 68
解析 由已知可计算求出=30,而回归直线必过点(,),
则=0.67×30+54.9=75,设模糊数字为a,则
=75,计算得a=68.
5. 为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:
喜爱打篮球 不喜爱打篮球 总计
男生 20 5 25
女生 10 15 25
总计 30 20 50
则在犯错误的概率不超过________的前提下认为喜爱打篮球与性别有关(请用百分数表示).
P(χ2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001
k0 2.706 3.841 5.024 6.635 7.879 10.828
答案 0.5%
解析 χ2=≈8.333>7.879,
所以在犯错误的概率不超过0.005的前提下认为喜爱打篮球与性别有关.
6. (2013·福建)某工厂有25周岁以上 ( http: / / www.21cnjy.com )(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
HYPERLINK "http://www.21cnjy.com"
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80件者 ( http: / / www.21cnjy.com )为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?
附:χ2=
P(χ2≥k) 0.100 0.050 0.010 0.001
k 2.706 3.841 6.635 10.828
解 (1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.
所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;
25周岁以下组工人有40×0.05=2(人),记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有1 ( http: / / www.21cnjy.com )0种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
其中,至少有1名“25周岁以下组”工人的可能 ( http: / / www.21cnjy.com )结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
故所求的概率P=.
(2)由频率分布直方图可知,在抽取的1 ( http: / / www.21cnjy.com )00名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可得2×2列联表如下:
生产能手 非生产能手 合计
25周岁以上组 15 45 60
25周岁以下组 15 25 40
合计 30 70 100
所以得χ2==≈1.79.
因为1.79<2.706.
所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.
同课章节目录