(本栏目内容,学生用书中以活页形式单独装订成册!)
一、选择题(每小题6分,共36分)
1.下列抽取样本的方式是简单随机抽样的有( )
①从无限多个个体中抽取50个个体作为样本;
②箱子里有100枝铅笔,今从中选取10枝进行检验.在抽样操作时,从中任意拿出一枝检测后再放回箱子里;
③从50个个体中一次性抽取5个个体作为样本.
A.0个 B.1个
C.2个 D.3个
【解析】 可利用简单随机抽样所具备的4个特点来判断.①②③均不是简单随机抽样,原因是:①中总体的个数不是有限个;②是放回抽样;③不是逐个抽取.所以①②③均不是简单随机抽样.
【答案】 A
2.要完成下列两项调查:
①从某社区125户高收入家庭,280户中等收入家庭,95户低收入家庭中选出100户调查社会购买力的某项指标;
②从某中学高一年级的12名体育特长生中选出3人调查学习负担情况.
应采用的抽样方法是( )
A.①②都用随机抽样法
B.①用分层抽样法,②用简单随机抽样法
C.①②都用分层抽样法
D.①用简单随机抽样法,②用分层抽样法
【解析】 由简单随机抽样和分层抽样的特点可知①应用分层抽样,②由于个体较少,采用简单随机抽样即可.
【答案】 B
3.为了了解某市高三毕业生升学考试中数学成绩的情况,从参加考试的学生中随机地抽查了1 000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )
A.总体指的是该市参加升学考试的全体学生
B.个体指的是1 000名学生中的每一名学生
C.样本容量指的是1 000名学生
D.样本是指1 000名学生的数学升学考试成绩
【解析】 因为是了解学生的数学成绩的情况,因此样本是指1 000名学生的数学成绩,而不是学生.
【答案】 D
4.为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为( )
A.3,2 B.2,3
C.2,30 D.30,2
【解析】 因为92÷30不是整数,因此必须先剔除部分个体数,因为92÷30=3……2,故剔除2个即可,而间隔为3.
【答案】 A
5. 某学校有高一学生720人,现从高一、高二、高三这三个年级学生中采用分层抽样的方法,抽取180人进行英语水平测试.已知抽取的高一学生数是抽取的高二学生数、高三学生数的等差中项,且高二年级抽取40人,则该校高三学生人数是( )
A.480 B.640
C.800 D.960
【解析】 设抽取高一学生x人,抽取高三学生y人,高三学生总人数为z人,则由题意得:
求得又由=,
则z=960.故选D.
【答案】 D
6.(2008年广东卷)某校共有学生2 000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( )
一年级
二年级
三年级
女生
373
x
y
男生
377
370
z
A.12 B.16
C.18 D.24
【解析】 由已知可得二年级女生人数为2 000×0.19=380,
∴一、二、三年级学生总数分别为750、750、500,
∴应在三年级抽取的学生数为
64×=16.故选B.
【答案】 B
二、填空题(每小题6分,共18分)
7.用系统抽样法从160名学生中抽取容量为20的样本,将160名学生随机地进行1~160的编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是________.
【解析】 平均分成20组,每组有8个编号.
因此设第一组抽取的编号为n,
则n+8×15=126,n=6.
【答案】 6
8.某学校共有师生2 400人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________.
【解析】 设教师人数为n,由=,得n=150.
【答案】 150
9.一个工厂生产了2 400件某种产品,它们来自甲、乙、丙3条生产线,现采用分层抽样的方法对这批产品进行抽样检查.已知从甲、乙、丙3条生产线依次抽取的产品个数恰好组成一个等差数列,且知这批产品中甲生产线生产的产品数量是6 000件,则这批产品中丙生产线生产的产品数量是________件.
【解析】 由甲生产线共生产了6 000件,而总体共有24 000,故每个个体被抽到的概率为=,因此甲生产线共抽到了6 000×=1 500件,而乙丙两生产线共可抽取18 000×=4 500件,设丙抽取了n件,则乙抽取了4 500-n,由三者成等差数列可得:2(4 500-n)=1 500+n?n=2 500,即丙抽取了2 500件样品,而由于每个个体被抽取的概率均相等为,故丙生产线共生产了=?N=10 000件.
【答案】 10 000
三、解答题(共46分)
10.(15分)从某厂生产的905辆家用轿车中随机抽取90辆测试某项性能,请合理选择抽样方法进行抽样,并写出抽样过程.
【解析】 可用系统抽样法进行抽样,抽样步骤如下:
(1)将905辆轿车用随机方式编号;
(2)从总体中剔除5辆(剔除法可用随机数表法),将剩下的900辆轿车重新编号(分别为001,002,…,900)并分成90段;
(3)在第一段001,002,…,010这十个编号中用简单随机抽样抽出一个作为起始号码(如006);
(4)把起始号码依次加间隔10,可获得样本.
11.(15分)某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中的一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.
(1)在游泳组中,试确定青年人、中年人、老年人分别所占的比例;
(2)在游泳组中,试确定青年人、中年人、老年人分别应抽取的人数.
【解析】 (1)设登山组人数为x,在游泳组中,青年人、中年人、老年人各占比例分别为a、b、c,则有=47.5%,=10%,解得b=50%,c=10%.
故a=100%-50%-10%=40%,即在游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.
(2)在游泳组中,抽取的青年人人数为200××40%=60(人);抽取的中年人人数为200××50%=75(人);抽取的老年人人数为200××10%=15(人).
12.(16分)某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本.如果采用系统抽样和分层抽样方法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n.
【解析】 总体容量为6+12+18=36.
当样本容量是n时,由题意知,系统抽样的间隔为,分层抽样的比例是,抽取的工程师人数为·6=,技术员人数为·12=,技工人数为·18=,所以n应是6的倍数,36的约数,即n=6,12,18.
当样本容量为(n+1)时,总体容量是35人,系统抽样的间隔为,因为必须是整数,所以n只能取6.
即样本容量n=6.
课件30张PPT。1.理解随机抽样的必要性和重要性.
2.会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样.
3.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
4.理解样本数据的标准差的意义和作用,会计算数据标准差.
5.能从样本数据中提取基本的数字特征(如平均数,标准差),并给出合理的解释.
6.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.7.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
8.会作两个相关联变量数据的散点图,会利用散点图认识变量间的相关关系.
9.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
10.了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.
(1)了解独立检验(只要求2×2列联表)的基本思想、方法及其简单应用.
(2)了解假设检验的基本思想、方法及其简单应用.
(3)了解回归的基本思想、方法及其简单应用第一节 抽样方法1.抽样调查
(1)抽样调查
通常情况下,从调查对象中按照一定的方法抽取一部分进行 ,获取数据,并以此对调查对象的某项指标作出 ,这就是抽样调查.
(2)总体和样本
调查对象的 称为总体,被抽取的 称为样本.
(3)抽样调查与普查相比有很多优点,最突出的有两点:
① ;
②节约人力、物力、财力.调查或观测推断一部分全体迅速、及时2.简单随机抽样
(1)一般地,设一个总体含有N个个体,从中逐个不放回的抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的概率相等,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样方法有两种—— 法和 法.抽签随机数差异明显的几个部分(1)适用于总体由差异明显的几部分组成的情况.
(2)更能充分反映总体的情况.
(3)是等可能抽样.
(4)当各层抽取的个体数目确定后,每层中的样本抽取仍可用简单随机抽样或系统抽样方法,甚至还可以再次使用分层抽样.
4.系统抽样
系统抽样是将总体的个体进行编号,按照简单随机抽样抽取第一个样本,然后按 抽取其他样本.
系统抽样又叫 或 .相同的间隔等距抽样机械抽样(1)由系统抽样的定义可知系统抽样有以下特征:
①当总体容量N较大时,采用系统抽样.
②将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样.
③预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.
(2)系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学中的转化思想.5.简单随机抽样、系统抽样、分层抽样的比较:1.在简单随机抽样中,某一个个体被抽到的可能性是( )
A.与第几次抽样有关,第一次抽到的可能性最大
B.与第几次抽样有关,第一次抽到的可能性最小
C.与第几次抽样无关,每一次抽到的可能性相等
D.与第几次抽样无关,与抽取几个样本有关
【解析】 在简单随机抽样中,每个个体被抽到的概率是相等的,与第几次抽无关.
【答案】 C2.有20们同学,编号从1~20,现在从中抽取4人的作文卷进行调查,用系统抽样方法确定所抽的编号为( )
A.5,10,15,20 B.2,6,10,14
C.2,4,6,8 D.5,8,11,14
【解析】 将20分成4个组,每组5个号,间隔等距离为5.
【答案】 A3.某大型超市销售的乳类商品有4类:鲜奶、酸奶、婴幼儿奶粉、成人奶粉,且鲜奶、酸奶、婴幼儿奶粉、成人奶粉分别有45种、10种、25种、20种不同的品牌,现从中抽取一个容量为20的样本进行三聚氰胺的安全检测,若采用分层抽样的方法抽取样本,则抽取的酸奶与成人奶粉品牌数之和是( )
A.7 B.6
C.5 D.4【答案】 B4.为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为________.【答案】 405.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n=________.【答案】 80【答案】 B某校高中三年级的295名学生已经编号为1,2,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.
【解析】 按1∶5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号.
按照1∶5的比例,应该抽取的样本容量为295÷5=59,我们把这295名同学分成59组,每组5人.第1组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,第59组是编号为291~295的5名学生.
采用简单随机抽样的方法,从第1组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5,k∈N*),那么抽取的学生编号为k+5l(l=0,1,2,…,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,…,288,293.在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为:①采用随机的方法将总体中个体编号;②将整体编号进行分段,确定分段间隔k(k∈N*);③在第1段内采用简单随机抽样的方法确定起始个体编号l;④按照事先预定的规则抽取样本.1.某单位有在岗职工共624人,为了调查工人用于上班途中的时间,决定抽取68名工人进行调查.如何用系统抽样方法完成这一抽样?
【解析】 因为624=68×9+12,为了保证“等距”分段,应先剔除12人.
第一步:将624名职工按随机方式进行编号;
第二步:从总体中剔除12人(剔除方法可用随机数表法),将剩下的612名职工重新编号(分别为000,001,002,…,611),并分成68段;
第三步:在第1段000,001,002,…,008这9个编号中,用简单随机抽样法抽出一个不妨设编号为k作为起始号码;
第四步:在各段中抽取的职工编号为k+9l(l=0,1,2,…67),得到68个个体作为样本,如k=003时样本为003,012,021,…,606.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取.分层抽样的操作步骤:
①将总体按一定标准进行分层;
②计算各层的个体数与总体数的比,按各层个体数占总体数的比确定各层应抽取的样本容量;
③在每一层进行抽样(可用简单随机抽样或系统抽样).2.一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.本节主要考查学生在应用问题中构造抽样模型、识别模型、收集数据等能力方法,是统计学中最基础的知识.在高考试题中主要以选择题或填空题的形式出现,题目多为中低档题,重在考查抽样方法的应用.
1.(2009年陕西卷)某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( )
A.9 B.18
C.27 D.36【答案】 B2.(2009年广东卷)某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.
【答案】 37 20课时作业
点击进入链接
(本栏目内容,学生用书中以活页形式单独装订成册!)
一、选择题(每小题6分,共36分)
1.下列关系中,是相关关系的为( )
①学生的学习态度与学习成绩之间的关系;
②教师的执教水平与学生的学习成绩之间的关系;
③学生的身高与学生的学习成绩之间的关系;
④家庭的经济条件与学生的学习成绩之间的关系.
A.①② B.①③
C.②③ D.②④
【解析】 学生的学习成绩与学生的学习态度和教师的执教水平是相关的,与学生的身高和家庭经济条件不相关.
【答案】 A
2.下列命题:
①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;
②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;
③通过回归直线y=bx+a及回归系数b,可以估计和预测变量的取值和变化趋势.
其中正确的命题是( )
A.①② B.①③
C.②③ D.①②③
【解析】 利用最小二乘法求回归直线就是求样本数据的点到直线的距离的平方和最小值.利用回归直线,可以进行预测.而从散点图的分布可以判断是否线性相关.
【答案】 D
3.回归方程y=1.5x-15,则( )
A.y=1.5-15 B.15是回归系数a
C.1.5是回归系数a D.x=10时,y=0
【解析】 由a=-b得=b+a,即为A.
【答案】 A
4.下列叙述中:( )
①变量间关系有函数关系,还有相关关系;
②回归函数即用函数关系近似地描述相互关系;
③i=x1+x2+…+xn;
④线性回归方程y=bx+a中,b=,a=-b;
⑤线性回归方程一定可以近似地表示所有相关关系.其中正确的有( )
A.①②③ B.①②③④⑤
C.①②③④ D.③④⑤
【解析】 ①②③④显然正确,线性回归方程不一定可以近似地表示所有相关关系,如它不可表示非线性的相关关系,因此,⑤错误,所以选C.
【答案】 C
5.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为y=0.66x+1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )
A.83% B.72%
C.67% D.66%
【解析】 将y=7.675代入回归方程,可计算得x≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.
【答案】 A
6.三点(3,10),(7,20),(11,24)的线性回归方程为( )
A.y=1.75x-5.75 B.y=1.75x+5.75
C.y=-1.75x+5.75 D.y=-1.75x-5.75
【解析】 方法一:设回归直线方程为y=bx+a,则
b=
=
=1.75,
a=-b =18-1.75×7=5.75.
故y=1.75x+5.75,故选B.
方法二:将点代入选项用代入法检验可排除A、C、D.
【答案】 B
二、填空题(每小题6分,共18分)
7.如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据的线性相关性最大.
【解析】 因为A、B、C、E四点分布在一条直线附近且贴近某一直线,D点离得远.
【答案】 D
8.下表是某地的年降雨量与年平均气温,判断两者是否是相关关系________.(填“是”或“否”)
年平均气温(℃)
12.51
12.84
12.84
13.69
13.33
12.74
13.05
年降雨量(mm)
748
542
507
813
547
701
432
【解析】 由于散点图中各点并不在一条直线的附近,所以它们不具有相关关系.
【答案】 否
9.已知回归方程y=4.4x+838.19,则可估计x与y增长速度之比约为________.
【解析】 Δy=y2-y1=4.4(x2-x1),
∴==≈0.227.
【答案】 0.227
三、解答题(共46分)
10.(15分)山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg).
施化肥量x
15
20
25
30
35
40
45
棉花产量y
330
345
365
405
445
450
455
(1)画出散点图;
(2)判断是否具有相关关系.
【解析】 (1)散点图如图所示,
(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.
11.(15分)已知变量x,y线性相关,x与y有下列对应数据:
x
1
2
3
4
y
2
3
求y对x的回归直线方程.
【解析】 ==,==,
i2=12+22+32+42=30,iyi=1×+2×+3×2+4×3=,
∴b===,
a=-b =-×=-.
∴y=x-.
12.(16分)某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关系,随机抽取10户进行调查,其结果如下:
月人均收入x(元)
300
390
420
504
570
700
760
800
850
1 080
月人均生活费y(元)
255
324
330
345
450
520
580
650
700
750
利用上述资料:
(1)画出散点图;
(2)如果变量x与y之间具有线性相关关系,求出回归直线方程;
(3)测算人均收入为280元时,人均生活费支出应为多少元?
【解析】 (1)散点图如图所示:
(2) =637.4,=490.4,
∴y=0.70 761x+39.369 39.
(3)把x=280代入,得y≈237.5元,测算人均收入为280元时,人均生活费支出应为237.5元.
课件23张PPT。第三节 相关性、最小二乘估计1.相关性
(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的 .
(2)从散点图上,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样的近似过程称为 .
(3)若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是 ,若所有点看上去都在某条曲线附近波动,称此相关是 .
散点图曲线拟合线性相关非线性相关1.下列两个变量之间的关系哪个不是函数关系( )
A.角度和它的余弦值
B.正方形的边长和它的面积
C.正n边形的边数和顶点角度之和
D.人的年龄和身高
【解析】 A、B、C中的两个变量都是函数关系,它们可以用函数关系式来表示,D中的两个变量之间的关系是相关关系.
故选D.
【答案】 D
2.有关线性回归的说法,不正确的是( )
A.相关关系的两个变量是非确定关系
B.散点图能直接地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.散点图中的点越集中,两个变量的相关性越强
【解析】 散点图上的点大致分布在通过散点图中心的那条直线附近,整体上呈线性分布时,两个变量相关关系越强.
【答案】 D3.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的回归方程是( )
A.y=1.23x+4 B.y=1.23x+5
C.y=1.23x+0.08 D.y=0.08x+1.23
【解析】 当x=4时, y=1.23×4+0.08=5.故选C.
【答案】 C
4.根据两个变量x,y之间的观测数据画成散点图如图,则这两个变量________线性相关关系(填“具有”或“不具有”).
【解析】 若两个变量具有线性相关关系,则散点应在一条直线附近分布,显然此散点图不满足.
【答案】 不具有5.若施化肥量x kg与水稻产量y kg在一定范围内线性相关,若回归方程为y=5x+250.当施化肥量为80 kg时,预计水稻的产量为________.
【解析】 当x=80时,y=5×80+250=650(kg).
【答案】 650 kg下面两个变量间的关系不是函数关系的是( )
A.正方体的棱长与体积
B.角的度数与它的正弦值
C.单产量为常数时,土地面积与粮食总产量
D.日照时间与小麦亩产量【思路点拨】 函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.
【解析】 ∵A中,V=a3;B中,y=sin a;C中,y=ax;D中,两个变量之间是相关关系.∴选D.
【答案】 D5个学生的数学和物理成绩如下表:
画出散点图,判断它们是否有相关关系,若相关,求出回归直线方程.
【解析】 以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示.由散点图可知,两者之间具有相关关系,且为线性相关.
设回归直线方程为y=bx+a,则
b==0.36,a=-b=40.8.
∴回归直线方程为y=0.36x+40.8.判断变量之间有无相关关系,一种常用的简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关关系,是不是线性相关关系,是正相关还是负相关,相关关系强还是弱.1.在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如下表:
根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.
【解析】 以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关.某 种产品的宣传费支出x与销售额y(单位:万元)之间有如下对应数据:
(1)画出散点图;
(2)求回归直线方程;
(3)试预测宣传费支出为10万元时,销售额多大?
【解析】 (1)根据表中所列数据可得散点图如图所示:2.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
【解析】 (1)由题设所给数据,可得散点图如图所示: 本节主要考查线性回归系数为主,同时可考查利用散点图判断两个变量间的相关关系.
在高考题中本部分的命题主要是以选择、填空题为主,属于中档题目.
1.(2009年宁夏卷)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关【解析】 图1中的数据随着x的增大而y减小,因此变量x与变量y负相关;图2中的数据随着u的增大,v也增大,因此u与v正相关.
【答案】 C
2.已知变量x,y呈线性相关关系,回归方程为y=0.5+2x,则变量x,y是( )
A.线性正相关关系
B.由回归方程无法判断其正负相关
C.线性负相关关系
D.不存在线性相关关系
【解析】 随着变量x增大,变量y有增大的趋势,则x、y称为正相关,则A是正确的.
【答案】 A课时作业
点击进入链接
(本栏目内容,学生用书中以活页形式单独装订成册!)
一、选择题(每小题6分,共36分)
1.关于频率直方图的下列有关说法正确的是( )
A.直方图的高表示取某数的频率
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值
D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值
【解析】 我们要注意频率直方图和条形图的区别,在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.
【答案】 D
2.某地一种植物一年生长的高度如下表:
高度(cm)
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
棵数
20
30
80
40
30
则该植物一年生长在[30,40)内的频率是( )
A.0.80 B.0.65
C.0.40 D.0.25
【解析】 由频率含义可计算其结果.由频率的定义得80÷(20+30+80+40+30)=0.40.
【答案】 C
3.如图表示甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是( )
A.56分 B.57分
C.58分 D.59分
【解析】 易知甲乙两人的中位数分别是32和25,故两人中位数之和为32+25=57.
【答案】 B
4.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力从4.6到5.0之间的学生数为b,则a,b的值分别为( )
A.0.27,78 B.0.27,83
C.2.7,78 D.2.7,83
【解析】 由频率分布直方图可以得a=2.7×0.1=0.27,前四组的频率分别为0.01,0.03,0.09,0.27,则频数为1,3,9,27.后六组的频数和为87,构成了以27为首项,和为87的等差数列,设该公差为d,
则27×6+×d=87?d=-5.
∴b=27+(27-5)+(27-2×5)+(27-3×5)=78.
【答案】 A
5.一组数据中的每一个数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )
A.81.2,4.4 B.78.8,4.4
C.81.2,84.4 D.78.8,75.6
【解析】 设原来的平均数为.
则-80=1.2,∴=81.2,方差不变.
【答案】 A
6.如图是甲、乙两名射击运动员各射击10次后所得到的成绩的茎叶图(茎表示成绩的整数环数,叶表示小数点后的数字),由图可知( )
A.甲、乙中位数的和为18.2,乙稳定性高
B.甲、乙中位数的和为17.8,甲稳定性高
C.甲、乙中位数的和为18.5,甲稳定性高
D.甲、乙中位数的和为18.65,乙稳定性高
【解析】 求中位数时,必须先将这组数据从小到大或从大到小排列,数据的个数为奇数,则中位数是最中间的一个,若数据的个数为偶数,则中位数是最中间的两个数据的平均数,据此易知两人中位数和为18.2,又分析茎叶图可知乙数据分布比较集中,即乙的稳定性较高.
【答案】 A
二、填空题(每小题6分,共18分)
7.(2009年浙江卷)某个容量为100的样本的频率分布直方图如下,则在区间[4,5)上的数据的频数为________.
【解析】 样本数据在(1,4)和(5,6)上的频率为(0.05+0.01+0.15+0.40)×1=0.7,故样本数据在(4,5)上的频率为1-0.7=0.3,其频数为100×0.3=30.
【答案】 30
8.(2009年辽宁卷)某企业3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为________h.
【解析】 由于三个厂的产量比为1∶2∶1,所以从三个厂抽出产品比例也应为1∶2∶1.所以100件产品的使用寿命平均值为=1 013.
【答案】 1 013
9.(2008年上海卷)已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是________.
【解析】 ∵中位数为10.5,∴=10.5,a+b=21,
∵==10,
∴s2=[(10-2)2+(10-3)2+(10-3)2+(10-7)2+(10-a)2+(10-b)2+(10-12)2+(10-13.7)2+(10-18.3)2+(10-20)2].
令y=(10-a)2+(10-b)2=2a2-42a+221
=22+,
当a=10.5时,y取最小值,方差s2也取最小值.
∴a=10.5,b=10.5.
【答案】 a=10.5,b=10.5
三、解答题(共46分)
10.(15分)下图是某个人口为90万人的县城人口年龄分布:
(1)年龄大于60岁的有多少人?
(2)年龄小于20岁和在40~60岁间的共有多少人?
(3)年龄在20~40岁的人口比大于60岁的人口多多少?
【解析】 (1)年龄大于60的有90×=5(万).
(2)年龄小于20岁和在40~60岁之间的有
90×=65(万).
(3)20~40岁的人比大于60岁的人多90=35(万).
11.(15分)为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:
组别
频数
频率
145.5~149.5
1
0.02
149.5~153.5
4
0.08
153.5~157.5
20
0.40
157.5~161.5
15
0.30
161.5~165.5
8
0.16
165.5~169.5
m
n
合计
M
N
(1)求出表中m,n,M,N所表示的数分别是多少?
(2)画出频率分布直方图;
(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5以上的概率.
【解析】 (1)方法一:M==50,m=50-(1+4+20+15+8)=2,
N=1,n===0.04.
方法二:n=1-(0.02+0.08+0.4+0.3+0.16)=0.04
N=1,=,∴M=2,
M=1+4+20+15+8+2=50
(2)作出直角坐标系,组距为4,纵轴表示频率/组距,横轴表示身高,画出直方图如图所示.
(3)在153.5~157.5范围内最多,估计身高在161.5以上的概率为P==0.2或P=(0.01+0.04)×4=0.2.
12.(16分)对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下表:
甲
27
38
30
37
35
31
乙
33
29
38
34
28
36
(1)画出茎叶图,由茎叶图你能获得哪些信息?
(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并判断选谁参加比赛更合适.
【解析】 (1)画茎叶图如图,中间数为数据的十位数.
从这个茎叶图中可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是33.5,甲的中位数是33.因此,乙总体得分情况比甲好.
(2)由计算可知,甲=33,乙=33;s甲≈3.96,s乙≈3.56;甲的中位数是33,乙的中位数是33.5.综合比较选乙参加比赛较为合适.
课件25张PPT。第二节 统计图表、数据的数学特征、用样本估计总体条形统计图扇形统计图折线统计图茎叶图样本数据的第n项样本容量平均数标准差标准差的平方样本容量接近总体容量总体的数字特征总体的分布各小长方形的面积等于1样本容量组数频率分布的方法的优点与不足:
①频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.
②直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但是从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.③频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.
④用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况.但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.1.一个容量为32的样本,已知某组样本的频率为0.375,则该组样本的频数为( )
A.4 B.8
C.12 D.16【答案】 C2.甲、乙两位同学参加了由学校举办的篮球比赛,它们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳定的是( )
A.甲 B.乙
C.甲、乙相同 D.不能确定
【解析】 平均数相同,看谁的标准差小,标准差小的就稳定.
【答案】 B
3.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数和方差分别为( )【答案】 A4.(2009年湖北卷)样本容量为200的频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在[6,10)内的频数为________,数据落在[2,10)内的概率约为________.
【解析】 由于组距为4,因此在[6,10)之间的频率为0.08×4=0.32.其频数为0.32×200=64.
落在[2,10)之间的概率为(0.02+0.08)×4=0.4.
【答案】 64 0.45.如图是CBA篮球联赛中,甲乙两名运动员某赛季一些场次得分的茎叶图,则平均得分高的运动员是________.
【解析】 从茎叶图上可得甲得分:8,10,15,16,22,23,25,26,27,32,平均值为20.4;乙得分:8,12,14,17,18,19,21,27,28,29,平均值为19.3,∴平均得分高的运动员是甲
【答案】 甲某中学对343名学生就十本书的喜爱情况做了一项统计调查,结果呈现如下:
请用三种统计图表表示上述数据.
【思路点拨】 明确三种统计图表的不同,按要求画表.【解析】 (1)条形图:
(2折线图:
(3)扇形图:
对划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大速度的数据如下:
甲:27,38,30,37,35,31;
乙:33,29,38,34,28,36.
根据以上数据,试判断他们谁更优秀.(1)现实中总体所包含的个体数往往较多,总体的平均数与标准差、方差是不知道(或不可求)的,所以我们通常用样本的平均数与标准差、方差来估计总体的平均数与标准差、方差.
(2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的分散程度越大,越不稳定;标准差、方差越小,数据的分散程度越小,越稳定.1.甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价.
【解析】 (1)由图象可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
甲==13,
乙==13,
s甲2=[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s乙2=[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s甲2>s乙2可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高. 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?
请说明理由.【解析】 (1)由已知可设每组的频率为
2x,4x,17x,15x,9x,3x.
则2x+4x+17x+15x+9x+3x=1
解得x=0.02.
则第二小组的频率为0.02×4=0.08,
样本容量为12÷0.08=150.
(2)次数在110次以上(含110次)的频率和为
17×0.02+15×0.02+9×0.02+3×0.02
=0.34+0.3+0.18+0.06=0.88.
则高一学生的达标率约为0.88×100%=88%.
(3)在这次测试中,学生跳绳次数的中位数落在第四组.因为中位数为平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标.2.为了估计某人的射击技术状况,在他的训练记录中抽取了50次进行检验,他命中环数如下:
7 8 6 8 6 5 9 10 7 9
5 6 5 6 7 8 7 9 10 9
8 5 7 8 7 6 8 6 7 7
9 6 5 8 6 9 6 8 10 7
8 7 8 6 9 8 7 10 8 9
(1)作出频率分布表;
(2)画出频率分布条形图;
(3)估计该人命中6~8环的百分比是多少.
【解析】 (1)频率分布表如下:
(2)以命中环数为横轴,频率为纵轴,建立直角坐标系,在横轴上标出所有命中环数,频率值等距标在纵轴上,以各个命中环数为底边中点,对应频率为高作出各矩形,于是得如下频率分布条形图.
(3)由频率分布条形图知:0.20+0.22+0.24=0.66,知该人命中6~8环的百分比为66%.本节是用样本估计总体,是统计学的基础.以考查频率分布直方图、茎叶图、平均数、方差、标准差为主,同时考查对样本估计总体的思想的理解.
在高考题中主要是以选择题和填空题为主,属于中低档题目.
1.(2009年重庆卷)从一堆苹果中任取5只,称得它们的质量如下(单位:克)
125 124 121 123 127
则该样本标准差s=________克(用数字作答).【答案】 22.
(2009年福建卷)某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算失误,则数字x应该是 .
【解析】 当x≥4时,=≠91,
∴x<4,∴=91,
∴x=1.
【答案】 1课时作业
点击进入链接
(本栏目内容,学生用书中以活页形式单独装订成册!)
一、选择题(每小题6分,共36分)
1.对分类变量X与Y的随机变量?2的观测值?,说法正确的是( )
A.?越大,“X与Y有关系”可信程度越小
B.?越小,“X与Y有关系”可信程度越小
C.?越接近于0,“X与Y无关”程度越小
D.?越大,“X与Y无关”程度越大
【解析】 ?越大,说明“X与Y有关系”成立的可信程度越大,反之越小.
【答案】 B
2.对于独立性检验,下列说法中错误的是( )
A.?2的值越大,说明两事件相关程度越大
B.?2的值越小,说明两事件相关程度越小
C.?2≤3.841时,有95%的把握说事件A与B有关
D.?2>6.635时,有99%的把握说事件A与B有关
【解析】 在独立性检验中,随机变量?2的取值大小可说明两个变量相关的程度.一般地随机变量?2的值越大,两变量的相关程度越大;反之就越小.临界值?2>6.635说明有99%的把握认为二者有关系;?2≤2.706则说明二者几乎无关.因此可知C中的说法是不正确的.
【答案】 C
3.设两个变量x与y之间具有线性相关关系,相关系数是r,回归方程为y=a+bx,那么必有( )
A.b与r符号相同 B.a与r符号相同
C.b与r符号相反 D.a与r符号相反
【解析】 由于b=
r=
分母均为正,而分子相同,故b与r同号.
【答案】 A
4.已知x、y的取值如下表所示:
x
0
1
2
3
4
y
2.2
4.3
4.8
4.8
6.7
若从散点图分析,y与x线性相关,且y=0.95x+a,则a的值等于( )
A.2.6 B.6.3
C.2 D.4.5
【解析】 方法一:直接对照法 由表中数据得=2,=4.5,在回归直线方程y=bx+a中,a=-b=4.5-0.95×2=2.6,故选A.
方法二:逆向思维法 由于线性回归方程一定经过样本中心点(,),即(2,4.5),将四个选项中的a值代入方程,然后检验哪一条直线经过点(2,4.5),经检验只有A正确.
【答案】 A
5.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现?2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游愿望有关系的可信程度是( )
P(?2≥k)
…
0.25
0.15
0.10
0.02
0.010
0.005
…
k
…
1.323
2.072
2.706
5.024
6.635
7.879
…
A.90% B.95%
C.97.5% D.99.5%
【解析】 ∵?2=6.023>5.024,∴可断言市民收入增减与旅游愿望有关系的可信程度为97.5%,故选C.
【答案】 C
6.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示.
杂质高
杂质低
旧设备
37
121
新设备
22
202
根据以上数据,则( )
A.含杂质的高低与设备改造有关
B.含杂质的高低与设备改造无关
C.设备是否改造决定含杂质的高低
D.以上答案都不对
【解析】 由已知数据得到如下2×2列联表
杂质高
杂质低
合计
旧设备
37
121
158
新设备
22
202
224
合计
59
323
382
由公式?2=≈13.11,
由于13.11>6.635,故有99%的把握认为含杂质的高低与设备是否改造是有关的.
【答案】 A
二、填空题(每小题6分,共18分)
7.在独立性检验中,选用?2统计量,用其取值大小来推断独立性是否成立,当?2满足条件________时,我们有99%的把握说事件A与B有关.
【解析】 由独立性检验判断表得K2>6.635.
【答案】 ?2>6.635
8.若两个分类变量x和y的列联表为:
y1
y2
x1
5
15
x2
40
10
则x与y之间有关系的概率约为________.
【解析】 ?2=≈18.822,
查表知P(?2≥10.828)≈0.001,
∴x与y之间有关系的概率约为1-0.001=0.999.
【答案】 0.999
9.下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②设有一个回归方程=3-5x,变量x增加一个单位时,y平均增加5个单位;
③回归方程=bx+a必过点(,);
④曲线上的点与该点的坐标之间具有相关关系;
⑤在一个2×2列联表中,由计算得?2=13.079,则其两个变量间有关系的可能性是90%.
其中错误的是________.
【解析】 ①正确.由回归方程的定义及最小二乘法思想,知③正确.②④⑤不正确.
【答案】 ②④⑤
三、解答题(共46分)
10.(15分)下表是某地区的一种传染病与饮用水的调查表.
得病
不得病
合计
干净水
52
466
518
不干净水
94
218
312
合计
146
684
830
试作统计分析推断.(注:若K2>10.828,则认为得传染病与饮用水无关)
【解析】 根据列联表中数据可计算K2观测值为
?=≈54.21.
由于54.21>10.828,
说明该地区的传染病与饮用不干净水是有关的.
11.(15分)某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了180件产品进行分析,其中设备改造前的合格品有36件,不合格品有49件,设备改造后生产的合格品有65件,不合格品有30件,根据所给数据:
(1)写出2×2列联表;
(2)判断产品是否合格与设备改造是否有关.
【解析】 (1)由已知数据得
合格品
不合格品
合计
设备改造后
65
30
95
设备改造前
36
49
85
合计
101
79
180
(2)根据列联表中数据,?2的观测值为
?=≈12.38.
由于12.38>10.828,有99.9%的把握认为产品是否合格与设备改造有关.
12.(16分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
【解析】
设x表示每月产量(单位:千件),y表示单位成本(单位:元/件),作散点图.由图知y与x间呈线性相关关系,设线性回归方程为=bx+a.由公式可求得b=-1.818,a=77.363,
∴线性回归方程为y=-1.818x+77.363.
(2)由线性回归方程知,每增加1 000件产量, 单位成本下降1.818元.
(3)产量为6 000件时,单位成本是66.45元/件,单位成本是70元/件时,产量为4 050件.
课件27张PPT。第四节 统计案例当 ?≤3.841时,认为X与Y无关;
当 ?>3.841时,有95%的把握说X与Y有关;
当 ?>6.635时,有99%的把握说X与Y有关;
当 ?>10.828时,有99.9%的把握说X与Y有关.1.相关系数度量( )
A.两个变量之间线性相关关系的强度
B.散点图是否显示有意义的模型
C.两个变量之间是否存在因果关系
D.两个变量之间是否存在关系
【解析】 相关系数来衡量两个变量之间线性相关关系的强弱.
【答案】 A2.以下对线性相关系数r的叙述中,正确的是( )
A.|r|∈(0,+∞),|r|越大,相关程度越大;反之,相关程度越小
B.|r|∈(-∞,+∞),r越大,相关程度越大;反之,相关程度越小
C.|r|≤1,|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小
D.以上说法都不对
【解析】 根据相关系数的定义和计算公式可知,|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小,所以C正确.
【答案】 C3.下列说法正确的个数为( )
①对事件A与B的检验无关时,即两个事件互不影响
②事件A与B关系越密切,则?2就越大;
③?2的大小是判定事件A与B是否有关的唯一根据;
④若判定两事件A与B有关,则A发生,B一定发生.
A.1 B.2
C.3 D.4
【解析】 由概念知②正确,其他均不正确.
【答案】 A4.下面是一个2×2列联表
则表中a、b处的值分别为________.
【解析】 ∵a+21=73,∴a=52.
又∵a+2=b,∴b=54.
【答案】 52、545.在独立性检验中,选用?x2统计量,用其取值大小来推断独立性是否成立,当?x2满足条件________时,我们有99%的把握说事件A与B有关.
【解析】 由独立性检验判断表得?x2>6.635.
【答案】 ?X2>6.635测得某国10对父子身高(单位:英寸)如下:
假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如下统计资料是:
在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,若它们之间具有相关关系,再求回归方程,否则 ,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的。1.一项调查表对9个不同的x值,测得y的9个对应值如下表:
试作出该数据的散点图并由图判断是否存在回归直线,若有,则求出回归方程.
【解析】 散点图如图所示在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,利用独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效?
【解析】 根据题目所给的数据作出如下的列联表:
利用图形来判断两个变量之间是否有关系,可以画出三维柱形图、二维条形图,仅从图形上只可以粗略地估计两个分类变量的关系,可以结合所求的数值来进行比较,作图时应注意单位统一、图形准确,但不能给我们两个分类变量有关或无关的精确的可信程度,只有利用独立性检验的有关计算,才能作出精确的判断.2.某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:
(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?
(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关?并说明理由.本节主要内容是变量的相关性及其几种常见的统计方法.在高考中主要是以考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来了解一些基本的统计思想.
在高考中多为选择题、填空题,也有可能出现解答题,都为中低档题.
1.已知x、y之间的数据如表所示,则回归直线过点( )
【答案】 D【解析】 当x=25时,y=0.50×25-0.81=11.69.
【答案】 11.69课时作业
点击进入链接