1.由一组数据(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程=x+,则下列说法不正确的是( )
A.直线=x+必过点(,)
B.直线=x+至少经过点(x1,y1)(x2,y2)……(xn,yn)中的一个点
D.直线=x+和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差是该坐标平面上所有直线与这些点的偏差中最小的直线
[答案] B
2.当建立了多个模型来拟合某一数据时,为了比较各个模型的拟合效果,我们可以通过计算________来确定.( )
(1)残差平方和
(2)相关指数R2
(3)相关系数r
A.(1)(3) B.(1)(2)
C.(2)(3) D.(1)(2)(3)
[答案] B
3.某种产品的广告费支出x与销售额y(单位:万元)之间有下表关系:
x
2
4
5
6
8
y
30
40
60
50
70
已知y与x之间是线性相关关系,若实际销售额不低于82.5万元,则广告费支出最少是__________万元.
[答案] 10
[解析] 由本节例2可知y关于x的回归直线方程为=6.5x+17.5由6.5x+17.5≥82.5得x≥10.故广告费支出最少为10万元.
4.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x(单位:h)与当天投篮命中率y之间的关系:
时间x
1
2
3
4
5
命中率y
0.4
0.5
0.6
0.6
0.4
小李这5天的平均投篮命中率为________,用线性回归分析法的方法, 预测小李该月6号打6h篮球的投篮命中率为________.
[答案] 0.5 0.53
[解析] 这5天的平均投篮命中率为
==0.5,
==3.
(xi-)(yi-)=(1-3)×(0.4-0.5)+(2-3)×(0.5-0.5)+(3-3)×(0.6-0.5)+(4-3)×(0.6-0.5)+(5-3)×(0.4-0.5)=0.1.
(xi-)2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10.
==0.01,=-=0.5-0.03=0.47.
所以回归直线方程为=0.01x+0.47.
当x=6时,=0.01×6+0.47=0.53.
5.在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x的一组数据如下表所示:
x(s)
5
10
15
20
30
40
50
60
y(mm)
6
10
11
13
16
17
19
23
(1)画出数据的散点图;
(2)根据散点图,你能得出什么结论.
[解析] (1)如图所示:
(2)结论:设x与y是具有相关关系的两个变量,且相应于n组观测值的n个点大致分布在一条直线附近,其中整体上与这n个点最接近的一条直线最能代表变量x与y之间的关系.
1.下列关于等高条形图的叙述正确的是( )
A.从等高条形图中可以精确地判断两个分类变量是否有关系
B.从等高条例形图中可以看出两个变量频数的相对大小
C.从等高条形图可以粗略地看出两个分类变量是否有关系
D.以上说法都不对
[答案] C
[解析] 在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能找出频率,无法找出频数,故B错.
2.对两个分类变量进行独立性检验的主要作用是( )
A.判断模型的拟合效果
B.对两个变量进行相关分析
C.给出两个分类变量有关系的可靠程度
D.估计预报变量的平均值
[答案] C
[解析] 独立性检验的目的就是明确两个分类变量有关系的可靠程度.
3.在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( )
A.若随机变量K2的观测值k>6.635,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99% 的可能患有肺病
B.若利用随机变量K2求出有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99个患肺病
C.若利用随机变量K2求出有95%的把握说吸烟与患肺病有关,则是指有5%的可能性使得推断错误
D.以上说法均有错误
[答案] C
[解析] 在独立性检验中得到的概率是两个分类变量有关系的概率.