统 计(2) 一、知识与方法:
1.判断两个变量间符合线性相关关系的方法有:
(1)作散点图,以_______为横坐标、_________为纵坐标,在平面直角坐标系中描出样本数据;当
散点图中点的分布大致在一条直线上或其附近时,说明这两个变量符合线性相关关系,并将此
直线叫_________,常利用______________法求其方程ybxa。
其中bxynxy(xx)(yy)iiiii1nnnxi12inx2i1(xx)ii1n,aybx。
2(公式不要求记忆,但要求会用)
(2)算样本相关系数r(公式不要求记忆,但要求会用),r具有以下性质:
① |r|1,且|r|越接近______,线性相关关系越强;|r|越接近______,线性相关关系越弱;② 当|r|_____时,我们就认为两个变量具有很强的线性相关关系。
2.线性相关关系又分为___________ 和_____________两种。 3.回归分析:
(1)残差______ 残差图(其纵坐标是_______) 残差平方和__________,残差平方和越小,
模型的拟合效果越好。 (2)相关指数:R(公式不要求记忆,但要求会用);R越_____,模型的拟合效果越好。 (3)总偏差平方和
22(yi1niy)2,回归平方和等于总偏差平方和减去残差平方和。
24、独立性检验、假设检验:要求会列22列联表,知道假设检验的基本思想、方法。K的观测值
k由公式K2__________得出,观测值k越大,表明两个分类变量_______的可能性越大,反
之越小。如k6.635,就有99%的把握认为两个分类变量有关系,即判断两个分类变量有关
系出现错误只有____的可能。 二、例题:
例1、调查表明某种设备使用的年限x(年)与所支出的维修费用y(元)有以下统计资料:
使用年限x 维修费用y 已知:
2 2.2 53 3.8 4 5.5 5 6.5 6 7.0 xi152i90,xiyi112.3,
i1(1) 作出散点图(x为解释变量,y为预报变量);(2)计算样本相关系数r; (3) 求x、y;(4)求回归方程;
(5) 估计使用10年时,维修费用是多少? (6)计算残差平方和;
解:(3)x4,y5;(4)由已知可得:bxyii152i15i5xy2xi5x112.35451.23
90542 于是 aybx51.2340.08 ,所以,回归直线方程是:y1.23x0.08。 (5)由第(2)可得,当x10时,y1.23x0.081.23100.0812.38(万元)
即使用10年时,估计维修费用是12.38万元。 三、练习题:
1.两个变量y与x的回归方程是y1.5x15,则
A y与x呈负相关关系 B x10时,y等于0; C y与x的相关系数r满足|r|0.75 D y1.5x15
2.已知两个变量y与x符合线性相关关系,其回归直线的方程是y2.13x12, 若x10,则y_________。
3.若某拟合模型对一组样本数据的残差平方和为89,其相关指数R0.95,则总偏差平方和为_____________;回归平方和为_____________。
4.若有一组数据的总偏差平方和为100,相关指数为0.6,则其残差平方和为_____; 回归平方和为_________。
5.对于一组数据的两个拟合模型甲、乙,它们的残差平方和分别为180.2和290.8,若要从中选取一个模型对预报变量进行预报,则应该选择模型_____。
6.统计学中用相关系数r来衡量两个变量之间线性相关关系的强弱,对于变量x与y,经计算得
2r0.001,则变量x与y的相关关系
A 线性相关关系很强 B 线性相关关系较弱 C 线性相关关系一般 D 不确定 7.经收集数据得出小麦基本苗数x与成熟期有效穗y之间的关系如下表: x 15.0 25.8 30.0 36.6 44.4 y 39.4 42.9 42.9 43.1 49.2 (1)以x为解释变量、y为预报变量,作出散点图;
(2)求y与x之间的回归方程,对于基本苗数x56.7,预报成熟期有效穗; (3)计算各组残差,并计算残差平方和;
(4)求相关指数R,并说明残差变量对成熟期有效穗的影响占百份之几? (以上计算要求精确到0.01)
8.对于22列联表,在二维条形图中两个比例的值
2ac与相差越大,h:“x与y有关系”abcd可能性就_______。
9.某企业为了研究员工工作的积极性与对待企业改革态度的关系,用简单随机抽样的方法抽取了
189名员工进行调查,所得到的数据如下表: 支持改革 不支持改革 合计 工作积极 工作不积极 合计 54 103 95 189 (1)先完成上表;(2)依据上表中的数据的分析,企业能够得出什么结论?
10.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
(1)画出数据对应的散点图;并判断y与x之间是否符合线性相关关系; (2)求线性回归方程,并在散点图中加上回归直线; (3)估计当房屋面积为150m时的销售价格. 答案:三、练习题:
2
3、1780,1691,提示:由题意知残差平方和占总偏差平方和的比例为195%0.05,所以总偏差平方和
891780,回归平方和为178095%1691。 0.054、越大; 5、甲; 6、B ; 7、(1)略;(2)有散点图可以看出,样本点呈条状分布,故y与x之间有较好的线性相关关系,经过计算得其回归直线方程为y0.29x34.32, 对于基本苗数x56.7,预报成熟期有效穗y50.76; (3)e10.73,e21.10,e30.12,e41.83,e52.00
2(4)相关指数R0.818,说明残差变量对成熟期有效穗的影响占181.8%18.2%。
(5)
ei152i9.24。
8、(1) 工作积极 工作不积极 合计 支持改革 54 32 86 不支持改革 40 63 103 合计 94 95 189 2(2)K的观测值k10.767.879,故有99.5%的把握认为员工工作的积极性与支持企业改革
是有关系的。 10. 解:(1)数据对应的散点图如图所示:
55152(2)xxi109,(xix)1570,y23.2,(xix)(yiy)308,
5i1i1i1
所求回归直线方程为y0.1962x1.8166 (3)据(2),当x150m时,销售价格的估计值为:
2y0.19621501.816631.2466(万元)
因篇幅问题不能全部显示,请点此查看更多更全内容