4.最小二乘法线性拟合
我们知道,用作图法求出直线的斜率a和截据b,可以确定这条直线所对应的经验公式,但用作图法拟合直线时,由于作图连线有较大的随意性,尤其在测量数据比较分散时,对同一组测量数据,不同的人去处理,所得结果有差异,因此是一种粗略的数据处理方法,求出的a和b误差较大。用最小二乘法拟合直线处理数据时,任何人去处理同一组数据,只要处理过程没有错误,得到的斜率a和截据b是唯一的。
最小二乘法就是将一组符合Y=a+bX关系的测量数据,用计算的方法求出最佳的a和b。显然,关键是如何求出最佳的a和b。
(1) 求回归直线
设直线方程的表达式为:
yabx (2-6-1)
要根据测量数据求出最佳的a和b。对满足线性关系的一组等精度测量数据(xi,yi),假定自变量xi的误差可以忽略,则在同一xi下,测量点yi和直线上的点a+bxi的偏差di如下:
d1y1abx1
d2y2abx2
dnynabxn
显然最好测量点都在直线上(即d1=d2=„„=dn=0),求出的a和b是最理想的,但测量点不可能都在直线上,这样只有考虑d1、d2、„„、dn为最小,也就是考虑d1+d2+„„+dn为最小,但因d1、d2、„„、dn有正有负,加起来可能相互抵消,因此不可取;而|d1|+
222
|d2|+„„+ |dn|又不好解方程,因而不可行。现在采取一种等效方法:当d1+d2+„„+dn
222
对a和b为最小时,d1、d2、„„、dn也为最小。取(d1+d2+„„+dn)为最小值,求a和b的方法叫最小二乘法。
令 Ddi1n2i=Ddi1n2i[yiabxi]2 (2-6-2)
i1nD对a和b分别求一阶偏导数为:
nnD2[yinabxi] ai1i1nnnD22[xiyiaxibxi] bi1i1i1 Ⅱ 基本概念与数据处理 – 27 –
再求二阶偏导数为:
n2D2D22n; 2xi22abi1n2D2D22n0显然: ; 2xi0 22abi1满足最小值条件,令一阶偏导数为零:
yi1ninabxi0 (2-6-3)
i1nn2n
xyii1niaxibxi0 (2-6-4)
i1i11n1n引入平均值: xxi; yyi;
ni1ni11n21nxxi; xyxiyi
ni1ni12则: yabx0
xyaxbx20 (2-6-5) 解得: aybx (2-6-6)
bxyxyxx22 (2-6-7)
将a、b值带入线性方程yabx,即得到回归直线方程。
(2) y、a、b的标准差
在最小二乘法中,假定自变量误差可以忽略不计,是为了方便推导回归方程。操作中函数的误差大于自变量的误差即可认为满足假定。实际上两者均是变量,都有误差,从而导致结果y、a、b的标准差(n≥6)如下:
– 28 – Ⅱ 基本概念与数据处理
ydi1n2in2n(yi1nibxia)2n2 (2-6-8)
(根式的分母为n-2,是因为有两个变量)
axi1ni12innxi2(xi)2i1yx2n(xx)22y (2-6-9)
bnnxi2(xi)2i1i1nny1n(xx)22y (2-6-10)
(3)相关系数
相关系数是衡量一组测量数据xi、yi线性相关程度的参量,其定义为: rxyxy(x2x)(y2y)22 (2-6-11)
r值在0<|r|≤1中。 |r|越接近于1,x 、y 之间线性好;r为正,直线斜率为正,称为正相关;r为负,直线斜率为负,称为负相关。|r|接近于0,则测量数据点分散或xi、yi之间为非线性。不论测量数据好坏都能求出a和b,所以我们必须有一种判断测量数据好坏的方法,用来判断什么样的测量数据不宜拟合,判断的方法是|r| n 3 4 5 6 7 8 r0 1.000 0.990 0.959 0.917 0.874 0.834 n 9 10 11 12 13 14 r0 0.798 0.765 0.735 0.708 0.684 0.661 n 15 16 17 18 19 20 r0 0.641 0.623 0.606 0.590 0.575 0.561 在进行一元线性回归之前应先求出r值,再与r0比较,若|r|> r0,则x和y具有线性关系,可求回归直线;否则反之。 Ⅱ 基本概念与数据处理 – 29 – 例9:灵敏电流计的电流常数Ki和内阻Rg的测量公式为R2RsURg测得的 KiR1d数据同例7,其中间处理过程如下,试用最小二乘法求出Ki和Rg,并写出回归方程的表达式。 解:测量公式与线性方程表达式y=a+bx比较: yR2 xU bRs aRg KiR1d数据处理如表2-6-3: 表2-6-3 Rs=0.100Ω R1=4350.0Ω d=40.0mm i R2(Ω) U(V) 2(10ΩR2421 400.0 2.82 ) 16.00 7.95 11.3 2 350.0 2.49 12.25 6.20 8.72 3 300.0 2.15 9.000 4.62 6.45 4 250.0 1.82 6.250 3.31 4.55 5 6 7 8 50.0 0.56 0.250 0.31 0.28 平均值 225.0 1.67125 6.375 3.34625 4.615625 200.0 150.0 100.0 1.51 1.18 0.84 4.000 2.250 1.000 2.28 3.02 1.39 1.77 0.71 0.84 U(V) R2U(10ΩV) 222 中间过程可多取位: 2 x=1.67125 y=225.0 x=3.34625 y=6.375×10 xy=461.5625 24 相关系数 rxyxy(x2x)(y2y)220.998 查表得知,当n=8时,r0=0.834,两者比较r>r0,说明x、y(即U、R2)之间线性相关,可以求回归直线。 求回归方程的系数 bxyxyxx22=154.6192304 aybx=-33.4 代换 Rga=33.4Ω – 30 – Ⅱ 基本概念与数据处理 Rsb=154.6192304 KiRidKi= Rs-9 =3.7170×10A/mm bRid计算标准差为: y=2.64561902; a=2.300545589; b=1.257626418 计算不确定度: ΔRg=a=2Ω; 测量结果表达式 电流计内阻: Rg=(33±2)Ω Kib-9 ==0.81%; ΔK =0.03×10A/mm KbRgRg=6.1% 电流常数: K =(3.72±0.03)×10A/mm 回归方程: R2=155U-33 5.计算器在数据处理中的应用 -9 Ki=0.81% K在处理数据时,不同的计算器的编程方式各不相同,下面以震旦AURORA SC180型计算器为例作以介绍。 (1)计算标准偏差S ① 标准偏差S的计算器运行公式: 1ns(xix)2n1i11n因为 xxi ni1x2xxix2ii1i1i1nnn2n1 Ⅱ 基本概念与数据处理 – 31 – 所以 sxi1n2i(xi)2i1nnn1 (只有为xi单变量) ② 操作步骤和方法 (ⅰ) 按[MODE][0]键,计算器进入单变量统计计算状态。屏右上角显示“STAT1”指示符。 (ⅱ) 清除内存数据:按[INV][ON/C.CE]键。 (ⅲ) 数据输入:依次先键入数值,然后按[DATA]键,每完成一次输入的同时,屏幕均会显示数据的个数n值。 (ⅳ) 数据修正:按[DATA]键之前,要删除错误数据,按[ON/C.CE];按[DATA]键后要删除错误数据,再次输入该错误值,然后按[INV][DEL]。 (ⅴ) 取分析结果: [INV][x]:平均值 [INV][[INV][ x]:数据和 x]: 数据平方和 2 [INV][S]:测量列的标准偏差 [INV][n]:数据个数 例10:一组等精度测量值为:83.1、83.3、83.3、83.7、83.9、83.6、83.4、83.4、83.1、83.2,试求x、 解: 按 键 [MODE][0] [INV][ON/C.CE] 83.1[DATA] 83.3[DATA] 83.3[DATA] 83.7[DATA] 83.9[DATA] 83.6[DATA] 83.4[DATA] 显 示 ST1 0 0 n 1 n 2 n 3 n 4 n 5 n 6 n 7 x、x、S、n 。 2 – 32 – Ⅱ 基本概念与数据处理 83.4[DATA] 83.1[DATA] 83.2[DATA] [INV][x] n 8 n 9 n 10 83.4 834 69556.22 0.262466929 10 x] [INV][x] [INV][2[INV][S] [INV][n] 注:当n≥6时,认为=S 。 (2)最小二乘法求回归直线 ① 求回归直线参量a、b、r的计算器运行公式 由(2-6-6)、(2-6-7)、(2-6-11)式得到以下只含xi、yi两个变量的公式: anyi1nibxii1nnnnii bxyi1i1ni1nxiyii1n (xi)2nxi2i1rnxiyixiyii1i1i1nnn[nxi2(xi)2][nyi2(yi)2]i1i1i1i1nnnn ② 操作步骤和方法: (ⅰ) 按[MODE][.],计算器进入双变量统计计算状态。屏幕右上角显示“STAT2”指示符。 (ⅱ) 清除内存数据:按[INV][ON/C.CE]键 (ⅲ) 双变量数据输入:先键入x的值、 按[a]键, 然后键入y的值、 按[b]键,再按[DATA]键,完成输入。屏幕会同时显示数据的个数,即n值。 (ⅳ) 数据修正:同单变量数据输入。 (ⅴ) 取分析结果 [INV][a]:回归直线的截距 [INV][b]:回归直线的斜率 Ⅱ 基本概念与数据处理 – 33 – [INV][r]:相关系数 还可以取以下值: [INV][x]、[INV][y]、[INV][Σx]、[INV][Σx]、[INV][Σy]、[INV][Σy]、 2 2 [INV][Σxy], 以便计算y、a、b(计算器没有该三项的计算程序)。 例11: 灵敏电流计实验所测数据如下: RS=0.100Ω R1=4350.0Ω d=40.0mm R2(Ω) 400.0 U(V) 2.82 350.0 2.49 300.0 2.15 250.0 1.82 200.0 1.51 150.0 1.18 100.0 0.84 50.0 0.56 要求所使用计算器具有计算最小二乘法的功能,求回归直线以及电流计的电流常数Ki和内阻Rg。 解: 测量公式R2则: 按 键 [MODE][.] [INV][ON/C.CE] 2.82{a}400.0[b][DATA] 2.49[a]350.0[b][DATA] 2.15[a]300.0[b][DATA] 1.82[a]250.0[b][DATA] 1.51[a]200.0[b][DATA] 1.18[a]150.0[b][DATA] 0.84[a]100.0[b][DATA] 0.56[a]50.0[b][DATA] [INV][a] [INV][b] [INV][r] 显 示 ST2 0 0 n 1 n 2 n 3 n 4 n 5 n 6 n 7 n 8 a -32.12335698 b 153.8509241 r 0.9998323336 RsURg与线性方程表达式y=a+bx比较y=R2 x=U, KiR1d查表知道,当n=8时,r0=0.834, r>r0,说明U、R2之间线性相关。得到: 回归方程 R2=154U-32 电流计内阻 Rg=32 -9 电流常数 K=3.74×10A/mm – 34 – Ⅱ 基本概念与数据处理 习 题 1.指出下列测量结果的有效数字: (1) I=5010mA 8 (2) C=2.99792458×10m/s 2.按“四舍五入”修约法,将下列数据只保留3位有效数字: (1) 1.005 (2) 979.499 (3) 980.501 (4) 6.275 (5) 3.134 3.单位变换: (1) m=3.162±0.002kg = g = mg = T (2) θ=(59.8±0.1)° =( )ˊ(3) L=98.96±0.04cm = m = mm = µm 4.改错并且将一般表达式改写成科学表达式: 1192 (1) Y=(1.96×10±5.78×10)N/m (2) L=(160000±100)m 5.按有效数字运算规则计算下列各式: -5 (1) 1000= 3 (2) 3.2×10+3.2= 0 (3) tg305ˊ= (4) 100.325+100.125= 100.325100.1252 (5) R1=5.10kΩ,R2=5.10×10Ω,R3=51Ω。 求: R=R1+R2+R3= (6) L=1.674m-8.00cm= Ⅱ 基本概念与数据处理 – 35 – 6.求下列公式的不确定度: (1) 4m 2dhxy3(2) N= 22(3) L=h+ d 3(4) Z= xy xy7.用分度值为1mm的米尺测量一物体长度L,测得数据为:98.98cm、98.96cm、98.97cm、 98.94cm、99.00cm、98.95cm、98.97cm,试求L、 ΔL,并写出测量结果表达式 L±ΔL。 8.测量出一个铅圆柱体的直径为d=(2.040±0.001)cm,高度为h=(4.120±0.001)cm,质量为m=(149.10±0.05)g,试计算、,并表示测量结果。 9.某同学测量弹簧倔强系数的数据如下: F(g) y(cm) 2.00 6.90 4.00 10.00 6.00 13.05 8.00 15.95 10.00 19.00 12.00 22.05 14.00 25.10 其中F为弹簧所受的作用力,y为弹簧的长度,已知y-y0=( 1)F,试用作图法求弹k簧的倔强系数k及弹簧的原来长度y0。 10.用伏安法测电阻时,测出的数据如下,试求回归直线,并求出测量结果R值。 I(mA) U(V) 2.00 1.00 4.00 2.01 6.00 3.05 8.00 4.00 10.00 12.00 14.00 16.00 18.00 20.00 5.01 5.99 6.98 8.00 9.00 9.96 11. 用双臂电桥对某一电阻作多次等精度测量,测得数据如下: R(Ω):12.06 12.10 12.12 12.15 12.16 12.17 12.19 12.21 12.22 12.25 12.26 12.35 12.42 12.83 试用3准则判断该测量列中是否有坏值,计算出检验后的算术平均值及平均值的标准差,正确表达测量结果。 – 36 – Ⅱ 基本概念与数据处理 相关系数公式: 因篇幅问题不能全部显示,请点此查看更多更全内容