线性拟合是曲线拟合的一种形式。设x和y都是被观测的量,且y是x的函数:y=f(x; b),曲线拟合就是通过x,y的观测值来寻求参数b的最佳估计值,及寻求最佳的理论曲线y=f(x; b)。当函数y=f(x; b)为关于b的i线性函数时,称这种曲线拟合为线性拟合。
在科学技术的许多领域中,常会遇到以下问题:在各种物理问题和统计问题中,对有关量进行多次观测或实验得到了一些数据组,它们是零散的,不仅不便于处理,而且通常不能确切和充分地体现出其固有的规律。为了得到数据之间的固有规律或者用当前数据来预测期望得到的数据,就要用
连续曲线近似地刻画或比拟平面上
离散点组所表示的坐标之间的
函数关系,
高维空间中的相应问题亦属此范畴。设x,y为被观测的量,y可表示为x的函数: 。假定这个函数关系已经由实际问题从理论上具体确定,则称为理论函数,但其中含有n个未知参数。通过实验可以获得多组数据: ,通过m组数据可寻求参数b的最佳估计值,即寻求最佳的理论函数 。在数值分析中,
曲线拟合就是用解析表达式逼近离散数据,即离散数据的公式化。
式中为已知的n个线性无关的连续函数,称为
基函数。对诸的不同选取可构成多种典型的和常用的线性模型。
至于
非线性模型以及非最小二乘原则的情形,参数b可通过解非线性方程组或最优化计算中的有关方法来确定(见非线性方程组数值解法、最优化)。
对于给定的
离散数据,需恰当地选取一般模型中函数f(x,b)的类别和具体形式,这是拟合效果的基础。若已知离散数据的实际背景规律,即
因变量y对
自变量x的依赖关系已有表达式形式确定的
经验公式,则直接取相应的经验公式为拟合模型。反之,可通过对模型中基函数(个数和种类)的不同选取,分别进行相应的拟合并择其效果佳者。函数对模型的适应性起着测试的作用,故又称为测试函数。另一种途径是:在模型中纳入个数和种类足够多的测试函数,借助于
数理统计方法中的
相关性分析和
显著性检验,对所包含的测试函数逐个或依次进行筛选以建立较适合的模型(见回归分析)。当然,上述方法还可对拟合的
残差(视为新的离散数据)再次进行,以弥补初次拟合的不足。总之,当数据中变量之间的内在联系不明确时,为选择到相适应的模型,一般需要反复地进行拟合试验和分析鉴别。
线性拟合作为数学计算中一种常用的
数学方法,在建筑、物理、化学、甚至于天体物理、航天中都得到基本的应用。一般情况下,线性拟合需要根据实际需要,取用不同的
拟合度,即R2。
两个变量之间的关系是
一次函数关系的——图象是直线,这样的两个变量之间的关系就是“
线性关系”;如果不是一次函数关系的——图象不是直线,就是“
非线性关系”。线性拟合和非线性拟合不同。