决定系数
决定系数,或称判定系数(英语:Coefficient of determination,记为R 2),在统计学中用于度量因变量的变异中可由自变量解释部分所占的比例,以此来判断回归模型的解释力。[1][2][3]
对于简单线性回归而言,决定系数为样本相关系数的平方。[4]当加入其他回归自变量后,决定系数相应地变为多重相关系数的平方。
假设一数据集包括y1,...,yn共n个观察值,相对应的模型预测值分别为f1,...,fn。定义残差ei = yi − fi,平均观察值为
于是可以得到总平方和
残差平方和
由此,决定系数可定义为
参考文献
- ^ Steel, R. G. D.; Torrie, J. H. Principles and Procedures of Statistics with Special Reference to the Biological Sciences. McGraw Hill. 1960.
- ^ Glantz, Stanton A.; Slinker, B. K. Primer of Applied Regression and Analysis of Variance. McGraw-Hill. 1990. ISBN 0-07-023407-8.
- ^ Draper, N. R.; Smith, H. Applied Regression Analysis. Wiley-Interscience. 1998. ISBN 0-471-17082-8.
- ^ Devore, Jay L. Probability and Statistics for Engineering and the Sciences 8th. Boston, MA: Cengage Learning. 2011: 508–510. ISBN 0-538-73352-7.