决定系数(R2)

MachineLearning

Publish Date: 2021-03-24

Update Date: 2021-03-24

Word Count: 239

Read Times: 1 Min

Read Count:

一般用可决系数（$R^2$）评价线性回归模型对数据的拟合程度。

它可以通过计算观测值 $y$ 和预测值 $\hat{y}$ 之间的相关性来得出。

$$
R^2 = \frac{\sum(\hat{y}{t} - \bar{y})^2}{\sum(y{t}-\bar{y})^2},
$$

反映了回归模型所能解释的被预测变量的变异占被预测变量总变异的比例。

但是仅仅利用 $R^2$ 来衡量模型是远远不够的。因为当增加解释变量的个数时，$R^2$ 值将会不断增加，但这并不意味着更好的模型效果。

采用调整的可决系数可以解决以上问题：

$$
\bar{R}^2 = 1-(1-R^2)\frac{T-1}{T-k-1},
$$

其中，T 是观测点的个数，k 是预测变量的个数。

ahmatjan

https://ahmat1914.github.io/2021/03/24/jue-ding-xi-shu-r2/

All articles in this blog are used except for special statements CC BY 4.0 reprint polocy. If reproduced, please indicate source ahmatjan !

符号函数（Sign function，简称sgn）是一个逻辑函数，用以判断实数的正负号。

2021-03-27 MachineLearning

数学

最小二乘法（英语：least squares method），又称最小平方法，是一种数学优化建模方法。它通过最小化误差的平方和寻找数据的最佳函数匹配。

2021-03-24 MachineLearning

优化