subtitle
03
27
Adaboost 算法流程 Adaboost 算法流程
对于二分类任务,Adaboost 几本思路是训练d 个弱分类器 $G_1(x), G_2(x), …, G_d(x)$,然后把这些弱分类器线性组合成强分类器 $G(x)$。 $$G(x)=sign(f(x))$$ $$f(x)=\sum_
27
符号函数 符号函数
符号函数(Sign function,简称sgn)是一个逻辑函数,用以判断实数的正负号。 为避免和英文读音相似的正弦函数(sine)混淆,它亦称为 Signum function。其定义为: 参考 Wikipedia
24
决定系数(R2) 决定系数(R2)
一般用可决系数($R^2$)评价线性回归模型对数据的拟合程度。 它可以通过计算观测值 $y$ 和预测值 $\hat{y}$ 之间的相关性来得出。 $$R^2 = \frac{\sum(\hat{y}{t} - \bar{y})^2}{\
24
最小二乘法 最小二乘法
最小二乘法(英语:least squares method),又称最小平方法,是一种数学优化建模方法。它通过最小化误差的平方和寻找数据的最佳函数匹配。 最小化残差平方和来确定模型的各个参数($\beta_1, \beta_2, ….,
22
常用统计值及含义 常用统计值及含义
均值、方差、协方差、相关系数。 通用几个统计值 均值 The sum divided by the count. 数据集中程度的一个统计量,目的是确定一组数据的均衡点。 $$\mu_x=\bar{X}=\frac{\sum_{i=1}^{
21
19
单位根检验 单位根检验
单位根检验单位根检验是一种更客观的判定是否需要差分的方法。 这个针对平稳性的统计假设检验被用于判断是否需要差分方法来让数据更平稳。单位根检验的方法有很多种,ADF是一种常用的单位根检验方法,他的原假设为序列具有单位根,即非平稳,对于一个平稳
19
自相关图 自相关图
自相关系数自相关系数可以测量时间序列 滞后值 之间的线性相关性,正如相关系数可以衡量两个变量之间的线性相关性。 如 $r_1$ 衡量 $y_t$ 和 $y_{t-1}$ 之间的关系;$r_2$ 衡量 $y_t$ 和 $y_{t-2}$
18
ARIMA 系列模型 ARIMA 系列模型
AR 模型自回归模型基于目标变量历史数据的组合对目标变量进行预测。自回归一词中的自字即表明其是对变量自身进行的回归。 一个 $p$ 阶的自回归模型 $AR(p)$可以表示如下:$$y_t=c+w_1y_{t-1}+w_2y_{t-2}+ …
18
延迟算子 延迟算子
延迟算子时间序列的延迟使用延迟算子(backshift operator)描述, 用$B$ 表示。 (有的文献使用滞后算子,Lag operator,用$L$表示) $$By_t=y_{t-1}$$ $$B(By_t)=B^2y_t=y_{
1 / 2