Ensemble Learning 集成多个算法结果得到比任何单个算法更好的结果,称为集成学习。 2021-02-19 MachineLearning 集成学习 随机森林 随机森林是一种具有代表性的 Bagging(装袋法)集成算法。 2021-02-19 MachineLearning 集成学习 树模型 随机森林 使用交叉验证选择决策树预剪枝参数 max_depth max_depth 限制树的最大深度,超过设定深度的树枝全部剪掉。 2021-02-15 MachineLearning exercises 决策树 树模型 支持向量机相关习题 比较感知机的对偶形式与线性可分支持向量机的对偶形式 已知正例点$x_1=(1,2)^T$,$x_2=(2,3)^T$,$x_3=(3,3)^T$,负例点$x_4=(2,1)^T$,$x_5=(3,2)^T$,试求最大间隔分离超平面和分类决 2021-01-22 MachineLearning exercises svm 支持向量机内容概要 概览支持向量机(Support Vector Machine)是一种二类分类模型。基本原理是,特征空间上几何间隔最大化。 In its most simple type, SVM doesn’t support multiclass cl 2021-01-20 MachineLearning svm k-means 习题 简述一下K-means算法的原理和工作流程 输入k,表示数据聚类到k簇 随机选出 k个质心 将每个点归到距离最近的质心所属簇 求簇中每个点均值,求出该质心新的位置 循环3、4 当质心不再发生变化停止迭代 K-means中常用的到中心距 2021-01-12 MachineLearning exercises k-means k-means 算法知识点梳理 Overviewk-means 算法是最常用的聚类算法,属于无监督学习算法。 工作原理和流程 输入k,表示数据聚类到k簇 随机选出 k个质心(Centroid) 将每个点归到距离最近的质心所属簇 求簇中每个点均值,求出该质心新的位置 循环3 2021-01-12 MachineLearning Note k-means ID3 算法 决策树是一个非常常见并且优秀的机器学习算法,它易于理解、可解释性强,其可作为分类算法,也可用于回归模型。基本算法有 ID3、C4.5、CART。 Overview ID3算法(Iterative Dichotomiser 3 迭代二叉树3代 2021-01-07 MachineLearning Note 决策树 树模型 Advantages of the different impurity metrics? 分类决策树中,我们的目标函数是最大化每次切分数据带来的信息增益: 其中 $f$ 是决策问题基于的特征;$D_p$ 和 $D_j$ 分别是父节点数据集和第 $j$ 个子节点数据集; $I$ 不纯度衡量指标; $N$ 是数据集总大小,$N_j 2021-01-07 MachineLearning 决策树 评估指标 entropy VS gini Entropy vs ginisklearn.tree.DecisionTreeClassifier(criterion="gini") 中 criterion 参数用于指定节点上决策问题评估指标(不纯度降低量最大或信息 2021-01-07 MachineLearning 决策树 评估指标 熵 基尼不纯度