subtitle
Ensemble Learning Ensemble Learning
集成多个算法结果得到比任何单个算法更好的结果,称为集成学习。
随机森林 随机森林
随机森林是一种具有代表性的 Bagging(装袋法)集成算法。
使用交叉验证选择决策树预剪枝参数 max_depth 使用交叉验证选择决策树预剪枝参数 max_depth
max_depth 限制树的最大深度,超过设定深度的树枝全部剪掉。
支持向量机相关习题 支持向量机相关习题
比较感知机的对偶形式与线性可分支持向量机的对偶形式 已知正例点$x_1=(1,2)^T$,$x_2=(2,3)^T$,$x_3=(3,3)^T$,负例点$x_4=(2,1)^T$,$x_5=(3,2)^T$,试求最大间隔分离超平面和分类决
支持向量机内容概要 支持向量机内容概要
概览支持向量机(Support Vector Machine)是一种二类分类模型。基本原理是,特征空间上几何间隔最大化。 In its most simple type, SVM doesn’t support multiclass cl
k-means 习题 k-means 习题
简述一下K-means算法的原理和工作流程 输入k,表示数据聚类到k簇 随机选出 k个质心 将每个点归到距离最近的质心所属簇 求簇中每个点均值,求出该质心新的位置 循环3、4 当质心不再发生变化停止迭代 K-means中常用的到中心距
k-means 算法知识点梳理 k-means 算法知识点梳理
Overviewk-means 算法是最常用的聚类算法,属于无监督学习算法。 工作原理和流程 输入k,表示数据聚类到k簇 随机选出 k个质心(Centroid) 将每个点归到距离最近的质心所属簇 求簇中每个点均值,求出该质心新的位置 循环3
ID3 算法 ID3 算法
决策树是一个非常常见并且优秀的机器学习算法,它易于理解、可解释性强,其可作为分类算法,也可用于回归模型。基本算法有 ID3、C4.5、CART。 Overview ID3算法(Iterative Dichotomiser 3 迭代二叉树3代
Advantages of the different impurity metrics? Advantages of the different impurity metrics?
分类决策树中,我们的目标函数是最大化每次切分数据带来的信息增益: 其中 $f$ 是决策问题基于的特征;$D_p$ 和 $D_j$ 分别是父节点数据集和第 $j$ 个子节点数据集; $I$ 不纯度衡量指标; $N$ 是数据集总大小,$N_j
entropy VS gini entropy VS gini
Entropy vs ginisklearn.tree.DecisionTreeClassifier(criterion="gini") 中 criterion 参数用于指定节点上决策问题评估指标(不纯度降低量最大或信息
4 / 6