IP属地:浙江
主要思考几个问题: 1、logistic回归的应用场景 Logistic回归是一种用于解决二分类问题的机器学习方法,是一种判别模型:表现为直接对...
疑问: 为什么要分训练集、验证集、测试集? 为什么采用交叉验证? 交叉验证的应用场景是什么? 最终预测模型是怎么得到的? 预备知识:什么是超参数...
1.1.1 为什么使用python 1.1.1.1 科学家的需求 获取数据(模拟、实验控制) 操作和处理数据 可视化结果、快速理解、绘制高质量图...
1、 在当前的很多数据集上,相对其他算法有着很大的优势,表现良好2、它能够处理很高维度的数据,并且不用做特征选择,因为特征子集是随机选择的3、在...
总体思路: 理解问题:查看每个变量并且根据他们的意义和对问题的重要性进行哲学分析。单因素研究:只关注因变量(SalePrice)并且进行更深入的...
过拟合:训练集上表现很好,但是在测试集上表现很差,泛化性能差。 降低过拟合的方法:(1)试着寻找最简单的假设(2)正则化(3)early sto...
在随机森林bagging法中可以发现booststrap每次约有1/3的样本不会出现在bootstrap所采集的样本集合中,故没有参加决策树的建...
相同点:(1)都是由多棵树组成的,都是集成学习算法(2)最终的结果都是由多颗树一起决定 不同点:(1)组成随机森林的树可以是分类树,也可以是回归...