前言 数据分析是通过明确分析目的,梳理并确定分析逻辑,针对性的收集、整理数据,并采用统计、挖掘技术分析,提取有用信息和展示结论的过程。 本文从常用数据分析逻辑框架及技术方法介...
前言 数据分析是通过明确分析目的,梳理并确定分析逻辑,针对性的收集、整理数据,并采用统计、挖掘技术分析,提取有用信息和展示结论的过程。 本文从常用数据分析逻辑框架及技术方法介...
前言 数据分析是通过明确分析目的,梳理并确定分析逻辑,针对性的收集、整理数据,并采用统计、挖掘技术分析,提取有用信息和展示结论的过程,是数据科学领域的核心技能。 本文从数据分...
数据、算法、算力是人工智能发展的三要素。数据决定了Ai模型学习的上限,数据规模越大、质量越高,模型就能够拥有更好的泛化能力。然而在实际工程中,经常有数据量太少(相对模型而言)...
前言 机器学习中,模型的拟合效果意味着对新数据的预测能力的强弱(泛化能力)。而程序员评价模型拟合效果时,常说“过拟合”及“欠拟合”,那究竟什么是过/欠拟合呢?什么指标可以判断...
1 时间序列 时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。典型的时间序列问题,例如股价预测、制造业中的电力预测、传统消费品行...
XGBOOST 简介 XGBOOST:简单来说是集成了很多个基学习器(如Cart决策树)的模型。它是集成学习的串行方式(boosting)的一种经典实现,是广泛应用在工业、竞...
1 赛题 2 赛题分析 2.1 赛题背景 随着科技发展,银行陆续打造了线上线下、丰富多样的客户触点,来满足客户日常业务办理、渠道交易等客户需求。面对着大量的客户,银行需要更...
1 特征选择的目的 机器学习中特征选择是一个重要步骤,以筛选出显著特征、摒弃非显著特征。这样做的作用是: 减少特征(避免维度灾难),提高训练速度,降低运算开销; 减少干扰噪...
创造新的特征是一件十分困难的事情,需要丰富的专业知识和大量的时间?;餮坝τ玫谋局驶旧暇褪翘卣鞴こ??!狝ndrew Ng 业内常说数据决定了模型效果上限,而机器学习算法...
1 超参数优化 调参即超参数优化,是指从超参数空间中选择一组合适的超参数,以权衡好模型的偏差(bias)和方差(variance),从而提高模型效果及性能。常用的调参方法有...
实验目的 观察组培金线莲不同品种、不同栽培周期下的生长情况,多方面分析其生长速率,从而确定适宜的栽培品种。 数据情况 数据集为金线莲信息。只有1个excel表,为金线莲生长指...
本质上,生成器也是一种迭代器。但生成器只能迭代一次,因为值是在迭代过程生成,而所有的值没有保存在内存。这里先介绍下迭代器的概念,迭代器分为3部分: 可迭代对象: python...