四、LightGBM LightGBM也是常用的GBDT工具包,速度快于XGBoost,精度也还可以,其设计理念为: -单个机器在不牺牲速度的情况下,尽可能使用上更多...
四、LightGBM LightGBM也是常用的GBDT工具包,速度快于XGBoost,精度也还可以,其设计理念为: -单个机器在不牺牲速度的情况下,尽可能使用上更多...
@作者: 机器学习算法 @迪吉老农[http://weibo.com/dijilaonong/] 最近使用GBDT时,想通过分布式进行训练,尝试了一些框架,但原理不太了解。有...
Attention技术在 NLP 模型中几乎已经成了不可或缺的重要组成部分,最早Attention主要应用在机器翻译中起到了文本对齐的作用,比如下图,Attention 矩阵...
@作者: 机器学习算法 @迪吉老农[http://weibo.com/dijilaonong/] AUC这个指标在排序问题里经常用到,之前也有个模糊的印象,就是一个排序正确的...
@作者: 机器学习算法 @迪吉老农代码地址:https://github.com/yandili/forge_load 1. 背景需求 最近组内的GPU利用率一直被警告,说是...
@零乱徘徊 哈哈你发了这么多科普文
不正经的微博大数据:论桌上足球的攻防实践作者:微博研发中心算法平台@迪吉老农 今天是春节前一天,作为目前在公司内数一数二的选手,感觉可以和大家分享一下桌上足球这项运动的精髓。 1. 背景 桌上足球的英文是foosb...
一. 引述 传统深度网络:数据驱动大量迭代遇到新数据重新训练低效 神经图灵机 (Neural Turing Machine):极少量样本便可以进行有效学习强大的推理能力人类水...
@作者: 研发中心算法平台 @迪吉老农 假冒大V的头像识别 一. 问题的定义 热门微博的评论中出现了一批假冒名人头像的用户,在头像右下角仿造了一个V字图形。如图, 热门微博的...
分布式TensorFlow简介 参数服务器 当计算模型越来越大,模型的参数越来越多,多到模型参数的更新,一台机器的性能都不够时,我们需要将参数分开到不同的机器去存储和更新。 ...
MXnet的学习笔记,这次主要是MXnet和TensorFlow在自然语言处理(NLP)上的应用。关于MXnet中其他应用例子的综述介绍可以看这里[MXnet] Simple...