前言 当我们自建大数据集群(如OLAP集群、实时计算集群、分布式存储集群、全文搜索集群等)的时候,除了硬件资源要合理配备外,在操作系统层面也要进行一些事前配置,让大数据组件能...
前言 当我们自建大数据集群(如OLAP集群、实时计算集群、分布式存储集群、全文搜索集群等)的时候,除了硬件资源要合理配备外,在操作系统层面也要进行一些事前配置,让大数据组件能...
Date: 2020/11/22 Coder: CW Foreword: CW 近日在自己的机子上发现,nvcc --version 和 nvidia-smi 显示出来的CU...
2022年的最后一天,照例来写几笔。凌晨0点回来揭晓年度最佳单曲。 健康 新冠疫情第三年的结尾,解封了,阳过了,也痊愈了(咳嗽和味觉减退还在缓慢恢复中)。 虽然从统计角度看,...
数据血缘 数据血缘(data lineage)是数据治理(data governance)的重要组成部分,也是元数据管理、数据质量管理的有力工具。通俗地讲,数据血缘就是数据在...
我们在初始化SparkConf时,或者提交Spark任务时,都会有master参数需要设置,如下: 但是这个master到底是何含义呢?文档说是设定master url,但是...
本文根据李宏毅老师2019最新的机器学习视频整理。 视频地址:https://www.bilibili.com/video/av46561029/?p=61ppt下载地址:h...
1、这个全世界怎么要求你,那是它的事,我最偏心你,我的糖都给你。 2、我会毫不犹豫的奔向你,这次,每次,次次。 3、你可以听很丧的歌,但我希望你能看看外面的太阳星星月亮行人树...
1 “被人理解真的是很奇妙的事情, 是那种你以为只有你自己蜷缩在看不见光的地方,而他提着灯来找你时对你说,我可以坐在你旁边吗。” 2 “人生里很多节点都是突然一个瞬间想通的,...
Kullback-Leibler Divergence,即K-L散度,是一种量化两种概率分布P和Q之间差异的方式,又叫相对熵。在概率学和统计学上,我们经?;崾褂靡恢指虻サ摹?..