今天我并不是要推荐Tableau相关的书籍,因为目前市面上已经发行的Tableau书籍都比较久远,我和喜乐君今年即将要出版的两本Tableau数据分析系列图书,距上市还有一段时间,还需要大家耐心等待。不过,我强烈向大家推荐一本KNIME相关的新书《KNIME数据科学案例教程》。
在我接触的数据分析软件中,毫无疑问Tableau Desktop和Prep是上手最容易的,没有之一,这两个工具也是我工作中的好帮手。Desktop自不用多说,我的公众号就是因Desktop而生的,而Prep作为Desktop的前置工具,更着重于关系型数据库的ETL工作,作为ETL的后起之秀,虽然Prep可以完成我工作中的80%工作,但是遇到更加复杂的使用场景,Prep就略显吃力。
我在寻找Prep的替补软件的过程中,发现了KNIME。KNIME不仅可以搞定ETL工作,机器学习、可视化、Python编程等等都可以在一个软件,或者说一个流程中完成,是一款全能型的数据工具。最近我一直在向别人安利这个软件,最重要的是桌面版免费。
引用书中对KNIME的介绍:
KNIME数据分析平台是一款强大、开源的数据挖掘软件平台,用于数据科学、数字化创新、机器学习等广泛领域,通过??榛诘?、无代码的工作流方式固化和传递流程、链接算法资源,从而形成更为优化的人力组织模式,高效低成本实现灵活多变、时效性要求特别高的数字化需求??梢约虻サ亟淅斫馕笫菔贝摹癊xcel”,是未来信息化社会人人必备的工具体系的一环,是数字化发展趋势下的必然产物,是方法论的具象工具之一。
相对于Prep来说,KNIME有一定的学习成本,但并不是很高。如果基本熟练了Prep的使用,学习起KNIME来就更加的顺畅。尤其是KNIME可以使用编程中的各种变量,循环,递归,遍历等算法,这是Prep所不具备的,而这些过程通过拖拽节点的可视化方式实现,并不需要使用代码,有编程思维的人使用起来就更加的得心应手。比如,以前需要使用python完成的工作,KNIME中拖拽几个节点配置一下就可以了,省去了编写代码的过程,我在前面《购物篮分析(3)——利用Knime和Python实现》一文中已经对比过。
而《KNIME数据科学案例教程》这本书的特点就是案例化教学,通过几十个案例,一步一步带领大家了解KNIME,这是我非常喜欢的一种思路,简单高效。
引用书中内容简介
本书以若干数据处理任务为主线,循序渐进地引导读者使用KNIME开源数据平台。书中提供了一些富有趣味性的数据处理案例,在一步一步解决问题的过程中,帮助读者熟悉KNIME当中众多节点的使用方法,以便在其他数据任务中举一反三。作为大数据时代的“Excel”,它将成为未来数字化、信息化社会工程师的必备工具之一。本书的目的就是以KNIME平台作为组织间,人与机器之间的有效媒介,助力各行各业高效发掘数据资产当中的价值。
本书既适合初学者入门,精心设计的案例对于工作多年的开发者也有参考价值,并可作为高等院校和培训机构相关专业的教学参考书。
说了这么多KNIME的好处,只有你自己去尝试了才知道它到底适不适合你。工具本无所谓好坏,一个工具也不可能全能到解决所有的问题,只要根据自身需求和特定环境,选择自己适合自己的工具即可。
对我来说,能用Tableau就不用别的软件,而Tableau无法完成的时候,KNIME打辅助就可以轻松解决99%的工作。