自己的博客维护起来越来越麻烦,简书也越来越好了,所以索性来一次老文搬家。因为是老文,聊的很多都是过去时的内容,感兴趣的可以凑合看看,下面这篇的原始日期是:2012/06/03
首先,不谈到底大数据的定义是什么,说什么都会被拍,定义是仁者见仁的事情。
在理解层面,不能孤立的就大数据谈大数据,它其实包含很多方面,涉及很多范畴。诸如,被广泛谈到的,大数据与互联网产品(广义的,包括服务)的关系,与云计算的关系,以及三者组合起来形成的商业或者社会价值模式。最典型的就是Google的搜索,表面看只是搜索服务,实则是打通了产品、数据、云计算的多个范畴。
传统的互联网模式更多的是企业提供产品,用户使用产品(免费或者付费)。而大数据的互联网模式中多了闭环的另一半,用户消费的同时,也会产生价值,这个价值目前看是以数据为载体形式产生的,这些数据自下而上发挥价值,不仅为互联网企业,也为传统各行各业带来价值。举个例子,好比一个LBS应用,从产品侧看,可能是为了满足用户空间导航、商家检索的功能;而从数据价值的视角看,用户在使用应用的同时,其产生的数据里蕴含了诸如兴趣喜欢、行为习惯、地域特征等需求、模式、意向层面的信息,这些信息反过来可以辅助LBS应用开发商优化产品服务,从更大角度看,也可以将数据开放或共享给第三方生产型企业,以提高企业在产品、运营、营销等多方面的精细化决策。
为了进一步说明三者的关系,可以从概念层面做出如下概念框图:
(A)产品/服务层
最上层与用户直接接触到的是产品或服务,从传统产品模式角度看(自上而下看),单向的通过产品服务的功能或体验去满足用户的需求是核心,数据是为了支撑产品的,是副产品;而从大数据的角度看(自下而上看),产品是为数据服务的,是产生数据工具或平台,数据才是隐藏其后的核心。
在这个层面做事情,简单看有三种模式(确实很简单的看):
i).只注重产品(如传统的互联网产品经理的做法),更多的是从用户需求出发,关注功能设计,重视用户体验,通过产品的不同侧重点结合不同时期的精细化运营手段,构建核心竞争力;
ii).只注重数据,这种模式是从价值出发,也可以理解为从数据消费方的需求出发,去采集获取数据,这些数据可以有多种来源,开放产品API、公共网页抓取、第三方数据公司购买、市场研究公司的Panel、社会公共数据、市场调研数据、数据交换平台、大众数据整合平台(众包模式)…同时也可以来自不同的终端,如手机、RFID设备、IP地址、公共摄像头…,从业者更关注的往往是数据层面的问题,比如数据质量管理、主数据管理(MDM)、数据庞杂性、个人隐私安全等等;
iii).注重产品和数据的均衡,如果说第一种模式需要的是产品经理式的leader,第二种模式需要的是大数据模式的leader,那这第三种模式则需要能均衡考虑产品、数据的leader,即可以将用户侧的用户需求与价值侧的商家需求完美的融合的人,而在运营、盈利模式层面在2B/2C层都游刃有余的人。
(B)大数据层
如果说上面产品环节更多的是在企业内部完成的,那大数据这个环节则是构建在企业与企业之间,也就是一个大数据生态链上。从当前的现状来看,全球产生的数据规模正在逐级攀升,而大数据这个生态价值链也会越来越长,最终形式如何,很难预料,但链条当中可能会有几种类型的公司存在(暂不考虑数据应用环节):
i).Player类型
Player类型公司直接参与大数据价值链上横向的一环,比如,有之前提到的数据采集类公司(数据IT化、数据整合),有基础数据处理类公司(非数据化数据的半结构化与结构化),有数据联盟、数据市?。ǜ咝У氖菔占疲?,有数据质量管理组织,有数据挖掘建模类的公司,有数据产品类公司,有BA/网站分析类公司等;
ii).平台类型
平台类型的大数据企业不直接参与链条,而是间接为Player类型的企业或个人提供服务,其中尤其是面向企业的公司,往往具有很强的技术实力。比如,分布式数据计算平台(如提供类似hadoop的解决方案),提供通用的数据分析甚至挖掘能力或服务的企业,第三方推荐引擎(国内的如百分点科技),社会化数据采集平台(众包模式),面向个人的公共文件(也是数据)云存储平台等;
iii).专业工具型
专业工具型的企业为Player类型的企业、平台类型的企业或个人提供IT工具软件,比如,企业内部报表工具、微博社会化展示工具、专业统计/数据挖掘工具等;
iv).咨询服务类型
上述企业都需要数学、计算、业务专家,尤其是跨多个领域的交叉型人才,这些人目前还属于稀缺资源,因此,中小企业要想将自有数据的价值发挥出来,往往需要类似咨询公司来提供整体解决方案规划、交叉人才的知识和技能、相关工具和平台,在初期,这类企业会有很多的市场机会。
上述各类公司都有自己的上下游,关系微妙,定位也大不相同,因此也产生了大量不同的商业模式(此处后续希望另起一篇进一步展开详述)。
(C)云计算层
虽然云计算理论的诞生和大数据并无直接关系,但随着互联网web2.0时代的发展,网络上用户产生的数据越来越多,且依托社会化网络化传播,数据量呈指数增长。而且,除结构化数据外,UGC数据更多的以文本、图片、音频、视频等半结构化或非结构化数据存在。这些都为数据的存储、计算提出了很高的要求。而云计算在这个环节却有着先天的优势,这就为云计算及大数据应用提供了拉手的空间。
其实,云计算是“无处不在”的,这里的“无处不在”是指在上图中的产品、大数据、数据价值应用环节都有云计算的存在。比如,在产品层面,基于开发者的PaaS层面的云计算服务提供商,可以为开发人员提供从操作系统、开发语言、数据库等一应俱全的云开发平台;再比如,像Testin这样的初创企业,可以为广大APP开发人员提供基于真机智能终端的云测试服务。在大数据层面,上面提到很多,自不必都说。在价值应用层面,虽然现在还没有发生,但可以想象,在大量原始数据、信息知识集中到云端,云计算能力也集中到云端的情况下,大数据的价值应用更有可能是以SaaS的形式提供给互联网及传统企业的需求方手中。
我们可以看到,云计算越来越脱离纯忽悠的阶段,走向真实,这个“真实”既表现在云计算服务形势在IaaS、PaaS、SaaS三个层面的落地,也表现在为个人用户、开发者用户、企业用户等多用户类型的服务上。而这些“真实”除了资源、资金的节约,效率的提高外,更表现在大数据可能带来的广泛的“逆向价值”的产生上。
如果说云计算是公路的话,那么大数据应用则相当于汽车。好的汽车可以驱动公路的发展,而好的公路又会反过来又能促进汽车的进步。
(D)价值应用层(价值再造过程)
大数据的价值应用可以通过企业内部快速实现,就像很多互联网企业做的那样,比如亚马逊,基于自有用户行为、评分数据,为用户提供视频推荐服务。也可以取之于互联网用之于互联网,比如像Google、百度,收集互联网数据,提供搜索产品,进而在互联网行业内通过搜索广告将数据价值化;再比如,互联网广告定向投放第三方公司,基于多个媒体端的监测数据及其它开放数据,基于不同人群投放不同的定向广告,基于数据价值,有效提升CTR,进而为广告主在网络媒体端提高ROI。
但大数据更多的价值空间并不仅仅局限于互联网行业,在市政规划、金融证券、电信、医疗卫生、保险、电力、传统制造业等等均可以有多种应用方向。应用方向可以包括客户洞察、客户服务、风险控制、交叉销售等不同方向。
大数据价值的实现难点,首先在于价值需求的挖掘,如何从行业内外发现需求(不论是企业客户需求,还是最终个人需求)。其次则要考虑数据价值的实现模式,尤其是数据产品应用模式。就像Google,最先创造了搜索的产品应用模式,随着竞争的加剧,公司需要不断扩充新的数据,不断提高公司的技术核心竞争力,探索一个个新的数据产品应用模式。并且,在上面两个难点中,都需要融合不断更新的数据,新的社会学理论,去思考问题,不断从企业出发,以新的视角去看待业务问题,看待市场、社会、人、人性。这个是难中之难。
作者:老读悟,微信公众号:laoduwu666