利用数据提升经济效益有很多战场,本文聊的是用户转化领域的2个典型情景和现存的问题。(其他还有偏后台的供应商管理或工作流平台优化,有空再写)
现在有哪些用户行为数据(以OTA为例)
用户从搜索入站,关键词是出行需求;出行日期和当前日期的差距,暗示用户此时处于出行的何种阶段,以及出行可能的类别;反复搜索、筛选、查看的过程数据;多设备反复以上过程的数据;(假如没有就这样离开了)完成预订的行为数据;查询订单状态,可能有来电来信的行为数据;完成后的点评,索取发票的沟通等行为数据。
假设我们不看以上任何数据,最传统方式在后台一个个产品录入,根据价格/分类排序,也完全可以售卖。借鉴了数据之后,首先“准备干啥”,其次“为了什么”,让我们分两大类的利用数据的方式,来解答这两个问题:
第一大类 润物细无声
客人没有感觉到额外的事情发生,最主要的场景是“排序”--这个词范围很大,产品排序,类别排序,评论排序等等,只要是排序就有数据优化空间。
排序的基本因素,大致可以分为三部分:
一是内容本身的质量
不同类目差距很大:
虚拟产品关注是否传递了充分的信息,例如OTA来说,图片数量、种类、质量,格式化的基本信息,例如位置信息,设施和使用说明等等;
如果是实物产品,涉及仓储,例如哪个分仓有哪些SKU,配送费用等;
虚拟和实物共有的,影响排序的内容,是服务内容,比如退改签条例,一般而言服务类内容有行业标准和法律法规,比较难拉开差距(但是钻空子的行当还是太多了,比如ota。。。。,这种情况下服务类内容对质量分影响很大);
第一部分对大部分打工同学来说根本不是问题,因为如果内容都不具备,根本不会有什么数据分析和数据运营,然而对创业同学来说,大部分时间还是花在这部分,后面的事情略奢侈。
二是非实时的干预
比如付费对排名的影响(这个可以写一个p4p的长篇论文,对于不做ppc的人来说就是买流量,其实完全不是这么一回事儿,市场投放的人命苦就在这里,不多展开。)
再比如根据市场活动需求排序,根据利润排序,根据账号购买历史排序等等。
这部分其实客人大都可以自己排序筛选,无非是有一个默认排序,以及特殊区域、广告区域的排序而已。
三是实时的干预
也就是所谓大数据反哺。举例子来说,如果这个客人在之前的记录里,显示出商务或者大款的特征(类似价格倒序排序,只看这个地区最贵的酒店),此时应该在各个角落将各种排序从D丝版本切到高富帅版本。
这时的排序调整可以对转化起到戏剧化的影响-不仅仅是增加了客单价,甚至因为优先展示了高价产品,转化率会更高,因为让某些客人觉得合乎身价。
三个层次排序的数据应用水平
排序优化的应用水平,也就是一二三的顺序,首先基础内容是最最根本的,没有一,什么也玩不起来;二可能对新转型互联网的行业有难度,一般来说都是标配;三是更上一层楼的对资源和团队有一定要求的、比较前沿的领域,二线以上互联网公司一般都有。
第二大类 嘈切错杂弹
相比第一类的尽量不打扰,第二类是“适度打扰客人”。
如果说第一类已经充分进入大数据时代,第二类的现状就基本属于和数据分析没有太大的关系,靠行业经验和直觉来试错。
类比线下的传统行业,如果第一大类是超市如何放置商品货架的话,第二大类无疑就是主动推销的促销人员了。
传统零售行业,包括传统软件行业,已经有极其成熟的经验体系,即在客人进入门店的每个时间节点,介入推销的成功率是有规律性的差异的,这是需要培训给每一个,学历可能不是太高的店员店长的。至于传统软件行业,互联网时代的小朋友可能很难想象,大部分销售是靠会展的(其他部分是靠酒席的),和传销拉人一样,在展会过程中,为与会者做产品介绍的每个时间节点,例如见面寒暄,介绍册,参观展厅,介绍案例,各个环节和情景下,介入干预并说服的成功率是不同的,同样有完整的培训体系。
然而目前这一切都是基于经验,而不是基于理性的。
时代已经悄然发生变化,翻译软件已经可以通过机器学习,自行掌握不同语言的语序差异和使用习惯,在统计学进入这个领域之前,这是无法描述给机器的、只有人类能做到的模糊任务。换句话说,假如能收集大量的可供学习的素材,“在哪个时间节点,如何打扰客人,收益的期望最大”是完全可以计算的。
不做任何干预的情况下,客人在进站-搜索-排序-筛选-再次搜索-排序-离站或支付下单,有一个期望的转化率,我们的命题就是,根据用户的行为数据,选择最合适的位置“打扰”客人,并验证这个选择是否最优,逐步改善。
对传统超市、会展销售、呼叫中心来说,在根据经验制定了操作流程和培训之后,在流程和培训无法企及的地方如何继续优化呢?--完全是残酷的适者生存,如果销售人员和产品、当地客群本身“相性”高(也就是匹配),自然会越“打扰”业绩越好,如果不匹配,很快就会走人,天朝最不缺的就是用来试验的人,很快就会产生明星推销人员,没有人会关注离开的人。
然而离开的人并非没有价值,我们换个角度思考,如果在残酷的适者生存的过程里,用数据记录完整的过程呢?性别/年龄/学历水平/主动程度/切入的话题/擅长的产品类别,不断淘汰,不断有人脱颖而出的过程,正是典型的模型参数学习过程。
回到最开头的ota会员营销话题,本文想说的是,无论打扰的方式是站内信/edm/微信,还是短信/电话,打扰的内容是阳春白雪的文案还是下里巴人的让利,我们现在跳出执行的细节层面,在整体来看,形式/内容/话术风格/时令/地域文化差异,共同影响了结果,而这一切只要有数据,都是可以机器学习的。
显然如果只有online数据,无论完整性还是完备性都是不够的,还需要有和客服/门店/快递人员的语音记录等线下内容。虽然难度看起来很大,但是令人不寒而栗的是,如果这些问题被克服了,实际上就不需要多次重复建设,这可能是一种公共社会基础???,类似《三体2》里,几十年后到处触摸屏、实时语音提示的情景。
这种(显然会导致一大堆人失业的)未来,在目前看来并不是非常不可能,除了数据获取和清洗需要很大的投入之外,暂时无法克服的只剩下一些存储和运算的性能瓶颈而已。
聊一点题外话
在古装片里,经常能看到皇帝召出占星师之类的角色,用八卦来推算未来,一般来说我们称之为“迷信”。
然而假如用数据运营的角度重新看,有一些古代知识分子,根据历史经验,把各种相关事件抽象到阴阳八卦(也就是1和0的二进制),以3位数的二进制(例如乾就是111)来将历史事件归纳提炼,变成“某种规律”,当需要占卜时,只需要把当时已知的情况作为参数录入进“某种规律”,就可以得到一个误差极大、但具备一定参考价值、并且算法还在不断更新的“天意”。
用这个角度看,在没有任何计算设备的古代,这个方法是何其的科学。(而且占卜结果不好,并不会重新算、或者改掉,相比之下比现在的统计局还更靠谱一些)
在思考一些数据应用的情景时,偶尔就会想,可能我们现在的很多数据处理方法(为了克服性能问题,大量用减少精确性的偷懒假设,比如马尔可夫链),在未来人类看来,和阴阳八卦的误差率数量级是差不多的。带着这些遐思去一边整理随笔,一边回顾历史、吐槽未来,也算是周末(带娃之余)最简单最纯粹的快乐吧。