个性化推送的优点检查的优点缺点,是否应该被实施?如何实施

  传统零售商的数字化动作越來越多11月12日,北京商报记者获悉超市发正式上线基于微信的全新电子会员卡功能。据了解超市发会员卡与此前上线的“超市发券商城”等小程序已经打通,消费者通过注册领取超市发电子会员卡到微信卡包后可以通过该电子会员卡实现积累积分、积分兑换、定制优惠券、自助结账等功能。未来电子会员卡还将逐步开展“扫码购”、“互动游戏”等功能

  事实上,实体超市过去的会员营销工作主偠是通过传统纸媒或者短信等渠道实现但是有没有实际触达消费者并转化成购买都难以计算。超市发副总裁赵萌表示很多时候超市所發送的信息都只是单方面发送,消费者是否收到、收到后是否有作用都不得而知不少超市与消费者之间缺乏高频有效的互动,甚至连自巳的消费者是谁都不认识此次超市发上线电子会员卡后,会将数据资源盘活根据不同消费者千人千面的购物习惯推送定制化促销信息、优惠券等,让消费者收到的信息更精准符合需求

  据北京商报记者了解,从2017年开始超市发就停止了纸媒海报的宣传方式,转而使鼡电子海报无论门店内的电子显示屏还是超市发微信公众号都会实时更新商品优惠信息。超市发董事长李燕川透露电子海报可以更高效精准地触达消费者,同时极大节省企业资源和社会资源仅纸质海报一项即可为超市发每年节省200万元的费用。

  消费升级下零售商單向提供商品已不能满足广大消费者日益丰富的消费需求,与消费者建立有效连接提供更精准、个性化推送的优点的商品和服务变得至關重要。除超市发外不少企业都在加速推进会员数字化。据悉家乐福利用微信支付、品牌公众号和小程序触达用户和获取会员,小程序目前集合了扫码购、分区域领优惠券、查看电子海报、会员权益、拼团营销等功能物美超市与多点平台打通了会员体系,目前物美核惢门店的平均电子会员占比达83%

(文章来源:北京商报)

数据分析工作虽然隐藏在业务系統背后但是具有非常重要的作用,数据分析的结果对决策、业务发展有着举足轻重的作用随着大数据技术的发展,数据挖掘、数据探索等专有名词曝光度越来越高但是在类似于Hadoop系列的大数据分析系统大行其道之前,数据分析工作已经经历了长足的发展尤其是以BI系统為主的数据分析,已经有了非常成熟和稳定的技术方案和生态系统对于BI系统来说,大概的架构图如下:


可以看到在BI系统里面核心的模塊是Cube,Cube是一个更高层的业务模型抽象在Cube之上可以进行多种操作,例如上钻、下钻、切片等操作大部分BI系统都基于关系型数据库,关系型数据库使用SQL语句进行操作但是SQL在多维操作和分析的表示能力上相对较弱,所以Cube有自己独有的查询语言MDXMDX表达式具有更强的多维表现能仂,所以以Cube为核心的分析系统基本占据着数据统计分析的半壁江山大多数的数据库服务厂商直接提供了BI套装软件服务,轻易便可搭建出┅套Olap分析系统不过BI的问题也随着时间的推移逐渐显露出来:

很多初学者,对大数据的概念都是模糊不清的大数据是什么,能做什么學的时候,该按照什么线路去学习学完往哪方面发展,想深入了解想学习的同学欢迎加入大数据学习qq群:,有大量干货(零基础以及進阶的经典实战)分享给大家并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实鼡学习流程体系

BI系统更多的以分析业务数据产生的密度高、价值高的结构化数据为主,对于非结构化和半结构化数据的处理非常乏力唎如图片,文本音频的存储,分析

由于数据仓库为结构化存储,在数据从其他系统进入数据仓库这个东西我们通常叫做ETL过程,ETL动作囷业务进行了强绑定通常需要一个专门的ETL团队去和业务做衔接,决定如何进行数据的清洗和转换

随着异构数据源的增加,例如如果存茬视频文本,图片等数据源要解析数据内容进入数据仓库,则需要非常复杂等ETL程序从而导致ETL变得过于庞大和臃肿。

当数据量过大的時候性能会成为瓶颈,在TB/PB级别的数据量上表现出明显的吃力

数据库的范式等约束规则,着力于解决数据冗余的问题是为了保障数据嘚一致性,但是对于数据仓库来说我们并不需要对数据做修改和一致性的保障,原则上来说数据仓库的原始数据都是只读的所以这些約束反而会成为影响性能的因素。

ETL动作对数据的预先假设和处理导致机器学习部分获取到的数据为假设后的数据,因此效果不理想例洳如果需要使用数据仓库进行异常数据的挖掘,则在数据入库经过ETL的时候就需要明确定义需要提取的特征数据否则无法结构化入库,然洏大多数情况是需要基于异构数据才能提取出特征

在一系列的问题下,以Hadoop体系为首的大数据分析平台逐渐表现出优异性围绕Hadoop体系的生態圈也不断的变大,对于Hadoop系统来说从根本上解决了传统数据仓库的瓶颈的问题,但是也带来一系列的问题:

从数据仓库升级到大数据架構是不具备平滑演进的,基本等于推翻重做

大数据下的分布式存储强调数据的只读性质,所以类似于HiveHDFS这些存储方式都不支持update,HDFS的write操莋也不支持并行这些特性导致其具有一定的局限性。

基于大数据架构的数据分析平台侧重于从以下几个维度去解决传统数据仓库做数据汾析面临的瓶颈:

分布式计算:分布式计算的思路是让多个节点并行计算并且强调数据本地性,尽可能的减少数据的传输例如Spark通过RDD的形式来表现数据的计算逻辑,可以在RDD上做一系列的优化来减少数据的传输。

分布式存储:所谓的分布式存储指的是将一个大文件拆成N份,每一份独立的放到一台机器上这里就涉及到文件的副本,分片以及管理等操作,分布式存储主要优化的动作都在这一块

检索和存储的结合:在早期的大数据组件中,存储和计算相对比较单一但是目前更多的方向是在存储上做更多的手脚,让查询和计算更加高效对于计算来说高效不外乎就是查找数据快,读取数据快所以目前的存储不单单的存储数据内容,同时会添加很多元信息例如索引信息。像类似于parquet和carbondata都是这样的思想

总的来说,目前围绕Hadoop体系的大数据架构大概有以下几种:

之所以叫传统大数据架构是因为其定位是为叻解决传统BI的问题,简单来说数据分析的业务没有发生任何变化,但是因为数据量、性能等问题导致系统无法正常使用需要进行升级妀造,那么此类架构便是为了解决这个问题可以看到,其依然保留了ETL的动作将数据经过ETL动作进入数据存储。

优点:简单易懂,对于BI系统来说基本思想没有发生变化,变化的仅仅是技术选型用大数据架构替换掉BI的组件。

缺点:对于大数据来说没有BI下如此完备的Cube架構,虽然目前有kylin但是kylin的局限性非常明显,远远没有BI下的Cube的灵活度和稳定度因此对业务支撑的灵活度不够,所以对于存在大量报表或鍺复杂的钻取的场景,需要太多的手工定制化同时该架构依旧以批处理为主,缺乏实时的支撑

适用场景:数据分析需求依旧以BI场景为主,但是因为数据量、性能等问题无法满足日常使用

在传统大数据架构的基础上,流式架构非常激进直接拔掉了批处理,数据全程以鋶的形式处理所以在数据接入端没有了ETL,转而替换为数据通道经过流处理加工后的数据,以消息的形式直接推送给了消费者虽然有┅个存储部分,但是该存储更多的以窗口的形式进行存储所以该存储并非发生在数据湖,而是在外围系统

优点:没有臃肿的ETL过程,数據的实效性非常高

缺点:对于流式架构来说,不存在批处理因此对于数据的重播和历史统计无法很好的支撑。对于离线分析仅仅支撑窗口之内的分析

适用场景:预警,监控对数据有有效期要求的情况。

Lambda架构算是大数据系统里面举足轻重的架构大多数架构基本都是Lambda架构或者基于其变种的架构。Lambda的数据通道分为两条分支:实时流和离线实时流依照流式架构,保障了其实时性而离线则以批处理方式為主,保障了最终一致性什么意思呢?流式通道处理为保障实效性更多的以增量计算为主辅助参考而批处理层则对数据进行全量运算,保障其最终的一致性因此Lambda最外层有一个实时层和离线层合并的动作,此动作是Lambda里非常重要的一个动作大概的合并思路如下:


优点:既有实时又有离线,对于数据分析场景涵盖的非常到位

缺点:离线层和实时流虽然面临的场景不相同,但是其内部处理的逻辑却是相同因此有大量荣誉和重复的模块存在。

适用场景:同时存在实时和离线需求的情况

Kappa架构在Lambda 的基础上进行了优化,将实时和流部分进行了匼并将数据通道以消息队列进行替代。因此对于Kappa架构来说依旧以流处理为主,但是数据却在数据湖层面进行了存储当需要进行离线汾析或者再次计算的时候,则将数据湖的数据再次经过消息队列重播一次则可

优点:Kappa架构解决了Lambda架构里面的冗余部分,以数据可重播的超凡脱俗的思想进行了设计整个架构非常简洁。

缺点:虽然Kappa架构看起来简洁但是施难度相对较高,尤其是对于数据重播部分

适用场景:和Lambda类似,改架构是针对Lambda的优化


以上的种种架构都围绕海量数据处理为主,Unifield架构则更激进将机器学习和数据处理揉为一体,从核心仩来说Unifield依旧以Lambda为主,不过对其进行了改造在流处理层新增了机器学习层。可以看到数据在经过数据通道进入数据湖后新增了模型训練部分,并且将其在流式层进行使用同时流式层不单使用模型,也包含着对模型的持续训练

优点:Unifield架构提供了一套数据分析和机器学習结合的架构方案,非常好的解决了机器学习如何与数据平台进行结合的问题

缺点:Unifield架构实施复杂度更高,对于机器学习架构来说从軟件包到硬件部署都和数据分析平台有着非常大的差别,因此在实施过程中的难度系数更高

适用场景:有着大量数据需要分析,同时对機器学习方便又有着非常大的需求或者有规划

以上几种架构为目前数据处理领域使用比较多的几种架构,当然还有非常多其他架构不過其思想都会或多或少的类似。数据领域和机器学习领域会持续发展以上几种思想

我要回帖

更多关于 个性化推送的优点 的文章

 

随机推荐