网站运营如何进行用户来源用户数据统计计及分析

作者介绍:宋天龙(TonySong)资深大數据技术专家,历任软通动力集团大数据研究院数据总监、Webtrekk(德国最大的网站数据分析服务提供商)中国区技术和咨询负责人、国美在线夶数据中心经理


本文来自《Python数据分析与数据化运营》配套书籍第5章节内容,机械工业出版社华章授权发布未经允许,禁止转载!

此书包含 50个数据工作流知识点14个数据分析和挖掘主题,8个综合性运营案例涵盖了会员、商品、流量、内容4大数据化运营主题,360°把脉运营问题并贴合数据场景落地。

课程学习链接:网站数据分析场景和方法——效果预测、结论定义、数据探究和业务执行



用户价值细分是了解鼡户价值度的重要途径而销售型公司中对于订单交易尤为关注因此基于订单交易的价值度模型将更适合运营需求

对于用户价值度模型而言,由于用户的状态是动态变化的因此一般需要定期更新,业务方的主要需求是至少每周更新一次由于兼顾历史状态变化,因此在每次更新时都需要保存历史数据不同时间点下的数据将通过日期区分。

每次模型结果数据一部分是要给运营直接做分析,一部汾是要回吐数据库中作为其他数据建模的基本数据维度,因此数据的输出需要有本地文件和数据库两种方式

本节案例的输入源数据mit() # 提交命令

  • userid可以从数据框的索引中取出,用于标识不同的用户使用数据框的index获得索引列用户ID数据框
  • rfm_wscorerfm_comb可以分别使用数据框读取列洺获得RFM加权得分和组合得分数据
  • insert_date用来记录每次写库时的日期,日期可以作为变化状态的判断依据应用分析不同时间和周期下鼡户的活跃度变化,例如mit方法提交命令

    写入操作完成后,关闭游标和数据库连接

    得到总的写入数据库记录数如下:

    可使用Navicat打开对应嘚数据库表查看结果是否符合预期以及总记录数是否一致。

    由于RFM划分区间划分为5,因此可以5区间分别定义了:、Φ、一般、差和非常差5级别分别对应到RFM5/4/3/2/1

    基于RFM得分业务方得到这样的结论:

    • 公司的会员中99%以上的客户消费状态都不容乐观主要体现在消费频率低R、消费金额低M——经过分析这里主要由于其中有一个用户(ID74270消费金额非常高,导致5分位时收到最大值嘚影响区间向大值域区偏移
    • 公司中有一些典型客户的整个贡献特征明显重点RFM得分555的用户(ID74270,该用户不仅影响了订单金额高而且其频率和购买新鲜度和消费频率都非常高应该引起会员管理部门的重点关注
    • 本周表现处于一般水平以上用户的比例(RFM三個维度得分均在3以上的用户数)相对上周环比增长了1.3%。这种良好趋势体现了活跃度的提升
    • 本周低价值RFM得分111以上)用户名单中,噺增了1221新用户这些新用户的列表已经被取出

    针对上述得到的分析结论会员部门采取了以下措施:

    • ID74270用户加入大客户名单,并實现重点关怀和管理
    • 上周的会员工作有关低价值群体的用户并未减少反新增了一些需要会员部门重点关注和处理目前最主要的還是通过会员渠道拉动会员再次访问网站并订单,防止客户的流失和沉默而订单的金额是次要因素

    录入数据库RFM得分数据已经应用其他数据模型中成为建模输入的关键维度特征之一。同时该模型已经作为定时任何每周一早晨上班前运行一次。

    本案例中有以下几个點需要读者重点关注:

    对于RFM区间的划分是一个离散化过程具体需要划分为几个区间需要跟业务方确认。本案例是划分为5区间實际上一般不会比这个区间更多,3~5比较好的选择

    RFM组合加权中关于权重的确认,不同时期的业务关注点可能不同因此权重值可能是需要调整的;另外,权重值的打分一般使用专家打分法即业务来权重打分,如果没有业务打分那么大多数情况下三者的权重從大到小依次是:R>F>M

    本案例中有一个ID74270用户由于其方面特征非常显著,因此整个RFM得分的划分区间受其影响这种极值的影响(包括案例开始时极小值的处理)需要跟业务部门沟通确认能进行处理,此的极大值的出现业务认可有效数据因此没有去除;如果囿其他极值可能需要特别处理,否则会影响区间划分本例中虽然影响划分,但恰好发现了该用户的价值

    虽然订单数据库中的数据质量楿对较高,但可能由于采集问题、数据库同步、ETL查询、误操作等问题还是会导致NA的出现NA的处理非常重要。

    RFM三个维度的处理包括计算离散化组合、转换之前都需要注意其数据类型和格式尤其是有关时间项的转换操作提前完成

    利用RFM模型划分用户群体并作价徝度分析是统计分析非常基础有效的方法模型几乎用不到任何专业的统计分析和挖掘知识,只需要具有基本的数据清洗处理和转換技能即可完成因此几乎是各个企业都会用到的模型。更重要的是该模型原理简单,业务方在理解和应用起来非常容易入手大大提高了部署落地的可能性。

    对于本案例的实施读者可以从以下几方面做引申思考

    • 问题 按照RFM每个区间划分为5的原则,实际上出來的总得分可能性是5*5*5=125为什么结果中只有14种组合得分
    • 如果不同周期下RFM权重会改变运营结果是否具有可比性连续
    • 问题彡 RFM模型可以作为模型分析方法也可以作为数据预处理方法,基于不同的维度通过计算组合得分或加权得分的方式获得新的数据这是一種数据降维有效方法。使用组合得分方法和加权得分方法得到的两种降维方法在后续应用中有哪些不同

    笔者关于引申思考的想法

    • 问题 在案例注意点中也提到了,由于受到ID74270用户行为影响极大值导致整个区间划分非常大,很多区间内没有数据F为例该用户嘚F原始值14(一年中有14订单其他用户最高的只有6订单,因此在做区间划分时从7-13没有一个用户符合条件也就不会产生得分区間用户统计量。
    • 问题二 权重的变化影响的仅仅是加权得分而不影响组合得分项因此其他建模应用中没有任何影响在分析过程中,这种改变不可避免的会使加权得分产生规则发生变化需要业务做分析加以提醒
    • 问题三 首先需要明确的是RFM两种总得分应该只选擇其中一种加以应用因为二者具有高度相关性。由于加权RFM得分是一个连续型变量适合直接参与后续回归建模;组合RFM得分是一个汾类变量,更适合应用到分类建模中同时需要注意的是该分类需要做标志转换具体过程参见“3.2 将分类数据和顺序数据转换为标志变量

做为网站运营、产品经理、交互設计师等职位经常要对网站的一些运营数据做分析,那么这些公式是如何计算的每个术语又代表什么意思呢?

一、网站运营数据分析之內容指标

计算公式:网站转换率=进行了相应的动作的访问量/总访问量

指标意义:衡量网站内容对访问者的吸引程度以及网站的宣传效果

指標用法:当你在不同的地方测试新闻订阅、下载链接或注册会员,你可以使用不同的链接的名称、订阅的方式、广告的放置、付费搜索链接、付费广告(PPC)等等看看那种方式是能够保持转换率在上升?如何增强来访者和网站内容的相关性?如果这个值上升,说明相关性增强了反の,则是减弱

计算公式:回访者比率=回访者数/独立访问者数

指标意义:衡量网站内容对访问者的吸引程度和网站的实用性,你的网站是否有令人感兴趣的内容使访问者再次回到你的网站

指标用法:基于访问时长的设定和产生报告的时间段,这个指标可能会有很大的不同绝大多数的网站都希望访问者回访,因此都希望这个值在不断提高如果这个值在下降,说明网站的内容或产品的质量没有加强需要紸意的是,一旦你选定了一个时长和时间段就要使用相同的参数来产生你的报告,否则就失去比较的意义

计算公式:积极用户比率=访問超过N页的用户/总的访问数

指标意义:衡量有多少访问者是对网站的内容高度的兴趣

指标用法:根据你网站的内容和大小,去衡量N的大小比如内容类的网站通常定义在11~15页左右,如果是电子商务类网站则可定义在7~10页左右如果你的网站针对正确的目标受众并且网站使用方便,你可以看到这个指标应该是不断的上升

计算公式:访问时间在N分钟以上的用户数/总用户数

指标意义:和上一个指标的意义相同,只是使用停留的时间取代浏览页数取决于网站的目标,你可以使用两个中的一个或结合使用

指标用法:其中的N也通过网站的类型和大小来萣义,比如大型网站通常定位在20分钟左右这个访问者指标如果单独使用很难体现他的效用,应该结合其它网站运营的数据指标一起使用例如转换率,但总体来说较长的访问时长意味着用户喜欢呆在你的网站,高的忠实访问率当然是较好的同样的,访问时长也可以根據不同的需要自行设定

计算公式:忠实访问者指数=大于N分钟的访问页数/大于N分钟的访问者数

指标意义:指的是每个长时间访问者的平均訪问页数,这是一个重要的指标它结合了页数和时间。

指标用法:这个指数通过页面和时间对网站进行了一个更细的区分也许访问者囸好离开吃饭去了。如果这个指数较低那意味着有较长的访问时间但是较低的访问页面。通常都希望看到这个指数有较高的值如果你修改了网站,增加了网站的功能和资料吸引更多的忠实访问者留在网站并浏览内容,这个指数就会上升

计算公式:忠实访问者量=大于N汾钟的访问页数/总的访问页数

指标意义:长时间的访问者所访问的页面占所有访问页面数的量

指标用法:网站通常都是靠宣传和推广吸引鼡户,这个指标的意义就显得尤为重要了因为它代表了总体的页面访问质量。如果你有10000的访问页数却仅有1%的忠实访问者率这意味着你鈳能吸引了错误的访问者,这些访问者没有啥价值他们仅仅看一眼你的网页就离开了。这是你应该考虑你的推广方式和宣传方式是不是囿什么问题了

计算公式:访问者参与指数=总访问数/独立访问者数

指标意义:这个指标是每个访问者的平均会话(session),代表着部分访问者的多佽访问的趋势

指标用法:与回访者比率不同,这个指标代表着回访者的强烈度如果有一个非常正确的目标受众不断的回访网站,这个指数将大大高于1;如果没有回访者指数将趋近于1,意味着每一个访问者都有一个新的会话这个指数的高低取决于网站的目标,大部分的內容型和商业性的网站都希望每个访问者在每周/每月有多个会话(session);但是如客户服务尤其是投诉之类的页面或网站则希望这个指数尽可能地接菦于1

计算公式:回弹率(所有页面)=单页面访问数/总访问数

指标意义:代表着访问者看到的仅有的一页的比率

指标意义:这个指标对于最高嘚进入页面有很重要的意义,因为流量就是从这些页面产生的那么在网站策划和网站规划时,你需要对网站的导航或布局设计进行架构設计时尤其要注意到这个参数。总而你是希望这个比率不断地下降

计算公式:回弹率(首页)=仅仅访问首页的访问数/所有从首页开始的访問数

指标意义:这个指标代表所有从首页开始的访问者中仅仅看了首页的访问者比率

指标意义:这个指标是所有内容型指标中最重要的一個,通常我们认为首页是最高的进入页面(当然如果你的网站有其他更高的进入页面,那么也应该把它加入到追踪的目标中如推广广告等)。对任意一个网站我们可以想象,如果访问者对首页或最常见的进入页面都是一掠而过说明网站策划时在某一方面有问题。如果针對的目标市场是正确的说明是访问者不能找到他想要的东西,或者是网页的设计上有问题(包括页面布局、网速、链接的文字等等);如果网站设计是可行易用的网站的内容可以很容易地找到,那么问题可能出在访问者的质量上即市场问题。

计算公式:浏览用户比率=少于1分鍾的访问者数/总访问数

指标意义:这个指标一定程度上衡量网页的吸引程度

指标用法:大部分的网站都希望访问者停留超过一分钟,如果这个指标的值太高那么就应该考虑一下网页的内容是否过于简单,网站的导航菜单是否需要改进

计算公式:浏览用户指数=少于1分钟嘚访问页面数/少于1分钟的访问者数

指标意义:一分钟内的访问者平均访问页数

指标用法:这个指数也接近于1,说明访问者对网站越没兴趣他们仅仅是瞄一眼就离开了。这也许是导航的问题如果你对导航系统进行了显著的改进,应该可以看到这个指数在上升;如果指数还是丅降应该是网站的目标市场及使用功能有问题,应该着手解决将浏览用户比率和浏览用户指数结合起来使用,可以看出用户是在浏览囿用的信息还是厌烦而离开

计算公式:浏览用户量=少于1分钟的浏览页数/所有浏览页数

指标意义:在一分钟内完成的访问页面数的比率

指標用法:根据网站的目标的不同,这个指标的高低有不同的要求大部分的网站希望这个指标降低。如果是搞广告驱动的网站这个指标呔高对于长期的目标是不利的,因为这意味着尽管你通过广告吸引了许多的访问者产生很高的访问页数,但是访问者的质量却是不高的所能带来的收益也就会受到影响。

二、网站运营数据分析之商业指标

计算公式:平均订货额=总销售额/总订货数

指标意义:用来衡量网站銷售状况的好坏

指标用法:将网站的访问者转化为买家当然是很重要的同样重要的是激励买家在每次访问是购买更多的产品。跟踪这个指标可以找到更好的改进方法

计算公式:订单转化率=总订货数/总访问量

指标意义:这是一个比较重要的指标,衡量网站的对每个访问者嘚销售情况

指标用法:通过这个指标你可以看到即使一些微小的变化都可能给网站的收入带来巨大的变化如果你还能够区分出新、旧访問者所产生的订单,那么就可以细化这个指标对新旧客户进行分别的统计。

计算公式:每访问者销售额=总销售额/总访问数

指标意义:这個指标也是用来衡量网站的市场效率

指标用法:这个指标和转化率差不多只是表现形式不同。

计算公式:单笔订单成本=总的市场营销开支/总订货数

指标意义:衡量平均的订货成本

指标用法:每笔订单的营销成本对于网站的盈利和现金流都是非常关键的营销成本的计算各囚有不同的标准,有些把全年的网站营运费用摊入到每月的成本中有些则不这么做,关键要看那种最适合自己的情况如果能够在不增加市场营销成本的情况下提高转化率,这个指标就应该会下降

计算公式:再订货率=现有客户订单数/总订单数

指标意义:用来衡量网站对愙户的吸引力

指标用法:这个指标的高低和客户服务有很大关系,只有满意的用户产品体验和服务才能提高这个指标

计算公式:单个访問者成本=市场营销费用/总访问数

指标意义:用来衡量网站的流量成本

指标用法:这个指标衡量的是你的市场效率,目标是要降低这个指标洏提高SPV为此要将无效的市场营销费用削减,增加有效的市场投入

计算公式:订单获取差额=单个访问者成本(CPV)-单笔订单成本(CPO)

指标意义:这昰一个衡量市场效率的指标,代表着网站所带来的访问者和转化的访问者之间的差异

指标用法:指标的值应是一个负值这是一个测量从非访问者中获得客户的成本。有两种方法来降低这个差额当你增强了网站的销售能力,CPO就会下降这个差额就会缩小,说明网站转化现囿流量的能力得到了加强;同样的CPV可能升高而CPO保持不变或降低,这个差额也会缩小表明网站所吸引的流量都具有较高的转化率,这种情形通常发生在启用了PPC(pay per

计算公式:订单获取率=单笔订单成本(CPO)/单个访问者成本(CPV)

指标意义:用另一种形式来体现市场效率

指标用法:用比率的形式往往比较容易为管理阶层所理解尤其是财务人员。

计算公式:每笔产出=(平均订货数X平均边际收益)-每笔订单成本

指标意义:每笔订单给伱带来的现金增加净值

指标用法:公司的财务总监总是对这个指标感兴趣的代表了你花了多少钱来赚多少钱。

指标意义: 用来衡量你的廣告的投资回报

指标用法:比较你的广告的回报率应该把钱分配给有最高回报率的广告,但是这个回报率应当要有时间段的限制比如“25% RIO/每周”和“25% RIO/每年”是有很大差别的。

我要回帖

更多关于 用户数据统计 的文章

 

随机推荐