任网行数据分析 用户画像中的群体画像主要有哪些?

一个产品创意初期对用户的需求定义,在产品原型产出后,有时候会推倒重来。

为什么对用户理解遗失?用户是多样的,在设计初期没有对用户进行定义,闭门造车中,设计师很容易忘记用户雏形。因此,在设计初期需要用户画像来帮助设计师理解用户,用户画像在整个产品过程中具有指导作用。

用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理,如,可以做分类统计:喜欢红酒的用户有多少?喜欢红酒的人群中,男、女比例是多少?

也可以做数据挖掘工作:利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌?利用聚类算法分析,喜欢红酒的人年龄段分布情况?

大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。当计算机具备这样的能力后,无论是搜索引擎、推荐引擎、广告投放等各种应用领域,都将能进一步提升精准度,提高信息获取的效率。


早期Pruitt和Adlan的人物角色周期概念
1计划:创建角色前的研究和计划阶段
2构思与孕育:将研究数据和观察转换成角色
3诞生与成熟:强有力/清晰地表达
4成年:在设计流程中发挥作用
5终生成就与退休:评估角色地作用


Alan Cooper提出“人物角色”概念——以明确目标创建人物画像,从用户使用情景出发,研究人员观察记录用户在使用同类产品时的场景及人机交互的细节及原因(从群体用户的问卷调研、数据分析到具象的个性描述,再到抽象应用),产品设计人员依据用户行为数据redesign现有产品。如下图所示:

做用户画像的基础,是通过数据对海量用户有一个初步的了解,一般采用用户数据提取分析与问卷调研两种方式进行,根据产品目标确定统计分析的维度指标。

分析的维度,可以按照人口属性和产品行为属性进行综合分析,


人口属性(静态信息):地域、年龄、性别、文化、职业、收入、生活习惯、消费习惯等;
产品行为(动态信息):产品类别、活跃频率、产品喜好、产品驱动、使用习惯、产品消费等;
构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。
对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。如,世界上分为两种人,一种是学英语的人,一种是不学英语的人;客户分三类,高价值客户,中价值客户,低价值客户;产品生命周期分为,投入期、成长期、成熟期、衰退期…所有的子分类将构成了类目空间的全部集合。
这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。
此处将用户数据划分为静态信息数据、动态信息数据两大类。

用户相对稳定的信息,如图所示,主要包括人口属性、商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗工作,因此这方面信息的数据建模不是本篇文章重点。


用户不断变化的行为信息,如果存在上帝,每一个人的行为都在时刻被上帝那双无形的眼睛监控着,广义上讲,一个用户打开网页,买了一个杯子;与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等一样都是上帝眼中的用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多,如上图所示:浏览凡客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞“双十一大促给力”的微博消息。等等均可看作互联网用户行为。

在互联网上,用户行为,可以看作用户动态信息的唯一数据来源。

以下是腾讯开放平台的一些产品用户属性,年龄与性别的交叉分析,付费用户与年龄的交叉分析。无论是后台数据分析还是用户问卷调研,都需要进行研究的效度与信度论证,保证数据尽量准确可用。


做问卷调研,需要做多少份问卷呢?一般是4000份以上,这个时候的抽样置信区间可以达到99%,错误率幅度在2%左右。如果保持错误率2%的水平,置信水平95%,那么问卷数量可以下降到2500份。需要注意的是一般我们回收问卷,还会通过答题完整性、一致性等多项标准剔除无效问卷,所以回收问卷尽量高于标准数量的10%。
案例:页游用户年龄与性别分布

数据来源:2013年腾讯开放平台白皮书


案例:付费用户年龄分布

数据来源:2013年腾讯开放平台白皮书


这本白皮书还是有不少用户数据可以供大家参考,有兴趣的同学可以去腾讯开放平台下载:/

二、具象的定性个体描述

创造人物角色,这里先说一个概念:Persona。Alan Cooper提出了Persona这一概念。《赢在用户》这本书将其翻译为“人物角色”,是在上面的海量数据分析基础上,进行具象化得到一个的虚拟用户。

P 代表基本性(Primary research)指该用户角色是否基于对真实用户的情景访谈


E 代表移情性(Empathy)指用户角色中包含姓名、照片和产品相关的描述,该用户角色是否引起同理心。
R 代表真实性(Realistic)指对那些每天与顾客打交道的人来说,用户角色是否看起来像真实人物。
S 代表独特性(Singular)每个用户是否是独特的,彼此很少有相似性。
O 代表目标性(Objectives)该用户角色是否包含与产品相关的高层次目标,是否包含关键词来阐述该目标。
N 代表数量(Number)用户角色的数量是否足够少,以便设计团队能记住每个用户角色的姓名,以及其中的一个主要用户角色。一个产品,一般最多满足3个角色需求。
A 代表应用性(Applicable)设计团队是否能使用用户角色作为一种实用工具进行设计决策。
我们通过调研去了解用户,根据他们的目标、行为和观点的差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,例如:一些个人基本信息,家庭、工作、生活环境描述,赋予一个名字、一张照片、场景等描述,就形成了一个具象的典型用户画像。人物角色一般会包含与产品使用相关的具体情境,用户目标或产品使用行为描述等。为了让让用户画像容易记忆,可以用具体的名字、标志性语言、几条简单的关键特征进行描述。一个产品通常会设计3~6个角色代表所有的用户群体。
譬如下面就是做YY用户画像的一个案例:

用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。如,红酒 ,这个案例,从歌手、专辑、单曲三个维度,融合离线计算与在线实时推荐机制进行设计与开发

以下也是某音乐产品的推荐逻辑:


案例三:流失预警模型决策树算法

以下是微博的做用户画像的完整案例:

基于对设计的需要和市场的了解,2011年度微博ucd团队进行了一次微博用户的用户画像研究。整个勾画过程持续了三个月,下面结合微博用户画像的流程以及项目的一些心得作一些总结与介绍。在进行微博用户画像的过程中,所面临的情况是微博产品上线已经两年多,用户群已稳定发展起来,并且研究人员对于产品及用户整体状况有了一定的把握,但是在具像化、有生活情境的故事版用户上却还存在认识的不足,因此我们在进行用户画像时给自己定下了四个目标:
使产品经理、交互设计师、视觉设计师、开发工程师对微博产品目标用户产生具象的认识,更好的了解我们的目标用户;
细化用户的使用场景、使用目的,方便产品、交互等角色讨论产品方案时举出实例;
提高产品设计效率,把资源投入在典型用户上;
指导产品决策,便于针对性地定位产品,通过分层满足目标用户需求,逐步提高用户对产品的认同度与依赖度。

一般而言,用户画像在产品没有上线、市场前景较为模糊、产品需求还需探索的阶段,定性化的用户画像能有效地节省时间、资源,在较短的时间通过桌面研究、访谈等定性化的方法来获得用户画像是一种比较可行和最优的方式。而事实上,用户画像是一种能将定性与定量方法很好结合在一起的载体,通过定量化的前期调研能获得一个对于用户群较为精准的认识,在后期的用户角色的建立中能很好地对用户优先顺序进行排序,将核心的、规模较大的用户着重突出出来。定性化的方法虽然无法对不同单位的特征作数量上的比较和统计分析,但能对观察资料进行归纳、分类、比较,进而对某个或某类现象的性质和特征作出概括,在角色建构的过程中定性化的方式能获得大量用户的生活情境、使用场景、用户心智等资料,进而形成活生生的用户类型。基于我们后台数据的支持和挖掘,这次我们的用户画像选择将定量化和定性化方法相结合来创建微博用户画像。总体来说,这次用户画像所经历的流程主要有:

一、前期资料搜集与后台数据挖掘


在描绘了这一项目的时间节点,制定出项目规划后,对前期资料搜集有利于我们了解项目的背景和对总体情况的把握。我们必需要明确的是用户画像的过程本身是一个很好的定义自身设计产品边界的契机。虽然用户画像是在创造一系列的“典型”或者“象征性”的用户,但用户画像的一个更高层次的功用在于使用用户画像融合边缘情况的行为或需求。创建用户画像不是单纯是抽离出典型进行分隔的一个过程,更为重要的是整合进边缘人群的需求,使产品能在更大范围里满足用户需求。
因此在画像之前,我们需要知道产品的用户特征,用户使用产品的操作行为特征等要素,从总体上把握用户群的需求,同时也需要竭力了解所谓边缘用户的行为或需求以便于在后期画像过程中将其需求最大程度地整合进去。
第一阶段我们首先对后台数据进行提取,通过后台数据挖掘了解到用户上网环境的一些关键指标,如屏幕分辨率、移动端与WEB端用户的比率等。在对用户使用场景有一些初步把握后,我们随机提取了10万用户UID样本量,获取用户职业身份、年龄、性别、学历、浏览微博时长(手机、浏览器),用户的偏好(博文内容中获得)等关键因素,进行清洗后,使用SPSS聚类分析确认区分最明显的因素,得出最为典型的五类用户及其占比:
第一类属于微博内领袖人物,粉丝以及活跃度都很高,认证数量比总体高,年龄比总体偏大,男性占比稍高于总体;
第二类属于微博内属于非领袖活跃人物,关注人数多,认证数量高于总体,来自手机端注册较少,女性用户高于总体;
第三类喜欢浏览,粉丝少,全部来自PC端的年龄偏大的男性用户;
第四类浏览量很小,很少搜索,会有转发一些微博,男性稍微高于总体,而且属于低龄化群体;
第五类属于纯浏览型,很少原创以及转发和被转发,私信等,全部来自PC端的女性用户。
至此,研究团队已经对整个用户群类型与规模有了一个定量化的把握和了解,这对于建立可信的用户画像非常具有参考价值,后期的画像在数据上有了支持。
在用户画像的过程中有一个很重要的概念叫做颗粒度,就是我们的用户画像应该细化到哪种程度。举一个极端的例子,如果“用户画像”最细的颗粒度应该是细到每一个用户每一具体的生活场景中,但是这基本上是一个不可能完成的任务,同时如果用户画像的颗粒度太大,对于产品设计的指导意义又相对变小了,所以把握好画像的总体丰富程度显得异常重要了。上一步我们形成了对整体用户的一个了解,但还有一些信息没有很好的得到。在这一步,我们采取问卷调查的方法来丰富用户的情态,这对于把握用户画像颗粒度有一定参考意义。
通过问卷调查研究团队主要想了解的信息有微博用户的使用场景、用户关注的内容、整体满意程度以及个人的人口学统计特征,在已有数据的支持下继续深化了解用户信息。我们通过网调系统以及微博通知的方式回收5000多份问卷,在问卷设计中涉及到以上主要变量,对回收的这批数据进行处理,获得了用户的人口学统计特征以及常用功能的占比,这些常用功能包括用户使用深度、使用核心功能等要素。

三、用户访谈与角色建构


在前期数据支持下,在这一阶段就需要发挥定性研究的长处了,前期如果是一个搭建骨架的过程,那么这一阶段就是一个塑造一个有血有肉的活体的过程了。根据目标用户的比例和使用特征数据,我们在这一阶段找到20名目标用户进行深度访谈,重点挖掘其生活情境与使用场景。围绕用户的行为特征,通过添加环境、人际关系、操作熟练程度、使用意向、人口统计学属性等细节对用户进行描述,形成用户画像的框架。此外,对用户画像取合适的名字、适当描述个性,附照片等能使角色更加生动,栩栩如生,更易于设计师形成直观印象。由于前期对用户群比例有了定量化的支持,因此在涉及到超过三个以上的用户画像需要进行排序时就有了比较明确的数据支持,这时保证了画像顺序最大的客观性。通过整个前期的调研加上定性的访谈,最终我们形成了下列五类用户角色:

总体说来,所形成的用户画像有了数据的支持和具像化的丰富,基本上满足对可信服的用户角色的PERSONA7个要求。但对于微博这个用户基数比较大的产品来说,这一用户画像还有再待提升的地方,首先微博用户的使用场景还需要根据用户群进行进一步的细化研究,了解不同用户在不同情境(交通过程中,上班途中,睡觉前)的典型使用行为与习惯,在不同情景下,不同典型用户操作行为和习惯有什么不同。同时我们按照职业分类用户的方法可能还存在问题,还需要研究不同行业人士、不同职业背景、不同身份地位的人的行为,细化专业人员与专业行业,以使用行为模式为特征提取共性,探索在不同典型场景开发出新需求点的可能性。

扫二维码或微信搜索“大有青年”关注公众号

    权限管理系统是任何一个企业管理系统内都必备也是非常重要的模块,对权限系统的分析和规划也是一个B端产品经理必备的能力。

    现有的权限系统通常基于RBAC(Role-Based Access Control)的思想设计,角色和权限绑定、角色和用户之间的松耦合、多对多的关系来实现授权和授权的快速变更,从而控制用户对系统的功能使用和数据访问权限,以达到企业或机构安全管控的目的。

    和用户权限系统密切相关的还有两个模块:账号体系和组织架构。

    账号体系,会负责用户账号注册、登录验证、密码找回等功能,其中登录验证(即准入权限)和权限系统有着密切的关系。

    组织架构,即公司的行政组织架构。对于大型企业,可能会有总公司、大区、分公司、办事处、部门等各个不同级别的机构,机构之间可能纵横交错,彼此有业务往来,较为复杂;对于小微企业或流程相对简单的业务,通常只有公司,部门两个级别,较为简单。面对复杂的大型企业组织架构,权限系统的设计和实现复杂性会成倍的增加。

    阿里钉钉是很多人都在使用,并且也是复杂型的后台管理系统,本文会结合钉钉的一些做法对权限系统进行介绍。

二、规划一个权限系统的核心

权限系统要实现的核心目标是对企业业务的安全管控,企业业务对安全性要求的级别,实现安全管控的粒度,是产品经理需要解决的核心问题,依赖产品经理拥有一定的行业经验和对用户实际业务流程、操作有较深的认识。我们使用产品经理通用的思考模型“角色→场景→任务”来梳理这一问题。

B端产品的用户画像和C端产品不同。

C端产品的用户画像有梁宁提出的小闲、小明、小笨这种具备明显性格特征、行为特征的用户画像。

而B端产品是强业务、岗位职责驱动,企业组织架构下,具备不同级别不同职责的岗位,就是B端产品的用户画像。

因此产品经理弄清楚其行业客户的组织架构下的职位设置、职级设置、职责设置之间的共性即可。B端产品经理对职位、职级、职责的理解,还有很多值的探讨的地方,在此不做详述。

钉钉的角色按照职务、岗位进行设置

场景即用户使用产品的时间和空间。不同时间不同空间下,意味着用户可能会使用不同的终端设备,不同的网络情况,执行不同的任务,有着不一样的行为习惯等等。

C端产品会非常重视用户场景不同而后残生的不同需求,比如一款音乐APP:晨间地铁上,伏案工作中,孤枕难眠时都会有不同的用户情绪和需求。

作为B端产品,只需重考虑以下两点:一是PC端和移动端上不同场景下的不同权限;二是如果业务操作中涉及工作地点的变更,需要考虑一些数据安全性。

    在B端组织架构下,每个角色要执行的任务是由职责完全决定的,因此理解角色职责,就可以掌握用户需要在产品上完成的任务。

    比如企业某部门leader的职责是负责某项业务销售数据的增长,那么经常统计信息,查看报表任务会由他们完成,按照角色梳理即可。

    在做角色任务梳理的时候可以从可以做什么、不可以做什么、可以向系统提交哪些数据、可以向系统查询哪些数据、可操作的数据范围几个纬度进行入手。

    通过对角色、场景、任务的梳理后,根据共性抽象出权限系统中的核心要素,角色类型、准入权限、使用权限、数据权限。

    同时,在大型组织架构以及大型平台下,还需抽象出组织权限,应用权限方便进行细粒度的授权控制。

    角色从使用的角度划分,一种是管理角色,一种是业务角色。管理角色是针对平台的管理用户,用来划分管理的范围。业务角色是员工在系统中执行各种实际工作流时的角色。

    从创建方式的角度划分,一种是内置角色,一种是自定义角色。通常管理角色通过自定义的方式创建,业务角色通过内置的方式创建。

    至于系统应该选择用什么样的方式定义权限,根据产品的组织架构,和性质来划分:

  1. 有工作流,但是组织架构较为简单:管理角色自定义到菜单或功能级别,业务角色根据业务流梳理业务角色内置即可;

  2. 简单类型产品,没有工作流:管理角色和业务角色重合,根据需求做到菜单级别自定义授权,或功能级别自定义授权即可;

  3. 复杂组织架构,复杂业务流:管理角色做到应用级别授权,管理员由IT运维人员担任,他们通常不了解业务,因此菜单或功能级别的权限划分给业务角色,业务角色根据工作流引擎内置。由于复杂业务流情况下,系统一定会有一套自定义工作流的引擎,用来随时创建和变更工作流程,因此业务角色通常是各个岗位的岗位名称即可。除此之外,可能还要处理上下级权限继承的关系。

创建变更流程都会用到的业务角色

    超级管理员角色是拥有最高权限的角色,通常内置一个admin用户,或者是创建某个管理实体的用户。以钉钉为例,对企业进行注册和创建的用户即为超级管理员。超级管理员对应的用户只有一个,整个系统归属于它,允许变更该用户,不允许删除角色。

    所有的自定义管理员为普通管理员,其管理权限配置需配置组织部门权限和应用管理权限,组织部门权限是其管理的数据范围,如XX子公司、销售部,应用权限即各个应用。

    业务角色的权限体现在工作流中,随着任务在不同岗位之间流转,不同岗位看到的内容完全一样,只是处理的表单不一样。

    比如请假审批:一张请假单先通过小组leader到部门leader到人事,数据一致,只是数据的状态在发生改变。根据职位来配置业务角色即可。

    一般来说,系统部署好之后,业务角色会完全初始化好,变更的话需要通过工作流引擎中添加,或者通过添加代码的方式增加。通常企业的职位、职级设置都相似,变更的情况较少发生。

    组织架构创建之后,会天然的体现组织权限,表现为数据的归属和访问范围,无需创建角色。组织权限是自动赋予在部门级别上的权限。

    比如销售部门拥有销售数据提交、查看、分析报表查看、下载的权限,那么一个用户创建到销售部门下后,会自动继承该部门的组织权限,再根据该用户的具体业务角色在确定其具体可访问的数据。

    比如老王是A部门的,那么老王只能访问A部门的数据,不能访问隔壁B部门的数据。老王的业务角色是普通销售员,就只能查看自己的数据,而老王的领导老万是部门经理,就可以查看销售部所有人员的数据。这便是组织权限的具体体现。

    准入权限是对用户账号的登录限制,原则上属于用户账号体系,和角色关联不大。通常会有如下功能需求:

    直接限制账号是否拥有登入平台,或登入某个应用的权限,比如普通员工无法进入人事管理应用。

    二次验证是在识别到用户的登录地点、登录设备、登录客户端变更之后的二次验证,做的比较好的如微信的二次登录验证,支持验证码,邀请好友验证等多种方式。

    仅允许在规定时间之前使用账号,通常用于发放试用账号之类的临时账号。

    包括特定设备限制,或者设备数量限制。如果是高级别的安全性需求,登录设备可能需要先进行安全登记,才允许登录。设备数量限制通常是作为付费增值服务,比如印象笔记,免费用户最多只允许在两个设备上同时使用。

    客户端限制通常使用的较少,BS应用使用任何浏览器都可以登录。笔者仅在企业邮箱中见过类似限制,Google企业邮箱如果需要使用foxmail类的第三方邮件客户端进行收发邮件,仅知道账号密码是不够的,还需要从Google Mail后台,生成一个实时动态密码进行验证才行。

    网络限制通常是企业的内网和外网限制,应用和数据只能通过企业内网访问。在一些公安、军工类安全级别高的场景下,设备被人为接入外网后,还会立即发出警报。

    用户的使用权限由其组织权限、业务角色、数据状态共同决定,通常为增、删、改、查。不做过多赘述。

    另外用户角色可执行的任务,通常是可以访问的系统页面,在做权限系统时,除了要求用户只能访问被分配权限的页面,在用户通过其他方式,如直接访问url时,需要能够进行阻止。

    数据权限有两个重要的识别方式,数据状态和数据归属。

    根据工作流引擎或者业务流程确定,一张请假单可能会有草稿、待审批、审批通过、审批不通过的各种数据状态,不同的数据状态根据工作流的配置自动在各个业务角色间流转。不同数据状态下,不同角色拥有不同的操作。

    数据归属即为创建这个数据的人或拥有该数据的部门,通常情况下数据的创建人永远拥有该数据的可见的权限,比如我提交的请假单,整个流程中,我都可以随时查看该数据及数据状态的变更。历史记录的查看也依赖创建人拥有数据权限。也有一些特殊情况,比如数据归档之后,对于创建人,可能就不可见了。

    本文笔者以钉钉进行举例,实际上所有的功能权限都是钉钉租户权限,租户权限是什么意思呢?

    钉钉是一个面向企业的SaaS服务系统,那么所有的客户(单个独立注册的企业)在钉钉系统里面都属于钉钉的租户。

    在钉钉内部,还有另外一个租户管理系统,用以管理所有已注册租户,比如对租户进行授权,租户行为数据分析等等。租户管理系统内的用户权限也可按照本文的模式进行产品设计。

    作者:一直往北方开(微信号:z),多年SaaS产品、购物中心集团CRM、自主创业、云计算虚拟化行业产品经验,文章总结均为落地型实战型产品经验,热爱阅读,持续学习者、思考者

    本文由 @一直往北方开 原创发布于九三招聘网。未经许可,禁止转载。

节目简介:《中国新说唱》是2018年爱奇艺举全平台之力打造的S+级自制超级网综。它是中国第一个以“剧集式”叙事 理念制作的真人秀节目,也是第一档华语青年说唱音乐真人秀。在兼具“燃、酷、潮“三大基因的同时,中国元素与说唱音乐的华丽碰撞,以及新时代新青年的自信表达,无疑将推动《中国新说唱》更好地回归音乐本身,打造一场华语青年说唱音乐盛会?。

我要回帖

更多关于 数据分析 用户画像 的文章

 

随机推荐