数据分析概述

文章分享:一份来自贾扬清的AI青年修炼指南:不存在算法工程师、调参侠没有市场

大致流程:

  1. 原始数据收集
    • 数据埋点。收集用户在网页端,APP,小程序等终端的各种数据。
    • 业务数据
    • 外部数据
  2. 数据加工处理
    • 将收集的数据转换成可理解、可量化、可观察的业务指标
  3. 数据可视化
  4. 数据决策和执行
  5. 数据产品
    • 将策略制作成数据应用和产品,开始自动化和系统化运营。
  6. 数据战略
    • 积累了大量数据,大量模型,大量数据应用
    • 不只是数据分析,可以将数据变现

三类岗位:

  • 业务线 数据分析
  • 研发线 数据仓库
    • 数据仓库也是普通的数据库(例如 mysql),里面存的数据是为数据分析人员服务的,不对接用户。举例来说,里面可以存储用户行为路径、每日新增用户数等指标。
  • 算法线 数据挖掘
    • 相对于数据分析,需要建模,模型的目的是做预测。

行业黑话:

  • ETL:提取转换加载(英语:Extract, transform, load,简称ETL),用来描述将资料从来源端经过抽取、转置、加载至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。
  • DW 数据仓库(data warehouse)
  • CRM 客户关系管理 销售
  • CMS(Content Management System)”内容管理系统”

理解业务从理解商业模式开始:

98-1.png

指标体系

数据指标概念

场景 1,描述刚上线社区产品最近表现

  1. 日活每天都在涨,新增用户也很多。
  2. 日活按 IMEI 是在涨,但是注册用户没有很多 》新增注册转化只有 20%,说明没有促使用户注册的动机。

场景 2,产品上线一段时间,领导想知道是否要推广产品

  1. 最近日活平稳,新增用户最初没那么多了。
  2. 虽然日活平稳,但是用户活跃程度很高(人均发帖,好友关系)比上个月增长了 30%,新用户次日留存提升。(可以推广)

定义及常用数据指标

数据指标是对当前业务有参考价值统计数据。

常用的数据指标:

  • 用户数据:谁
  • 行为数据:干了什么
  • 业务数据:产生了什么结果

用户数据:

  • 存量: DAU(日活)、MAU(月活)
  • 增量: 新增用户
  • 健康程度: 留存率
  • 从哪儿来: 渠道来源
    • 搜索引擎推广 SEO
    • Rom 推广
    • app 商店
    • 手机厂商预装
    • 其它产品挂下载链接

行为数据:

  • 次数、频率,PV, UV, 访问深度
  • 关键路径走了多远, 转化率
  • 行为做了多久, 时长
  • 质量, 弹出率(跳出率,进去后立即出来)

98-2.png

业务数据:

  • 总量 GMV 访问时长
  • ARPU(Average Revenue Per User)
  • ARPPU(Average Revenue Per Paying User)
  • 人数 付费人数 播放人数
  • 健康程度 付费率 付费频次 观看率
  • 被消费对象 SKU 被消费内容

数据指标详解

DAU、MAU

  • Daily
    • 如何理解 Daily
    • 出海产品跨时区
  • Monthly
    • 怎样才算一个有效的月活呢?视情况而定。某用户一个月只活跃了一次,我们可能认为将其纳入月活会降低数据的可参考性,可以规定一个用户月活跃 7 次以上,才纳入统计。
  • 活跃(怎么才算一次有效的活跃?)
    1. 数据统计系统的定义
      • 基于事件上报:有事件上报 》该用户活跃
      • 预制报表的统计系统( e.g. 友盟…)都是基于事件上报进行统计
        • web 端页面加载成功
        • app 端按钮点击
    2. 业务定义,用户执行了关键事件
      • 日活事件列表(访问首页/访问商品详情页/访问抽奖页)
  • 用户
    • 用户通过多台设备访问产品
    • 认人
      • 给每位注册用户一个 UID
      • 只适合强登录/注册产品,未登录用户会被漏掉
    • 认设备
      • IMEI Cookie 中随机字符串
      • 无法对应设备背后的用户
    • 产品是否强制登录
      • 人+单独指标记录设备
    • 不登录用户是否有价值
      • 没价值(人+单独指标记录设备)
      • 有价值(设备)

如何理解“新增用户”:

  • 渠道商 点了下载就算
  • 运营 下载成功才算,一个用户一天最多算一次
  • 产品 按启动量算,没打开不算
  • 研发 注册了才叫新增用户,表里得能查到

用户留存:7 日留存算法、…,具体细节会根据情况变动。

为什么要看留存? 了解某个渠道的质量。

如何选择指标

从最终目的出发:

  1. 梳理业务模块
  2. 判断业务模块类型
  3. 根据业务模块类型选择数据指标

如何梳理业务模块?

  • 目的,比如我要卖货
  • 实现目的的方法,通过文章来卖货(如何搞大/搞频繁(手段))
  • 方法需要的工具,通过社区创作文章来卖货,我提供一个制作精美图文的工具
  • 实现方法的途径

例子:

  • 头条:自媒体高效创作资讯换取广告收入
  • 社区带货:社区创作软文卖货
  • 教育:为学员提供便捷的学习系统高效学习课程和分为良好的社群服务换取学费

业务模块:

98-3.png

通过四象限去分析上面 3 个场景,我们可以根据业务模块选择数据指标:

  • 工具模块:效率
  • 内容浏览模块:质和量
  • 交易模块:转化率
  • 社区模块:活跃

工具类模块关心的指标

反映维度 场景 结果
使用量 累积量,用户投入程度 拍照,笔记 用户粘性强
目标达成率 是否正常运转 支付,搜索 满意度高
频次 用户是否养成习惯 闹钟 养成固定习惯

案例:QQ 音乐的歌词海报功能,让其分享朋友圈

  • 使用量:进入歌词创建环节的数量
  • 目标达成率:海报生成数量
  • 频次:功能使用频次

交易类模块关心的指标

指标反映维度 场景 结果
详情页转化率 核心场景转化效率 电商 更容易卖
金额 总交易规模 电商,知识付费 卖更多
客单价 单个用户价值 奢侈品海淘 卖更高价
复购率 收入的持久程度 订阅式购物 卖更多次

内容浏览类模块关心的指标

指标反映维度 场景 结果
浏览数 累积量 头条类 有多少人阅读
浏览广度 覆盖内容库存情况 视频网站多个频道 库存利用率高
浏览时长 占据用户多少时间 快手,抖音 减少竞品使用时间
内容互动 用户对内容反映(弹幕) B 站 提高用户粘性

案例,微信看一看模块:

  • 浏览数
  • 浏览广度 覆盖的媒体数量
  • 浏览时长
  • 内容互动 点赞/评论/转发数量

社区社交类模块关心的指标

指标反映维度 场景 结果
发布量 用户创作内容的数量 贴吧 更多的话题源头
互动量 用户与用户之间互动的次数 微博 社区更有活力
关系密度 用户与用户之间的关系 微信 更可能长期留存

案例,脉脉 职言板块:

  • 发布量 发布的职言数量
  • 互动量 点赞评论转发数量
  • 关系密度 发布的职言涉及到的公司数量(因为是匿名发言)

如何选择数据工具

举个例子:

  • 懂球帝: 足球迷必备神器 》用户导向
  • 百度贴吧: 全球最大中文兴趣社区 贴吧最初来贡献内容 》内容导向
  • 规模化电商流量快速变现 》流量导向
  • 寺库奢侈品: 给你全世界的美好 》用户导向

对比:

  • 爱奇艺延禧攻略独播,把具体内容放在截图 》内容/流量导向
  • 哔哩哔哩,弹幕番剧直播高清视频 》用户导向

根据公司阶段划分:

98-4.jpg

---- 例子:共享充电宝 start ----

老板关注的问题:

  • 大家会不会为这个事情买单?
  • 如何核验

每天有多少人经过这个充电宝放置点:

  • 多少人扫码了
  • 多少人借用了充电宝

解决方案:计数

扫码了,但是没有借用充电宝的人,询问其动机。

单个充电宝放置点的运转效率有没有可能提升?

  • 换一个地方会不会更好?

面临竞争,用户忠诚度很重要。

  • 随机地发一些优惠。
    • 如果是超市的话,可以每天都有部分商品优惠。这样可以期望顾客在冲着优惠商品的同时,顺手买一些没有优惠的商品。

周转效率?

  • 一个放置点没有充电宝了,可以为将充电宝放在该点位的用户提供优惠。

---- 例子:共享充电宝 end ----

计数阶段:

  • 通过脚本与代码统计日志
  • 通过 BI 工具进行基本的分析
  • 通过 awk 工具去搞,外加 uniq 去重,wc 去统计
1
2
3
awk '{print $1}' access.log|sort|uniq|wc -l

# 每一行数据以空格隔开,第一个就是 $1 ,第二个就是 $2,...

linux 查看一个文件有多少行:

1
wc -l 文件名

想要选取其中一部分,放到一个新的文件:

1
head -想要的行数 文件名 >新文件名

可以使用 goaccess 这款工具简单的来统计(若链接无法访问可去 archive.org ):
https://blog.csdn.net/weixin_43599336/article/details/86533550

一个百度统计的 demo :
https://tongji.baidu.com/web/demo/overview/index?siteId=5503017

用户导向的工具要关注的问题:

  • 用户来了干什么?
  • 用户还会不会再来?
  • 用户在哪流失了?
  • 用户都是啥样的?

Mixpanel 工具:埋点代码,生成图形。

Inspectlet 工具:通过录制屏幕的行为,还原用户的行为轨迹。

业务导向的工具:

98-5.png

神策数据:
https://www.sensorsdata.cn/demo/demo.html

数据分析方法

数据分析的价值

  • 新购的这一批视频到底有没有价值
  • 浏览到消费的转化率一直不超过 1%,产品到底该优化哪儿
  • 上个预装渠道进来的量,表现如何?
  • 按销售额来看这个月绩效该怎么分配?
  • 精准广告投放该怎么选择对象人群?
  • 该引入哪些新的商品品种?

数据分析方法:

对比分析

对比分析比什么:

  1. 绝对值
    • 本身具备价值的数字
    • 销售金额
    • 阅读数 微信公众号的 10 万+
  2. 比例值
    • 在具体环境中看比例,才具备对比价值
    • 活跃占比
    • 注册转化率

问题:绝对值,不易得知内在问题;比例值,易收到极端值影响 2%~4%

怎么比?

  • 环比
    • 例子:7 号, 6 号, 5 号
    • 例子:7 月, 6 月, 5 月
    • 总结:对短期内具备连续性的数据进行分析
  • 同比
    • 例子:今年国庆销售额, 去年国庆销售额
    • 观察更为长期的数据集
    • 观察的时间周期里有较多干扰,希望某种程度上消除这些干扰

和谁比?

  • 和自己比
    • 从时间维度 环比|同比
    • 从不同业务线
    • 从过往经验估计
  • 和同行业比
    • 是自身因素还是行业趋势

多维拆解

公司做了微博大 V 推广,想看情况,数据怎么样?

APP 启动:

  • 按设备
    • iPhone, 美图手机比较多,符合产品定位
  • 按来源
    • 用户因 PUSH 下发进入 APP 比较多
  • 按城市等级查看
    • 发现一线城市用户比较多
      • 原因:运营能力有限只有北上广深有推送,因此打开几率大
  • 按新老用户查看
    • 日活量整体变化不大,老用户占比下降,新用户占比上升,留不住用户

结论:目前推广群体没问题,因为用户打开 APP 的来自推送,而运营力量不足,只在北上广深有运营,进行推送,其它城市没有,但微博大 V 推广是全国覆盖,其它城市流量被浪费了。

数据分析本质,用不同的视角去拆分、观察同样一个数据指标。

支付流程拆解:

98-6.png

从上图可以看出,B 渠道比较优质,应该投更多的钱。

一些其他的漏斗:

98-7.jpg

---- 案例:流量异常变动 start ----

动机:

  • 跌:采取动作,减缓趋势。
  • 涨:弄清原因,并放大。

最近销量突然跌了 10%,是友商搞了个活动吗?是促销活动结束了么?是新上的商品搜索结果页的变动导致的?

问题严重么?

  1. 假设:如果是个例,往期应该没这么大跌幅
  2. 证明:周同比、月同比,确实都没有如此跌幅
  3. 结论:确实是个问题

是不是服务挂了?

  1. 假设:如果是技术问题,应该存在“断崖式下跌”,且修复后会回归正常
  2. 证明:按小时查看,符合平时流量规律

是不是渠道问题?

  1. 假设:如果是渠道问题,应该存在某个渠道远低于平时的流量
  2. 证明:按渠道维度拆解,百度渠道明显下降将近 20%
  3. 结论:有问题,需进一步查询

是不是哪里缺货?

  1. 假设:如果是发货问题,应该存在某个地区远低于平时的销量
  2. 证明:按地域维度拆解流量, 陕西、浙江低了不少

跟市场沟通:
陕西和浙江的关键词投放计划在 28 号那天被消耗完了,29 号上班后才重新充值投放新的计划。

---- 案例:流量异常变动 end ----

活动影响

  • 查对应活动页面及对应动作的数据波动,关注活动是否有地域属性

版本发布

  • 将版本号作为维度,区分查看

渠道投放

  • 查看渠道来源变化

服务故障

  • 明确故障时间,按时间为维度进行小时或者分钟级别的拆分

漏斗分析

漏斗观察:

98-8.png

适用场景

  • 适用:有明确的业务流程和业务目标
  • 不太适用:没有明确的流程,跳转关系复杂

漏斗是有时间窗口的

  • 按周: 业务本身复杂,决策成本高,多日完成
    • 理财,往往是一周或者半个月
  • 按月: 决策周期更长
    • 装修、买房
  • 周期太长:包含了太多无关信息
  • 周期太短:扔掉了很多有用的信息

漏斗有严格顺序

  • 首页 -> 搜索 -> 商品详情 -> 支付 -> 支付成功
  • 不能跳
  • 同时我们从分类、搜索、推荐位都可以进入商品详情,这也是要考虑的

漏斗的计数单位可以是用户,也可以是事件。

  • 课程的负责人,关心每天有多少人会选择我们,并最终付费。关心的是用户。
  • 设计 PM 关心为什么有人第一次访问页面没有做出选择,也关心选择课程后为何有人没有支付。关心事件。

常见渠道划分方式:

  • 具体的流量实体: 百度、头条、线下
  • 媒介: SEO、自然搜索
  • 其他参数:营销活动名称、广告关键词

作为渠道,什么样的排序规则才是合理的?
要不停变化,确保使用者不知道自己的规则。否则会被恶意刷排名。

留存分析

验证产品长期价值可以看月留存。

将某一时间段的用户 ID 与另一时间段的用户 ID 做交叉去重:

98-9.png

上图可以看出随着产品版本不断的优化,月留存是不断增长的。

一般的计算方式,看大盘可能不准

  • 产品、运营、技术、市场每个环节可能都会对留存造成影响
  • 比如搞活动,引入了一个低质量的渠道,造成留存大跌,因为低质量渠道进来的都是垃圾用户,因此需要看精准留存

精准留存:

  • 过滤进行过指定行为的用户 ID,再计算
  • 将用户分为不同的群体后,观察之前留存的区别
    • 比如一个游戏产品,服务器会分区,不同区的留存不同。是不是因为有的区运营得不错?可以把运营得不错的区的运营手法,推广到其他区。

留存分析适用场景:

  • 评估产品功能粘性
  • 验证产品长期价值

案例 1(付费漫画)

某漫画产品,有一 VIP 会员功能,可看付费漫画。不是 VIP 不能看最新的连载,要等一周才能解锁观看。最近,该产品上线了一批新的会员漫画。公司想要验证这批会员漫画对会员付费功能的价值。

难点: 单纯的数字相关并不说明问题,不能说最近付费涨了就是这批漫画的功劳,要将具体的数字带入业务流程中检验。

漏斗分析:

98-10.png

把用户分为两类,有哪些是付费时看过 VIP 漫画的,有哪些是付费时没看过 VIP 漫画的。进行对比,可以发现看过这批付费漫画后,然后进行会员付费的比例更高。

注意:借助漏斗分析对比(转化关系明确时),时间太久不合适。

案例 2(主播)

以用户留存衡量某一主播对产品价值的影响(分群体)。

难点:
某些功能不能带来直接的商业价值,但希望它能长期留住用户。
留存是一个特别复杂的问题,谁都可能影响它。

因此需要看精准留存。

98-11.png

用户画像

概述

98-12.png

用户画像:
对用户各类特征进行标识,给用户贴上各类标签,通过这些标签将用户分为不同的群体,以便对不同的群体分别进行产品 / 运营动作

标签都有啥?

  • 基础属性:年龄、性别、生日、星座、教育、身高、收入、职业
  • 社会关系:婚姻、有无小孩、有无女孩、家有老人、性取向
  • 行为特征
    • 基本行为:注册时间、来源渠道
    • 业务行为:买过特惠商品、曾获优秀学员

标签怎么来?

  1. 用户直接填写
  2. 推测

何时需要用户画像?

  • 做活动(防止流量浪费)
  • 简单的个性化运营,就算不是千人千面,也需要 3 人 3 面
  • 业务分析(借助用户画像的精准分析)
  • 用户研究

如何推测:

98-13.png

还可以通过用户身边的人推断

  • 距离相近
    • 某些属性,周围的人都具备,用户大概率也具备,例如大学区域
  • 行为相似
    • 通过协同过滤,找到行为相似的目标用户,对用户进行分群

实战

很多产品经理觉的我公司很小啊,不需要做数据分析、用户画像吧?其实不是的。一个小公司其实几十万的 DAU 就非常不错,但是市场上能够提供的流量是非常大的。

98-14.png

真正的用户

  • 高留存
  • 核心行为频次、完成率高

现在比较好的广告平台,比如谷歌、腾讯的广点通都是可以精准的选择用户属性的,如下图所示:

98-15.png

运营资源盘活

【问题】整个公司的内部营销资源存在上限

运营资源盘活:常规做法是出台一套运营资源的使用规则。
比如一天最多只能推 3 条、同一个类型的营销在一周(一月)内不得重复推送等。

精细化的用户分群运营,既能提升整个公司的可用资源,也能提升被推送用户的体验(没人希望自己手机的推送消息划不完吧)。

有的公司会搞一个排期表:

98-16.png

【另一个问题】:需要在「千人一面」和「千人千面」之间找到 ROI 的平衡。

理想情况:每个标签都去做不同的推送内容。
实际:运营力量有限。哪怕将用户精确地分成一千个群体,运营团队也很难每天都去编一千条不同的推送文案和页面。

「千人一面」整个公司的内部营销资源存在上限
「千人十面」往往就能解决 80% 的问题,对应 7~8 个标签足矣
「千人千面」人力运营往往难以企及,自动化后或许可以

98-17.png

归因查找

很多时候,用户的操作行为不会像漏斗分析那样,经过层层过滤,最后到达某一行为。这个时候用漏斗分析不适合。

归因查找:找出事件发生的「主要原因」。

可以使用神策数据之类的产品。

98-18.png

对业务中明确的业务目标(购买、留资料、充值等)归因即可:

  1. 将目标的达成拆分到各个模块,方便统计各模块的贡献(这其实也是在给各团队分 KPI)
  2. 获悉当前指标达成的主要因素,获得如何提升业务指标的洞见

末次归因:转化路径短,且事件间关联性强的场景(添加好友是因为什么)

  • 比如交友软件,通过漂流瓶,附件的人,摇一摇,或者随机推荐好友

递减归因:转化路径长,非目标事件差异不大,没有完全主导的

  • 假如有一个时间管理工具,某用户买了 VIP 后没有广告了,不能简单看这一刻和刚刚用的功能有什么关系,我们可以归为 6,3,1 比例(示例)。

首次归因:强流量依赖的业务场景,拉人比后续所有事都重要。

98-19.png

路径挖掘

场景一,有明确的起始场景:

98-20.png

场景二,有明确的结果目标:

98-21.png

场景二的例子:
某在线职业培训平台,结束事件是:注册完成。我们想知道用户都经历了什么,这时我们需要把路径倒过来看,可以看出大部分的流量从【开始注册】来的,然后再往前看一步,发现【开始注册】的流量来自【登录】页面(登录页面有注册功能)和一些公开课。我们可以发现很多用户是从免费的公开课注册成功的。由此可以看出,大部分的用户都是被免费的公开课吸引,毕竟公开课不需要支付成本。

行为序列

运作原理:将单个用户的所有行为以时间线的形式进行排列。

适用场景:观察掩盖在统计信息下的更细致信息,还原用户具体的使用场景,同时还能通过观察具体的行为特征,找到提升产品价值的机会点。

举个例子:
运用用户行为序列分析法查看某共享单车 APP 的单个用户行为,通过查看我们发现,这个用户不断的在解锁我们的活动单车和锁定活动单车,并且解锁和锁定的间隔时间非常短,只有几十秒。每天有四五次这种行为,这种行为肯定是不正常的,我们再筛选一部分行为序列查看详情,我们可以发现,两次解锁的时间间隔只有 11 分钟,但是这两个铁地站的距离为 7.2KM,这是正常操作下无法实现的,这里只是简单的一个例子,单个用户的行为序列能让我们发现很多细致的信息,在这就不一一列举了。

辅助决策:

  • 通过用户画像、用户行为序列分析辅助我们在产品设计时做决策
  • 观察已有的用户的行为序列,将新设计的流程或者策略套进去看是否成立。

行为序列还可以用来防止一些恶意行为:

  • 刷量
  • 薅羊毛
  • spam

98-22.png

机刷机器是位置不动的,坐标固定的;人肉刷可以用身份证,固定的行为操作路径;薅羊毛的,限制羊毛用途,比如发的红包,只能打赏主播,不能干别的。

98-23.png

案例-专题活动效果分析

一个拉新活动,希望看到活动的效果数据。

目前活动对日活的帮助?活动带来的用户粘性是否高?哪些活动做得好?哪些活动做得不好?如何优化?

要建立分析逻辑框架。

活动前:

  • 流量:活动前每天流量效果,流量波动原因拆解
  • 收入

活动中:

  • 流量、DAU、MAU
    • 新用户进入
    • 不活跃老用户唤醒
    • 活动期间连续访问情况、用户粘性
    • 各类活动效果对比
  • 收入

活动后:

  • 流量
    • 新用户的沉淀
    • 唤醒老用户后续活跃量
  • 客服数据,活动复盘
  • 收入

撰写报告:

  • 图文并茂:大部分是图(90%),少部分是文
  • 先给结论,标题比较重要
  • 阐述的逻辑性要强

不同类型产品举例

电商类 APP

首页模块,用户视角:

  • 搜索: 流量的最大入口
  • 广告: banner, 各种活动宣传
  • 导航: 十宫格
  • 淘宝主要坑位
  • Feed 流, 电商+内容
  • 个性化推荐
  • 底部 button

三个问题:

  • 引流:首页作为最大的带量位,分发效率怎么评估(整体)
  • 漏斗:交易额是核心指标,如何理解数字转化的过程(路径)
  • 用户:拉新(痛点)

整体、分发效率评估:

  • 日活、留存、渗透率
  • 找到反映产品问题的指标,比如 CTR、人均访问页面数等

新用户与老用户相比,由于对 APP 不熟悉,在漏斗环节可能有几个特征:

  • 用户行为比较离散化
  • 在某个环节转化率会比老用户低很多
  • 新用户当天逛,过一段时间可能再下单

对于一款电商 APP,分发效率是非常重要的一个产品指标,相关文章:

互联网金融 toC 授信

互联网金融的本质是风控,数据分析师角色

  • 风控分析,一定的模型理解能力,大量的行业和法律法规经验
  • 数据建模,算法要求高,行业经验要求一般

产品对象 toB 和 toC

  • toB 定量打分卡、定性行业经验
  • toC 个人信用分
  • 央行征信报告

信用分构成:

  1. 身份特质、稳定性
    • 所在公司,职业类型,消费稳定度,近一年内使用手机号码数,手机号码稳定天数,地址稳定天数
  2. 履约能力
    • 是否有车,是否有房,近一个月流动资产日均值,近三个月流动资产日均值,近六个月流动资产日均值,近一年流动资产日均值,近一个月理财产品总收益,近三个月理财产品总收益,近六个月理财产品总收益,近一年理财产品总收益,历史理财产品总收益,近一个月支付总金额,近三个月支付总金额,近六个月支付总金额,近一个月消费总金额,近三个月消费总金额,近六个月消费总金额
  3. 信用历史
    • 近一个月主动查询金融机构次数,近三个月主动查询金融机构数,近六个月主动查询金融机构数,近一个月信贷类还款总金额,近三个月信贷类还款总金额,近六个月信贷类还款总金额,近一年信贷类还款总金额,近一年信贷类还款月份数,近一年M1 状态,近一年 M3 状态,近一年 M6 状态,近两年 M1 状态,近两年 M3 状态,近两年 M6 状态,近五年 M1 状态,近五年 M3 状态,近五年 M6 状态
  4. 人脉关系
    • 近 1 年人脉圈稳定度,社交影响力指数,信用环境指数
  5. 行为偏好
    • 消费区域个数,近一年支付活跃场景数,近一年母婴消费总金额,近一年母婴消费总笔数,近一年游戏消费总金额,近一年游戏消费总笔数,近三个月家居建材消费总金额,进三个月家具建材消费总笔数,近一年汽车消费总金额,近一年汽车消费总笔数,近一年航旅度假消费总金额,近一年航旅度假消费总笔数

数据处理工具

本小节主要是 excel, tableau 等数据处理工具的教程。

这里顺便贴上用 Python 裁剪视频的代码:

1
2
3
4
5
6
from moviepy.video.io.ffmpeg_tools import ffmpeg_extract_subclip

start_time = 2691
end_time = 4075

ffmpeg_extract_subclip("D:\学习资料\pylearn\day50\\1.mp4",start_time,end_time,targetname="aout.mp4")

excel 的基本使用

0:00-27:43 excel
27:44-end tableau