在用户画像系列—当我们聊用户画像,我们在聊什么? 先容了用户画像的利用处景: (1)本性化保举 经过用户标签给用户保举合适的商品大概内容 (2)营销圈选 按照组合条件(比如说:性别女、年龄25-30、都会白领)圈选出一部分用户,给他们发送push大概短信奉告他们比来有什么活动之类的。 (3)战略引擎 按照用户标签射平分歧的战略,比如说:高消耗职员有奢侈品进口通道 (4)算法模子 (5)画像报告 布景: 明天这篇文章首要分享下用户画像在营销圈选中的利用,后续会继续聊其他几个偏向的利用处景。 营销圈选,望文生义就是按照一些组合条件圈选出合适的人群,比如说:比来要搞女性的美妆促销活动。那应当很轻易了解,我选出这方面需求的女性用户,然后经过发送push弹窗大概短信大概邮件等等方式来告诉用户,我们有一个美妆大促活动有什么什么优惠,然后让你来加入。 题目: 可是会出现一些题目,比如说:平台用户总共有10w,可是我按照组合条件挑选(女性用户、都会白领、年龄在25-30岁之间)出来只要5000。假如只是给这5000人发送这个需求明显是没法子到达我的要求。那有没有什么法子呢? 比如说:发现圈选的方针用户5000里面,有很多类似的地方,喜好美妆对于满减活动也比力敏感,然后平台里面10w 用户也有很多男性用户虽然年龄跨越30岁了,可是对于美妆也很是感爱好(能够是给女朋友买?) 那想到一种法子能否是可以经过这5000用户,去全量用户里面找和这些用户比力类似的一些人呢?经过这5000个用户找到和他们类似的2.5w个用户,加起来3w,给这3w人发送营销活动。 处理计划: 上文中提到的5000个用户称号为“种子用户”,平台用户10w称之为一切用户(DMP用户),然后我们扩大出来的3w用户称之为“类似用户”大概"扩大用户",这个进程称之为Lookalike 那究竟若何才能按照种子用户找到这部分类似用户呢? Lookalike整体营业流程以下: (1)按照平台的全量构建标签,也是用户画像标签的加工(dws_user_info_profile) (2)按照构建的用户标签停止向量化,可以参考Spark Word2Vec构建向量化(dws_user_info_profile_embe),具体内容可参考: https://dblab.xmu.edu.cn/blog/1292/ (3)将向量化的用户特征数据写入ElasticSearch,此处斟酌用Spark 停止批量写入,提升性能,至此用户量化和入库工作就已经完成了 (4)在营销平台按照圈选条件(比如说:女性、年龄25-30岁、喜好美妆),最初获得种子用户的id列表 (5)按照种子用户关联用户向量特征获得可以婚配上的用户的向量特征,种子用户id,种子用户向量 (6)按照向量特征去ElasticSearch 里面停止扩量 ElasticSearch 建立索引mapping 首要有两个字段,userId和vector_embedding(dense_vector),其中vector_embedding 为dense_vector范例 ElasticSearch向量化利用参考: https://cloud.tencent.com/developer/article/1774216 经过利用ES向量化查询功用完成扩量,具体实现会触及到扩量查询采用Spark 提升并发性,经过设置扩量倍数参数来获得每一个种子用户的Top N 扩量,终极将扩量后的数据写入HDFS目录同时告诉营销平台扩量完成。 |