- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2022-11-16來源:靈仙瀏覽數:641次
在搭建用戶標簽體系的過程中,除了數據收集、數據清洗、數據加工之外,標簽的管理也是非常重要的一環,合理的管理可以最大化的發揮標簽的價值。
企業在采購大數據平臺時為了結合一些應用場景,普遍上架了客戶標簽和客戶畫像項目。這些項目有沒有起到預期效果?標簽應用與大數據平臺如何有效結合?標簽和畫像到底有什么關系?標簽的IT架構與CRM、數據中臺有什么聯系?
在搭建用戶標簽體系的過程中,除了數據收集、數據清洗、數據加工之外,標簽的管理也是非常重要的一環,合理的管理可以最大化的發揮標簽的價值。
通過下圖一個小例子我們先感受一下標簽,一個數據項可以加工出很多標簽,同時一個標簽也可以由很多數據項共同加工而成。
從數據查詢的角度來看,最原始的數據查詢方式是關鍵字段查詢,后來演化為基于元數據的自定義查詢,再到現在的標簽化查詢,數據的粒度是在逐步深化的,所以講標簽是數據最細粒度的劃分。從技術性能角度來看,標簽是把復雜的業務邏輯轉化為提前T+1跑批了。例如“是否7天內理財到期客戶”,一個客戶可能持有多款理財產品,這個標簽如果不提前跑批會涉及多表關聯以及復雜的業務邏輯判斷,查詢性能響應自然是吃不消的。
以下為兩種典型的標簽管理方式。
1、原始標簽管理:最原始的管理方式,基本是0管理,直接通過數據庫中的表管理。

2、產品化后的標簽管理:

一、按照來源方式分類
1、用戶自己填寫的數據生成的標簽這部分標簽是用戶在注冊產品或者在各個模塊自行填寫的信息。一般就是【性別】、【生日】、【真實姓名】、【居住地】、【身份證】等。
2、通過統計用戶行為,生成的統計標簽常見的做法是,基于用戶在平臺中的交互行為,通過對埋點收集到的數據進行各維度的統計加工。
3、通過算法生成的標簽基于歷史數據訓練機器學習模型得到的標簽,常用的如營銷響應率、產品響應率。
4、通過第三方采購、積累的比如螞蟻評分、電信數據等等。
二、按照業務場景分類
這種方式根據各自業務特點不同、業務復雜度不同,所采取的分類層級和分類也不盡相同。這個分類,主要是用于標簽系統的標簽管理,按照業務方式進行組織標簽類別,有助于用戶的便捷使用。以下為幾個參考案例:阿里達摩盤的標簽分類:
某司內部的標簽分類:
某電商平臺用戶標簽分類:
三、按照數據類型分類
1、數值型標簽
如【用戶最近7天購買金額】、【用戶近1天瀏覽天數】等,這些標簽都是按照一定的規則統計生成的,均是數值型標簽。組成公式是:【時間范圍】+【行為方式】+【統計方式】。下圖是達摩盤標簽中的部分統計標簽:
2、單值型枚舉標簽
這類標簽的最大特征,就是一個用戶在這個標簽中,只能有一個選項值。而且,和數值型標簽的區別在于,單選型標簽的選項值是可窮舉的,是離散的。例如:【用戶的生命周期】,用戶肯定是處于【成長期】、【成熟期】、【衰退期】、【沉睡期】其中的一個,不可能屬于兩個或者多個。
3、多值型枚舉標簽
一個用戶可以有多個值。同樣,復選型標簽也是離散值,選項是可窮舉的。
例如:【用戶的收貨城市】,用戶可以有多個城市
4、文本型標簽
這類標簽最大的特征,是不連續、且不可窮舉。例如,【用戶常用熱搜詞】,每個用戶都可以有自己的常用熱搜詞,但熱搜詞的數量是巨大的,不能像單選型標簽或者復選型標簽那樣,幾個、甚至最多幾十個選項,就能覆蓋所有。為啥要進行這個分類呢?
標簽的內容信息,指的是一個標簽具體有哪些基本信息。主要包括:【標簽基本信息】、【標簽的數據表信息】、【標簽加工信息】、【標簽的質量信息】、【標簽的應用信息】

一個完整的標簽建設項目包括標簽加工、標簽裝載、標簽管理、標簽服務四個環節的,如下圖所示:

標簽加工:很多客戶問我標簽加工是放在大數據平臺,還是傳統數據平臺中?其實放在哪里都可以,如果你的基礎數據已經落地在HDFS了,那建議你在大數據平臺中做,畢竟分布式架構的加工跑批速度會有優勢,另外對于算法挖掘和文本挖掘類的標簽傳統數據倉庫技術也無法支撐。?
標簽裝載:標簽裝載層是標簽對外提供服務的物理存儲層,這里面數據庫選型尤為重要,后面有專門的章節分析。數據建模方面,寬表是標簽數據模型的金標準。有很多客戶問我,寬表中的字段數有沒有限制?一張寬表字段數如果太多可不可以按主題拆表做join?標簽所有場景的性能響應要求都是秒級的,任何數據庫表關聯都會大大降低查詢效率,所以數據庫選型要充分考慮這些因素。
標簽管理:標簽管理是指平臺應用的管理端,管理端是面向內部用戶使用的,服務端是面向客戶服務的。管理端包括數據代理、標簽庫管理、標簽元數據管理、標簽審批、標簽上下架、標簽應用效果評估、衍生標簽配置、客群提取、客群洞察等標簽全生命周期管理功能。?
標簽服務:標簽服務是指平臺應用的服務端,管理端和服務端要做微服務切割,目的是解耦并建議分開部署,隔離不同渠道調用所占用的資源,例如內部篩選客群負載過大時,不能影響手機銀行標簽API調用服務,服務之間要做隔離。服務端設計要在網關層面充分考慮負載并發的壓力,做分布式部署,保證并發性能的瓶頸不出現java進程這一端。
標簽是打通數據后臺與渠道系統之間的重要載體,標簽系統上線后會迅速過渡到跨部門、跨系統的標簽運營管理階段,所以做好標簽的創建、審批、開發、上線、應用、評估、共享、變更、下線等全生命周期流程管理規范是一項非常重要的工作。


當然,這么做的劣勢就是查詢性能的損耗,過去沒有大數據技術的支撐這種設計顯然是不合理的,現在技術突破了,業務創新就可以有更多更合理的選擇。
標簽在銀行業的應用場景非常廣泛,我們常講的標簽很多人會默認為客戶標簽,其實貼標簽的對象不僅僅可以是客戶,還可以是賬戶、產品、機構、員工、渠道等等,例如我們可以給員工貼標簽,譬如通過歷史數據觀察員工最擅長銷售哪類金融產品、員工月均訪客次數、員工績效等等。

在規劃標簽的應用路徑時,建議大家先搞清楚標簽的服務對象,是針對內部員工的還是直接對客服務的。例如淘寶中的猜你喜歡就是標簽直接服務于客戶,同理如果標簽服務于手機銀行、網銀、STM等自助渠道就屬于對客應用。如果標簽服務于CRM、營銷平臺、柜面等員工渠道就屬于內部員工類應用。?
客戶標簽、客戶畫像、客戶360°視圖三者之間的關系很多人搞得云里霧里的,其實從字面意思上就容易理解它們的含義。我請一位畫家幫我畫一幅畫像,那么這幅畫像首先是靜態的,只反映我當下的樣子。畫家動筆時當然需要仔細觀察我的特點,比如眼睛、鼻子、嘴的特征是什么樣的,這些特征就是標簽,它也是靜態的。畫像只反映當下的我,如果要研究我的全貌就需要了解我的歷史,我的家庭成員都有誰,我的朋友圈都有誰等等,這就是客戶360°視圖。所以,客戶標簽是客戶畫像的組成元素,客戶畫像是輕量級的客戶360°視圖,這是我的理解。

第一,客戶畫像由標簽組成,不需要復雜的數據模型支撐,一但標簽系統建成,開發迭代客戶畫像的成本就變得非常低。
第二,客戶畫像只顯示客戶有價值的特征,不關聯不鉆取查看繁瑣的關聯明細,對一線員工來說反而更直觀更傻瓜。
第三,客戶畫像很輕,不局限于CRM應用,更容易與全渠道、全設備終端進行集成,例如柜面、廳堂PAD等終端都需要集成客戶畫像。
關于于標簽管理的產品化,主要產品模塊包括標簽列表及標簽詳情頁。其實主要就是針對標簽的分類及標簽的內容信息。
1、標簽列表
標簽列表頁,主要涉及的功能模塊有:標簽目錄檢索。即將標簽體系作為檢索條件,檢索標簽
標簽關鍵詞搜索。支持用戶通過搜索的方式直接找到標簽
標簽列表。呈現檢索或者搜索后的標簽列表,列表可呈現必要標簽信息
標簽排序。按照關鍵數據進行標簽的排序
2、標簽詳情頁
標簽詳情頁,主要涉及的功能模塊有:標簽基本信息
標簽的應用信息
標簽的數據表信息
標簽的加工信息
標簽的質量信息 
(本文部分文字來源常年磊悅,作者楊磊)