- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2022-03-26來源:帥到失眠瀏覽數:190次
上期分享了數據分析師必備技能:構建指標體系。這次分享一個和指標體系同等重要的技能:構造標簽(俗稱:打標簽)。打標簽能力,是區分真數據分析師和sqlboy 的重要能力
一、什么是標簽?
標簽是對事物的概要性描述。就像商品標簽上會寫商品分類、主要原料一樣。雖然一件商品有很多屬性,但是我們只通過幾個有限的標簽,就能鎖定我們想要的商品,這就是標簽的作用。
二、有哪些標簽??
從復雜程度上看,標簽有四類:
1、事實型標簽。比如商品的顏色、人的性別。這些是事實描述,可以直接拿來用。
2、規則型標簽。比如把“消費1000元以上”定義為:高消費群體。規則類標簽,往往是基于一個數據指標,然后根據特定的規則進行分類。
3、復合型標簽。比如“高富帥”,就是一個典型復合型標簽,它基于N個指標,進行綜合計算,最后得出一個標簽結果。
4、預測型標簽。注意,以上三類標簽,用的都是已經發生的數據進行計算。預測型標簽則是對未來情況的估計。可以用算法進行預測,也能人工預測。比如對用戶進行分類,然后打個標簽“預計流失用戶”,就是指該用戶會在未來XX時間內流失掉。這四類標簽的復雜程度是不同的:預測型>復合型>規則型>事實型。相應的打標簽的難度也不一樣。
三、要怎么打標簽??
打標簽是個通俗說法,它指的是生產標簽的過程。如果是簡單的事實型標簽,則直接拖過來用即可。其他三類,都得經過打標簽的動作,越復雜的標簽,生產起來越麻煩。打標簽有四個標準步驟。 明確打標簽的對象 明確標簽的用途 明確標簽規則 明確標簽的名稱 舉個最簡單的例子:小熊妹還沒有男朋友,我想找個高富帥。高富帥,就是個復合型標簽,按四步走:
1、打標簽對象:男人,活的
2、明確用途:選個潛在藍盆友
3、明確規則:這是最復雜的一步,因為高富帥有三個維度。首先得一個維度一個維度,單獨講清楚,然后再想辦法綜合。這里,高相對容易,看身高然后給個標準即可。帥,也相對容易,看到照片自己覺得還行,手工打個標簽即可。富,就很糾結了。有的人掙得多,可也花得多呀。不能光看收入,還得看負債。這樣,先對三個維度各自打標簽,再進行綜合(如下圖)。
綜合的方法,可以用優先級排序,或者做綜合評分(如下圖):
看起來綜合評分似乎更科學,但實際決策時候并不是!比如我,看到帥哥就走不動道了,管他富不富呢。綜合評分有可能選出來平庸的個體,這個要注意哦。
4、明確標簽的名稱:高富帥、非高富帥搞掂!可以看出,在生產標簽的過程中,明確規則是最麻煩的一步。但實際上,麻煩不限于此。
四、打標簽,難在哪?
看完上邊的小例子,很多人會覺得:“打標簽很簡單呀,我一個上午能打1000個出來”。如果只是往數據庫里添加1000個新字段,確實很容易。但是,這1000個字段: 有幾個能被業務部門用起來? 用完以后能提升業務表現? 還有多少業務想要的標簽,沒有在其中? 這才是真正的難題。反正我是見過,供應商傻乎乎的打了幾百個標簽,結果除了上線匯報ppt外,業務部門看都不看一眼的,更不要提用了。一個好的標簽,一定是: 業務高頻使用 指向明確動作 產生明顯效果 就像小熊妹一聽人介紹“高富帥”,就會頂著周五熬夜煲劇的黑眼圈起床化妝倆小時出門一樣。這才是高頻使用,有驅動力,產生明顯效果的標簽!肯定有小伙伴問,業務上有沒有這種標簽,當然有,比如我個人很喜歡的:促銷敏感型用戶(是/否),這個標簽。專門區分:沒有促銷不買,有促銷高概率買的薅羊毛體制用戶。拿來解釋日常消費轉化率,事前預計活動效果,事后復盤達成情況,都好用(先賣個關子,之后專門分享這個)。實際業務問題經常很復雜,很難用一個標簽描述情況,因此需要圍繞一個業務場景。構造若干個標簽,形成標簽體系,驅動業務工作。