日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

標簽與指標到底有什么區別?

時間:2022-10-13來源:暴力社瀏覽數:619

傅一平評語:

標簽和指標都是數據加工的結果,是對數據的一種描述和解讀,往往大量出現在寬表中,區分清楚這兩個概念的區別有助于更好的理解數據模型,這篇文章對兩者的區別做了很好的詮釋,值得看一看,我的理解是這樣:

指標是對各種客觀事物的數值描述,標簽是對各種客觀事物的特征標識,前者回答“是多少”問題,一般具有統計性質,比如到達用戶數,后者回答“是什么”問題,一般具有形容性質,比如高端用戶。

正文開始

最近在工作中也經常和標簽、指標打交道,但是似乎很少有人能完全說明白這兩者的明確定義、區別和聯系,今天嘗試來聊聊這個問題。

內容

本來應該先從定義開始,但是數據玩家找了很多定義,總感覺很晦澀,需要一定的深入思考和實踐經歷才能完全理解,于是我們先暫時不看定義,從兩者的特征開始比較,第一個特征是兩者的內容。

常見的指標,宏觀層面比如GDP、CPI、PPI,金融機構常用的存貸比、不良率、AUM,產品運營的MAU、DAU、LTV等等,都是對一個客觀事實的描述,通常以可量化的數值形態呈現,或為數值,或為比率。

一個指標通常包含三個部分:口徑/邏輯、維度、限定詞。

口徑和邏輯,也就是這個指標具體的含義,首先得有一個業務口徑,然后由技術把他落地成為一個技術的加工邏輯,從哪幾個表取,count、sum、max、min或者是avg。

維度指的是我們從什么角度去看這個指標,是時間維度(年/月/日)、機構維度(不同分支機構)還是客群或產品維度,在SQL語句里就是group by。

限定詞就是在這個維度下,我們選取哪一個具體的枚舉值,對應SQL語句就是where條件。

舉個栗子,AUM的業務口徑是客戶名下所有資產,包括存款、理財、代銷基金、保險等…… 技術的加工邏輯會有一長串SQL,關鍵的點是所有金額做sum。

如果只看全行的AUM,是不需要維度的,如果要看具體某一個維度,就需要group by了,指標就變成了按機構維度看AUM,即group by org。

限定詞就是要看某個具體分行,比如上海分行所有客戶的AUM,SQL語句里就需要加上 where org = '021'。

不論怎么定義,大家可以發現,每一個環節都是陳述事實,實際的數值是多少就是多少,指標只是按不同的方式展示這個值,這也帶來指標的另一個特征:指標基本都是數值型

當然,不排除有些定性指標,比如在KPI中,有的考核指標描述為:某項工作是否完成,不過絕大多數核心指標,都應該是量化的。

與指標不同,標簽是存在人為劃分的。

比如AUM>=100萬在某些銀行就是私行客戶了,但是在大行估計就是個高凈值客戶。

標簽通常是描述某些具體實體的,比如AUM>=100萬,你一定可以挑出一些客戶滿足這個特征,但是指標陳述的通常是抽象概念,比如AUM本身,你沒法對應到一個或者一群具體客戶身上。

有些標簽看上去人為定義的成分比較少,也是基于事實進行定義的,比如性別標簽,車輛品牌標簽,車主客戶標簽,代發客戶標簽……

所以我在標題里加了“往往”,遇到這類標簽的時候,我們的直覺也會告訴我們,這是標簽,而不是指標,原因參考指標的另一個特征。

對,指標基本都是數值型,而標簽基本都不是數值型

哪怕是基于數值型的標簽,一定也要有個人為劃分的定義。

比如上面提到的,基于AUM構建客戶等級標簽,AUM是個數值型的指標,標簽定義為AUM等于、大于或小于某一個值,人為劃分了客戶的等級。

因此標簽可以基于指標來定義,那么指標可不可以基于標簽來定義呢?

當然可以,比如“私行客戶轉化數量”,這里用到了一個標簽“私行客戶”,私行客戶本身又依賴于AUM等指標。

所以標簽和指標可以相互轉化

分類

指標的分類相對還是比較統一的,通常劃分為原子指標、派生指標、衍生指標。

原子指標不疊加任何維度,僅是對業務事實的最基本描述,通常是一些整體指標,通過SQL直接統計出來的,比如客戶數、留存率、交易量……

但是實際業務使用中,更關心某一特定維度的指標,比如手機銀行客戶數、7日留存率、長尾客群交易量……

因此我們有了派生指標。派生指標就是原子指標疊加一個或多個維度。

手機銀行客戶數是客戶數疊加產品或渠道維度;7日留存率是留存率疊加時間維度;長尾客群交易量是交易量疊加客群維度(這里客群是一個標簽)。

僅僅疊加維度還不夠,有時候我們還需要不同指標之間互相計算,最常見的就是求人均和比率,比如客群AUM、存貸比……

這就是衍生指標,即通過原子指標或派生指標互相加工而來。

標簽由于其人為劃分的特性,分類就沒那么統一,比較常見的一種劃分為事實標簽、規則/統計標簽、模型標簽。

事實標簽也是描述實體的客觀事實,比如上文提到的性別、車主等等,描述一些具體實體的特征。

規則/統計標簽是基于事實的統計結果結合一些人為判斷生成的,比如青年客戶(年齡在18到35之間)、中年客戶(年齡在36到55之間)、老年客戶(年齡55+)等等。

模型標簽就比較主觀了,是通過事實標簽和規則/統計標簽,抽象出來的群體特征,其劃分的群體通常比上兩類標簽更細。比如“月光一族”,“消費達人”等。

應用場景

現在大家已經對標簽和指標有了相對明確的概念,我們來看看兩者的應用場景有何差別。

通常拆解使用

指標的使用場景,一般都是一個大指標,拆解到某個或多個維度,附加一個或多個限定詞

用于經營分析、監測、評價、建模

在經營分析中,用于監測和評價業務效果、考核情況等,所有的KPI都是指標用于評價和監測業務效果。

需要不斷歸納和抽象

標簽是基于底層數據的歸納和抽象,希望刻畫某一群實體的特征,通過標簽,一定可以定位一群具體的實體,可能是客戶,也可能是產品。

用于標注、分類、刻畫群體特征

標簽的核心其實是分類,針對每一個分類,希望能夠給予不同的營銷策略、產品策略、觸達策略等。

不過,由于標簽和指標可以互相轉化,因此在實際運用中,也不用過多糾結兩者的區別,因為兩者通常是結合起來使用的。

總結

總結一下,指標描述客觀事實,通常是抽象的概念,以量化指標為主,拆解到不同維度,用于經營分析、監測、評價和建模;

標簽人為劃分,描述特定群體的實體特征,可以定位到具體實體,難以量化,歸納和抽象形成,用于標注、分類、刻畫群體特征。

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢