日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

網易數據分析大賽獲獎作品分享:歌曲鑒賞人選品

時間:2022-08-29來源:摳腳女漢子瀏覽數:474

在當前的網易云音樂曲庫中,歌曲可以根據播放量級的不同,從小到大歸類為“金字塔”形狀的層級結構。云音樂生態致力于幫助優質歌曲內容一路扶持成長,但是由于小歌的歌曲表現特征稀疏和穩健性欠缺,扶持策略撈取歌曲時的歌曲結構難以與“金字塔”結構保持一致,并對尾部歌曲撈取不足。

導讀:

大家好,我們來自網易云音樂數據產品團隊,首先感謝網易數帆的同事組織此次數據分析大賽,同時也非常榮幸代表MUSE團隊來參加這次比賽,我們參賽的題目是《歌曲鑒賞人選品》。主要從4個部分跟大家逐一介紹,分別是項目背景、痛點分析、落地方案和最終效果。

1項目背景

在內容、社區、電商等行業內部,普遍存在用戶行為稀疏,內容冷啟動難和優質內容發掘難等問題。網易云音樂同樣存在大量長尾內容,其中不乏滄海遺珠有待發現,亟需給予流量扶持和精細運營,但傳統的外包人工審核和打分機制,勢必會導致發掘效率低下,且易受到人為偏好影響而有失偏頗。為此,本項目旨在通過搭建潛力內容挖掘模型,打破內容單維度衡量標準,優化內容流量分發機制,從而打造健康可循環的內容生態。

在當前的網易云音樂曲庫中,歌曲可以根據播放量級的不同,從小到大歸類為“金字塔”形狀的層級結構。云音樂生態致力于幫助優質歌曲內容一路扶持成長,但是由于小歌的歌曲表現特征稀疏和穩健性欠缺,扶持策略撈取歌曲時的歌曲結構難以與“金字塔”結構保持一致,并對尾部歌曲撈取不足。長此以往,“尾部歌曲”供應不足,未來的腰部和頭部歌曲后繼無歌,待分發的優質歌曲將會出現結構性斷層,優質歌曲內容生態循環鏈存在“斷鏈”危機。

2挑戰

鑒于尾部歌曲行為稀疏,難以藉此有效撈取潛力歌曲,曾經嘗試以純人工的方式借助業務經驗為歌曲背書。具體機制是,通過基礎規則過濾,每日選取600首歌分配給6人打分團隊,每首歌曲經過三輪打分,確定人工綜合得分。而后根據打分高低遴選前30首歌曲給予定量分發、助其擴圈。經過半年人工打分的沉淀,共有千量級的歌曲被人工試聽并獲得打分。但總體復盤來看,3日600首的速度難以追趕云音樂日益豐富的創作歌曲量,海量歌曲無法在成長期獲得打分露出的機會,從而與分發機會失之交臂。

除去人工效率考量,我們對比發現人工打分歌曲的升級成功率遠低于大盤水平,這一方面是由于人工打分存在主觀性、缺乏統一評分標準,分數準確性不能保證;另一方面,由于人工打分團隊人員固化,在音樂品味上與網易云音樂的聽眾不夠“相似”,故“人工打分高”和“歌曲有潛力升級”不能直接畫上等號。總之,單純依靠人工背書的方式評判尾部歌曲質量并不順利。

3落地方案

在衡量用戶音樂欣賞行為高低的因素中,用戶對音樂的鑒賞能力是極為重要的一環。鑒賞能力較強的用戶通常是某些垂類音樂風格下的專家,不僅能夠在該垂類風格下不斷深耕,還能在歌曲成長生命周期的早期挖掘出好的音樂,并能通過不同渠道通過分享影響其他用戶。因此我們決定通過制定一套「鑒賞伯樂挖掘選品」來發現平臺內鑒賞能力較強的用戶人群,在不打擾用戶的前提下既公平的獲得歌曲評分,又能極大發揮用戶的鑒賞價值。

3.1 什么是「鑒賞伯樂挖掘模型」

整體思路是通過內容找人、人找內容的方式,通過用戶近半年內收藏歌曲成長表現中各項數據指標,包括收藏歌曲數量、收藏歌曲升級等級數、收藏歌曲升級比例等維度,并對這些維度的數據進行加權處理,最終得出百分制的評分標準,來對這些用戶的鑒賞能力進行由高到低的評定。從根本上解決此前員工打分效率低、主觀性強的痛點,并且可以無感知地借用站內用戶的力量,形成完全零成本的"眾包"打分模式。

挖掘鑒賞人特征

根據用戶聽歌時長、涉獵范圍、垂類觸及等方面,按照多、廣、深三個方面對鑒賞人的鑒賞能力進行挖掘,并區分出不同垂類曲風、地域、語種的鑒賞人等級。

如何排除干擾項

為了保障用戶行為數據可信,對黑名單、爆款、非優質歌曲進行排除限制,一是針對MUSE平臺的違規歌曲以及短期刷量的黑名單歌曲進行排除,二是針對歌曲上線即巔峰的爆款歌曲進行排除。三是針對歌曲歷史最高等級沒有到達腰部的非優質歌曲進行排除。

3.2 如何搭建「鑒賞伯樂挖掘模型」

鑒賞人的挖掘具體分為2部分:

Step1:收藏時間限定

即 「發現歌曲時間權重分」,對用戶收藏某首歌曲的時間先后進行加權處理。在某首歌曲播放到達最高等級的成長周期中,對歌曲進行較早收藏的用戶得分更高,以表現該用戶更好的鑒賞能力。并且在這部分中,針對用戶“歌曲上線即收藏”的情況進行了0分的降權處理,以避免爆款歌曲或狂熱粉絲對模型的干擾。

Step2:品味分布限定

即「收藏歌曲升級權重分」,在計算收藏歌曲升級權重得分時,將只收聽某位藝人/某種曲風的狂熱粉絲行為進行降權處理,以避免某個用戶只收藏單一某個藝人/曲風的情況。根據前兩步的歌曲條件限定和用戶行為限定,綜合生成“收藏歌曲升級權重分”,表示用戶收藏歌曲中升級歌曲的最終權重得分。

3.3 各垂類鑒賞人分布

「鑒賞伯樂挖掘模型」基于這兩個因素在不同曲風垂類下挖掘出的鑒賞者,由用戶數據表現和聽歌風格分布計算他們的「鑒賞人得分」,并根據得分將這批用戶劃分為四級:A、B、C和D級。因各個垂類的人群數量及分布差異,將垂類分為大垂類和小垂類,并基于不同垂類的特征設定不同的分級標準。

大垂類包括:華語流行、華語嘻哈說唱、英語流行、英語嘻哈說唱;

小垂類包括:其他;搖滾;R&B;日語;電子;民謠鄉村;爵士古典;國風;漢語;其他流行。

4最終效果

通過「鑒賞伯樂挖掘模型」,我們從平臺中發現了100w+各音樂垂類領域下的識曲行家,并依靠這些用戶的鑒賞能力篩選出未來可能會火的種子歌曲,為算法補充尾部潛力歌曲資源。

4.1 鑒賞人畫像

全能鑒賞人,該用戶近一年收聽359首處于生命周期早期的歌曲,這些歌曲在用戶收聽時并未被廣泛宣傳,但在之后逐漸擁有了大規模聽眾,其中有36首歌曲達成了等級越遷,包括「致你」這種爆款歌曲。該用戶的top1鑒賞曲風是華語流行,可以借用他在華語流行歌曲中的鑒別能力盡早挖掘出潛在爆款歌曲,并及時對歌曲進行扶持,加速其成長。

垂類鑒賞人,該用戶是一名英語說唱的偏好者,近一年聽了102首尚未被發覺的尾部歌曲。由于英語說唱歌曲的生產力無法與華語流行相比,因此該用戶的識曲數量有限,挖掘好歌的難度也更大。但即便如此,他也挖掘出了3首優質垂類歌曲,每首歌曲最終都完成了3級以上的等級越遷。

由此可見,在我們平臺中隱藏著不少民間高手,通過他們對各音樂曲風的鑒別能力,可以將處于生命周期早期的歌曲挖掘出來,并結合我們的算法在不同渠道中分發給更多用戶,積累更多的用戶行為數據,就能根據歌曲的后續健康度表現,判斷是否需要加速分發幫助歌曲破圈,盡快成長為爆款。

4.2 鑒賞人選歌

接下來是一個「鑒賞伯樂挖掘模型」幫助長尾歌曲成長的例子?!付嗪葻崴惯@首歌自上線以來長期處于只有極少數人在聽的狀態,4月3日被鑒賞者發現并紅心收藏,鑒賞者對該歌曲的背書被我們立即識別到,并于第二天引入算法流量進行扶持分發,之后退出扶持再讓其自然成長。經過2-3天的加量扶持后,歌曲有了一定的人群受眾,之后逐漸快速成長,因各項指標一直良好,被算法再次加量扶持,最終沖上了站內排行榜。

平臺中的廣大鑒賞人為我們成功地發現了許多優質小歌,這些小歌被扶持后的播放等級越遷成功率超過40%,比例遠高于之前人工打分的3%。同時「鑒賞人挖掘模型」可以每天基于海量鑒賞人聽歌識曲數據對尾部小歌進行評分,及時發掘平臺中所有的潛力歌曲提供給算法做扶持,解決了尾部歌曲行為稀疏難選品的問題,優化了目前平臺尾部歌曲撈取不足、待分發的優質歌曲將會出現結構性斷層的問題。

4.3 方法論拓展

「鑒賞伯樂挖掘模型」通過內容找人、人找內容的方式不斷為平臺挖掘有潛力的歌曲,幫助其進行冷啟扶持,快速破圈,最終成為爆款;同時也使云音樂的歌曲生態循環鏈更加完整?!歌b賞伯樂挖掘模型」更是當前內容生命周期「卡巴拉生命樹」冷啟中的重要一環,后續我們計劃將這套歌曲扶持體系應用于更多內容場景(例:歌單、播客)。

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢