日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

構建有效的數據科學團隊

時間:2019-03-15來源:億信華辰瀏覽數:643


隨著數據科學和人工智能幾乎進入陽光下的每個行業,建立一個能夠建立成功的AI項目的團隊的挑戰也是如此。對統計學家,程序員和溝通者完美融合的原型“數據科學家”的需求從未如此強烈。但隨著塵埃落定,我們開始聽到失敗的?項目和??失望的??專業人士的故事??。

您可能聽說過昂貴的專家團隊一次又一次失敗。作為一名在各個行業工作的數據科學顧問,我有機會親眼看到這一趨勢。許多人傾向于認為數據科學是一個新領域,并期望它成為主流時會有成長的痛苦,但我們忘記了這個領域的來源。這是我嘗試通過自己的經驗反映成功數據團隊的品質,并幫助商業領袖和高管創建更好的人工智能策略。

不要忘記你的根

首先,我們需要將數據科學視為現有學科的自然演變,而不是全新的學科。畢竟,我們在計算機時代開始之前一直在處理數據,至少從20世紀60年代開始,人工智能的概念就已存在。其他學科,如數據庫知識發現,決策支持系統,商業智能,數據挖掘,分析,預測分析等,已經存在很長時間了。每個人的主要目標是從數據中提取有意義的模式,并利用這些模式獲取見解并為未來做出決策。

數據科學是這一趨勢的最新體現,這是因為我們在互聯網時代可以獲得的數量和種類數據大量增加。相對便宜的計算能力和機器學習算法的新突破可以利用這些豐富的數據進一步推動它。這些新算法的復雜性和數學復雜性的增加使得具有高級學位的人突然需要能夠理解它們,因此AI比賽已經開始。

但盡管這項技術顯而易見,但我堅信,我們可以從舊學科中的神話和最佳實踐中學到很多東西。

秘密成分?

好的,這是一個棘手的問題。我見過公司經常會遇到最新最好的算法和計算處理器,同時把數據視為???理所當然。我們可能有大量數據可用,但數據的質量不是特定的。良好的數據仍然難以收集,因此可能是您可能擁有的主要競爭優勢。除非您提供良好的數據,否則最好的算法無法保證良好的模型。正如他們所說 - 垃圾進去,垃圾出來。

人工智能最容易被忽視的一個方面是,大多數算法都是通過開源軟件或通過云提供商以極低的成本免費提供的。在某種程度上,AI算法已經或將要通過這些庫和服務商品化。

我的建議是首先將您的數據科學路線圖分解為每個人都同意的簡單用例,并且可以在一位數的周數內實現。還要確保可以獲得數據,明確定義ROI和/或可交付成果,并且數據團隊遵循迭代執行過程。

因為,數據是任何數據科學戰略中最重要的組成部分,您需要的第一批人才是??數據工程師。數據工程師通常是具有良好編程和硬件技能的人員,可以構建您的數據基礎架構。這取決于您的數據大小,但他們通常很適合使用大數據和云技術,知道如何構建數據管道,設計數據庫以及從中提取數據。他們將知道如何在基本級別查看數據,并對數據質量進行簡單的聚合以進行健全性檢查,但不一定是分析數據的專家。

在構建了數據基礎架構之后,您將需要能夠獲取該數據的人員,清理它,分析數據,在其上運行實驗并傳達結果。根據您的業務需求,確切的技能會有所不同。大部分時間,這項工作由數據分析師完成,???他們擅長處理和清理數據,創建統計推斷或預測模型,運行實驗,繪制結果,創建報告以及向更高層次的利益相關者提供見解。他們主要在Jupyter筆記本或Rstudio工作,并結合了編程,統計和機器學習知識。我們不應指望他們編寫生產質量代碼。

這讓我接下來的角色。如果您正在構建數據產品,則需要??團隊中的機器學習工程師?。這些人不是構建機器學習算法的研究人員,而是熟悉各種數據科學庫的數據聚焦軟件開發人員,并且知道如何根據分析師開發的模型編寫生產質量代碼。要完成這項工作,他們必須與數據工程師密切合作,或者也可以由數學精通的數據工程師為小型團隊完成。大多數希望進入數據科學領域的開發人員都應該將其視為一個很好的職業選擇。

有時,擁有一個更注重設計的數據可視化專家??來創建高度優化的圖表和報告以傳達分析結果也可能是有用??的。

我傾向于將??數據科學家??視為在所有上述角色中均高于平均水平的人,以及誰知道如何與??領域專家合作??以提供結果。這些合作者通常在您的團隊或組織之外,在醫學,金融,經濟學,市場營銷,法律等案例中利用他們的主題專業知識。

如果您正在處理需要某些自定義或專有數據科學算法的問題,那么可能需要聘請具有博士或核心研究背景的人員。他們可能對會話AI,計算機視覺,機器人,強化學習,圖形模型等AI領域背后的理論和算法有深刻的理解。我傾向于喜歡??研究工程師?或??研究科學家這樣??的角色。

數據科學團隊中另一個重要但較少談論的角色是??數據科學經理??或??數據科學負責人。對于規模較小的團隊而言,擁有一名對團隊中所有不同角色有深入了解的團隊中的高級成員可能就足夠了。但是一旦團隊成長,你可能需要具備強大技術和商業戰略背景的人。

數據科學經理是實踐領導者,他們將構建您的數據科學戰略的基礎,招募和建立您的團隊,確保每個人彼此交互,擁有他們需要的數據和信息,并開發整個團隊的流程可以按照。它們是數據團隊與組織其他成員,協作者和管理人員的接口。他們將復雜的AI術語翻譯成非專家,并確保他們的工作與整個組織的戰略保持一致。

管理者需要經常發揮的另一個重要作用是在整個團隊中設計??數據治理??和??道德?標準。來自該領域的大多數專業人員都學習了完成工作所需的技術技能,但我很少看到數據隱私和分析結果的道德溝通的重要性。這導致像Facebook丑聞一樣???使我們的領域聲名狼借。在我看來,擁有在團隊中了解并執行這些價值觀的人會讓您超越其他人。

所以,這些是我對成功的數據科學團隊的看法。主要的方法是 - 如果我們始終保持簡單的策略,在合適的時間雇用合適的人員,利用從以前的領域收集的知識,并開發一個最適合您的團隊和目標的過程,有沒有理由你不能成為一個有效的數據驅動組織。

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢