如果你已經(jīng)決定在今年做更多的人工智能實(shí)驗(yàn),請首先仔細(xì)研究您的數(shù)據(jù)管理實(shí)踐。

對于一個(gè)有一整個(gè)團(tuán)隊(duì)和組織正在急切地想要“進(jìn)入人工智能領(lǐng)域”的CIO來說,這可能很難聽到。人們很容易的就一頭扎進(jìn)數(shù)據(jù)科學(xué)和人工智能領(lǐng)域當(dāng)中。然而,如果不首先了解數(shù)據(jù)管理(以及數(shù)據(jù)的其他方面)的重要性,就很難取得進(jìn)展。
記住,AI即數(shù)據(jù)。在沒有數(shù)據(jù)的情況下,你無法使用AI或機(jī)器學(xué)習(xí)做任何事情,因此你必須首先確保理解并管理數(shù)據(jù)的生命周期。
好的數(shù)據(jù)管理的標(biāo)志
數(shù)據(jù)管理雖然不是CIO最重要的方面之一,但它對機(jī)器學(xué)習(xí)和人工智能卻是至關(guān)重要。老話說得好,“輸出質(zhì)量是由輸入質(zhì)量決定的”用在這里非常合適,因?yàn)槿绻銚碛械氖窃愀獾臄?shù)據(jù),你也將得到一個(gè)糟糕的模型。一個(gè)糟糕的模型反過來又會告訴你去做錯(cuò)誤的事情,這確實(shí)會對你的組織造成一些損害。
也就是說,當(dāng)你的數(shù)據(jù)管理得當(dāng)時(shí),人工智能絕對可以改變一個(gè)組織的能力和可能性。
為了確保你的組織在使用AI時(shí)走上正確的道路,你需要仔細(xì)查看你的數(shù)據(jù)管理實(shí)踐。一個(gè)數(shù)據(jù)管理的關(guān)鍵要素之一是理解:
你的數(shù)據(jù)來自何處
誰訪問或更改了該數(shù)據(jù)
如何使用你的數(shù)據(jù)(例如,你是否有權(quán)將數(shù)據(jù)用于其他目的?)
收集數(shù)據(jù)的時(shí)間
你的數(shù)據(jù)在過去有什么用途(以及將來可能如何使用)。
4個(gè)需要檢查的領(lǐng)域
在接下來的一年里,想想你的目標(biāo)。如果AI出現(xiàn)在這個(gè)列表上的任何地方,你都需要認(rèn)真考慮如何從事一些專注于數(shù)據(jù)和數(shù)據(jù)管理的最佳實(shí)踐。在新年的會議中考慮一下這些問題。
首先,為了確保你的數(shù)據(jù)不是垃圾,你需要從全局開始,雖然這聽起來可能違反直覺。你需要構(gòu)建一個(gè)數(shù)據(jù)策略來回答圍繞數(shù)據(jù)的這些“大”問題,然后考慮治理、質(zhì)量和集成等相關(guān)的關(guān)鍵元素。以下是我認(rèn)為可以幫助你為AI做好準(zhǔn)備的幾個(gè)方面:
數(shù)據(jù)策略:即數(shù)據(jù)的“who, what, when, why, 以及 how”。你的數(shù)據(jù)策略會告訴你所做的一切。如果你沒有數(shù)據(jù)策略,你確實(shí)需要制定一個(gè)。
數(shù)據(jù)治理:管理組織數(shù)據(jù)的(或應(yīng)該)的規(guī)則和系統(tǒng)。數(shù)據(jù)治理應(yīng)該由數(shù)據(jù)策略來驅(qū)動(dòng)。治理應(yīng)該考慮(并管理)數(shù)據(jù)的所有方面,包括數(shù)據(jù)質(zhì)量、數(shù)據(jù)訪問和數(shù)據(jù)集成。
數(shù)據(jù)質(zhì)量:擁有一個(gè)能夠確保數(shù)據(jù)準(zhǔn)確和有用的過程和系統(tǒng)。數(shù)據(jù)質(zhì)量的保證需要從收集數(shù)據(jù)的瞬間開始,并在整個(gè)數(shù)據(jù)生命周期中持續(xù)。數(shù)據(jù)質(zhì)量應(yīng)該由數(shù)據(jù)治理規(guī)則/系統(tǒng)來決定和驅(qū)動(dòng)。
數(shù)據(jù)集成:許多人會將數(shù)據(jù)集成到其他領(lǐng)域(不管他們是否有這樣的意識),但是他們應(yīng)該在考慮數(shù)據(jù)時(shí)就考慮到這一點(diǎn)。它將被數(shù)據(jù)策略所告知和驅(qū)動(dòng),并與數(shù)據(jù)質(zhì)量密切相關(guān)。必須花時(shí)間考慮如何在整個(gè)組織和整個(gè)數(shù)據(jù)生命周期中集成數(shù)據(jù)。
數(shù)據(jù)管理、數(shù)據(jù)策略和數(shù)據(jù)治理可能不像談?wù)撊斯ぶ悄芎蜋C(jī)器學(xué)習(xí)來得那么吸引人,但是在能夠正確地使用人工智能之前,必須先將這些數(shù)據(jù)整理好。當(dāng)你的同事在下一次社交活動(dòng)中不斷談?wù)撊斯ぶ悄軙r(shí),你必須提醒他們數(shù)據(jù)有多重要。提醒他們“輸出質(zhì)量是由輸入質(zhì)量決定的”--尤其是在人工智能和機(jī)器學(xué)習(xí)方面。
在未來一年,預(yù)計(jì)我們將看到會有比以往任何時(shí)候都多的資源轉(zhuǎn)向人工智能和與是人工智能相關(guān)的項(xiàng)目上面。如果人工智能是你所在的IT組織的下一個(gè)重點(diǎn)關(guān)注領(lǐng)域,那就從數(shù)據(jù)管理開始吧,這樣才能為自己最后的成功做好準(zhǔn)備。
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)