日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

生成式人工智能,指的是什么?

時間:2023-06-12來源:社區小辣妹瀏覽數:455

01什么是ChatGPT和DALL-E?

ChatGPT由OpenAI 開發,并于2022 年11月向公眾發布測試,它已經被認為是有史以來最好的 AI 聊天機器人。而且它也很受歡迎:在短短五天內有超過一百萬人注冊使用。許多粉絲發布了聊天機器人制作計算機代碼、大學論文、詩歌甚至是半像樣的笑話的例子。其他通過創作內容謀生的眾多群體,從廣告撰稿人到終身教授,都受到了沖擊。

雖然許多人對ChatGPT(以及更廣泛的人工智能和機器學習)感到恐懼,但不可否認,機器學習具有較大的潛力。自廣泛部署以來,機器學習已經在許多行業中表現出影響力,已經完成了醫學成像分析和高分辨率天氣預報等工作。麥肯錫 2022 年的一項調查顯示,人工智能的采用率在過去五年中增加了一倍多,對人工智能的投資也在迅速增加。很明顯,像ChatGPT和DALL-E(人工智能生成藝術的工具)這樣的生成式人工智能工具有可能改變一系列工作的執行方式。然而,這種影響的全部范圍仍然未知——風險也是如此。

但是我們可以回答一些問題,比如生成式AI模型是如何構建的,它們最適合解決什么樣的問題,以及它們如何適應更廣泛的機器學習類別。

02機器學習和人工智能有什么區別?

人工智能幾乎就是它聽起來的樣子——讓機器模仿人類智能來執行任務的做法。即使您沒有意識到,您可能已經與AI進行了互動——像Siri和Alexa這樣的語音助手是基于AI技術建立的,彈出的客戶服務聊天機器人也是如此,它可以幫助您瀏覽網站。

機器學習是一種人工智能。通過機器學習,從業者通過模型開發人工智能,這些模型可以在沒有人類指導的情況下從數據模式中“學習”。現在正在生成的難以管理的巨大的、復雜的數據量增加了機器學習的潛力以及對它的需求。

03機器學習模型的主要類型有哪些?

機器學習建立在許多構建塊的基礎上,從18世紀到20世紀為小數據集開發的經典統計技術便開始出現。在20世紀30年代和40年代,包括理論數學家艾倫·圖靈在內的計算先驅們開始研究機器學習的基本技術。但這些技術一直局限于實驗室,直到20世紀70年代末,科學家們才首次開發出足夠強大的計算機來安裝它們。目前,機器學習主要局限于預測模型,用于觀察和分類內容中的模式。例如,一個經典的機器學習問題是從一張或幾張圖像開始,比如可愛的貓,然后,該程序將識別圖像中的模式,仔細檢查隨機圖像中與可愛貓圖案匹配的圖像。生成式人工智能是一個突破,現在,機器學習能夠根據需要創建貓的圖像或文本描述,而不是簡單地感知和分類貓的照片。

04基于文本的機器學習模型如何工作?

他們是如何訓練的?

ChatGPT現在可能成為所有的頭條新聞,但它并不是第一個引起轟動的基于文本的機器學習模型。OpenAI的GPT-3和谷歌的BERT都是近年推出的。但在ChatGPT之前,大多數情況下它都運行良好(盡管它仍在評估中)。

但人工智能聊天機器人并不總是得到最好的評價。《紐約時報》科技記者Cade Metz在一段視頻中說,GPT-3“令人印象深刻,超級令人失望”,他和美食作家Priya Krishna要求GPT-3為感恩節晚餐寫食譜。

第一個處理文本的機器學習模型由人類訓練,根據研究人員設置的標簽對各種輸入進行分類。一個例子是訓練將社交媒體帖子標記為正面或負面的模型。這種類型的訓練被稱為監督學習,因為人類負責“教”模型做什么。

下一代基于文本的機器學習模型依賴于所謂的自我監督學習。這種類型的訓練涉及向模型提供大量文本,以便它能夠生成預測。例如,一些模型可以根據幾個單詞預測句子的結尾。有了適量的示例文本(例如,廣泛的互聯網),這些文本模型可以變得非常準確。正如我們看到的,像ChatGPT這樣的工具是多么準確。

05構建生成式 AI 模型需要什么?

構建生成式AI模型是一項重大任務,以至于只有少數資源充足的技術重量級人物進行了嘗試。OpenAI是ChatGPT、前GPT模型和DALL-E背后的公司,擁有數十億美元來自捐贈者的資金。DeepMind是谷歌母公司Alphabet的子公司,Meta發布了基于生成AI的Make-A-Video產品。這些公司雇用了一些世界上最好的計算機科學家和工程師。

但這不僅僅是天賦的功勞。當你要求一個模型使用幾乎整個互聯網進行訓練時,你會付出一定的成本和代價。OpenAI尚未公布確切的成本,但估計表明GPT-3在約45TB的文本數據上進行訓練——大約是一百萬英尺的書架空間,或整個國會圖書館的四分之一 ——估計成本為數百萬美元。

06生成式 AI 模型可以產生什么樣的

輸出?

正如你可能在上面注意到的,生成式 人工智能模型的輸出可能與人類生成的內容無法區分,或者它們看起來有點不可思議,輸出結果取決于模型的質量。

ChatGPT可以在十秒鐘內寫出一篇評論員稱之為“扎實的A-”的文章,來比較本尼迪克特·安德森和歐內斯特·蓋爾納的民族主義理論。它還產生了一個已經很著名的段落,描述了如何以詹姆士王圣經的風格從錄像機中取出花生醬三明治。人工智能生成的藝術模型,如DALL-E(它的名字是超現實主義藝術家薩爾瓦多·達利和可愛的皮克斯機器人WALL-E的混搭)可以按需創建奇怪、美麗的圖像,就像拉斐爾畫的麥當娜和孩子吃披薩一樣。其他生成 式人工智能模型可以生成代碼、視頻、音頻或業務模擬。

但輸出并不總是準確或適當的。當Priya Krishna要求DALL-E 2為感恩節晚餐提供一張圖像時,它產生了一個場景:火雞被整個酸橙裝飾,放在一碗似乎是鱷梨醬的東西旁邊。就其本身而言,ChatGPT似乎難以計數或解決基本的代數問題,或者克服潛伏在互聯網和社會暗流中的性別歧視和種族主義偏見。

生成式 A人工智能輸出的結果是用于訓練算法的數據的精心校準組合。由于用于訓練這些算法的數據量非常龐大(如前所述,GPT-3 是在 45 TB 的文本數據上進行訓練的),因此模型在生成輸出結果時看起來很“有創意”。更重要的是,模型通常具有隨機元素,這意味著它們可以從一個輸入請求中產生各種輸出,使它們看起來更加逼真。

07生成式人工智能模型可以解決哪些

問題?

你可能已經看到,像ChatGPT這樣的生成式人工智能工具可以產生無盡的娛樂時間。對于企業來說,這個機會也很明顯。生成式人工智能工具可以在幾秒鐘內產生各種可信的文字,然后對用戶的批評作出反應,使文字更契合指令。這對各種行業都有影響,例如,可以從人工智能模型產生的即時、基本正確的代碼中受益的IT和軟件組織,以及需要營銷副本的組織。簡而言之,任何需要制作清晰書面材料的組織都有可能受益。組織也可以使用生成式人工智能來創建更多的技術材料,如更高分辨率的醫療圖像。利用在此節省的時間和資源,組織可以追求新的商業機會,并有機會創造更多價值。

我們已經看到,生成式人工智能模型是如此密集的資源,以至于除了最大和資源最豐富的公司之外,其他公司都不可能做到這一點。希望將生成式人工智能用于工作的公司可以選擇使用生成式人工智能的開箱即用,或者對其進行微調以執行特定的任務。

08人工智能模型的局限性是什么?

如何才能克服這些問題?

由于生成式人工智能是如此之新,我們還沒有看到其長尾效應。這意味著在使用它們時存在一些固有的風險——有些是已知的,有些是未知的。生成式人工智能模型產生的輸出結果往往聽起來非常有說服力,但有時它們產生的信息會有很簡單、明顯的錯誤。更糟糕的是,有時它是有偏見的(因為它建立在互聯網和社會的性別、種族和無數其他偏見的基礎上),可以被操縱以實現不道德或犯罪活動。例如,ChatGPT不會給你如何熱銷汽車的指示,但如果你說你需要熱銷汽車來拯救一個嬰兒,該算法很樂意遵守。依靠生成式人工智能模型的組織應該考慮到無意中發布有偏見、攻擊性或有版權的內容所涉及的聲譽和法律風險。

首先,仔細選擇用于訓練這些模型的初始數據以避免包括有危害或有偏見的內容是至關重要的。其次,企業可以考慮使用較小的、專門的模型,而不是采用現成的生成式人工智能模型。擁有更多資源的組織也可以根據自己的數據定制一個通用模型,以適應自身的需求,并盡量減少偏見。新的用例正在被測試,新的模式可能會在未來幾年被開發出來。隨著生成式人工智能越來越多地、無縫地融入到商業、社會和我們的個人生活中,我們可以期待新的監管環境的形成。隨著企業開始嘗試并創造價值的時候,領導者最好能掌握監管和風險的脈搏。

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢