如今,人工智慧在商業領域無所不在,從組裝線上的自動決策機器人到提供客戶服務的聊天機器人,再到能源領域的動態峰值定價優化。新聞充斥著人工智慧如何影響我們在各個行業的工作和互動方式的故事。
然而,最近引起廣泛關注的是產生人工智慧這一更具體的領域,它是 ChatGPT、DALL-E 和 OpenAI 的 Sora 等熱門內容、圖像和影片創作應用程式的基礎技術。生成性人工智慧有時也被稱為 GenAI,它有可能比當今支援企業的其他人工智慧解決方案更顯著地改變業務——但前提是組織能夠提供正確的資料存儲,以滿足技術所需的容量和效能。
什麼是生成式人工智慧?
簡而言之,生成性人工智慧就是產生全新內容的人工智慧,無論是聊天機器人回應、產品設計、廣告資料、圖像或影片片段。雖然人工智慧是造成道德上模稜兩可的深度偽造行為的原因,但它也可以用於自動化書面回應或履歷或線上資料等內容;推薦創新藥物化合物;優化電子晶片設計;以特定風格創作音樂或小說;使電影中的配音更加準確;按照任何要求的風格創作新藝術作品;根據某些參數創建建築設計;等等。
生成式人工智慧與其他類型的人工智慧不同,它依賴以下元件:
大型語言模型(LLM)
LLM 是一個處理、總結和產生文字的程式。它在海量資料集上進行訓練——可能包含數萬億個參數——並且可以學習理解文字和上下文。法學碩士 (LLM) 在推動生成式人工智慧模型在內容創作方面取得巨大進步方面發揮了關鍵作用。例如,它們可以將文字轉換為圖像或視頻,還可以自動為圖像添加字幕。
生成對抗網路(GAN)
GAN 由兩個神經網路組成,它們不斷相互競爭以識別明顯人為的輸出。一個網路被視為生成器,另一個網路被視為鑑別器。生成器被編程為創建看起來正確的錯誤或不準確的輸出,而鑑別器的任務是識別哪些輸出是錯誤的。透過這個不需要人工監督的過程,生成器可以更好地創建逼真的內容,而鑑別器可以更好地檢測它。隨著時間的推移,產生的內容變得越來越真實,直到鑑別器無法再偵測到不準確性。
變形金剛
這種類型的神經網路使非常大的訓練模型能夠解析大量不需要事先標記的資料。這意味著人工智慧演算法可以瀏覽數百萬甚至數十億個基於文字的頁面,從而為模型提供更深入的「知識」。 Transformer 使模型能夠識別和理解單字之間的聯繫,例如,在一段內容中,理解書中各個句子之間的上下文。模型還可以了解特定蛋白質或化學物質、代碼行甚至 DNA 標記之間的聯繫和背景。
與傳統人工智慧通常遵循預定的步驟來解析資料並得出結果不同,生成人工智慧通常允許使用者輸入提示或查詢來開始生成內容。例如,你可以要求應用程式撰寫一篇關於第二次世界大戰前夕事件的短文。要求提供描繪十八世紀澳洲日常生活的原創藝術作品。或用文字描述一個場景,然後在逼真的影片中觀看它栩栩如生地呈現。生成式人工智慧旨在創造新內容,而不是根據規則和預設結果完成任務。
GenAI 的工作原理以及資料儲存的重要性
任何類型的人工智慧通常都涉及大量數據,而產生人工智慧可能需要的數據甚至更多。包括 GenAI 在內的人工智慧專案有兩個階段,每個階段的研究人員都必須管理和處理大量資料集。
訓練階段
為了訓練生成式人工智慧演算法,研究人員向其輸入了大量資料。這包括線上網路內容、書籍、影片、圖像、報告、社交媒體內容等等。人工智慧平台必須能夠儲存這些數據。人工智慧演算法分析這些內容集合併識別聯繫、上下文、模式等。它圍繞著這些模式和聯繫創建數學模型,並在接收更多數據時不斷完善這些模型。法學碩士反覆深入研究他們的數據集,以增加對模式和含義的理解和認識。
人工智慧訓練產生的工作量龐大且複雜。它們需要同時對儲存進行超高效能的讀取和寫入。支援這些工作負載的硬體和軟體必須能夠跟上。
推理階段
GenAI 演算法訓練完成後,使用者就可以進行查詢並要求內容輸出。這些任務需要高效能的讀取能力,因為人工智慧系統必須將查詢應用於儲存中的數十億或數兆個參數,才能在幾秒鐘內創建最佳回應。此階段的性質也意味著大多數系統必須具有平行資料路徑才能達到使用者期望的速度和效能。
生成式人工智慧需要考慮的資料儲存因素
為了支援生成式人工智慧的超大儲存需求,組織必須重新考慮其資料儲存和管理實踐。許多組織選擇混合資料儲存方法,並利用雲端和本地儲存的優勢來支援人工智慧專案。
人工智慧友善資料儲存通常包括以下內容:
-
-
- 大容量 – PB 是一個起點
- 超高性能 – 低延遲、高 IOPS 和吞吐量
- 並行處理 – 理想情況下連接到大型運算陣列和多個獨立網絡
-
為了實現生成式人工智慧所需的效能,許多組織正在轉向使用基於快閃記憶體的 SSD 作為其內部部署陣列。可以使用硬碟來儲存 AI 數據,但快閃記憶體被認為是最佳選擇。實際上, 一位專家 行業分析公司 NAND Research 最近表示,“那些認真對待大型語言模型的組織正在購買高端閃存。”
借助 SSD,組織可以在更小的空間內以更少的能耗提供所需的高 IOPS。 SSD 也是高效能物件儲存的好選擇,這通常是 AI 專案的首選儲存類型。
甚至像 AWS、Azure 和 Google Cloud Platform 這樣的超大規模企業也正在轉向使用基於快閃記憶體的 SSD 系統來提供客戶想要的效能。
群聯電子為生成式人工智慧提供創新資料存儲
隨著企業越來越意識到生成式人工智慧的價值以及它如何幫助他們的業務,群聯電子持續投資研發和創新,以滿足他們不斷變化的資料儲存需求。
Phison 了解 AI 以及其成功所需的儲存類型。為此,該公司推出了專有客製化服務IMAGIN+,其中包括AI計算模型和AI服務解決方案。
該公司還推出了 愛DAPTIV+,IMAGIN+ 的擴展。新服務利用群聯的「創新整合 將SSD引入AI運算架構,拓展NAND儲存解決方案在AI應用市場。 」
透過將SSD整合到AI運算框架中,群聯有助於提高AI硬體解決方案的運作效能,並透過減少對GPU和DRAM的依賴來降低AI專案的成本。 Phison SSD 可以充當卸載支持,並允許組織在訓練其生成性 AI 模型時減少對 GPU 和 DRAM 的需求。
借助群聯電子的 aiDAPTIV+ 解決方案,各種規模的企業都可以從生成式人工智慧中受益,同時保持對其專有資料的控制。組織不再需要花費數百萬美元來購買如此多的專用硬體和 GPU 來根據其資料訓練 AI。
生成式人工智慧有可能徹底改變各行各業的業務運作、產品設計、客戶服務、行銷工作等等。透過 Phison 的快閃記憶體儲存和 SSD,您可以讓您的組織做好準備迎接這種轉變。
來自 Phison 的附加 AI 內容