讀書筆記 - 李弘毅教授【生成式AI導論 2024】第1講:生成式AI是什麼?
最近開始認真讀書,寫一些讀書筆記,今天是李弘毅教授的 2024 生成式 AI 導入系列的第 1 講。 生成式人工智慧 (Generative AI): 機器產生 (創造 = 泛指產生在訓練時沒有看過的東西) 複雜 ( 幾乎無法窮舉 ) 而有結構的物件 文章 - 由文字所構成 影像 - 由像素所構成 語音 - 由取樣點構成 反過來討論「何謂非生成式 AI」? 分類 (Classification): 從「有限的」選項中做選擇 垃圾郵件偵測 (Yes / No) 貓狗分類器 (圖片類型分類,貓 or 狗) 生成式人工智慧,是人工智慧「眾多可能的目標之一」。 機器學習 (Machine Learning): 機器自動從「資料」找一個函式 使用機器,透過參數的輸入,套入既有算式,自動輸出/找出參數。 假設要讓機器學習如何分辨貓和狗 (輸入一張圖片,辨識出是貓或狗) 識別貓跟狗,需要有上萬個參數,這些 帶有大量未知參數的函式 ,就是 模型 機器學習,就是把上萬個參數「找出來」的過程 = 細訓練 (training) / learning 資料的輸入輸出的「限制」即為 訓練資料 「驗證」函式輸出結果即為 測試 testing / 推論 inference 現行慣用譬喻的類神經網路 (Neural Network),即為有大量參數的函式 透過類神經網路把大量參數解出來的技術,就是 深度學習 (Deep Learning) 生成式人工智慧的「目標」並不一定要透過深度學習技術來達成,也可以用一般的機器學習來達成。 以機器學習/深度學習的概念,ChatGPT 可以被想像為一個函式,輸入是一段文字,透過巨量參數的語言模型,將輸入的文字拆解為一連串文字接龍的問題分類,最終輸出「 文字接龍 (合理範圍是有限的答案) 」後的合理答案。產生文章的概念,就是生成一連串較小單位的的文字。 ChatGPT 使用的語言模型是 Transformer。 AI 畫圖 (Stable Diffusion, Midjourney, DALL-E) 也都是函式,但使用的模型是輸入文字後,輸出圖片。 其中一種 Open AI 開發的圖片的 生成策略 ,是輸出一連串的像素,以某種固定順序依序生成為圖片,此生成技術稱為 Auto-regressive Generation → 但並沒有紅起來。 名詞關聯性:人工智慧