生成式人工智慧與機器學習導論2025 — 搞懂機器學習與深度學習
生成式人工智慧與機器學習導論2025 — 搞懂機器學習與深度學習¶
🤖 什麼是機器學習?
機器學習的本質就是一種「透過資料尋找一個函式 (Function)」的技術。在生成式 AI 中,這個函式輸入一段未完成的句子,輸出下一個 token;而在本次課程的範例中,函式則輸入投影片資訊,預測老師這堂課會講多久。
🛠️ 機器學習的「3+1」核心步驟
要找出這個最佳函式,需要遵循以下三個基本步驟,加上一個關鍵的驗證環節:
-
第一步:定義目標 (Loss Function) 設定一個標準來評估函式的表現好壞。課程中使用了均方誤差 (MSE),計算預測時間與真實時間差距的平方,數值越小代表越精準。
-
第二步:劃定搜尋範圍 (Model) 根據人類的經驗(Domain Knowledge)決定函式的模樣。例如,我們直覺認為「投影片張數」越多,講課時間越長,這就是一種線性回歸 (Linear Regression) 模型。
-
第三步:尋找最佳函式 (Optimization) 在範圍內找到讓損失函數最低的參數。最常用的技術是梯度下降法 (Gradient Descent),透過計算斜率來決定參數更新的方向。
-
關鍵的「+1」:驗證 (Validation) 模型不能只在訓練過後的資料上表現好,還必須在「沒看過的資料」上測試。這就是所謂的模擬考,用來確認模型是否具備真正的預測能力。
🧠 深度學習:更強大的函式逼近器
當簡單的線性模型無法精確描述現實時(例如導論課與專業課的講課速度不同),我們就需要深度學習。
• 神經網路: 透過多層神經元 (Neuron) 與 ReLU 激活函數的組合,深度學習理論上可以模擬出任何複雜的非線性曲線。
- 挑戰: 雖然範圍更廣,但訓練也更困難。模型容易陷入局部最小值 (Local Minimum) 或鞍點 (Saddle Point),且容易產生過擬合 (Overfitting) — — 也就是模型只是「死背」了訓練資料,卻無法在實戰中應用。
參考資料
李弘毅 【生成式人工智慧與機器學習導論2025】第 5 講:一堂課搞懂機器學習與深度學習的基本原理
https://youtu.be/Taj1eHmZyWw?list=TLGGgkGzayH_mT0wNjAyMjAyNg
Comments
Loading comments…
Leave a Comment