生成式人工智慧與機器學習導論2025 — 搞懂機器學習與深度學習

生成式人工智慧與機器學習導論2025 — 搞懂機器學習與深度學習¶

🤖 什麼是機器學習？

機器學習的本質就是一種「透過資料尋找一個函式 (Function)」的技術。在生成式 AI 中，這個函式輸入一段未完成的句子，輸出下一個 token；而在本次課程的範例中，函式則輸入投影片資訊，預測老師這堂課會講多久。

🛠️ 機器學習的「3+1」核心步驟

要找出這個最佳函式，需要遵循以下三個基本步驟，加上一個關鍵的驗證環節：

第一步：定義目標 (Loss Function) 設定一個標準來評估函式的表現好壞。課程中使用了均方誤差 (MSE)，計算預測時間與真實時間差距的平方，數值越小代表越精準。
第二步：劃定搜尋範圍 (Model) 根據人類的經驗（Domain Knowledge）決定函式的模樣。例如，我們直覺認為「投影片張數」越多，講課時間越長，這就是一種線性回歸 (Linear Regression) 模型。
第三步：尋找最佳函式 (Optimization) 在範圍內找到讓損失函數最低的參數。最常用的技術是梯度下降法 (Gradient Descent)，透過計算斜率來決定參數更新的方向。
關鍵的「+1」：驗證 (Validation) 模型不能只在訓練過後的資料上表現好，還必須在「沒看過的資料」上測試。這就是所謂的模擬考，用來確認模型是否具備真正的預測能力。

🧠 深度學習：更強大的函式逼近器

當簡單的線性模型無法精確描述現實時（例如導論課與專業課的講課速度不同），我們就需要深度學習。

• 神經網路：透過多層神經元 (Neuron) 與 ReLU 激活函數的組合，深度學習理論上可以模擬出任何複雜的非線性曲線。

挑戰：雖然範圍更廣，但訓練也更困難。模型容易陷入局部最小值 (Local Minimum) 或鞍點 (Saddle Point)，且容易產生過擬合 (Overfitting) — — 也就是模型只是「死背」了訓練資料，卻無法在實戰中應用。
參考資料

李弘毅【生成式人工智慧與機器學習導論2025】第 5 講：一堂課搞懂機器學習與深度學習的基本原理