本篇文章主要對機器學習做個簡單的介紹,分享機器學習的主要三種方式,分別為監督式學習、非監督式學習以及加強學習。

監督式學習(Supervised Learning)

監督式學習為目前被廣泛運用的一種學習方式,有完整的訓練資料,而每筆訓練資料都有相對應的答案。在這樣的學習過程中,機器藉由訓練集的資料訓練出模型,未來投入新的資料時,機器便可根據這個模型對新的資料進行預測。

預測的結果可分為類別型態集數值型態,常見相關模型包含Linear Regression, Polynomial Regression, Logistic Regression, Decision Tree, Random Forest, KNN, SVM, Naive Bayes, Neural Network 等等。

非監督式學習(Unsupervised Learning)

有別於監督式學習,非監督式學習的資料是沒有答案的,更不需要人力去做標籤。比較經典的非監督式學習為分群問題,機器會根據資料特徵去做分類,有時我們也會以定義距離的方式去做分群。

常見相關模型包含Clustering, K-means, Anomaly Detection, PCA等等。

加強學習(Reinforcement Learning)

加強學習主要是經由每一次執行結果得到的反饋,再次對機器訓練, 從一次又一次的修正中得到更好得結果。前幾年AlphaGo打敗世界棋王的經典案例也是加強學習的一個例子。

深度學習也是加強學習中的一個案例,常見模型包含CNN, LSTM, GAN等等。

機器學習步驟:

  1. 蒐集資料
  2. 整理資料
  3. 選擇模型
  4. 進行訓練
  5. 模型調整
  6. 進行預測

機器學習首部曲的內容主要著重在第三個步驟,模型選擇。我們將分享一些機器學習的方法,並用Python進行練習。

詳細解說可參考影片,投影片可參考:

機器學習_簡介

下載