本篇文章主要對機器學習做個簡單的介紹,分享機器學習的主要三種方式,分別為監督式學習、非監督式學習以及加強學習。
監督式學習(Supervised Learning)
監督式學習為目前被廣泛運用的一種學習方式,有完整的訓練資料,而每筆訓練資料都有相對應的答案。在這樣的學習過程中,機器藉由訓練集的資料訓練出模型,未來投入新的資料時,機器便可根據這個模型對新的資料進行預測。
預測的結果可分為類別型態集數值型態,常見相關模型包含Linear Regression, Polynomial Regression, Logistic Regression, Decision Tree, Random Forest, KNN, SVM, Naive Bayes, Neural Network 等等。
非監督式學習(Unsupervised Learning)
有別於監督式學習,非監督式學習的資料是沒有答案的,更不需要人力去做標籤。比較經典的非監督式學習為分群問題,機器會根據資料特徵去做分類,有時我們也會以定義距離的方式去做分群。
常見相關模型包含Clustering, K-means, Anomaly Detection, PCA等等。
加強學習(Reinforcement Learning)
加強學習主要是經由每一次執行結果得到的反饋,再次對機器訓練, 從一次又一次的修正中得到更好得結果。前幾年AlphaGo打敗世界棋王的經典案例也是加強學習的一個例子。
深度學習也是加強學習中的一個案例,常見模型包含CNN, LSTM, GAN等等。
機器學習步驟:
- 蒐集資料
- 整理資料
- 選擇模型
- 進行訓練
- 模型調整
- 進行預測
機器學習首部曲的內容主要著重在第三個步驟,模型選擇。我們將分享一些機器學習的方法,並用Python進行練習。
詳細解說可參考影片,投影片可參考: