Isaac AI專欄

2019年01月07日下午 02:41

強化學習

Isaac

強化學習（Reinforcement learning）是機器學習的一個分支，它被廣泛應用於博奕、控制學、金融等多個領域，其概念主要是藉由讓智能體與環境做互動，並在過程中給予正負向的回饋來讓電腦不斷修正行為，進而學會做動態之決策。

舉個稍微生活化一點的例子吧！假設有一個學生（智能體）上課非常的吵鬧，這時候老師（環境）可能就會懲罰他並要求他下次改進行為（負向回饋），而學生也因為受到老師的責罰而未來會避免類似的事情再發生，反過來說，如果學生考試考高分，老師則給予他極大的獎勵（正向回饋），那學生也因此知道原來在學校裡就是要乖乖唸書考高分阿！藉由這樣一連串的正/負向的回饋，最終學生的行為就會漸漸的朝著老師所設定的方向去進行！

強化學習最著名的經典案例莫過於Google DeepMind公司於2014年所開發的下圍棋軟體AlphaGo了，AlphaGo結合了深度學習以及強化學習兩個機器學習的方法，使得電腦可以在下圍棋方面戰勝人類的棋王，這件事情到底有多難呢？根據計算，相比於其他棋類比賽，圍棋是被公認為難度最高棋類比賽，可見要開發出如AlphaGo這樣的圍棋軟體真的是不容易阿！

此外，由於AlphaGo在學習的過程中是沒有老師指導的，所以在下圍棋的過程中，也下出了人類未曾發現的下棋方法，這震憾了整個下圍棋的領域，或許未來我們可能還需要反過來像電腦學習討教吧！

總之，強化學習真的是一個備受關注的領域，或許哪天我們能賦予身旁的所有東西足夠的智慧，來讓人類的生活愈來愈便利阿!

tag : #強化學習 #人工智慧 #Reinforcement learning

文章作者：Isaac

FB留言

TAKO留言

你尚未登入無法留言

讀取更多留言...