AI alphastar 星際2暴打人類——人類或許要向AI學習( 四 )

(二)回顧

  1. 勝負機制

左邊的示意圖為:AI通過神經網絡活動來進行思考 , 并且可以考慮的范圍是地圖所有可視范圍(非開全圖 , 只是自己可以看到的地方 , 意味著不需要切屏 。 )

右邊的示意圖為:AI的勝負曲線 , WIN DRAW LOSE代表的是勝負概率 。 沒錯 , AI此時此刻認為自己已經勝率100%了 。 AI在認為自己lose的概率為100%的時候 , 不會主動退出游戲打出GG 。 事實上 , 這種神經網絡機制可以認為AI可分身為多個人同時應戰 。

  1. 獎懲機制

視頻中提到了為什么AI總是出純追獵 , 主要原因在于獎懲機制 , 出這個兵贏了就會繼續出 , 最后收斂到只出一個兵種 , 所以AI一般而言是不懂得兵種搭配的 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。