柯潔:“一個純凈、純粹自我學習的alphago是最強的...對于alphago的自我進步來講...人類太多余了。”
據(jù)悉,AlphaGo Zero可以通過自我對弈進行學習,它利用了一種名為強化學習的技術(shù)。在不斷訓(xùn)練的過程中,這套系統(tǒng)開始靠自己的能力學會了圍棋中的一些高級概念。值得一提的是,在經(jīng)過40天訓(xùn)練后,AlphaGo Zero已經(jīng)成功擊敗了AlphaGo Master(擊敗柯潔事的AlphaGo)!
留言與評論(共有 條評論) |