特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

基于組稀疏優(yōu)化的強(qiáng)化學(xué)習(xí)稀疏表征

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘要:強(qiáng)化學(xué)習(xí)由于具有出色的數(shù)據(jù)效率和快速學(xué)習(xí)的能力,開始應(yīng)用于許多實(shí)際問題以學(xué)習(xí)復(fù)雜策略。但是高維環(huán)境中的強(qiáng)化學(xué)習(xí)常常受限于維度災(zāi)難或者災(zāi)難性干擾,性能表現(xiàn)不佳甚至導(dǎo)致學(xué)習(xí)失敗。圍繞表征學(xué)習(xí),提出了一種符合Lasso 類型優(yōu)化的稀疏卷積深度強(qiáng)化學(xué)習(xí)方法。首先,對稀疏表征的理論和優(yōu)勢進(jìn)行綜述,將稀疏卷積方法引入深度強(qiáng)化學(xué)習(xí)中,提出了一種新的稀疏表征方法;其次,對由稀疏卷積編碼定義的可微優(yōu)化層進(jìn)行了數(shù)學(xué)推導(dǎo)并給出了優(yōu)化算法,為了驗(yàn)證新的稀疏表征方法的有效性,將其應(yīng)用于相關(guān)文獻(xiàn)常見的基準(zhǔn)環(huán)境中進(jìn)行測試。(剩余8514字)

monitor