注冊(cè)帳號(hào)丨忘記密碼?
1.點(diǎn)擊網(wǎng)站首頁(yè)右上角的“充值”按鈕可以為您的帳號(hào)充值
2.可選擇不同檔位的充值金額,充值后按篇按本計(jì)費(fèi)
3.充值成功后即可購(gòu)買網(wǎng)站上的任意文章或雜志的電子版
4.購(gòu)買后文章、雜志可在個(gè)人中心的訂閱/零買找到
5.登陸后可閱讀免費(fèi)專區(qū)的精彩內(nèi)容
打開文本圖片集
摘要:為提高多車場(chǎng)車輛路徑問題(multi-depot vehicle routing problem,MDVRP)的求解效率,提出了端到端的深度強(qiáng)化學(xué)習(xí)框架。首先,將MDVRP建模為馬爾可夫決策過程(Markov decision process,MDP),包括對(duì)其狀態(tài)、動(dòng)作、收益的定義;同時(shí),提出了改進(jìn)圖注意力網(wǎng)絡(luò)(graph attention network,GAT)作為編碼器對(duì)MDVRP的圖表示進(jìn)行特征嵌入編碼,設(shè)計(jì)了基于Transformer的解碼器;采用改進(jìn)REINFORCE算法來訓(xùn)練該模型,該模型不受圖的大小約束,即其一旦完成訓(xùn)練,就可用于求解任意車場(chǎng)和客戶數(shù)量的算例問題。(剩余21785字)
登錄龍?jiān)雌诳W(wǎng)
購(gòu)買文章
基于end-to-end深度強(qiáng)化學(xué)習(xí)的多車場(chǎng)車輛路徑優(yōu)化
文章價(jià)格:6.00元
當(dāng)前余額:100.00
閱讀
您目前是文章會(huì)員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報(bào)電話:400-106-1235
舉報(bào)郵箱:longyuandom@163.com