本發(fā)明公開(kāi)一種基于分層強(qiáng)化學(xué)習(xí)的四足機(jī)器人運(yùn)動(dòng)規(guī)劃方法,該方法通過(guò)構(gòu)建基于深度強(qiáng)化學(xué)習(xí)的上層行為決策控制器以及基于模型預(yù)測(cè)控制的下層運(yùn)動(dòng)執(zhí)行控制器;對(duì)于上層的深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò),基于SAC算法設(shè)計(jì)四足機(jī)器人的狀態(tài)更新網(wǎng)絡(luò)、動(dòng)作執(zhí)行網(wǎng)絡(luò)以及...