本發(fā)明公開(kāi)了一種端到端無(wú)人機(jī)自主導(dǎo)航方法,涉及無(wú)人機(jī)技術(shù)領(lǐng)域,包括以下步驟:設(shè)計(jì)強(qiáng)化學(xué)習(xí)框架下的狀態(tài)空間、動(dòng)作空間;設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù),建立基于領(lǐng)域知識(shí)的非稀疏獎(jiǎng)勵(lì)函數(shù);構(gòu)建基于時(shí)間序列的環(huán)境信息處理方法;引入基于輔助網(wǎng)絡(luò)引導(dǎo)的價(jià)值評(píng)估增強(qiáng)機(jī)...