本公開(kāi)提供了“利用機(jī)器學(xué)習(xí)進(jìn)行車(chē)輛操作”。一種計(jì)算機(jī),其包括處理器和存儲(chǔ)器,所述存儲(chǔ)器包括指令,所述指令可由所述處理器執(zhí)行以基于從機(jī)器學(xué)習(xí)系統(tǒng)輸出的預(yù)測(cè)而操作系統(tǒng),所述預(yù)測(cè)包括預(yù)測(cè)的狀態(tài)、動(dòng)作、獎(jiǎng)勵(lì)和成本,其中所述機(jī)器學(xué)習(xí)系統(tǒng)包括第一變換器和第二變換器,并且基于互模擬離線(xiàn)強(qiáng)化學(xué)習(xí)