“即時戰略遊戲”可用於軍事指揮訓練

來源:新浪新聞 2018-01-12 05:06:00

穀歌子公司DeepMind生產的“阿爾法狗”戰勝圍棋大師李世石後,“即時戰略遊戲”就成為許多人工智能專家眼中的下一個目標。DeepMind宣布將為研究人員提供一個用《星際爭霸Ⅱ》測試人工智能的新算法,阿裏巴巴也曾開發過一款《星際爭霸》的增強學習框架。

可能很多人隻關注到人工智能挑戰“即時戰略遊戲”事件本身,而忽略了其在軍事方麵的重大意義。大多數“即時戰略遊戲”其實就是一款軍事作戰指揮模擬軟件,比如一些二戰係列的遊戲,玩家可以通過扮演某個國家的將領,充分體驗各軍兵種在戰爭中所發揮的獨特作用,猶如親身親曆那些經典戰役。還有一些策略性非常強的遊戲,更偏重於對整體戰略和局部戰術的運用,玩家可以像在沙盤上一樣運籌帷幄,指揮調配自己的各種軍事力量,運用各種戰略戰術攻擊對方。雖然戰鬥過程被大大簡化,但其對實戰分析的模擬程度卻相當高。因此,“即時戰略遊戲”本身對提升軍事指揮訓練水平有很大助益。

戰爭是你死我活的對抗,一款真正的軍事遊戲必須具備高度對抗性。實戰對抗遊戲的樂趣來自於旗鼓相當的“對手”,因為水平差異所產生的“實力碾壓”會破壞遊戲本身對抗的樂趣。目前,遊戲中自帶的人工智能還比較原始,是基於預編程序的規則,沒有學習能力,也無法進行訓練,一旦被人類對手找到弱點後就很難再取勝。

原始人工智能的另一種情形,是快速從遊戲代碼中獲取信息,同時對屏幕內外所有單位下達指令,“手速”遠超人類,可以一直“碾壓”人類對手。這種情況下,人類與原始人工智能“對戰”很快就會失去興趣,進步也不快。提高水平的最好辦法,就是找到一個旗鼓相當的人類對手,但不同的選手之間水平差別比較大,很難找到一個水平層次相當的對手,更何況是一直陪伴自己共同提高的“夥伴”。

當擁有增強學習能力的人工智能開始挑戰“即時戰略遊戲”時,我們看到了解決上述問題的曙光。人工智能通過成千上萬次高強度的訓練和比賽,不斷積累經驗,提升自身水平,找到各種複雜局麵下的最優方案。相信用不了幾年,人工智能就能輕鬆擊敗《星際爭霸》遊戲中的一般選手。隨著DeepMind的強勢介入,擊敗頂級選手將指日可待。

之後,人工智能就可以向軍事指揮訓練方麵拓展。利用情報係統提供的素材和仿真實驗得到的大數據,將各類軍事作戰想定、規則和參數移植到“即時戰略遊戲”,較為逼真地建立起“藍軍”模擬係統。對抗的一方是真實的指揮員,另一方則是人工智能係統。人工智能通過強化學習將自己打造成為指揮員的“私人教練”,成為一個旗鼓相當的對手,並對指揮員開展個性化培訓,讓其在每局對戰中都能發現自己值得改進的地方。隨著指揮員水平的不斷提升,人工智能還會自動調整自己的水平,讓指揮員一直感受到對抗的樂趣和挑戰。

點擊查看原文

相關鏈接