China Daily Homepage
中文網(wǎng)首頁
時政
資訊
C財經(jīng)
生活
視頻
專欄
原創(chuàng)
觀天下
地方

登錄

注冊

移動新媒體

China Daily Homepage
中文網(wǎng)首頁
時政
資訊
C財經(jīng)
生活
視頻
專欄
漫畫
原創(chuàng)
觀天下
地方

新研究提升人工智能決策算法適用性

來源：科技日報

2024-09-13 08:44　

分享到

分享到微信

原標(biāo)題：新研究提升人工智能決策算法適用性

近日，由北京大學(xué)人工智能研究院、工學(xué)院、計算機學(xué)院和倫敦國王學(xué)院共同完成的論文——《大規(guī)模多智能體系統(tǒng)的高效強化學(xué)習(xí)》在國際學(xué)術(shù)期刊《自然·機器智能》上發(fā)表。這一成果首次在大規(guī)模多智能體系統(tǒng)中實現(xiàn)高效去中心化協(xié)同決策，有利于提升人工智能決策算法的擴展性和適用性。

多智能體系統(tǒng)主要以龐大的智能體交互數(shù)據(jù)為基礎(chǔ)，利用大量計算資源驅(qū)動每個智能體學(xué)習(xí)如何與其他智能體合作執(zhí)行復(fù)雜任務(wù)，其核心范式是多智能體強化學(xué)習(xí)。

“比如一個無人機編隊，每架無人機都由人工智能控制，我們把每架飛機的控制器叫作智能體，這個無人機編隊由多個智能體構(gòu)成，就是一個多智能體系統(tǒng)。”論文第一作者、北京大學(xué)人工智能研究院博士生馬成棟解釋。

馬成棟說，在真實大規(guī)模系統(tǒng)中，各個控制單位之間、控制單位與環(huán)境之間的交互成本往往非常高昂。這些系統(tǒng)中經(jīng)常存在客觀通信限制，如通信距離太遠(yuǎn)、全局通信有隱私泄露風(fēng)險、通信能耗限制等。控制單位之間難以實現(xiàn)全局信息交換，阻礙了人工智能決策算法在大規(guī)模系統(tǒng)中的擴展和應(yīng)用。

當(dāng)前，去中心化的多智能體強化學(xué)習(xí)成為國際學(xué)術(shù)界的研究熱點，其旨在探索一種算法，即在有限數(shù)據(jù)和資源條件下，將決策能力擴展到包含大量智能體的復(fù)雜真實系統(tǒng)中。

馬成棟說，去中心化的多智能體強化學(xué)習(xí)，以不依賴全局信息的方式讓每個智能體實現(xiàn)高效去中心化協(xié)同決策，展現(xiàn)出獨特優(yōu)勢。

論文通訊作者、北京大學(xué)人工智能研究院助理教授楊耀東介紹，研究團隊通過網(wǎng)絡(luò)化結(jié)構(gòu)解耦系統(tǒng)的全局動態(tài)特性，使智能體能獨立學(xué)習(xí)局部狀態(tài)轉(zhuǎn)移、鄰域信息價值和去中心化策略，將復(fù)雜的大規(guī)模決策難題轉(zhuǎn)化為更容易求解的問題。得益于此，即使在樣本數(shù)據(jù)和信息交互受限的情況下，大型人工智能系統(tǒng)也能展現(xiàn)令人滿意的決策性能。

研究團隊在較為復(fù)雜的城市交通和電力網(wǎng)絡(luò)中，對包含數(shù)百個智能體的場景進行了測試。結(jié)果顯示，與中心化多智能體學(xué)習(xí)方法相比，去中心化的方法可將信息交換成本降低70%或更多。而且，隨著智能體數(shù)量不斷增長，這一比例還會顯著下降。同時，樣本效率可提升50%以上。

“這一研究成果對于將人工智能模型擴展到大型電力網(wǎng)絡(luò)、城市交通信號控制等大規(guī)模多智能體系統(tǒng)具有重要價值。”馬成棟舉例說，在大型電網(wǎng)系統(tǒng)中，節(jié)點之間信息交換和傳輸過于頻繁，難免會產(chǎn)生干擾。某些節(jié)點一旦發(fā)生故障，就會嚴(yán)重影響其他節(jié)點的性能。去中心化可以降低這一風(fēng)險，提高電網(wǎng)系統(tǒng)穩(wěn)定性和安全性。

（記者楊雪）

【責(zé)任編輯：張瑨瑄】

科技日報

最熱新聞

為你推薦

換一批

關(guān)于我們 | 聯(lián)系我們

首頁
時政
資訊
財經(jīng)
生活
視頻
專欄
漫畫
獨家
招聘

違法和不良信息舉報
互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120170006
信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證0108263號
京公網(wǎng)安備11010502032503號
京網(wǎng)文[2011]0283-097號
京ICP備13028878號-6

中國日報網(wǎng)版權(quán)說明：凡注明來源為“中國日報網(wǎng)：XXX（署名）”，除與中國日報網(wǎng)簽署內(nèi)容授權(quán)協(xié)議的網(wǎng)站外，其他任何網(wǎng)站或單位未經(jīng)允許禁止轉(zhuǎn)載、使用，違者必究。如需使用，請與010-84883777聯(lián)系；凡本網(wǎng)注明“來源：XXX（非中國日報網(wǎng)）”的作品，均轉(zhuǎn)載自其它媒體，目的在于傳播更多信息，其他媒體如需轉(zhuǎn)載，請與稿件來源方聯(lián)系，如產(chǎn)生任何問題與本網(wǎng)無關(guān)。

版權(quán)保護：本網(wǎng)登載的內(nèi)容（包括文字、圖片、多媒體資訊等）版權(quán)屬中國日報網(wǎng)（中報國際文化傳媒（北京）有限公司）獨家所有使用。未經(jīng)中國日報網(wǎng)事先協(xié)議授權(quán)，禁止轉(zhuǎn)載使用。給中國日報網(wǎng)提意見：rx@chinadaily.com.cn

首頁
時政
資訊
財經(jīng)
文化
漫畫
視頻
地方

中文 | English

中國日報版權(quán)所有
Content@chinadaily.com.cn

国产av剧情不卡,人妻无码喷潮上位,天天久久av每天,国产一区二区三区日韩精品

新研究提升人工智能決策算法適用性