AI4Games:基于强化学习的演化博弈策略挖掘
AI4Games: Reinforcement Learning-Based Strategy Mining in Evolutionary Games
-
作者:
王宏宇
1
王龙
1
-
作者单位:
- 通讯作者:
王龙
Email:longwang@pku.edu.cn
-
提交时间:2025-08-18 11:24:23
摘要: 在多智能体系统中如何系统性地发掘具备长期优势的博弈策略,一直是演化博弈论中的核心问题之一。本文提出并实现了一个名为AI4Games的策略搜索框架,旨在为“基于强化学习的演化博弈策略挖掘”提供统一的原则和实现路径。该框架从策略表示、交互设计、奖励构造、学习优化到策略筛选等多个层面,构建出一套可推广、可复用的通用流程,适用于不同博弈模型、策略空间与目标设定,具备良好的适应性与扩展性。为了验证框架的可行性,我们以“在演化重复博弈中发掘主导策略”为应用场景,具体实现了AI4Games在该任务下的操作流程,并通过实验发现了表现优异的两步记忆策略(MTBR)。该策略具备清晰可解释的行为规则,并在多类环境中展现出强大的收益能力与演化稳定性。实验结果表明,AI4Games不仅能够有效完成特定策略发现任务,更为多智能体博弈行为建模与策略演化研究提供了一种具有普适性的技术框架。
版本历史
[V1] |
2025-08-18 11:24:23 |
ChinaXiv:202508.00255V1
|
下载全文 |