问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

多智能体强化学习测试环境：SMAC、MPE、PettingZoo等

创作时间:

作者:

@小白创作中心

多智能体强化学习测试环境：SMAC、MPE、PettingZoo等

引用

CSDN

1.

https://blog.csdn.net/qq_51399582/article/details/142148995

在多智能体强化学习（Multi-Agent Reinforcement Learning, MARL）的研究和应用中，构建合适的环境来测试和评估算法是非常重要的。以下是一些常用的多智能体强化学习环境，它们涵盖了多种任务类型，如协作、对抗、竞争等，帮助研究者验证算法的效果。

一、常用的多智能强化学习测试环境

1. SMAC（StarCraft Multi-Agent Challenge）

简介：SMAC 是基于实时战略游戏《星际争霸II》的一个多智能体强化学习平台。它提供了丰富的微观战斗场景，允许多个智能体在局部观测的条件下进行协作或对抗。
特点：
高度复杂的策略空间，智能体需要在合作中战胜对手。
集中训练和分散执行的框架非常适合多智能体强化学习算法的测试。
支持如 VDN、QMIX、MADDPG 等常见 MARL 算法。
适用任务：协作、对抗。
链接：SMAC 环境

2. MPE（Multi-Agent Particle Environment）

简介：MPE 是一个轻量级的多智能体粒子环境，智能体是无形的粒子，可以在二维平面中移动执行任务。该环境中，智能体需要完成协作或竞争任务。
特点：
提供多个经典的多智能体场景，包括协作和竞争。
易于设置，适合快速实验和算法验证。
适用任务：协作、竞争、对抗。
链接：MPE 环境

3. PettingZoo

简介：PettingZoo 是一个多智能体强化学习框架，类似于 OpenAI Gym，但它专门为多智能体任务设计。它提供了丰富的多智能体环境，如合作博弈、竞技游戏和对抗场景等。
特点：
支持多种不同类型的任务：协作、竞争、对抗等。
易于集成现有的多智能体强化学习算法。
提供了适合不同任务类型的 benchmark 环境。
适用任务：协作、对抗、策略博弈。
链接：PettingZoo 环境

4. MATLAB MARL Toolbox

简介：MATLAB 提供了一个用于多智能体强化学习的工具箱。用户可以快速构建和测试多智能体系统的合作和竞争任务。适合复杂系统的建模和实验。
特点：
便于使用 MATLAB 仿真工具进行复杂任务的设计。
集成强化学习算法，支持模型的快速迭代开发。
适用任务：复杂的工程应用、系统控制。
链接：MATLAB MARL Toolbox

5. OpenAI Gym + Gym-Multi-Agent

简介：OpenAI Gym 是单智能体强化学习的标准环境库，通过扩展 Gym-Multi-Agent，可以使其支持多智能体场景。该库能够快速集成多智能体问题，支持多种任务类型。
特点：
任务类型广泛，支持自定义多智能体环境。
轻量、易用，适合初学者和快速开发者。
适用任务：自定义的协作、对抗场景。
链接：Gym-Multi-Agent

6. DeepMind Lab2D

简介：DeepMind Lab2D 是一个灵活的二维模拟环境，适合多智能体场景。用户可以在二维平面上构建自定义的场景，智能体可以在该环境中进行交互。
特点：
灵活的任务设计，可用于构建从简单到复杂的多智能体场景。
支持与深度学习框架的无缝集成。
适用任务：协作、对抗、博弈。
链接：Lab2D

7. Hanabi Learning Environment

简介：Hanabi 是一个多智能体的协作游戏环境，基于牌类游戏 Hanabi。该环境特别适合测试智能体之间的沟通和协作能力。
特点：
测试智能体的协作和沟通策略。
支持有限的信息共享，适合复杂的决策场景。
适用任务：协作、信息共享。
链接：Hanabi 环境

8. MADRL (Multi-Agent Deep Reinforcement Learning)

简介：MADRL 是多智能体深度强化学习的经典环境集合，支持如捕食者-猎物等常见的多智能体任务。
特点：
提供标准的多智能体环境。
环境设置简洁、易用，适合验证多智能体算法。
适用任务：协作、对抗。
链接：MADRL 环境

9. Roboschool 和 PyBullet

简介：Roboschool 和 PyBullet 是机器人模拟环境，适合多智能体机器人控制和协作任务。通过这些环境可以模拟多机器人任务，如机器人足球等。
特点：
高度仿真现实物理，适合多智能体机器人协作或对抗任务。
支持复杂的物理交互和控制任务。
适用任务：机器人控制、协作。
链接：PyBullet 环境

二、获取测试环境的方式

上文给出的链接都是官方仓库或文档的参考路径，但这些链接可能会因为网络、地域或其它因素而无法打开。为了解决这个问题，可以尝试通过以下几种方式获取相关资源：

1. 通过 GitHub 搜索相关环境仓库

大部分多智能体强化学习环境的代码都托管在 GitHub 上，可以直接在 GitHub 上搜索相关项目。以下是一些关键搜索词：

SMAC
Multi-Agent Particle Environment (MPE)
PettingZoo
Hanabi Learning Environment
PyBullet

2. 通过 Google Scholar 或 arXiv 查找相关文献

如果你想查找这些环境的研究论文，可以通过Google Scholar或arXiv来搜索关键字，如 "StarCraft Multi-Agent Challenge" 或 "PettingZoo MARL environment"。

3. 通过 Python 包管理工具安装

很多环境可以通过 pip 直接安装：

pip install pettingzoo
pip install smac

4. 代理或镜像服务

如果遇到链接打不开的问题，可能与网络访问限制相关。你可以尝试使用代理或镜像网站访问 GitHub、arXiv 等资源。

三、总结

这些多智能体强化学习环境涵盖了从简易的粒子世界到复杂的物理仿真和对抗游戏，研究者可以根据任务的复杂性和需求选择合适的环境。这些环境不仅为 MARL 算法提供了标准测试平台，也为算法改进和实际应用提供了宝贵的实验基础。

热门推荐

五指袜助力跑者：防摩擦、增抓地，选购全攻略

五指袜助力跑者：防摩擦、增抓地，选购全攻略

世预赛亚洲区：越南主场迎战菲律宾，两队为出线权展开决战

世预赛亚洲区：越南主场迎战菲律宾，两队为出线权展开决战

从低迷到登顶！金相植半年重塑越南足球辉煌

从低迷到登顶！金相植半年重塑越南足球辉煌

韩国教头金相植率越南队备战铃木杯，目标重夺东南亚霸权

韩国教头金相植率越南队备战铃木杯，目标重夺东南亚霸权

金相植出任越南国家队主帅，主打“赢球心态”

金相植出任越南国家队主帅，主打“赢球心态”

双十一囤货指南：白牡丹和寿眉哪家强？

双十一囤货指南：白牡丹和寿眉哪家强？

吲哚美辛肠溶片副作用知多少？

吲哚美辛肠溶片副作用知多少？

冬季关节炎管理：吲哚美辛肠溶片的正确使用与注意事项

冬季关节炎管理：吲哚美辛肠溶片的正确使用与注意事项

钦州15处景点换上“粘土滤镜”：从白海豚栖息地到百年骑楼

钦州15处景点换上“粘土滤镜”：从白海豚栖息地到百年骑楼

钦州十大景点：白海豚故乡与千年古村的邂逅

钦州十大景点：白海豚故乡与千年古村的邂逅

社交恐惧症：不只是害羞，心理学教你这样应对

社交恐惧症：不只是害羞，心理学教你这样应对

贵阳至北海自驾7日游：黄果树瀑布邂逅涠洲岛

贵阳至北海自驾7日游：黄果树瀑布邂逅涠洲岛

喀斯特到热带雨林：黔桂两省秋日旅游攻略

喀斯特到热带雨林：黔桂两省秋日旅游攻略

私募基金投后管理系列谈之二——换股并购退出的风险及建议

私募基金投后管理系列谈之二——换股并购退出的风险及建议

什么情况下需要进行股权转让评估

什么情况下需要进行股权转让评估

莱拉甜心小镇：温馨画风搭配丰富互动，打造专属治愈空间

莱拉甜心小镇：温馨画风搭配丰富互动，打造专属治愈空间

白牡丹茶冲泡秘籍，你get了吗？

白牡丹茶冲泡秘籍，你get了吗？

福鼎白牡丹茶：从产地到品鉴的全方位指南

福鼎白牡丹茶：从产地到品鉴的全方位指南

白牡丹茶：抗糖护肝瘦身的科学之选

白牡丹茶：抗糖护肝瘦身的科学之选

福鼎白牡丹：果香四溢的白茶佳品

福鼎白牡丹：果香四溢的白茶佳品

福鼎白茶白牡丹茶饼：养生功效与冲泡保存全攻略

福鼎白茶白牡丹茶饼：养生功效与冲泡保存全攻略

如何在家为宝宝做视力检查？专家教你几招！

如何在家为宝宝做视力检查？专家教你几招！

科学育儿编辑部推荐：不同年龄段宝宝视力检查方法

科学育儿编辑部推荐：不同年龄段宝宝视力检查方法

长沙周边徒步指南：十大森林公园游玩攻略

长沙周边徒步指南：十大森林公园游玩攻略

郑州5大景点深度游：博物院、动物园、温泉全覆盖

郑州5大景点深度游：博物院、动物园、温泉全覆盖

郑州文物局发布新春游径，串联商代文明与工业遗存

郑州文物局发布新春游径，串联商代文明与工业遗存

春节游郑州：五条文物路线带你穿越千年

春节游郑州：五条文物路线带你穿越千年

从配对到优化：漫步者蓝牙耳机使用完全指南

从配对到优化：漫步者蓝牙耳机使用完全指南

高油酸花生与普通花生的区别？

高油酸花生与普通花生的区别？

吃生花生和吃熟花生，有啥区别？医生说出大实话，原来我吃错了

吃生花生和吃熟花生，有啥区别？医生说出大实话，原来我吃错了

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号