2. MARLenv 소개
배우기의 챕터 1~3은 MARL관련된 이야기를, 챕터 4에서는 이를 더 확장하여 multi-agent RL을 직접 다루는 algorithm으로 접근하는 방법에 관하여 간단하게 이전 논문들을 소개하는 시간을 가졌습니다. 이후 응용하기의 PART 1에서는 snake game의 소개와 함께 single/multi agent인 상황에서 기존의 single-agent algorithm을 학습시켰을때 일어나는 일을 설명했습니다.
앞선 내용들을 응용해 MARL에 대한 다양한 아이디어들을 실험해 볼 수 있도록 MARLenv의 사용법에 대해 소개하는 시간을 가져보도록 하겠습니다.
MARLenv는 ML2에서 개발한 오픈소스 강화학습 환경으로 multi-agent snake game이 구현되어 있습니다.
MARLenv 를 통해 기본적인 single-agent 훈련은 물론 multi-agent 훈련이 가능하며 다양한 모드로 snake game을 관찰할 수 있습니다. 또한 연구자들이 환경의 구성요소를 쉽게 변형할 수 있도록 하여 다양한 실험이 가능하도록 만들었습니다.
높은 자유도와 확장성을 갖고있는만큼 MARLenv를 사용하시면서 재미를 느끼실 수 있습니다.
오픈소스 프로젝트인 MARLenv에 대한 피드백과 컨트리뷰션은 언제나 환영입니다! MARLenv github 방문하기 🚀
이 문서에 기여하고 싶은 내용이 있으신가요? github에서 문서를 수정하세요!