Skip to content

maddpg算法有一些问题 #68

@hanhanpp

Description

@hanhanpp

我发现你的MADDPG代码与原文有一些出入,不知道怎么回事:
(1) critic的输入只包括了对应agent的观测,而原文是所有agent的观测
(2)memory buffer 保存数据时,不同agent的动作保存顺序是不同的,而原文是一致的,不区分不同的agent

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions