21 12 月, 2017 | David 9的博客 --- 不怕"过拟合"

社会学家似乎也应该拿起AI的工具 — David 9

国人的勤奋总是令人惊讶，上海交大和伦敦大学学院(UCL）在今年nips大会和AAAI2018上发表了一篇有意思的demo paper，MAgent: 一个多智能体的RL增强学习平台, 帮助理解群体智能和社会现象学。先看一下MAgent可视化模拟红蓝两军战斗的demo，通过训练一个共享参数DQN，最后宏观上智能体学会一些协同策略：包围进攻（图1），合力追击（图2）：

作者不仅开源了MAgent平台，而且平台可扩展性和性能似乎相当不错，文章称在单GPU机器上可以同时训练100万个agent智能体，考虑到额外的图形模拟的渲染压力同时有DQN训练压力，C++代码性能确实不错（如果训练时间可以接受的话）。继续阅读一篇有意思的demo paper: 多智能体的RL增强学习平台, 理解群体智能和社会现象学，AAAI2018论文选读

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31