ICLR 2020论文精选:“好奇心”的本质探讨,元学习与增强学习(RL)的“好奇心”机制,好奇心算法搜索,智能体的适应力增强

与其说人类是智能“搜索”机,不如说人类是智能“贪婪”机— David 9
David最近在思考一个问题,表面上看所有智能问题都是“搜索”问题,包括今天我们讨论“好奇心”本质,也可以理解为对“好奇心”算法的搜索。
但是,人类仅仅是一台高级一点的“搜索机”吗?或者说除了“搜索”,“智能”(灵性)是否必须有一些其他重要属性比如“抽象能力”,“信息组织能力” ?换句话,仅仅用显式“搜索”构建的“智能”是不是“伪智能”?
事实上,今天我们探讨的这篇MIT在ICLR 2020的论文,就是这样一种“搜索”出来的“好奇心”。但是,这已经是当今一群聪明人可以设计的较好的“好奇心”机制了。
毫无疑问,好奇心是智能体主动探索外部环境,获取有用经验的驱动力。
在内部,MIT研究人员把“好奇心”设计为一种“代理回报”(proxy rewards)的机制:
来自:https://arxiv.org/pdf/2003.05325.pdf
在传统RL算法外部环境之间又架了一层“好奇心”模块,模块返回的\hat{r} 是RL算法真正训练使用的回报。(并不直接使用环境回报r )。
这样对于RL算法,回报不再是“傻乎乎”地锚定某个特定环境,而是可以适应多个环境。事实上该论文的实验就是针对多个RL环境游戏的,如Grid World:

继续阅读ICLR 2020论文精选:“好奇心”的本质探讨,元学习与增强学习(RL)的“好奇心”机制,好奇心算法搜索,智能体的适应力增强

审视”类人”智能和人类天性:谈谈Keras之父抽象因果推理语料(ARC)的kaggle竞赛,智能评估,导出智能,类人智能,人类天性

如果“智能”是个体应对特定环境而被“诱导”出的,那么,个体的应对方式或作出假设的瞬间,也许是最有趣的部分! — David 9

David曾经讨论过Keras之父对智能的看法,也谈论过Yann LeCun对智能的看法。前不久Keras之父发起的因果推理语料(ARC)的kaggle竞赛结束,进一步激励我总结一下对“智能”的新看法。

首先,几乎一致认可的是,“智能”不仅是一个个基于任务的技能的简单集合这么简单。如果是这样,无法解释人类在一生中会学习自己都无法预料一些技能,我们学习未知技能的灵活性总是超出自己的想象。

其次,人类智能也不是“通用智能”,这点François Chollet和Yann LeCun都提到了。如果人类智能是通用智能,那么无法解释人类根深蒂固不擅长的那些领域,如不擅长长期计划(跨域年的预测),视觉有盲区认知有偏差计算缓存小(多位数相乘就可以把我们难倒)等等。

人类视觉盲区

哪怕经过训练我们也不能像熟悉走路一样自然地掌握线性代数。

同时,没有免费午餐定理告诉我们,任何优化方法,在一些方面的优势,在另一些方面则是劣势。因此,存在一个凌驾所有智能的万能的“通用智能”的可能性不大。稍加思考你还能发现“智能”这个东西是脱离不了外部环境的,它是大自然的产物。

那么人类智能究竟是一种什么样的“智能”?

...阅读更多...加入David9的星球群阅读所有文章:

加入David9的星球群,获得通行密码 , 阅读全文

量子卷积神经网络QCNN,TensorFlow Quantum(TFQ)和近期量子计算的疑问总结和例子,David 9量子计算系列#2

人类使用工具的过程很有意思,他们用旧的“先验”去获取新“先验”,而不是满足于完善旧的“先验” — David 9

量子计算机和其它人类工具一样,只是帮助人们探索未见的新“先验”。因为第一期的量子计算QNN入门反响热烈,所以David打算在这里补充第二期。并回答一些前沿探索的关键性问题:

  • TFQ和Cirq的关系和架构

用一句话概括,TFQ(TensorFlow Quantum)是将CirqTensorFlow集成在一起的框架。TensorFlow是包装ml或深度学习算法的上层框架。而Cirq就更接近量子计算机设备操作,包括各种常见门逻辑线路(Circuits)设计,支持不同结构的量子设备(google的Xmon量子设备是网状qubits)。

本质上,TFQ模型的目的是把量子线路(Circuits)嵌入到普通深度学习(机器学习)模型中,让量子线路编码经典深度学习(机器学习)的信息(下图蓝框部分):

来自:https://ai.googleblog.com/2020/03/announcing-tensorflow-quantum-open.html

即,制定一些量子线路操作,并对输入量子的量子间“去纠缠”,然后就可以编码经典世界中的信息。详细了解可以看看我们第一期内容

  • NISQ和Cluster State 是什么意思?

NISQCluster State是目前量子计算领域的主流概念。

我们知道,所量子叠加态就是一个量子能在同一时间处于两种不同属性0和1的状态,而对于经典物理中,一个粒子只能处于一种状态,如要么左旋,要么右旋。所谓量子纠缠态,简单来说,就是满足一定条件的情况下一个量子的行为将会影响到另一个量子的状态。即其中一个量子被操作改变而发生状态变化时,比如进行量子观测时,一个量子被观测为左旋。则另一个量子其状态立即发生相应的状态变化。而两个量子之间不存在一定相同或者相反的绝对规则。因此两个被纠缠的粒子可以是状态相同,也可以是状态相反

叠加纠缠的普遍存在, 继续阅读量子卷积神经网络QCNN,TensorFlow Quantum(TFQ)和近期量子计算的疑问总结和例子,David 9量子计算系列#2