博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Google 开源新型强化学习框架 Dopamine
阅读量:6412 次
发布时间:2019-06-23

本文共 570 字,大约阅读时间需要 1 分钟。

  hot3.png

Google 近日一个新的基于 Tensorflow 的框架 —— Dopamine,旨在为新手和资深 RL(强化学习)研究人员提供灵活性、稳定性和可重复性。该框架受启发,反映了神经科学与强化学习研究之间的强历史联系,旨在实现可以推动激进发现的投机性研究。

Dopamine 的功能亮点

易用性

  • 清晰性和简洁性是该框架设计中的两个关键考虑因素。Google 提供的代码非常紧凑(约 15 个 Python 文件)且文档完善,Google 希望这种简单性能使研究人员更轻松地理解代理的内部运作并快速尝试新的想法。

复用性

  • Google 非常看重可复用性在强化学习研究中的重要性。为此,他们为代码提供完整的测试覆盖率;,并遵循 等学者给出的建议使用街机学习环境(Arcade Learning Environment)标准化经验评估。

基准测试

  • 对于新的研究人员而言,能够根据已有方法快速对自己的想法进行基准测试是非常重要的。因此,Google 提供四个 agent 的,包括 支持的 60 个游戏,格式为 Python pickle 文件(对于使用谷歌框架训练的智能体)和 JSON 数据文件(用于对比其他框架训练的智能体)。Google 还额外提供,可在上面快速查看所有 60 款游戏的 agent 可视化训练运行情况。

更多细节可查阅和。

转载地址:http://sikra.baihongyu.com/

你可能感兴趣的文章
项目实战:自定义监控项--监控CPU信息
查看>>
easyui-datetimebox设置默认时分秒00:00:00
查看>>
蚂蚁分类信息系统5.8多城市UTF8开源优化版
查看>>
在django1.2+python2.7环境中使用send_mail发送邮件
查看>>
“Metro”,移动设备视觉语言的新新人类
查看>>
PHP源代码下载(本代码供初学者使用)
查看>>
Disruptor-NET和内存栅栏
查看>>
Windows平台ipod touch/iphone等共享笔记本无线上网设置大全
查看>>
播放加密DVD
查看>>
分享Silverlight新鲜事 - Silverlight Firestarter全球会议
查看>>
产品设计体会(3013)项目的“敏捷沟通”实践
查看>>
RHEL6.3基本网络配置(1)ifconfig命令
查看>>
网络诊断工具之—路由追踪tracert命令
查看>>
Java模拟HTTP的Get和Post请求(增强)
查看>>
php 环境搭建(windows php+apache)
查看>>
让虚拟机的软盘盘符不显示(适用于所有windows系统包括Windows Server)
查看>>
Cygwin不好用
查看>>
jQuery插件之验证控件jquery.validate.js
查看>>
[经验]无线鼠标和无线键盘真的不能用了?——雷柏的重生之路~
查看>>
【转】plist涉及到沙盒的一个问题
查看>>