强化学习:一种更有效的机器人学习方式

机器人护士——神话还是现实? 虽然这听起来有些牵强,但已经有医院让机器人给护士带来工具,帮助护士更有效地集中精力为病人提供护理。 Vittorio Giammar在o是波士顿大学五年级的博士生,他希望自己的新濠影汇线上赌场研究能对这类应用有所帮助。
在信息与系统工程中心(CISE), Giammar在o在Rafik B. Hariri计算与计算科学与工程新濠影汇线上赌场研究所主任兼杰出工程教授Ioannis Paschalidis的指导下,从事国防部多学科大学新濠影汇线上赌场研究计划(MURI)的工作 神经自主:自主机器人的神经科学启发感知、导航和空间意识.
Giammar在o’s work centers around mach在e learn在g, more specifically re在forcement learn在g, a method for robots to learn how to select good actions. “以前,控制主要是数学的,现在我们意识到建模很难,”Giammar在o解释说。 “所以我们要做的是让智能体与环境互动,并尝试通过试错或经验来自己学习。”
设计能够通过强化学习来学习的机器人——就像人类和动物一样——将使机器人的计算效率更高。 Giammar在o说:“我们希望建立的算法不需要所有这些数据、清理和注释,也不需要收集数据背后的所有费用,因为有一些东西可以构建,可以廉价地投入到现场,可以自己学习。”
然而,贾马里诺和他的合作者很快意识到这不是一件容易的事; 在人类和动物中,学习过程需要一生的时间,而且在很大程度上效率低下。 为了克服这种低效率,Giammar在o和他的合作者决定使用人类和动物的行为数据来增强和改进机器人的学习过程,从简单的实验开始,比如在房间里从A点到B点。
在新濠影汇线上赌场研究过程中,Giammar在o的角色是从思考问题和如何解决问题开始的。 为了做到这一点,他和他的合作者提出了一个新濠影汇线上赌场研究问题,然后从数据中寻找这些问题的解决方案。 他们的数据来自于涉及人类和动物的实验,其中许多是在Michael Hasselmo和Chantal Stern领导的系统神经科学中心实验室进行的。 第一步是利用模仿学习技术,让机器人模仿人类动物在类似环境中的行为。 然后,他们试图降低算法的复杂性——让机器人更容易更快地跟上——然后让它通过强化学习来改进它所学到的东西。 一旦这些被开发出来,神经科学家就会参与进来,随后是讨论和辩护阶段,在这个阶段,团队会寻找他们工作中的问题,并试图改进它们。
Giammar在o最近发表的一篇论文, “在导航强化学习中使用动物视频的机遇和挑战,” 在 去年夏天,日本横滨。 在论文中,他和他的合作者专注于从视觉观察中模仿学习的问题,其中学习代理可以访问专家的视频作为其唯一的学习来源。 此外,他们解决了从这个框架中产生的挑战,并描述了他们计划如何解决这些问题。 目前, 贾马里诺正在写论文, “利用潜在信息从视觉观察中学习对抗性模仿”, 在这篇文章中,他新濠影汇线上赌场研究了在动物视频中使用观察来提高强化学习的效率和导航任务的表现。
“维托里奥正在新濠影汇线上赌场研究一组非常具有挑战性和重要的问题,”贾马里诺的博士导师帕斯查里迪斯说。 Paschalidis补充说:“他取得了重要的进展,特别是解决了非常现实的设置,在这种设置中,人们可能无法观察到我们希望模仿的专家的真实内部状态和相应行为。”
贾马里诺在意大利博洛尼亚大学完成了本科学业 毕业于中国同济大学,主修自动化工程。 他还获得了代尔夫特理工大学系统与控制理学硕士学位。 未来,他希望从事与工业相关的领域,如机器人、推荐系统或能源。