Facebook让聊天机器人学会了谈判
有意思的是,在FAIR的实验中,多数人都没发现跟他们聊天的不是真人,而是机器人,说明机器人已经学会如何在这个领域流畅地用英文进行对话了。FAIR最优秀的协商机器人就运用了强化学习和对话推演,它的表现已经可以跟人类谈判员相提并论。它达成的交易里,较好一些的和糟糕一些的差不多多,这也说明了FAIR的聊天机器人不仅会说英语,而且还能智能地考虑应该说什么。 用于聊天机器人的强化学习监督学习可以模仿人类用户的动作,但是它没法具体表现出达成目标的意志。FAIR团队选了另一种方法,他们先用监督学习进行预训练,然后用强化学习的方法结合评价指标对模型进行微调。以结果来说,他们用监督学习学到了如何把语言文字和意思相对应,然后用强化学习帮助判断说什么语句。 在增强学习中,智能体会试着根据自己与另一个智能体之间的对话优化自己的参数。不过同时这另一个智能体也可以是一个人,所以FAIR就用了一个训练过的监督学习模型来模仿人类。这个模仿人类的模型是固定不变的,因为研究者们发现如果两个模型的参数都可以优化的话,它们之间的对话就会偏离人类的语言,演化出一种它们自己的谈判语言。在每一场对话结束以后,智能体都会根据自己谈成的结果得到奖励。这种奖励是用智能体整个过程里的所有语言输出运用策略梯度进行反向传播得到的,目的是为了让智能体有更高的可能性选择会有更高奖励的动作。 期待更高发展对Facebook来说这是一项突破性的研究,对整个研究领域和机器人开发者来说,这是建立能讲道理、交谈、协商的机器人的重大进展,而这几项都是建立个性化数字助理的重要组成部分。 对FAIR的研究人员而言,他们也希望与其它的研究人员继续共同讨论研究成果、共同分析想要解决的问题。他们也期待更多有才干的人投入想法和精力,推动这个领域进一步发展。 (编辑:186手机网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |