1. 首页
  2. 教育
  3. 机器学习

摘译:认知体系研究综述(三)

前期回顾作为人工智能 的一个重要分支,认知体系的研究和应用经过了近40年的发展,已取得了可见的成果。前两期内容对认知体系的概念、感知和注意力进行了介绍,本期将继续分享关于行动选择和记忆的部分。

摘译:认知体系研究综述(三)

前期回顾

作为人工智能的一个重要分支,认知体系的研究和应用经过了近40年的发展,已取得了可见的成果。前两期内容对认知体系的概念、感知和注意力进行了介绍,本期将继续分享关于行动选择和记忆的部分。

摘译:认知体系研究综述(一)1 引言2 什么是认知体系3 认知体系的分类

摘译:认知体系研究综述(二)4、感知

5、注意力

6 行动选择(Action Selection)

一般来说,行动选择决定在什么时间要做些什么,被分为“做什么”(即做什么决策)和“怎样做”(即动作如何控制)。例如,在MIDAS体系,行动选择包含了目标任务和执行这个选择的动作或行动。同样的,在MIDCA中,下一个动作通常是从一个被计划好的序列中选择出来的(如果这个序列存在的话)。因为在不同的认知体系中,行动选择的方法是不同的。在接下来的讨论中,行动选择机制可应用于决策和动作。

图7显示了所有被执行的行动选择机制,根据相关的体系类型(符号、混合、涌现)来组织。执行行动选择的主要两种方式:计划和动态。计划是事先制定一系列的步骤以达到一个确定的目标。在动态的行动选择中,一个最好的动作是从其他方案中被选择出来的,基于当时可获得的知识。对于这个类别,我们考虑选择的类别(赢者通吃、概率、预定义)和选择的标准(相关性、效用、感情)。默认选项一直是基于给定的标准做出的最好的动作(有最高激活水平的动作)。

最后,学习也可以影响行动选择,但会在第8节中讨论。注意,这些行动选择机制并不互相排斥并且大多数体系中有不止一种机制。尽管很少的体系会执行同样的行动选择机制,可行的组合空间通常会很大。

摘译:认知体系研究综述(三)

图7:行动选择所涉及的机制

图7中可视化分为三列:符号、混合和涌现。注意,在这个图中(以及第7节和第8节的图中),排序顺序强调具有相似动作的选择机制(或分别为记忆和学习方法)的体系结构簇。

6.1 计划与反应式动作

可以预见的是,计划型行动选择在符号范式体系中更加常见,但是也能在一些混合的甚至是涌现范式体系中被发现。尤其是在任务分解中,当目标被递归地分解成子目标,任务分解是计划动作的一种非常常见的形式。

其他被使用的计划动作的类型有:暂时性的、连续性的、层级性任务网络的、生成式的、基于搜索的、局部择优的等等。在我们的选择中,很少有体系仅仅只依赖于计划,例如OSCAR做逻辑推理和IMPRINT使用任务分解来模拟人类行动。除此之外,计划型行动选择经常利用加强动态的行动选择机制,来提升对变化的环境的适应性。

6.2 动态行动选择

动态行动选择能提供更多灵活性,并且能被用来模拟人类和动物。“赢者通吃”是神经网络中的一种选择策略(最强的输入被增强而其余的被抑制),它和它的变异体在各种新兴体系中很常见。同样的机制也被用来在所有体系中寻找最适合的动作,通常行动是多个并行过程的合作和竞争的结果。

行动选择的预定义序(方式)可能服务于不同目的。比如,在Subsumption体系中,机器人行动被附属行动等级所表示,高级行动优先于(包含)低级行动的输出。

在FORR中,做决策的部分根据递增顺序来从顾问中考虑选项,以达到与人类成员类似的学习。在YMIR中,优先级首先被给与到反应层中的过程中,然后是内容层,再是过程控制层。这里,目的是提供一个平滑的实时行动生成。每层有一个不同的认知反应时间上限,因此,反应式模块为用户提供自动的反馈(变化的脸部表情、自动发声),而审议性模块生成更复杂的行动。剩余的行动选择机制包含有限状态机制,被经常用来表示动作的顺序甚至来编译整个系统的行动,概率行动选择也常见。

行动选择标准

在选择下一个动作时,有多个标准要被考虑到:相关性、效用和感情(包括动机、情感状态、情绪、心情、积极性等)。

相关性反映出动作有多么契合现在的情况,这主要应用于有符号范式推理的系统和在应用前测试规则前/后的条件。动作的效用是测量为了达到现有目标的期望贡献。一些体系也会执行候选动作的“干运行(dry run)”,并观察他们的效果来决定他们的效用。效用也会考虑到过去动作的表现并在将来通过强化学习来促进行动的成长。其他机器学习技术也可以被用来把过去的成功行动和目标做关联。最后,内部因素并不直接决定下一个行动,但是会使选择存在偏差。

简单来说,我们会考虑关联到情绪、积极性和人类个性特征的短期、长期和终身因素。基于这些因素对于人类的决策和其他认知能力的影响,在认知体系中模拟情绪和情感是重要的,特别在人机交互、社交机器人和虚拟代理的领域。

在认知系统中,人工感情通常被模拟成能够影响认知能力的过度状态。比如,在CoJACK中,斗志和恐惧的情绪能改变计划选择。在斗志高昂时,那些能应对威胁的计划有更高的效用,但当恐惧时,效用低下。其他例子包括压力影响决策的模型、影响21点策略的开心/悲伤情绪、在焦虑状态下的类比推理、记忆唤醒的影响、基于目标满意度的正面和负面情感、在HCI场景中的情绪学习等。

积极性是内部动机的另一个源泉。一般来说,他们代表基本的生理需要,比如食物和安全,但也能包含高级和社交动机。在ASMO中,3种相关的简单积极性,“喜欢红色、用户与机器人的赞美“,通过调整相关模块的权重来做偏差行动选择。在CHARISMA中,保存积极(避免伤害和饥饿)、好奇心和自我提升的欲望一起指导行动生成。在MACSi中,好奇心驱使代理,探索到它学习最快的领域。同样,在CERA-CRANIUM中,好奇心、恐惧和生气通过可移动的机器人来影响对环境的探索。

社交机器人Kismet的行动被3种适应性积极所影响:与人接触、与玩具接触以及休息。这些积极的外部事件会有助于机器人的情感状态(情绪)和通过面部表情,站姿或声音的语调来展示表情,比如生气、恶心、恐惧、欢乐、悲伤和惊喜。与拥有过度本质的情绪不同,性格特征是独特的长期行动模式,通过一贯的偏好例如内部动机,情绪,决策来展示。大部分的被识别的个性特征能被归纳到一个足够广泛定义人类个性的小的维度或因素集合里。

同样的,认知系统里的个性经常被多个因素和维度所代表。这些特征,反过来,和系统可能经历的情绪和积极性相关。在最简单的案例中,一个参数就足以在系统行动中创建一个系统偏差。

NARS和CogPrime使用“个性参数”来定义需要多少证据来评价逻辑声明的真实性或计划下一个动作。参数的值越大,系统就更加“保守”。在Novamente中,一个虚拟动物的个性特征(攻击性、好奇心、玩乐)通过概率规则与情绪状态和动作相关联。同样的,在AIS特征中,下流、冷淡、害羞、自信、懒散,它们被赋予一个整数值来定义被展示的程度。基于个性,抽象的规则能定义什么行动更有可能。在CLARION中,个性类型决定了很多预定义积极的基线强度和初始赤字。映像被包含在一个预训练的神经网络中。

引人注目的是,这些简单的模型甚至能生成一系列的个性。比如,Pogamut代理有9种可能的状态和5种个性因素(基于FFM),能够生成45种不同的映像,每种映像能够不同程度地产生12 种预定义的意图并生成广泛的行动。CLARION 和MAMID值得特殊的关注。CLARION提供一个认知可信的框架,有能力处理情绪、积极性和个性特征,并把它们和其他包含决策的认知系统相关联。

情绪的3个方面被模拟:反应式情感(情绪的潜意识经历)、审议性评估(可能有意识)和处理/动作(在评估之后)。因此,情绪以显性和隐形过程的交互形式出现并包含(和影响)认知和动作。多个CLARION模型已经被心理学数据,FFM个性的计算机模型,用来处理校园霸凌,压力下的表现退化和由社交焦虑所引起的成见偏差模型所验证。

MAMID是一个由外部事件、内部解释、目标和个性特征所产生的生成与情绪效果的模型。在内部,与信念网络和任务标准、个体标准有关,即目标失败是否会导致在一个特殊的代理中出现焦虑。MAMID已经在两个领域被实例化了:保卫和平的任务训练和搜救任务。它对于情绪和设计的跨学科理论的贡献也有很大的价值。

7 记忆(Memory)

记忆是任何系统级认知模型的必要部分,不管这个模型是用来学习人脑还是解决工程问题的。几乎所有的体系都有记忆系统来储存计算的中间结果,能够学习并适应变化的环境。然而记忆系统的特殊执行非常不同并且依赖于研究目标和概念限制,比如生物可信度和工程因素(编程语言、软件体系、框架使用)在认知框架论文中,记忆被期限(长期、短期)和类型(过程性的、陈述性的、语义的)所描述。

多储存记忆模型受Atkinson-Shi?rin模型的影响,之后被Baddeley 修改。这种记忆机制在心理学中占主流,但它在工程上的效用被很多人质疑,因为它并没有为很多记忆机制提供一个效用介绍。然而,大部分体系在记忆类型上不同,尽管命名惯例因为概念背景而不同。比如,为计划和解决问题而设计的体系有短期和长期的记忆系统。计划中的长期知识经常是指为事实和解题规则服务的知识,这和语义以及程序性的长期记忆有关。一些体系也能保存之前被执行的任务和被解决的问题,模仿情景记忆。计划中的短期记忆经常被现实世界的模型和目标的内容表示。

图8为各种记忆架构的可视化。这里我们遵循一个惯例来区分长期和短期的储存。长期储存又被进一步分解成语义的、程序化的、情景的类型,分别储存事实性知识,一定条件下的动作信息和系统的个人经历情景。短期记忆被分为感官记忆和工作记忆。感官记忆是非常短期的缓存区,能够储存一些近期的感知。工作记忆是一种暂时储存关于现有任务的感知。

7.1 感官记忆

感官记忆的用途是为了缓存输入的感知并在转换到其他记忆体系前做预处理。同样地,声像记忆能使声音刺激持续足够长的时间来做认知合并和特征提取,比如声调提取和分组。在感官记忆中,视觉数据的衰退率被认为是10个毫秒,声音数据更长,尽管时间限制并不总是被特别指明。其他执行这一记忆类型的机构包括soar, sigma, ACT-R, CHARISMA, CLARION, ICARUS 和POGAMUT.

摘译:认知体系研究综述(三)

图8

7.2 工作记忆

工作记忆可以被定义为和现有任务相关的短暂信息储存机制。它对一些认知能力非常重要,比如注意力、推理和学习,因此,我们列表上的每个认知体系都会以某些形式执行它。工作记忆的特殊呈现主要区别于哪些信息被储存,它是怎样被表达、被访问和被维护的。另外,一些感官体系有助于正在进行研究关于编码、操纵和维护信息的过程,以及在人类的工作记忆中它与其他人脑过程的联系。

尽管工作记忆对人类认知很重要,相对较少有论文提供关于它的内部组织和与其他模块联系的足够细节,它通常被概括为:“现有的世界状态”或“传感器中来的数据”。基于这些文件,我们推断,许多工作记忆体系是作为当前世界模型,现有目标/系统状态的高速缓存存储器。尽管现在工作记忆的能力没有明显的极限,新的目标或新的感官数据经常覆盖现存的内容。这一被简化的工作记忆能在许多的符号范式体系中找到。

更多工作记忆的感官可信模型使用一种激活机制。一些最早的工作记忆内容的激活模型在ACT-R中被执行。像之前一样,工作记忆中保有最多的相关知识,是从有偏差决定的长期记忆中恢复的。偏差是指激活,还包括有各种路径的基础级别的激活(可能上升或下降),来自邻近元素的分散激活。一个元素的激活度越高,它就越有可能进入工作记忆并直接影响系统的行动。这被应用在基于图的知识表达中,节点代表概念,权重被赋予到边缘上对应概念之间的联系。

自然地,激活也能被用在神经网络的表达上。另一个常见典范,把记忆表示为目标的存储共享,能被并行模块读取并改变的问题和部分结果。解决问题的方法是不断地更新共享的短期储存信息。在一些机器人科学的体系里,自我意识领域中,除了能为时空结合赋能还能为环境中的机器人提供实时的位置和方向信息。

同样的,Kismet 和 RoboCog使用基于相机坐标系的地图来保存近期获取的兴趣区的信息。为了防止无限成长,记忆中信息的数量需要被限制。比如,在ARCADIA中,有3-6个物体;在CHREST中,有4个组块;在 MDB中,有20条信息。然后,当新的信息来到时,最老的和最不相关的信息会被删除来避免过载。信息也能被丢弃,如果长时间不用的话。在推荐体系中,一个不同的方法可以使得工作记忆中的3-4个信息从记忆系统的体系中自然出现,不需要外部参数设定。

7.3 长期记忆

长期记忆可以长时间保存大量的信息。特别地,它被分解成隐性知识的程序性记忆(动作技能和常规行动)还有陈述性记忆包括(显性)知识。后者被进一步分解成语义(,事实的)和情景的(自传体的)记忆。长期记忆中的显性/隐性和陈述性/程序性维度之间的二分法经常被合并。其中的一个例外是CLARION, 其程序性和陈述性的记忆是分开的,并且被分解成一个隐性和显性的部分。这个区别被保存在知识表达的层面:隐形知识用类似于神经网络的分布式亚符号范式表征,而显性特征拥有一个明显的符号范式表征。

长期记忆可以存储先天知识,因此几乎所有体系都执行程序性或语义记忆。程序性记忆包含在任务领域中完成任务方式的知识。在符号范式生产系统中,程序性知识是被因特殊领域而预编码的或学习的”如果-然后“规则所代表。其他的变种包括感知运动模式、任务模式和行动脚本模式。在涌现范式体系中,程序性记忆可能包含状态-行动对序列或代表感官运动联系的人工神经网络。

语义记忆储存关于物体和它们之间关系的事实。在支持符号范式推理的体系中,语义信息被类网络的本体所执行,节点对应着概念,连接代表他们之间的关系。在涌现体系中,事实知识被网络中的激活模式所表示。

情景式记忆可以储存以往经验中的特例,如果相同的情景再次出现的话,这些之后能够被再利用。这些经验也可以被用来学习语义或程序性知识,比如CLARION保存动作导向的经验,例如 “输入、输出、结果”,并使用他们来影响未来的行动。

7.4 全局记忆

尽管有证据支持不同的记忆系统,把不同的知识或长短期的记忆分开,使用统一体系来存储系统中的所有信息。比如,CORTEX和Robocog使用一种综合的、动态多图像目标。同样地,AIS执行一种全局记忆,可以结合知识库,中间推理结果和系统的认知状态。DiPRA使用模糊认知地图来代表目标和计划。NARS将所有的经验知识当作Narcese中的正式语句,无论是陈述性的、情景式的或程序性的知识。同样,在一些涌现系统中,例如SASE和ART中,作为工作或长期记忆的神经元的作用是动态的,并且与神经元是否(发放)激活有关。

总的来说,认知体系中的记忆研究主要考虑体系、表达和检索。因为智能代理的领域和时段通常是被限制的,有关保存大量记忆的挑战只有相对比较少的关注度。对比之下,早期的人类长期记忆能力的估计值是在1.5千兆位内或10万个概念内,然而最近的发现表明人脑的能力可能更大。然而,尽管可获得的计算能力有所提升,依然不可能通过简单执行来达到人类记忆的最低估计量。因此,其他的方案包括使用现有方法来管理大规模数据并改进提升检索算法。两种方法都被探索过,前者是Soar和ACT-R,使用PostgreSQL关系型数据库从WordNet中加载概念和关系,后者是伴生体系。或者,SPA支持关联记忆的生物可信模型,有能力表达超过10万个概念在脉冲神经网络WordNet中。

未完待续

8 学习(Learning)9 推理(Reasoning)10 元认知(Meta-cognition)11 应用及讨论

免责声明:本站旨在传递信息,不代表有传资讯的观点和立场。本站遵循行业规范,如转载您的文章未标注版权,请联系我们(QQ:78799268)改正。本站的原创文章,如若转载,请注明出处:http://www.ainoline.cn/jiaoyu/jiqixuexi/12295.html

发表评论

电子邮件地址不会被公开。 必填项已用*标注

联系我们

在线咨询:点击这里给我发消息

邮件:78799268@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code