快捷搜索:

东北大学机器人足球队决策系统设计

1 引言

  足球机器人系统是近年来十分活跃的高科技竞技系统[1]。该系统已成为各种人工智能、机器人等领域问题的一种标准试验平台[2,3]。各种先进的方法和理论都在其中得到使用和验证[4,5,6]。为了指导mirosot的决策系统编程,我们提出了一种混合决策结构,如图1所示。该结构将足球机器人决策系统分为:任务确定与解答、角色分配与协调和机器人动作等三个层次,用信息预处理模块来处理传感器的原始信息,用一个快速反应模块来处理特殊情况。东北大学机器人足球队决策系统是一种基于该混合决策结构的多机器人对抗决策系统。mirosot分为small league、middle league、large league三种类型。我们以mirosot(middle league)比赛程序为例介绍决策系统各层计的主要内容,该项目规定敌双方各有5个机器人参加比赛。

2 决策系统描述

  足球机器人决策系统的输入是视觉传感器信息,输出的场上机器人的轮速信息。实际上整个决策系统就是从传感器空间到轮速空间的一个映射,定义为:

  d:s-》v;

  d:表示决策过程。

  s={(homerobots,enemyrobots,

  ball)},为含有我方机器人位姿信息、对方机器人位姿信息和球位置信息的传感器空间;其中,

  homerobots=(homerobot1,homerobot2,homerobot3,homerobot4,homerobot5)。

  homeroboti(i为机器人号码)为robot结构,定义为:(x,y,)。x,y和分别指的是机器人的x坐标、y坐标和正面朝向。ball为ball结构,定义为(x,y),x和y分别指的是球的x坐标和y坐标。

  v={(rbv1,rbv2,rbv3,rbv4,rbv5)},为机器人轮速空间。其中rbvi为号码为i的我方机器人动作指令。rbvi为velocity结构,定义为(lv,rv)。lv和rv分别对应机器人左轮和右轮速度。

  下面的讨论是基于两个基本假设之上的:

  假设1:自然坐标假设:假设我们在决策系统中使用的坐标都是自然坐标;

  假设2:右攻假设:假设我们总是从左半场向右半场进攻的。如果实际情况是我方在右半场,则通过一组公式将我方转换到左半场,该组公式为:

  object.x=bound_right-object.x; (1)

  object.y=object.y; (2)

  object.= object.。 (3)

  其中,object表示场地物体,包括我方机器人、对方机器人和球,其中球结构中不含,所以不对球作分量上的转换。

  bound_right为比赛场地的x方向上的长度,在mirosot(middle league)竞赛项目中,该尺寸大小为150cm。

  2.1 机器人动作层设计

  动作层定义了需要多个控制周期才能完成的轮式机器人动作。动作层主要解决的是机器人运动控制问题,包括轨迹规划、轨迹跟踪和点镇定控制问题。

  根据复杂程度划分,我们把足球机器人的动作分为基本动作和技术动作两个层次。基本动作是机器人实现复杂动作的基础。我们定义了三个基本动作:toposition、turn和move。toposition主要用来使机器人运动到给定点,turn是机器人原地旋转,move是机器人朝着某个方向前进。技术动作基本上是构建于基本动作之上的。常用的技术动作包括:goalkeeper、shoot、boundprocess、passball、blockman、pointwaiting等等,其功能分别为:守门、射门、边界处理、传球、盯人和跑位。这些技术动作构成了足球机器人的可选动作集合,也就是动作空间:

  a={a|a=goalkeeper,shoot,boundprocess,passball,blockman,pointwaiting,。。.}

  足球机器人动作层设计属于机器人运动学和动力学的范畴,该层抽象了足球机器人的动作,封装了足球机器人的物理模型、运动学模型和动力学模型,完成了从机器人关节空间(即轮速空间)到动作空间的映射,从而将我们从机器人关节空间的细枝末节中解放出来,把更多的精力放在数量不多的机器人动作的特性、实现方法等的研究上来。

  2.2 信息预处理模块设计

  输入是视觉信息,输出是赛场状态,所以它的主要作用是完成视觉空间到状态空间的映射。赛场状态是赛场的态势的数学描述。赛场状态的定义取决于决策系统设计者的主观意识。定义和匹配赛场状态的过程是态势分析的关键。该模块的另外一个重要作用是保证从视觉系统传来的传感器信息是否完整、精确和有效。在实际比赛过程中,由于场地的光线条件的往往不是很好,场地周围有很多观众,所以视觉系统的所面对的常常是恶劣的视觉环境。在这种情况下仅仅依靠增强视觉系统的精度和可靠性来建立传感器空间往往是不够的,这就需要信息预处理模块对视觉信息进行预处理。经常遇到的一种情况是在场地某点上一些颜色不好的机器人从视觉信息中丢失。遇到这种情况,我们就需要利用信息预处理模块对视觉传感器建模,预测一个机器人位姿来代替未知的机器人位姿,并进行特殊处理以便视觉系统尽快重新发现该机器人。

  我们的状态设计可表述如下:

  m={(m1,m2,m3,m4,m5)|m1~m5n}

  其中:

  m1特征维表示球的位置特征,我们按照球在某个局部区域的存在对竞赛双方攻防形势的意义,把赛场划分为若干个特征区域。所有特征区域的并集为整个赛场。

  m2特征维表示球的速度特征,我们将球的速度分为:高速、较高速、中速、中低速、低速等五个档次。

  m3特征维表示球的运动方向特征,我们将球的运动方向分为:右、右上、上、左上、左、左下、下、右下等八个方向。

  m4特征维表示敌我双方对场上形势的掌握程度,分别有:敌方控球、敌方我方顶牛、我方控球、双方皆不控球等四个特征状态。

  m5特征维表示敌我双方的攻防漏洞,分别有:敌方漏洞大,敌方漏洞较大、敌方漏洞小、我方漏洞小、我方漏洞较大、我方漏洞大等六个特征状态。需要注意的是,当球位于对我方的威胁很小的位置的时候,m5特征维分析中将不考虑我方的漏洞。同理当球位于对敌方的威胁很小的位置的时候,m5特征维分析中不考虑敌方的漏洞。

3 任务确定与解答层设计

  3.1 队形和角色定义

  我们把队形定义为我方球队应对当前状态的解答。任务确定与解答层的输出就是所选择的队形。

  队形定义:f={(rf1,rf2, rf3,rf4,rf5)|rf1~rf5r}。

  r为足球机器人角色空间,r={r|r=r1,r2,r3,},其中r1,r2,r3,为足球机器人角色。所谓角色就是单个机器人应对当前状态的解答。rf1、rf2、rf3、rf4、rf5是按照角色重要性的一个排列。rf1为最重要的角色,rf5为最不重要的角色,依此类推。我们把角色的这种排列称为队形角色序列。

  我们把足球机器人的角色归纳为四大类:

  (1) 第一类是能在开球瞬间完成简单开球任务的足球机器人角色,例如:点球角色、门球角色、争球角色、任意球角色等。

  (2)第二类是能完成特定踢球任务的足球机器人角色,例如:中路射门角色,边路射门角色,前场边界球处理角色,后场边界球处理角色,中路补射角色,边路传中角色等。

  简单看来,场上的机器人的状态只有两种可能,一种是踢球,一种是跑位,第一、第二类角色就是用来踢球的机器人角色。

  (3)第三类角色是能够以球为参考点的保持固定队伍形状的角色,例如:三角进攻上护卫角色,三角队进攻下护卫角色,三角防守上护卫角色,三角防守下护卫角色等。

  (4) 第四类角色是能够跑到球场的固定的位置等候机会的角色。

  角色的设计是基于动作层的基础上的。角色设计完成以后,角色就具有了自己的意义,我们可以把角色看成能完成某种任务的逻辑单元,或者是逻辑智能体,该单元具有在特定条件下能按照某种概率完成特定任务的特点。角色具有这种特点的属性可以被看做一类知识或者规则,这类知识为队形的设计提供依据。

  3.2 用队形实现对抗战术和战略

  我们可以近似地认为在没有对抗的情况下,rf1角色就可以完成队形所担负的任务,其他角色的存在只是为了确保任务的完成。对于一个队形来说,它的最重要的属性就是它所能完成的任务,也就是队形的目标。足球机器人的队形的目标就是将球踢向某个方向或者是某个区域。足球机器人系统的决策过程也就是选择合适的队形,然后忠实地执行该队形内容的过程。我们的目标是通过执行某个决策过程,使场上的形势达到对我方有利的状态。我们认为以下四种状态是对我方有利的状态:

  第一种是我方进球状态;

  第二种是对方防守出现很大空档的状态;

  第三种是将会引起裁判对我方有利的判罚的状态;

  第四种是解除我方被动局面的状态。

  下面举一个简单的例子来说明战术和战略的实现过程。我们将整个比赛场地划分为20个区域,如图2所示。假定场上形势初始状态为:

  m0=(area7,低速,左下,我方控球,我方漏洞小),为了简单起见,我们按照理性原则[14],以及有利目标状态原则,用规则库和搜索树的方法来选择合适的队形。选择的队形为f0,f0的目标为将球踢到area3,执行后赛场状态变为:m1=(area3,低速,右,我方控球,敌方漏洞小),

  我们选择队形f1来应对该状态。f1的目标是将球踢向area4,执行后赛场状态变为:

  m2=(area4,低速,右,我方控球,敌方漏洞小),

  我们选择队形f2来应对该状态。f2的目标是将球踢向area9,执行后赛场状态变为:

  m3=(area9,低速,右下,我方控球,敌方漏洞小),

  我们选择队形f3来应对该状态。f3的目标是将球踢向area14,执行后赛场状态变为:

  m4=(area14,低速,左下,我方控球,敌方漏洞大),

  我们选择队形f4来应对该状态。f4的目标是直接射门,执行后赛场状态变为:

  m5=(对方球门内,?,?,?,?)。

  为了使场上状态从m0到m5的变化,我们选择的队形依次为f0-》f1-》f2-》f3-》f4,其中,f0-》f1-》

  f2反应了我们的边路进攻战略,而f3-》f4则反应了我们的下底传中的战术配合。我们设计一个队形库来储存队形,并通过离线实验来得到队形的属性,从而建立从状态到队形的映射。

  3.3 队形的层次

  在足球机器人竞赛中,比赛双方的正面冲突往往是发生在比较小的范围内,特别是球的周围。对于竞赛机器人数目较多的比赛项目来说更是如此。在这种情况下,层次单一的队形作为应对策略往往不是很好的选择。比方说,当球在前半场对方门区内的时候,我们对于我方门区附近的我方队员的考虑就不必那么周全和详细。针对这种情况,我们引入了队形的层次的概念。我们把队形分为两个层次,一个是基本队形,一个是局部队形。基本队形是针对对方的基本攻防喜好,体现我方的基本攻防策略的队形,该队形受赛场形势的影响,各角色的排序由于重要性的变化将会有所变化,但是队形中各角色的内容随场上形势的变化不是很剧烈。基本队形可定义为:

  fbase=(fbase0,fbase1,fbase2,fbase3,fbase4)。

  局部队形针对的是发生直接冲突的区域的赛场形势,体现我方针对特定情况的战术的队形,定义为:

  flocal=(flocal0,flocal1,flocal2,?,?)。

  其中,?为通配符。因为在局部队形中不考虑与直接冲突区域关系不大的区域。真正应对赛场状态的队形由fbase和flocal组合而成,组合后的队形为:

  f=(flocal0,flocal1,flocal2,fbase3,fbase4)。

  可以看出,真正的队形的前几个角色(也是比较重要的,反应局部冲突应对策略的角色)是由flocal提供的,而其他的角色由fbase提供。这种多层次的队形设计进一步细化了队形设计,使队形设计更合理更有依据。

4 角色分配与协调层设计

  该层是连接上层的意图和机器人足球队员的具体行动的桥梁,它负责协调各机器人的行为,组织多机器人的合作与协商,解决多机器人资源冲突问题,并根据执行结果调整分配策略和角色内容。设场上5个机器人最终角色分配结果为:(rr1,rr2,rr3,rr4,rr5),我们将角色的这种排列称为机器人角色序列。这样,本层就可以看作是队形角色序列空间(即队形空间)f到机器人角色序列空间rr的一个映射,

  记为: f:f-》rr

  其中rr={(rr1,rr2,rr3,rr4,rr5)| rr1~rr5r}。

  为了很好的进行角色分配,我们为每个角色设计了相应的角色性能指标评判函数,

  记为: j = g(i,r)

  其中,i为机器人的号码,r为角色。

  角色性能指标评判函数的定义为角色分配过程提供依据。

  角色分配的基本原则为:

  (1) 为让各个机器人干最适合自己干的事情,也就是如果:

  g(i,r)=max(g(1,r), g(2,r), g(3,r), g(4,r), g(5,r)),则给机器人i分配r角色;

  (2) 优先分配重要角色。就是在为角色分配机器人的时候,重要的角色将会先被分配;

  (3) 尽量不发生的资源冲突。

  为了保证一个机器人只能被分配一个角色,角色性能指标评判函数将已经分配角色的机器人的性能指标置为一个非常小的值。这样,就保证了任何一个机器人都会有一项角色性能指标是所有指标中最大的,也就是说每一个机器人有且仅有一个被分配角色与之相对应。

  在以上基本原则的基础上,我们为了考虑其他一些因素增加了角色性能指标评判函数的功能:

  第一项是为了保持进攻和防守的连续性,我们跟踪每个机器人的角色分配情况,并给予已经分配某个角色的机器人在下次分配同样角色的时候给予某种优先权。

  第二项是为了保证机器人执行任务的效率,我们跟踪每个机器人的任务执行效果,对于连续被分配某个特定角色的机器人,如果该机器人关于该角色的性能指标持续减小且指标值一直为较大值,则在下次分配同样角色的时候将该机器人关于该角色的角色性能指标置为一个非常小的值。

  角色的分配不仅要考虑单个机器人角色性能指标情况,还要从整体上综合考虑以协调多机器人行为。在角色分配无法解决资源冲突问题时,我们通过优先保证重要角色的贯彻执行,更换不重要的角色的方法进行协调。

5 快速反应模块设计

  快速反应模块是为了提高决策系统对于某些特殊情况而设计的,这些特殊情况包括我方机器人进入了我方球门内,我方机器人进入了对方球门内等等。我们用通过该模块直接给出机器人轮速的方法应对紧急情况以提高系统的实时性。

6 结束语

  装备了该决策系统的东北大学牛牛队在2002年的firacup(足球机器人fira世界杯)上获得了simurosot(middle league)项目的第二名、simurosot(large league)项目的第三名和mirosot(middle league)项目的第三名,并在随后的国内比赛中获得了robocup小型组、mirosot(small league)、mirosot(middle league)和simurosot(large league)等四项赛事的冠军。这些都说明该系统是成功的。希望我们的实践能为其他院校的系统设计提供帮助。

您可能还会对下面的文章感兴趣: