一方面从比赛形式来看,OpenAI参与的是更加简单的1V1模式,在这种模式下没有配合一说,且大部分情况下都是正面对抗了解对手的状态。非完美博弈问题在其中并不严重,1V1的执行路径和状态空间也小了很多。一对一相对容易,真实的Dota25V5的游戏是一个更有挑战性的问题。5V5是一个多智能体的问题,需要通过智能体之间的配合才能获取胜利,是一个非完美信息博弈的问题,由于游戏里面的“战争迷雾”,玩家不能知道游戏的全部信息,有非常庞大的状态空间,需要非常长的执行路径才能获得游戏结果。
事实上,OpenAI也希望在明年《Dota2》赛期,可以用5V5的方式再次上台挑战,但5V5状态AI战胜人类的难度远远大于1V1,也大于围棋难度。与马斯克观点不同,涂威威认为,OpenAI击败电竞和围棋人机大战是不可比的,这是两种不一样的任务。目前AI技术很难在两个或两个以上的任务上工作得很好,AlphaGo是为19×19的围棋任务设计的,同样版本的AlphaGo目前甚至不能同时在19*19和20*20的棋盘上很好地工作。目前AlphaGo和OpenAI也不能交换彼此的任务,也就是说这些人工智能技术目前不具备迁移能力。
据千讯咨询发布的《中国游戏市场前景调查分析报告》显示,Dota25V5游戏难度要远远大于围棋的难度。Dota25V5是多智能体的协作游戏,而围棋只是1V1的游戏;前者的状态数远远大于围棋的状态数,且是非完美信息博弈,而围棋是完美信息博弈。Dota25V5需要更长期的策略,往往要在成千上万次操作之后才能获得成果。在技术贡献和社会意义上,目前OpenAI的机器人还不能和AlphaGo相提并论。
同时在英雄选择上OpenAI选择了影魔,该英雄本身没有控制技能,更多需要的是选手对距离细节等精准判断和细微操作。涂威威表示:“这恰恰是人类不擅长,机器擅长的,人类选手solo惯用影魔英雄是因为人类不擅长这样的事情,这样的英雄solo玩好了才能更容易地体现与其他玩家的差距。所以即便OpenAI在1V1上赢得了人类,离解决5V5的问题也很遥远。”