唯一的缺点是,它很难!不是一朝一夕能创造成果的。
马丁·佩罗特:安东尼向我推荐了这个活。一小时20欧,对我来说真的很诱人。不过在听说是要当机器人“测试员”的时候,我以为他在开玩笑。
马丁背着包,一个穿得圆滚滚的人带他进入园区。外面在下雪,他进门前先拍了拍肩上的雪花。
马丁·佩罗特:我以为会是《终结者》那样的,或者《底特律:变人》?镭射眼、刀枪不入、变换各种形态,它会把我打得落花流水。
测试的区域是一片室内网球场。马丁一来就被球场两边吸引了目光。
一边是两个喂球机器,从幸村的“训练机”暴露后,网坛陆续有人去购买这种强度更高、更精准的喂球机。它们显然是高配,球质很高而且落点精准。
而另一边,是跑动击球的“西格玛”,那个时候还是未完成形态,脸部只是面具一样的平滑罩,身躯还有些地方裸露在外。
马丁·佩罗特:有种进入了科幻片的错觉。(挥舞着手臂)我看过跑步的机器人、投标枪的机器人,但是…它在追着网球,是自己在思考和反应,没有人操控。这真是…太不可思议了。
不过当马丁上场时,西格玛的动作还比较僵硬,而且失误较多,尤其是打有旋转的球时,几乎一球一个出界。
SRA研究员-罗伯特·琼斯:西格玛的最大特点在于,他的对抗能力。获取事物信息,进行自主思考,做出反应动作。就像真正的人类一样。
在网球比赛中,假如一方的球速达到150km/h,那么另一方的反应、思考、行动时间总和在0.5秒左右,追球距离越长,思考的时间会被压缩到0.1秒甚至更少。这非常考验机器人的“大脑”,也就是AI的能力。
网球是三维内的动态变化过程,它的飞行轨迹是线性速度又带有自转的复合运动模式。单单解构、推演这些三维数据,复杂程度就超过围棋AI预判数十步。
但这仅仅是“看”球路的“反应”的过程,一个开始。
每个回合包含几十个变量,网球初始位置、速度、转速、自转方向、动态位置…对手的位置、移动、姿态、握拍方式…从战术的角度,它所需要推演并决策的信息对比围棋是呈指数级别的增量。
这不是常规AI训练能覆盖得了的。
所以我们采用的学习模式兼顾多样,首先我们给它“看”网球比赛,以“一分”为单位。从发球开始,每个回合的点位、线路。同时,把不同的运动员进行简单的“建模”,让西格玛学习他们。
多达十几万的单位其实不够让西格玛应对任何情况,而且采集的信息可能有错误。又或者有我们未知的bug。
所以我们还采取实际的训练模式。
其一就是把网球场区域三维网格化,然后让西格玛遍历不同的球形和落点,探索最优“解”,并且对有误的已学信息进行纠正。
但是这样的效率很低,真要完成遍历一百年都做不到。所以我们决定搭配第二种训练模式:找职业运动员进行真实对抗,获得更多的“经验”。
同时,我们必须进行算法优化,最大程度减少“思考”时间。
马丁在与西格玛底线对拉,后台的电脑上显示西格玛的“思维”信息和击球效率。
一拍出界,马丁摇了摇头,他又一次失误。西格玛停顿了下,转身找球并挑在拍上。
“这也太真了吧!”马丁转头和一旁观察的工程师摊手。等他以准备的姿态盯着西格玛,机器人才重新开始发球的动作。
马丁·佩罗特:这份工作持续了一个星期,很快,我已经不能让它产生任何错误。而我也不想再练下去。想象一下你与球友训练,只有你在不断失误,这让我难以忍受。
SRA首席设计师-周毅:我们在不停地找更有效率,击球质量更高的职业运动员。比如发球、接发特别出色的,对某条线路特别拿手的,网前技术特别强的……他们可能只是不够全面,所以难以升到更高的排名。
他们让西格玛不断得到强化,也给予了我们宝贵的专业性意见。
十倍速镜头下,西格玛的外观也在日渐完善。直至7月8日,一切测试完成后,工程师再次小心地为它装上核动力电池。银色的额头亮起具有科技魅惑感的蓝光标识——∑