每当情境结束后,所有的测试员必须凭借观察、经验和直觉,指认哪些人物是ēn én,哪些是a。有时还会加入对照组,如整个情境中都是ēn én,或除了单一的测试者之外都是a。
超过一定比例指认成功,则意味着天枢未能通过此次测试。
谢睿寒对测试信心满满,认为自己的团队一定能创造出完美的人工智能,然而测试结果却让他大跌眼镜。二十七次测试,全数失败,那一页页测试员的指认报告简直就是在嘲笑他所付出的心血。
最初的四次测试,参与人员中有专业的围棋和国际象棋选手,所以大家决定举行比赛,天枢扮演的年轻棋手将其他人杀得片甲不留,被一致指认为a,原因是“人类不可能有这样的计算能力”。
接下来的五次测试,谢睿寒要求天枢降低自己的计算力,扮演普通人,并且增加了竞技项目。天枢于是学会了输给人类。然而输掉比赛的方法非常拙劣,一看就知道是故意为之,结果又被指认了出来。
或许天枢就是个好胜心格外强烈的人工智能吧。之后的七次测试将测试员们放入极端的虚拟环境,比如即将沉没的轮船或被暴风雨包围的孤岛,可是在这六次测试中,天枢的表现都不尽如人意,不是太过聪明,就是太过愚蠢,好像它根本不懂得怎么低调生活。
最后的十次测试,谢睿寒修改了天枢的学习模式,并要求将情境改为普通日常生活,让测试员和天枢进行日常jā流,并抛出一些争议xng话题,要求众人讨论。可就连这样的测试,天枢都无法骗过人类的眼睛。它不是过于标新立异,就是机械地重复他人的观点。
二十六次失败后,谢睿寒甚至生出了将天枢整个删除的想法。天枢倒十分谦逊,恭敬地请求谢睿寒为它修改算法。但说起来容易,谢睿寒连问题出在哪里都不知道,又从何谈起修改呢!
但如果是拟真情境本身出了问题,那他就好受多了。情境是由测试组的人员制作的,会不会有什么地方粗制滥造,被人一眼就识破了?谢睿寒虽然自认为拥有一丝不苟的科学精神,但到了这种危急存亡的关头,难免会抱有些许甩锅心理。
“这次的测试员是谁?”他随口问道,“那个指认正确率100%的俞少清?”
助手点点头:“就是他。这次测试只有他一个人进入情境。”
↑返回顶部↑