心理与行为科学系一位青年学者刘鹏飞。
对方在浙大还没拿到教职,属于三年期非升即走的阶段,做的课题和人工智能沾点边。
刘鹏飞只觉得杜高有点急,昨天才约好,今天下午就在浙大门口的咖啡馆见到了。
杜高说:“没错,不是我的想法,我这是帮我认识的一位前辈问的,他制定的这套标准不仅要测人工智能的智力,还要测量人类的智力。
相当于这套标准需要做到既能衡量人工智能的智慧程度,又能衡量人类的智慧程度。
把这两者纳入到同一个范畴里。”
刘鹏飞一下就明白了对方的意思,这不是什么新的想法:“之前很多学者都想过要做相关研究。
老实说这不是什么新的idea。只是大家在尝试过程中没人能够做出一个好的结果。
毕竟过去对人工智能智力的测评,是基于技能熟练与否的度量来作参考标准。这种对特定任务的关注会导致在其他方面度量的缺失,比如稳定性和灵活性。
所以这需要超越基于技能的评估的标准,需要一套更高泛化等级的系统。
这套更高泛化等级的系统,难点在于,这套泛化的评价体系,如何去度量人工智能处理此前从未处理过情况的能力。
智力测试和技能评估其实属于心理测量学的范畴,它也是心理学范畴。但既然是测试,那么势必然说明这套评价体系是针对特定问题展开的,人工智能完全可以通过专门训练来解锁这套评价体系。
所以这太难了,我不认为以现有学术框架能够做到这一点,如果你朋友能做到这一点,我觉得他拿一个图灵奖绰绰有余。”刘鹏飞认为杜高的朋友不切实际。
杜高心想,不,今年的图灵奖只有可能颁发给我这位“朋友”,哪怕他本人不会到现场去领奖。
“另外你听说过G因子假说吗?”刘鹏飞问道。
杜高摇头:“没有。”
“这是关于智力研究领域心理学家们提出来的一种假说。
因为智力测试有很多,像韦氏智力测试、斯坦福-比奈量表、瑞文标准推理测验等等,这些测试的侧重点不同,但有些人在各种智力测验中得到的分数都是趋同的,都比较高。
而且这些人在生活中各方面的表现,似乎都比其他人要好一点点。学习任何领域都会更快一点,上手任何技能也都比其他人要更熟练。
所以心理学家们猜测,这背后是否存在着通用因素,使得这些人的智力表现整体就更高。
这个通用因素就像一个催化剂,可以跟不同领域、不同技能结合,让他们在方方面面的表现都更出色。
这也是最近这些年比较流行的g因子理论,g是general的意思。
如果你那朋友真的想要做一个整体性的框架,那么我觉得先找到g因子,然后验证人工智能也符合g因子假说,会是一个不错的方法。”