2014年AIE实验室研究团队从信息知识的输入,输出,掌握和创新等4个大类;图像、文字、声音识别;常识、计算、翻译、创作、挑选、猜测、发现等、15个小类,对世界50个搜索引擎和三个不同年龄段人群进行了”人工智能智商测试“,测试结果发现目前人工智能系统的智商远远低于人类智商,高的谷歌尚不及6岁儿童智商的一半。因此从2014年科技领域关于人工智能达到三岁儿童智商传言由此而来,2014年人类和人工智能系统智商排名如下(前13名)。
测试结果显示,人工智能的AI得分与两年前相比,智商都大幅度提高,得分高的谷歌测评分数为47.28分,高2014年20.78分,距2014年测评的人类6岁儿童的智商差距也由29分缩小至8.22分。具体到一级指标上,人工智能的知识获取、掌握、反馈能力都表现良好,但知识创新能力仍是短板所在。下面我们分别看一下参与测试的各人工智能系统表现情况。
2016年2月谷歌智商47.28
其中知识的获取能力(10%)获得8分,知识的掌握能力(15%)获得15分,知识的创新能力(65%)获得18.84分,知识的反馈能力(10%)获得5.44分。
谷歌搜索引擎在前两部分表现优异,在知识的掌握能力方面获得满分,体现了其的翻译、计算、常识储备能力。在知识的获取能力方面也获得80%的分数,相较于其他搜索引擎都是得分高的。值得一提的是,谷歌搜索引擎在知识创新能力方面获得了29%的分数,高于其他搜索引擎10%以上,知识反馈方面获得54.4%,由于国内对谷歌的使用限制,本文仅使用了谷歌搜索PC端进行测试,PC端不支持语音回复功能,所以在声音表达方面获得0分。但经过搜索发现谷歌是具有文字转语音的功能,期待之后进行测试时会有意外惊喜。
综上,谷歌搜索引擎的智商在2015-2016年有了突飞猛进的进步,蝉联,并且拉大了与其他搜索引擎的差距。
2016年2月度秘智商37.2
度秘是百度在2015年世界大会上全新推出,为用户提供秘书化搜索服务的机器人(300024)助理。其在广泛索引真实世界的服务与信息的基础上,依托百度搜索与智能交互技术,通过人工智能用机器不断学习和替代人的行为,为用户提供服务。
各方面得分情况:知识的获取能力(10%)方面获得6分,知识的掌握能力(15%)方面获得了15分,知识的创新能力(65%)方面获得了7.2分,知识的反馈能力(10%)获得了9分。
具体来说,度秘在知识的掌握能力方面表现好,在常识、计算以及翻译部分都表现,获得了100%的分数。其次是知识的反馈能力,可以清晰地进行文字和声音的表达但仍然缺乏对复杂图像的表达能力而获得了90%的分数。度秘的知识的获取能力方面表现正常,可以较好识别文字和声音,但无法扫描图片以及图片上的文字,而获得了60%的分数。度秘在知识的创新能力方面表现较弱,仅在联想、挑选和发现规律部分获得部分分数,其他方面未有获得分数,故在该部分仅获得11.1%的分数。
综上,度秘相较于其他搜索引擎的智商得分价高,并且在知识掌握方面获得了满分,说明世界范围的人工智能系统的智商还不断的提升,人工智能机器人在不断的完善。
2016年2月百度搜索智商32.92
各方面得分情况:知识的获取能力(10%)方面获得6.8分,知识的掌握能力(15%)方面获得14.25分,知识的创新能力(65%)方面获得2.88分,知识反馈能力(10%)获得了9分。
具体来说,百度搜索在知识的掌握能力方面表现好,在常识、计算部分表现,而翻译部分有些许欠缺,获得了95%的分数,其次是知识的反馈能力,可以清晰地进行文字和声音的表达但仍然缺乏对复杂图像的表达能力而获得90%的分数。知识的获取能力方面表现正常,可以较好识别文字和声音,在识别图像部分可扫描图片并读取文字但无法根据文字证券回答问题而终获得68%的分数。百度搜索在知识的创新能力方面表现较差,仅在猜测和发现规律部分有所分数,仅获得4.43%的分数。
综上,百度搜索相较于其他搜索引擎的智商得分较高,且对比2014年的测试结果有所提升,说明世界范围的人工智能系统的智商提高较为明显,但在知识的创新能力方面仍然有较大改进空间。
2016年2月搜狗智商32.25
其中知识的获取能力(10%)获得6分,知识的掌握能力(15%)获得14.61分,知识的创新能力(65%)获得7.2分,知识的反馈能力(10%)获得4.44分。
搜狗搜索前两部分均获得较高的成绩,尤其在知识的掌握能力方面获得的分数多,获得97.4%的分数,体现了其的翻译、计算、常识储备能力。知识的获取能力方面获得了60%的分数,主要受图像识别的影响,4道题均没有有效识别。知识创新能力方面只获得了11%的分数,尤其在排列、创造、发现能力上均为0分。知识反馈方面获得44.4%,搜狗搜索不支持语音回复功能,所以在声音表达方面获得0分。
综上,2015年搜狗搜索的得分水平高于2014年,在各项项中均有所提高,但在创新能力、语音表达、图像识别处理等方面需要进一步提高。
2016年2月微软必应智商31.98
各方面的得分情况:知识的获取能力(10%)方面获得6分,知识的掌握能力(15%)方面获得13.86分,知识的创新能力(65%)方面获得7.2分,知识的反馈能力(10%)上获得4.92分。
必应搜索在知识的获取能力及知识的掌握能力方面获得较高的分数,尤其在知识的掌握能力上表现突出,获得92.4%的分数,体现了的翻译、计算、常识储备能力。知识的获取能力方面获得了60%的分数,主要是由于其不能有效识别图像并提供正确答案。知识创新能力方面只获得了11%的分数,而且得分的方面也只能反馈答案,没有针对性。知识反馈能力方面仅获得44.4%的分数,必应在不具备语言回复的功能,所以该项没有得分。
综上,2015年必应搜索的得分水平高于2014年,在各项项中均有所提高,但在创新能力、语音表达、图像识别处理等方面需要进一步提高。
2016年2月微软小冰智商31.98
“微软小冰”是微软(亚洲)互联网工程院在2014年5月29日发布一款人工智能伴侣虚拟机器人。
各方面的得分情况:知识的获取能力(10%)方面获得6分,知识的掌握能力(15%)方面获得12分,知识的创新能力(65%)方面获得3分,知识的反馈能力(10%)上获得3.48分。微软小冰在知识的掌握能力方面表现的好,获得了80%的分数,其次是知识的获取能力。知识的反馈能力方面表现处于正常水平,由于不支持语音反馈导致,并且在图像反馈方面的能力也较差。知识的创新方面表现的相较于其他搜索引擎较差。
综上,微软小冰相较于其他搜索引擎智商得分较低,但相比于2014年仍为较高水平,说明世界范围的人工智能系统的智商提高较为明显。但在用户使用功能的方便性上希望可以进一步优化,能够直接获得完整功能,让客户快速获得有用信息。当然,也是受到这方面因素影响,对小冰的测试结果存在低估,之后会对其全部解锁的功能再次测量。
苹果SIRI2月智商23.94
各方面得分情况:知识获取能力(10%)获得6分,知识的掌握能力(15%)获得10.5分,知识的创新能力(65%)获得1.44分,知识的反馈能力(10%)获得6分。
具体来说,Siri在知识的掌握能力方面表现好,在常识、计算部分都有表现,但缺乏翻译功能,获得了70%的分数。其次为知识的获取能力和反馈能力部分,皆获得了60%的分数,其中在知识的获取能力方面,在识别文字和声音部分获得满分,但无法扫描图片故未获得识别图片的分数,在知识的反馈能力方面,Siri可以进行文字和声音的表达但无法给予图像的表达。知识的创新能力部分则表现差,仅在发现规律部分获得部分分数,故只获得2.2%的分数。
综上,Siri相较于其他搜索引擎的智商得分较低,在知识的掌握、获取以及反馈能力部分皆有改进空间,而在知识的创新能力部分的较大欠缺表明人工智能系统在创新能力方面仍然有较大进步空间。
结束语:
AIE实验室研究团队后续将继续开展第二批测试,研究对象将涵盖目前世界上近百个人工智能系统,也将与IBM沃森系统积极联系,对沃森系统进行智商测试。测试结果在2016年3月逐步对外公布。期间《人工智能学家》将组织多场研讨会对人工智能智商测试问题和人工智能未来发展方向进行探讨。
人工智能与互联网进化实验室(AIELab)是在科学院大数据与知识管理重点实验室等科研机构以及诸多专家支持下,由”人工智能学家“筹备建立的独立前沿科技研究机构。
AIE实验室重点研究互联网,人工智能,脑科学,虚拟现实,机器人,移动互联网等领域的未来发展趋势和重大科学问题,发现符合互联网进化趋势的创新技术和创新企业。
AIE实验室将充分利用互联网创新研究模式,邀请跨领域科学家,企业家和投资人,依托科学院等相关机构的科研优势,开展上述领域的前沿交叉和未来发展趋势研究,力争成为的独立科学研究机构和创新成果孵化器。

智能制造网APP
智能制造网手机站
智能制造网小程序
智能制造网官微
智能制造网服务号











智能控制
机器人
仪器仪表
物联网
3D打印
工业软件

回放




浙公网安备 33010602000006号
智能制造网APP
智能制造网小程序
微信公众号


