正在阅读:大数据驱动的通用人工智能 学术产业界双赢

大数据驱动的通用人工智能 学术产业界双赢

2016-03-31 11:47:04来源:中国投资咨询网 关键词:人工智能大数据机器人阅读量:32159

导读:随着机器学习的模型先进性以及机器处理大数据的能力不断升级,基于大数据的人工智能已经在人们的生活当中扮演越来越重要的角色。
  【中国智能制造网 市场分析】在Deepmind和AlphaGo获得的巨大成功吸引了全世界的目光的同时,新一代人工智能德比大战已经开始。
  大数据驱动的通用人工智能 学术产业界双赢
  Deepmind之前开发的玩雅达利(Atari)街机游戏的人工智能是全新一代的智能技术——大数据驱动通用人工智能(Big Data-driven Artificial General Intelligence)。
  
  就像这个名字所提到的,这里有两个重要的因素,一是“大数据”驱动,二是通用人工智能。大数据驱动的机器学习使得机器尽量脱离人类的经验指导,自动在海量数据和工作环境中挖掘知识取得进步。而通用人工智能基于端对端(end-to-end)的深度强化学习(Deep Reinforcement Learning),帮助机器能在不同的任务中共享一套学习框架,无需人类进一步调试。
  
  这两个因素同时作用出一个效果,即人需要的干预越来越少,而机器在与环境交互反馈中的自主学习比重越来越大。
  
  “大数据”驱动的机器学习
  
  AlphaGo的围棋棋力来自于30万张人类对弈棋谱以及3千万次自我对弈,这是一个典型的大数据机器学习产物。
  
  相比之下,1996年击败象棋大师卡斯帕罗夫的IBM深蓝(DeepBlue)人工智能,其依赖的是大量人类总结出来的走子规则的手动输入,以及基于超级计算机每秒上亿次搜索的全宽度(full-width)搜索解决方案。
  
  简单地说,深蓝的人工智能相当于人类把自己下象棋的知识和经验手动输入电脑中,而AlphaGo的人工智能是人类把一堆棋谱“丢”给电脑,后者自己学习总结出来甚至进一步超出人类围棋认知范畴的知识。
  
  基于机器学习来搭建人工智能,人类不需要通过显示地编程来教机器如何工作,而是给出一个学习框架,告诉机器如何根据自身当前设置以及提取环境的反馈去进一步更新参数,进而达到一个更好的工作表现。
  
  然后人类只需要把大量数据“喂”进机器,机器就可以不断学习不断优化自身的参数了。这样,人类就不需要自己首先去总结经验再交给机器,而是变成了“甩手掌柜”,在一边看着机器学习起来就行。
  
  随着机器学习的模型先进性以及机器处理大数据的能力不断升级,基于大数据的人工智能已经在人们的生活当中扮演越来越重要的角色。
  
  过去10年间,基于大数据的人工智能已经在各个领域展露头角,包括在线广告的投放、搜索引擎个性化网页排序、电商的个性化商品推荐、社交网络的好友建议、人脸识别、图像识别、自然语言理解、机器翻译、语音识别、无人机跟踪技术、汽车自动驾驶等等。
  
  很明显,未来的10年内,越来越多的应用场景会装配上人工智能,而且机器会不断学习,做得越来越好。
  
  通用人工智能
  
  Deepmind和其它做机器学习的科技公司的不同在于它提出来的通用人工智能(ArtificialGeneralIntelligence)的概念和产品。通用人工智能背后的技术是深度强化学习,其主要有两个特点,一是端对端(end-to-end)的学习,二是自适应,无需人类调参而胜任不同的任务。
  
  Deepmind之前推出的玩街机游戏的通用人工智能技术就地诠释了这两个特点。
  
  首先,机器的输入直接是游戏屏幕的像素,不需要任何特征设计和编码。这里要归功于近4年来名声大噪的深度学习技术。深度学习通过建立较深层数的人工神经网络模型,使机器能够自动从原始输入信息中提取、学习出适用于预测、决策的高层特征。
  
  例如在人脸识别这一场景中,深度卷积网络(deepconvolutionalnetworks)输入层得到图片像素本身,底层网络学习出点、直线、曲线、拐角等初级特征,中层网络在这些点、线、角的基础上学习出眼睛、鼻子、嘴等器官特征,高层网络则进一步组合这些器官特征判断出图片是否包含人脸。
  
  其次,同样设置的机器可以做不同的任务,只要“喂”进去的数据不同,无需人类调参或者只需要极小的人类工作花销。Deepmind使用同一个深度Q学习网络(DQN,deep-q-network)模型可以玩不同的街机游戏,只需要让机器玩某个游戏几天,它就能学会并超过人类玩家。
  
  通用人工智能可以理解为是在强化学习的框架下,结合其在不同任务下的适应性、模型零耦合(model-free)的优势和深度学习的特征自动提取的优势,实现出的能胜任多种任务端对端学习的超级人工智能。这已经十分接近人类学习和工作的方式了。
  
  正是由于以上两点优势,人类在开发新一代人工智能的过程中需要做的干涉越来越少,交给机器去自动完善的学习比重越来越大,这为人工智能的工作水平的提升以及在各个领域的普及带来了本质的飞跃。
  
  万物互联的人工智能时代
  
  近这三年,我们总是被各种耀眼的技术词汇轰炸着:大数据、机器学习、人工智能、物联网、工业4.0、互联网 ……我认为,这些五花八门的词汇其实都在指向同一个未来:一个万物互联的人工智能时代。
  
  我希望从三个维度上的趋势来解释这个观点:互联化、数据化和智能化。
  
  互联化是指我们真实世界的设备与设备互联,而不只是一台服务器上的网站和另一台服务器的网站相连。以汽车举例,我们的汽车可以连接到家里的空调,这样我们在回家的路上就可以发出指令启动房间里的空调;汽车也可以和路边的建筑设施互联,找到适合的停车位或者商场中的服务。
  
  汽车之间也可以互联,通讯汽车间距、速度等信息,自动保障行车安全。这就是物联网(在汽车垂直领域称作车联网),其在制造业的应用被德国称为工业4.0,在生活上的应用则被我们中国称为互联网 。
  
  数据化是指尽可能多的设备信息、工作状态被量化成数据并可在设备之间通讯。同样举汽车的例子,司机每天开车的路径、其中各个地点的速度、加速度、油门深浅、刹车轻重、路况等信息都可以通过传感器产生可记录、通讯和分析的数据。
  
  目前,以特斯拉为代表的新能源汽车已经在数据化进程上走得很远了。其他领域,例如家居、健康,也在推进数据化进程。由于越来越多的设备互联,各个设备的状态也进一步数据化,人类在接下来的10年内产生的数据量将会比互联网时代更上一个新台阶。
  
  从大数据的角度来讲,“大”不但指数据规模大,更指的是数据维度高。而设备的互联化和数据化将会产生比当今互联网大数据更加名副其实的大数据。
  
  智能化则是在设备互联化、数据化的基础上通过数据驱动的人工智能解决各种各样的快速有效的预测和决策问题。从机器学习的角度来讲,用于训练的数据规模越大、维度越高,就越能学习出更复杂的模型,胜任更高难度的智能工作。
  
  大数据是原材料,机器学习是原材料加工厂,而新一代人工智能服务则是工厂出炉的产品被消费在越来越多的日常生活中。我们看到近这三年这样一个新型产业链的每个环节都在蓬勃发展,而在AlphaGo战胜李世石的今天,更多的人开始注意到这条产业链带来的人工智能产品将会在未来10年间给人们的生活带来翻天覆地的改善。
  
  学术界与产业界双赢
  
  结合真实大数据并在人们日常生活中发挥作用的人工智能研究是目前有效率并符合整个产业链发展趋势的研究方式。研究大数据驱动的人工智能,首先得有“活的”大数据可供研究,才在真实环境中不断尝试研发新的人工智能模型。
  
  这样一个交互式的研究环境能够促进新成果的诞生。这也是当今许多并且奋战在人工智能研究一线的大学教授会选择在一家科技企业兼职的原因。
  
  而几年前高校的数据挖掘和机器学习研究仍然倾向于靠着一个许多年前生成的数据集不断地测试新模型。从实践经验来看,这样工作在一个老的小数据集上的模型很难胜任现实生活中的大规模动态数据。而高校实验室需要作出前沿的人工智能技术就需要奋斗在大数据处理的线。“Gethandsdirty。”这样才能切身感受到真实野性的数据,才能真正理解数据和基于数据搭建起来的人工智能。
  
  我认为在大数据驱动的人工智能研究中,大学科研团队与工业界算法团队相比,其优势在于能将主要精力投入在算法研究中,能在拥有大数据和测试平台的基础上,产出一般企业想不到的有效算法;另外大学研究者由于长期保持相关文献的收集整理,对领域内的新技术以及新旧技术的全局理解有很深的体会。
  
  大数据驱动的人工智能是一个产业界和学术界双赢合作的领域。
  
  我在伦敦大学学院的博士课题是互联网展示广告算法。互联网广告领域的数据由于涉及广告拍卖交易中的价格信息而十分敏感,所以该领域在2012年之前并不存在任何互联网广告领域的公开数据集可供高校研究者做研究。该领域绝大多数研究论文皆来自涉足互联网广告的科技公司,例如谷歌、微软、雅虎等等。
  
  对于高校研究者来说,做互联网广告大数据的研究,首要任务就是同相关企业建立研究合作,获取新的广告投放数据,并在合作企业的商业平台上直接做面向真实用户流量的实验。我们研究组在伦敦、北京和硅谷寻找到了多家广告科技企业进行合作,其中既有业务量和数据庞大的IT巨人,也有迭代速度极快的初创公司。
  
  我在博士期间发表的数篇互联网广告技术方面的论文,都包含了在这些企业平台上做的在线实验。我也在和企业的交互中学习到了很多在高校实验室无法接触到的实践经验。根据我们的研究产出,合作的企业也都有效提升了广告投放的效益。
我要评论
  • 德国Neura机器人中国总部落地萧山

    姜永柱代表区委区政府对Neura机器人中国总部的正式启动及远道而来的领导嘉宾表示诚挚祝贺和热烈欢迎。他说,此次Neura机器人中国总部的落户,不仅为萧山具身智能产业注入了强劲动能和智能基因,更将带动上下游产业链集聚发展,助力萧山打造具有国际影响力的智能机器人产业高地。
    人形机器人人工智能
    2025-10-23 09:57:32
  • 未来将由“光”书写:光纤成为人工智能经济的核心支柱

    研究显示,到2030年,全球人工智能应用可能需要超过1亿英里的长途光纤和数千万英里的城域光纤。随着数据量的快速增长——预计从2020年的约64ZB增长到2030年的200ZB以上——超大规模企业正在进行创纪录的资本投入,以满足日益增长的计算和网络需求。
    光纤人工智能
    2025-10-23 09:01:55
  • 早报|微软下一代AI芯片或由英特尔代工;乐聚机器人完成15亿元融资

    微软已向英特尔下达其下一代AI芯片Maia 2的晶圆代工订单,计划采用18A或18A-P制程;2025年10月22日,乐聚机器人宣布完成15亿元Pre-IPO轮融资......
    AI芯片晶圆代工机器人
    2025-10-22 09:47:51
  • 人工智能在制造业的新浪潮

    调查数据显示,95%的制造企业已经在AI/ML领域投入或计划在未来五年内进行投资。这一比例表明,人工智能应用在制造业中已趋于普及,并正由“试点探索”向“系统化整合”转变。
    人工智能AI赋能智能制造
    2025-10-21 09:25:54
  • OpenAI联合创始人:人工智能代理真正发挥作用还需10年

    OpenAI联合创始人预估,要系统解决上述所有问题,大约还需要十年时间。尽管众多投资者将2025年称为“智能体之年”,但现实发展仍面临显著挑战。广义上,AI智能体被定义为能够自主执行任务的虚拟助手,具备问题拆解、方案规划与自主实施的能力。
    OpenAI人工智能
    2025-10-20 10:58:05
  • 人工智能和物联网如何协作以实现更智能的技术

    人工智能与物联网的融合代表着科技发展的新方向。物联网通过分布在各处的传感器、设备和网络基础设施,持续生成海量的实时数据。而人工智能则通过机器学习与深度学习算法,对这些数据进行分析、建模与优化。
    人工智能物联网
    2025-10-20 10:57:54
版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了