正在阅读:解决机器学习debug问题需要更好的工具集

解决机器学习debug问题需要更好的工具集

2016-05-30 11:58:20来源:雷锋网 原标题:谷歌智能专家说 机器学习存在全新挑战 关键词:机器人学习人工智能机器人阅读量:31666

导读:机器学习更像是一个黑盒子编程方法,计算机程序自己有数据,自己可以生成概率逻辑,和基于传统布尔数学逻辑测试调试方法来验证系统完成不同。
  【中国智能制造网 名家论坛】谷歌研究(GoogleResearch)主管、人工智能专家PeterNorvig近在出席MIT的EmTechDigital大会时,发表了一些与主流人工智能和机器学习不同的观点。他将机器学习和传统软件编程进行了比较,强调我们所设计的机器学习,在系统调试和验证上存在全新挑战。
  
解决机器学习debug问题需要更好的工具集
 
  传统软件编程使用的是基于布尔数学体系的逻辑,按照这种逻辑,可以测试确认软件是否符合其设计初衷,在过去的几十年里,人们正是利用这一逻辑构建了各种软件调试工具和方法。
  
  相比之下,机器学习更像是一个黑盒子编程方法,计算机程序自己有数据,自己可以生成概率逻辑,和基于传统布尔数学逻辑的“true&false”测试调试方法来验证系统完成不同。
  
  对比传统编程,Norvig归纳总结了机器学习验证的情形:
  
  “现在的问题是,能够扩展应用到整个人工智能行业的机器学习验证方法,仍未成型。我们已经在这方面做了很多努力,投入了时间;对于如何使之奏效,我们也有了一点眉目,但是,相比于普通软件开发和验证数十年的经验,机器学习调试明显还没有达到预期。”
  
  如果调试机器学习如此困难,为什么还要使用它呢?尽管机器学习验证目前存在局限性,但是它在开发速度上依然具有一定优势。针对某些特定问题,比如语音识别或图像分类,复杂系统解决方案可以比传统编程方法快一倍、两倍、甚至三倍。举个例子,芯片制造商Nvidia公司工程师对一款自动驾驶汽车原型编写了100小时的训练数据程序。应用机器学习生产力对程序员来说吸引力,他们需要使用它,要求全新的验证方法。
  
  事实上,调试机器学习的出发点就是要区分相关问题固有的风险和危害,以及来自于问题发解决方案的技术的风险和危害。只有后者,也就是技术解决方案内部固有的风险和危害能够被控制。
  
  非定常性条件影响了传统编程和机器学习。所谓非定常性,就是指随着时间的过去,条件发生了变化,一开始,在相同条件下设计的系统非常有效,但慢慢地开始逐渐表现不佳。在传统编程中,当要发布一个开发新程序时,一般会先使用可验证的调试流程进行测试和验证,之后才会正式发布。
  
  但在机器学习中,似乎遗失了这种验证,因为机器学习并不适合传统编程技术那套步进式的流程:开发、测试、后发布。在机器学习里,会不断生成数据,然后同时再被机器学习系统不断获取,机器学习系统会进行再编程,继而导致那种步进式方法不能实行。
  
  针对机器学习验证问题,Norvig解释了自己的想法。传统测试套件认定是基于“true”、“false”、以及“equal”这些条件判断,而机器学习的测试认定则应该是根据评估测验,比如今天的试验结果90%不错,并且和昨天测试运行的结果一致。
  
  除了验证的问题很麻烦以外,验证机器学习系统产品所依据的事实很有可能是未知的,或者是主观性很强的。设想一下,例如我们设计一个机器学习系统来判断下图的这条裙子是金色搭配白色的,还是蓝色和黑色的,这问题连人类之间都没法达成一致。
  
  Norvig解释说:“对于一些问题,我们根本不知道正确答案是什么。因此,你又怎么可能训练一个机器学习算法判断某些根本没有答案的问题呢?”在Norvig看来,让机器学习寻求正确答案,只能依靠一种无偏见的方法,比如引入“陪审团”机制。人类生成数据去训练机器学习,然而人类本身就是具有偏见的,因此即便是在这种模式下,机器学习依然会存在一定偏见。要想匹配机器学习系统是否符合它们的设计初衷,评估的方法必须要能够识别并摈除偏见。
  
  传统软件是模块化的,每个模块的输入和输出都是独立的,因此很容易识别出哪个模块是bug。然而在机器学习中,尽管系统是利用数据进行开发的,但在系统内部,任何bug都能会被复制,终导致“牵一发而动全身”。虽然我们可以使用一些技巧去理解机器学习内部有错误,也有再训练机器学习系统的方法,但目前还没有办法能解决其中任何一个独立问题。
  
  在Norvig看来,解决机器学习debug问题需要一个更好的工具集,而整个工具集需要向前发展、更新。
我要评论
  • 德国Neura机器人中国总部落地萧山

    姜永柱代表区委区政府对Neura机器人中国总部的正式启动及远道而来的领导嘉宾表示诚挚祝贺和热烈欢迎。他说,此次Neura机器人中国总部的落户,不仅为萧山具身智能产业注入了强劲动能和智能基因,更将带动上下游产业链集聚发展,助力萧山打造具有国际影响力的智能机器人产业高地。
    人形机器人人工智能
    2025-10-23 09:57:32
  • 未来将由“光”书写:光纤成为人工智能经济的核心支柱

    研究显示,到2030年,全球人工智能应用可能需要超过1亿英里的长途光纤和数千万英里的城域光纤。随着数据量的快速增长——预计从2020年的约64ZB增长到2030年的200ZB以上——超大规模企业正在进行创纪录的资本投入,以满足日益增长的计算和网络需求。
    光纤人工智能
    2025-10-23 09:01:55
  • 早报|微软下一代AI芯片或由英特尔代工;乐聚机器人完成15亿元融资

    微软已向英特尔下达其下一代AI芯片Maia 2的晶圆代工订单,计划采用18A或18A-P制程;2025年10月22日,乐聚机器人宣布完成15亿元Pre-IPO轮融资......
    AI芯片晶圆代工机器人
    2025-10-22 09:47:51
  • 人工智能在制造业的新浪潮

    调查数据显示,95%的制造企业已经在AI/ML领域投入或计划在未来五年内进行投资。这一比例表明,人工智能应用在制造业中已趋于普及,并正由“试点探索”向“系统化整合”转变。
    人工智能AI赋能智能制造
    2025-10-21 09:25:54
  • OpenAI联合创始人:人工智能代理真正发挥作用还需10年

    OpenAI联合创始人预估,要系统解决上述所有问题,大约还需要十年时间。尽管众多投资者将2025年称为“智能体之年”,但现实发展仍面临显著挑战。广义上,AI智能体被定义为能够自主执行任务的虚拟助手,具备问题拆解、方案规划与自主实施的能力。
    OpenAI人工智能
    2025-10-20 10:58:05
  • 人工智能和物联网如何协作以实现更智能的技术

    人工智能与物联网的融合代表着科技发展的新方向。物联网通过分布在各处的传感器、设备和网络基础设施,持续生成海量的实时数据。而人工智能则通过机器学习与深度学习算法,对这些数据进行分析、建模与优化。
    人工智能物联网
    2025-10-20 10:57:54
版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了