正在阅读:仅靠概率论的机器学习无法实现通用智能

仅靠概率论的机器学习无法实现通用智能

2016-06-02 09:02:32来源:新智元 原标题:名家王培:仅靠概率论的机器学习无法实现通用智能 关键词:机器学习通用智能智能装备阅读量:31690

导读:自上世纪八十年代以来,概率统计逐渐取代数理逻辑成为人工智能中流行的形式化框架,以至于有人以此作为“新AI”取代“旧AI”的标志。
  【中国智能制造网 名家论坛】自上世纪八十年代以来,概率统计逐渐取代数理逻辑成为人工智能中流行的形式化框架,以至于有人以此作为“新AI”取代“旧AI”的标志。源远流长的概率论和数理统计在“数据挖掘”、“大数据”、“数据科学”、“神经网络”、“机器学习”等新潮名目之下焕发出了茁壮的生命力。尤其是“深度学习”技术在近年间令人炫目的进展,令很多人考虑是否沿这条路可以达到人工智能的目标。

仅靠概率论的机器学习无法实现通用智能
  
  这是个复杂的问题。一方面,“概率统计”是一个庞大的领域,包括难以数计的结论和方法;而另一方面,对“人工智能”有各种非常不同的理解。在这篇短文中,我试图聚焦于问题的核心。在概率统计中,这里只涉及其基本概念,如“概率函数”和“随机样本”等。而“人工智能的目标”在这里是指通用的、完整的智能系统。这种系统的能力应在各个方面和人脑的信息加工能力有可比性(尽管未必在所有细节上和人脑相同),特别是能够在现实环境中有效处理出乎系统设计者和系统本身预料的问题。
  
  一个自然的想法是给系统的每个信念一个概率值,其初始值或直接从数据中提取,或用各种统计算法和学习算法从相关数据中估计或总结。在此基础上,让系统反复用贝叶斯定理根据新证据修正信念。当需要在不同行动之间做选择时,选取期望效用值高的。这类基于决策论的理性模型早已在经济学、心理学等领域中被广泛应用。随着计算能力的大幅增长和各类数据的广泛收集,在计算机上实现这么个“理性人”的时机是否已经成熟了?
  
  当然没那么简单。首先,“概率”在这里是什么意思?作为一个数学理论,“概率”在概率论中的含义是被有关公理所严格确定的。但如何把这个数学概念应用于现实问题并非显而易见。经典的观点是把“概率”看作一个可重复实验中一个结果出现频率的极限。问题是“极限”是定义在无穷远点的,而我们的观测总是有限的。严格说来,仅从一个数列有限项的值是不能确定其极限的,甚至无法确定这个数列是否有极限。因此,把一个带有不确定性的量看作“随机变量”并讨论它属于某值域的概率,基于一个隐含假设:这个量在重复测量中的取值是有一个相对稳定的分布的。但既然是“假设”,这个条件就不是永远成立的,而在它不能被认为近似成立时,我们就不能谈“概率”,也就更谈不上用概率统计解决问题了。
  
  对概率的上述“频率解释”的局限性早已引起了很多人的关注。在诸多拓广概率使用范围的尝试中,一个有代表性的方案是对概率给予“主观解释”(又叫“私人解释”),即把它看作一个认识主体对信念的相信程度。和频率解释把一个事件的概率当作该事件的客观属性不同,主观解释容许不同认识主体赋予一个事件不同的概率值,而只要求在同一个认识主体的信念中的概率值是一致的,即不会给一个信念两个不同的概率值。这样,不可重复事件和数据不足的事件的概率也都有定义了。
  
  对通用智能系统来说,频率解释失之过窄(很多信念的概率根本没定义),而主观解释失之过宽(信念的概率没办法确定),因此常见的是某种“逻辑解释”(或“贝叶斯解释”,这两个概念的差别在这里不细谈),即把一个信念的概率看成系统已有证据对它的支持程度。对给定信念和证据,这个值是确定的(客观性的一面),尽管对其具体确定方式仍有不同意见。仅对给定信念而言,不同认识主体可以赋予其不同概率(主观性的一面),因为它们所拥有的证据不同。当某信念对应于可重复实验中的一个结果,且此结果的出现频率确有极限时,其概率应当收敛于这个极限。这样一来,这个解释可以说是集中了频率解释和主观解释的优势。
  
  我曾经中对上述三种解释在通用智能系统中的适用性有详细的讨论。尽管逻辑解释(或贝叶斯解释)比前两种在这个语境下更合理,以此为基础的方案仍面临若干严峻挑战。比如说,根据这种解释我们可以谈单个事件的概率,如“张三得了肺炎”。假定我们对张三只知道他的性别(男)和年龄(40),那么直接的办法就是以“40岁男人”为张三的“参考类”,以肺炎在此类中的发病率作为“张三得肺炎”的概率。但问题是张三会同时属于其他参考类(如“退役运动员”、“吸烟者”等等),其中每一个都可能为“张三得肺炎”提供一个不同的概率(因为各个参考类中的概率是根据不同的数据计算的)。在这种情况下,取哪个概率值呢?这就是“参考类问题”。一般的做法是用详细的描述,即“40岁、男性、吸烟者、退役运动员”,但这么详细的统计数据不一定存在,即使存在也可能因数据量太小而失去可靠性。在境况下,“详细的描述”包括张三的所有特点,而此时参考类大概只包含张三自己了。如果选一个我们有大量可靠数据的参考类(如“40岁男人”),则我们的统计结论是关于此类中的一个“随机样本”的,但不是关于张三的。因为我们有关于张三的进一步信息,他已不能被看作一个随机选择的40岁男人了。另一方面,如果不是选择一个参考类,而是同时考虑多个参考类,则必须处理这些参考类所提供的概率值之间的不一致。
 
我要评论
版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了