正在阅读:麻省理工神科技:大数据分析自动化

麻省理工神科技:大数据分析自动化

2016-03-22 16:53:33来源:网络大数据 关键词:云计算大数据大数据分析阅读量:34397

导读:大数据分析包括寻找有某种预测能力的埋藏模式。但是,选择哪些数据的“特征”来进行分析通常需要靠人类的直觉。
  【中国智能制造网  技术前沿】大数据分析包括寻找有某种预测能力的埋藏模式。但是,选择哪些数据的“特征”来进行分析通常需要靠人类的直觉。
  麻省理工神科技:大数据分析自动化

  在一个包含数据库中,举个例子,各种促销和每周的利润的开始和结束日期,其关键数据可能不是日期本身而是它们之间的跨度,或着不是总利润,但平均跨越这些跨度。
  
  这套取代人的直觉与算法的系统,优于906个人类团队中的615个团队。
  
  大数据分析包括寻找有某种预测能力的埋藏模式。但是,选择哪些数据的“特征”来进行分析通常需要靠人类的直觉。在一个包含数据库中,举个例子,各种促销和每周的利润的开始和结束日期,其关键数据可能不是日期本身而是它们之间的跨度,或着不是总利润,但平均跨越这些跨度。
  
  麻省理工学院的研究人员的目标是,用一个不仅能搜索模式也能设计特征的新系统把人类元素从大数据分析中剥离出来。为了测试他们系统的个原型,他们参加了三个数据科学竞赛,它与人类团队比赛,在不熟悉的数据集中找到预测模式。906个团队参与了三项比赛,研究人员的“数据科学机器”先于615个团队完成。
  
  在三项比赛中,数据科学机器的预测的准确率是94%和96%。第三个数字则是一个更为温和的数字87%。人类的团队通常需要进行好几个月的预测算法,而数据科学机器产生它的每一个条目只花了2-12小时。
  
  “我们把数据科学机器视为人类智能的自然补充,”Kanter说,他在麻省理工的硕士论文是《数据科学机器的基础》。“有这么多的数据需要进行分析。现在它(机器)只是待在那里没有做任何事。因此,也许我们可以拿出一个至少让我们能够开始着手、让我们前进的解决方案。”
  
  项目之间
  
  Kanter和他的导师KalyanVeeramachaneni,麻省理工学院计算机科学和人工智能实验室的研究科学家(CSAIL),在他们的论文中描述了数据科学机器,Kanter将在下周的IEEE科学数据和先进分析会议上发表。
  
  Veeramachaneni统一领导计算机科学与人工智能实验室的所有成员组,在大数据分析的实际问题中采用机器学习技术,如依据风电场场址确定其发电能力或预测学生从在线课程中辍学的风险。
  
  “我们从解决一些工业数据科学问题的经验中观察到的是一个非常关键的步骤,称为特征工程,”Veeramachaneni说。“你要做的件事就是把你的数据从数据库或结构中提取出来,为了做这个,你必须得有很多想法。”
  
  例如,2个关键指标被用在预测辍学上:一个学生花多少时间解决一个问题集和一个学生相比他或她的同学花了多少时间在课程网站上。麻省理工学院的在线学习平台MITx不记录那些统计数字,但它可以从推断中收集数据。
  
  特色组成
  
  Kanter和Veeramachaneni使用了一些技巧来制定数据分析候选特征。一种是利用数据库设计中固有的结构关系。数据库通常在不同的表中存储不同类型的数据,使用数字标识表示它们之间的相关性。数据科学机器跟踪这些相关性,将它们作为一个线索进行功能建设。
  
  例如,一个表可以列出零售项目和它们的成本;另一个表可能包括在个别客户购买的项目中列出的项目。数据科学机器将从个表中的个表输入到第二个。然后,从第二表的关联的几个不同的项目中选择相同的购买数量,它将执行一套操作,以产生候选功能:总成本,每个订单,每个订单的平均成本,低成本,每个订单,等等。作为跨表格的数字标识,数据科学机器会在各自层的顶端进行相互操作,找到小的平均值、平均数、和等。
  
  它也寻找所谓的分类数据,这似乎是限制在一个有限的范围内的值,如一周的天数或品牌名称。然后,它会依据划分现有的跨类别的功能产生新的功能。
  
  一旦它生成了一系列的备选项,它会减少它们的数量以确定这些值具有相关性。然后开始测试其样本数据的简化特征,使它们以不同的方式来优化它们预测收益率的准确性。
  
  “数据科学机器是一个令人惊奇的、前沿的研究解决实际问题的项目,是一种看问题的全新的方式。”MargoSeltzer说到,他是一个没有参与这项工作的哈佛大学计算机科学教授。“我想他们所做的将迅速成为一种标准——很快就会。”
我要评论
  • 建筑孪生市场:彻底改变建筑和智能基础设施

    这一技术的核心理念源自“数字孪生”(Digital Twin)概念,即利用物联网(IoT)、人工智能(AI)与大数据分析,构建与现实实体同步的虚拟模型。对于建筑行业而言,建筑孪生不仅是数字化管理的延伸,更是实现智能建造、绿色运维与城市智慧化管理的重要基础设施。
    人工智能大数据分析
    2025-10-15 11:29:52
  • 2025世界计算大会专题展优秀技术、产品及应用成果火热征集中!

    2025世界计算大会同期将举办2025世界计算大会专题展,本次专题展以“智算驱动新质生产力”为主题,聚焦计算技术前沿、成果应用、产业赋能等领域,集中展示全球计算领域最新技术、产品及应用成果。
    世界计算大会量子计算云计算
    2025-10-13 11:40:29
  • 工信领域有哪些重要政策和大事要闻?一文速览→

    工业和信息化部等七部门近日联合印发《深入推动服务型制造创新发展实施方案(2025—2028年)》;近日,工业和信息化部与国家标准委联合印发《云计算综合标准化体系建设指南(2025版)》......
    服务型制造云计算
    2025-10-13 09:36:26
  • 两部门关于印发《云计算综合标准化体系建设指南(2025版)》的通知

    《云计算综合标准化体系建设指南(2025版)》提出,到2027年,新制定云计算国家标准和行业标准30项以上,不断健全云计算产业标准体系。开展标准宣贯和实施推广的企业超过1000家,以标准赋能企业数字化转型升级的成效更加凸显。加快云计算领域国际标准供给,促进产业全球化发展。
    云计算云平台软件
    2025-10-10 09:07:31
  • 2025云栖大会剧透来了!今年有这些AI新看点

    2025云栖大会以“云智一体·碳硅共生”为主题,为期三天,设三大主论坛和110余场聚合话题,预计将有来自50多个国家的2000余位嘉宾出席。
    云栖大会云计算人工智能
    2025-09-17 09:49:56
  • 人工智能+大数据:2025年它们如何塑造企业

    “2025 年商业中的人工智能与大数据”如今已成为竞争优势的代名词。人工智能 (AI) 与大数据的融合正在通过预测分析、个性化服务和自动化运营重塑全球经济的各个领域。
    人工智能大数据
    2025-09-16 10:29:40
版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了