正在阅读:数据成本是否会将AI创企扼杀在摇篮中?

数据成本是否会将AI创企扼杀在摇篮中?

2018-11-17 10:07:42来源:猎云网 关键词:数据人工智能阅读量:25495

导读:目前,数据逐步成为AI创企的“金钟罩铁布衫”:初创企业收集的数据越多,就越能训练出更好的AI模型,使得新的市场竞争者难以与之匹敌。
  【中国智能制造网 行业动态】目前,数据逐步成为AI创企的“金钟罩铁布衫”:初创企业收集的数据越多,就越能训练出更好的AI模型,使得新的市场竞争者难以与之匹敌。然而,这些数据并非免费获取,许多AI创企认为,这笔额外的费用大大侵蚀了他们的利润。随着时间的推移,这些公司可能希望降低在数据上的投入,但目前尚不清楚如何预测这种情况出现的时间,以及降低至何种程度,这就增加了公司对未来增长进行建模的难度。
 
  在软件创企中,产品开发费用在损益表上归属于研发成本,而AI创企则将数据成本作为销售成本(cost of goods sold,COGS)的一部分,后者这种做法有助于企业发掘扩大规模同时降低成本的机遇,从而提高利润率。
 
  下面的数据价值链流程图显示了大多数AI创企获取和使用数据的方式。首先,企业将基础事实的片段作为原始数据进行记录。企业可将原始数据存储在某处,然后建立流程或途径进行维护和访问。在运用于AI模型之前,企业需要对数据进行标注,以便AI模型实施处理每个数据点的行为。随后,训练有素的模型接收数据并产生反馈,企业便可以使用这种反馈来执行驱动终端用户某种行为的操作。该过程可以分为三个不同的步骤:获取数据、存储数据和为了训练模型而标注数据。每一步都会产生相应的成本。
 
  数据采集成本
 
  在所有的数据价值链中,任何传感器(无论是物理设备还是人类)在收集原始数据时,首先需要捕捉对现实的观测。在这种情况下,数据采集的成本将来自于传感器的创建、分配和操作。如果该传感器是一种硬件,企业必须考虑材料和制造的成本;如果传感器是人,则成本来自于人员的招募以及提供他们制作和记录观察结果所需的工具。根据覆盖范围的不同,企业可能需要支付大量的费用来分布传感器。不仅如此,在某些用例中还可能需要进行高频率的数据收集,这也可能会增加人工和维护成本。例如,受众测量公司尼尔森(Nielsen)就需要承担上述所有成本,因为它既提供收视率收集盒,也需承担获取参与者电视节目观看情况的许可费。这样一来,随着覆盖范围越来越广泛,尼尔森的数据就越有价值,规模经济也就自然而然降低了单位数据采集成本。
 
  在某些用例中,企业向终端用户提供管理工作流程的工具(例如,自动电子邮件响应生成器),将他们捕获的数据存储在他们的工作流程中,或者观察他们与工具的交互并将其记录为数据,从而将数据采集的工作和成本转移给终端用户。如果企业选择免费分布这些工具,那么数据采集的成本就将是获取用户的成本。或者企业可以选择对工作流工具进行收费,这种方式可能会减慢和限制客户采用率,从而在抵消数据采集成本的同时减少数据采集,具体的降低和限制程度将取决于企业对该工具的定价。
 
  例如,我们公司的投资组合之一,大数据公司InsideSales为销售代表提供了一个可直接与销售线索建立联系的平台。在销售代表使用的过程中,平台会自动记录互动的相关数据,例如时间、模式、其他元数据,以及该销售渠道中的销售线索是否有进展。这些数据将被运用于AI模型的训练,从而计算出联系潜在客户佳的通信时间和通信方式。在这种情况下,随着越来越多用户入驻该平台,网络效应就有可能会提高工具的实用性,从而降低获取用户的成本。
 
  另外一种方式是,在另一个实体已经建立了数据收集渠道的情况下,确保建立战略伙伴关系可以进一步降低成本。例如,我们的另一家公司Tractable采用计算机视觉来实现汽车保险调节器的自动化。该公司目前正与几家业内出色的汽车保险公司合作,致力于研发获取受损汽车图像的技术。除此之外,我们无需使车主下载应用程序,从而节约了应用程序推广所需的成本。
 
  存储和管理成本
 
  在数据存储和访问方面,初创企业也面临着一个成本问题。除了数据收集之外,企业可能还需要客户提供其他相关数据来丰富模型。由于许多行业近期才逐步实现数字化,因此任何拥有企业所需数据的潜在客户都不容小觑。为了获取这些数据,企业可能会在低利润率的数据准备工作中花费大量的人力。
 
  此外,如果数据分布在不同的系统和孤岛中,那么企业可能需要花费大量的时间来构建各个集成,从而使模型完全正常运行。有些行业围绕整体式和异质性技术堆栈建立,使集成很难在客户之间重复使用。如果无法获取集成服务提供商,那么这家AI创企很快就可能发现自己陷入了这样的泥潭:只有为每个新客户构建定制集成,才能部署其AI系统。数据的结构方式也可能因客户而异,这就要求AI工程师花费额外时间对数据进行规范化或将其转换为标准化模式,从而应用AI模型。企业可以采用建立公共集成库的方法降低成本,因为它可以在新客户中被重复使用。
 
  训练成本
 
  大多数建立AI模型的方法都需要对数据进行标注,这对AI创企来说是大的和可变的成本之一。如果这些示例简单明了或是通俗易懂,外行人就可以进行标注。例如,在图片中画一些苹果,然后在所有苹果周围画一个框,即可标注为外包劳务服务。
 
  但有时,注释需要更多的专业知识和经验,例如根据视觉线索来确定苹果的质量和成熟度,或者判断石油钻机上的一小块锈斑是否具有风险。对于这种更专业的劳动力,企业可能需要建立一个高薪的内部专家标注团队。根据企业的标注方式,可能还必须构建自己的标注工作流工具,尽管Labelbox等公司目前已经开始提供此类工具。
 
  在某些AI应用程序中,终端用户会是有效的标注器,企业可以通过设计产品来减轻标注成本,这样用户就可以在与产品交互时进行数据标记。例如,Constructor提供针对电子商务的人工智能网站搜索,观察用户实际点击和购买每个产品的搜索词,使这些网站能够优化搜索结果从而获得更高的销售额。这种标注不可能通过外包或专家搜索服务进行人工操作,而且这种方式大大节约了Constructor潜在的巨额标注成本。
 
  即使受到了高精度的训练,但当模型无法确切地解释一项新输入的内容时,仍然需要进行偶尔的人工干预。根据模型向终端用户传递价值的方式,该用户自己可以对模型进行更正或标注,企业也可以通过使用质量控制的“AI保姆”来处理异常。如果企业正在建模的环境不稳定且变化速率很高,那么企业可能需要在稳定状态下保留一组标注器,以便根据需要使用新的数据更新模型。
 
  扩展AI业务
 
  批成功的AI企业进入市场时,通过提供无AI的工作流工具来捕获训练AI模型的数据,并且该数据终提高了工具的价值。这些初创企业在早期就能够实现软件利润,因为数据和人工智能在其价值主张中居于次要地位。然而,随着市场转向更专业的AI应用,下一波AI创企将面临更高的启动成本,并将耗费更多的人力来为客户提供初始价值,导致其成为低利润率的服务企业。
 
  获得大量客户和数据终将降低单位经济效益和构建至关重要的复合防御能力,但许多初创企业并不确切地了解这一点,也不明白他们需要采取哪些行动才能更快地实现目标。而出色的AI创企则会通过这种方式进行优化权衡,有计划地进行投资并迅速扩张。
 
  (原标题:数据成本是否会将AI创企扼杀在摇篮中?)
我要评论
文明上网,理性发言。(您还可以输入200个字符)

所有评论仅代表网友意见,与本站立场无关。

  • 人工智能在制造业的新浪潮

    调查数据显示,95%的制造企业已经在AI/ML领域投入或计划在未来五年内进行投资。这一比例表明,人工智能应用在制造业中已趋于普及,并正由“试点探索”向“系统化整合”转变。
    人工智能AI赋能智能制造
    2025-10-21 09:25:54
  • OpenAI联合创始人:人工智能代理真正发挥作用还需10年

    OpenAI联合创始人预估,要系统解决上述所有问题,大约还需要十年时间。尽管众多投资者将2025年称为“智能体之年”,但现实发展仍面临显著挑战。广义上,AI智能体被定义为能够自主执行任务的虚拟助手,具备问题拆解、方案规划与自主实施的能力。
    OpenAI人工智能
    2025-10-20 10:58:05
  • 人工智能和物联网如何协作以实现更智能的技术

    人工智能与物联网的融合代表着科技发展的新方向。物联网通过分布在各处的传感器、设备和网络基础设施,持续生成海量的实时数据。而人工智能则通过机器学习与深度学习算法,对这些数据进行分析、建模与优化。
    人工智能物联网
    2025-10-20 10:57:54
  • 中国生成式人工智能用户规模达5.15亿人,普及率36.5%

    《生成式人工智能应用发展报告(2025)》显示,截至2025年6月,我国生成式人工智能用户规模达5.15亿人,普及率为36.5%。上半年,国产生成式人工智能产品取得显著进步,在春节期间成为社会关注热点,推动生成式人工智能快速渗透。
    人工智能生成式人工智能
    2025-10-20 09:07:04
  • 物联网和 Agentic AI 助力未来智能医院

    随着物联网(IoT)与新一代智能体人工智能(Agentic AI)的融合,这一复杂体系正在被重新定义。越来越多的医院开始引入基于实时数据的智能运营模式,使医疗体系逐步从“经验驱动”走向“数据驱动”,甚至是“自主优化”的新阶段。
    医疗应用方案人工智能
    2025-10-17 13:23:02
  • 快讯|HDL与海康威视达成战略合作;特斯联与新华三达成战略合作

    中国智能控制品牌河东科技HDL与安防企业海康威视宣布达成战略合作,双方产品实现互联互通,为海外用户提供更完整的智能生活解决方案;特斯联与新华三正式宣布达成战略合作,双方将集中优势资源,围绕AIoT算力平台打造及异构算力生态建设进行深度合作......
    AIoT算力人工智能
    2025-10-17 11:27:16
版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了