数据清洗耗费AI公司95%的精力 第四范式推AI操作系统
原标题:数据清洗耗费AI公司95%的精力,第四范式推AI操作系统
产业变革时代,AI操作系统成全球竞争焦点。
8月20日,人工智能技术与服务商第四范式发布了企业级AI操作系统Sage AIOS。回顾互联网发展历史,操作系统对于技术的应用和普及发挥了关键作用,如同PC时代的Windows,移动互联网时代的安卓和IOS,每一项前沿技术最终都需要操作系统作为支撑平台,AI技术同样如此。
反观当下AI技术日渐应用于各行各业,但技术与产业之间的沟壑也开始显现。
首先数据治理问题最为突出。“数据治理占AI工作全流程95%的时间,即使花费这么多的时间,数据效果和数据质量两大难题,一直困扰着AI业务效果的提升。”第四范式创始人兼CEO戴文渊向包括第一财经在内的媒体表示。数据治理难度大一个很重要的原因就是数据的格式标准不统一,不同业务场景对于数据的要求也不尽相同。
AI落地的另一大阻力是门槛过高,科学家资源尤为稀缺。据戴文渊介绍,目前AI领域每一年新增的科学家数量是千万级别,但每一年新增场景却是百万级别,这导致科学家供给完全无法满足AI应用需求,不少科学家的精力耗费在低价值工作上。
此外业务价值不佳以及算力成本负担重,也是AI落地过程中最常见的问题。据Gartner预测,2022年平均每个企业在AI算力上的支出会是18年的4倍,总体市场支出将超过50亿美元。在算力高昂成本的背后,实际上是算力的巨大浪费——企业数据中心对AI负载进行针对性优化,算力平均使用率依然达不到60%。
“这些问题归根结底是因为缺少基于规范和标准的基础设施,AI实现规模化落地需要从底层系统出发,来设计和构建更标准化的AI产品。”戴文渊表示。正是在这一大背景下,第四范式推出了从算力、操作系统、生产平台到业务系统的AI产品矩阵。
从底层来定义数据标准并不容易,据第四范式AIOS产品负责人黄缨宁介绍,要定义数据至少需要三类know how(技术诀窍):业务、IT和AI的know how。包括不同业务场景中的模型需要什么样的数据,对应的数据需要从什么IT系统上去调取,以及如何将这些数据处理为AI 可用的数据“投喂”到AI系统中。
值得关注的是,疫情的到来正在给AI商业化进程按下“加速键”。据戴文渊透露,以往金融业务占据第四范式营收的90%,今年已经下降至50%,新零售和制造业增速迅猛。“消费互联网和工业互联网引爆的数据增长,促使一个个经济体开始发生巨大变化。”第四范式总裁裴沵思说道。
近一年AI独角兽公司上市消息不断传出,此前一位投资人曾向记者透露第四范式在考虑科创板。对此戴文渊回应,公司正在积极考虑科创板的窗口和机会。对于繁荣和泡沫并存的AI产业而言,IPO是否是AI独角兽们的最优选择?戴文渊认为要考虑两点:首先上市是否能够促进业务发展,尤其对于toB公司而言,上市后公司的影响力和公信力是否有助于业务拓展。第二上市后在融资上是否有更大的便利性,科创板开放灵活的创新机制,给AI公司创造了很好的机会。
责任编辑:张玫
软银表态惹争议,揭秘在华版图,孙正义这两年在中国赚了多少钱?
记者胡萌近日,据华尔街和路透社报道,软银董事长、CEO孙正义在8月10日举办的业绩发布会上表示,软银将暂停在中国的投资。这一消息引起热议。0001晶圆代工业供需失衡 多地企业纷纷加入涨价潮
《科创板日报》6日讯,据businesskorea报道,晶圆代工企业正经历一波高潮,订单量已超过他们的能力。向台积电和三星下单AP、GPU和汽车半导体的企业客户需要等待一年多。由于供不应求,代工服务费用激增。台积电最近取消了对大公司客户3%的折扣政策。中国台湾的联电和世界先进将服务价格提高了10%以上。“随着中国台湾企业选择涨价,韩国企业也在效仿,”当地一家封装公司的管理人士表示。0000产品供不应求、人手不够:可能还要继续招工 格力电器董明珠
证券时报e公司讯,最近几场直播,有何亲身感受?对此,董明珠今日在格力电器2019年年度股东大会上表示:我的感受就是卖得越多越高兴。第一次,我们在硬件上准备不够充分;第二次卖了3个多亿;第三场卖了7个多亿;今天这场,截至目前已经超过10个亿。我们今天这次直播特别感谢珠海市政府对我们的支持,让我们更大让利给消费者。创新是企业的生命力,能够支撑起来的是格力的9万员工0000加拿大法院下令:销毁孟晚舟案争议证据,归还电子设备
(观察者网讯)10月25日,华为高管孟晚舟已经回到了工作岗位。同日,加拿大法院则公布了相关案件的后续——命令加拿大警方销毁写有孟晚舟手机密码的纸条,归还她的设备。据香港《南华早报》10月26日报道,加拿大不列颠哥伦比亚省最高法院已经向联邦警察下令,要求销毁一张手写纸条,上面有孟晚舟的手机密码。{image=1}