2023/08/31 16:49 科技云报道
在过去近一年的时间里,AI大模型从最初的框架构建,逐步走到落地阶段。
然而,随着AI大模型深入到千行百业中,市场开始意识到通用大模型虽然功能强大,但似乎并不能完全满足不同企业的个性化需求。
大模型技术的安全性、解释性、易用性等综合指标正在成为此轮AI竞赛的关键,部分企业不再执着于大模型的开发,而把目光向普惠式AI、生成式AI+多云、大模型的私有化部署等多种商业模式。
AI与云计算迎来大融合时代
从诞生起,云计算一直被认为是未来的发展方向、互联网企业们的“第二增长曲线”。
但是,受互联网增长红利见顶以及政策监管趋严的影响。从2021年开始,原本处在高速增长阶段的云服务商们纷纷陷入了增速放缓的阶段。从高峰时的超过50%的增速,一路跌至2022年的20%,甚至更低。
全球产业需求的消退,导致云计算行业增速失调。根据研究机构TrendForce今年2月的预警,Meta、微软、谷歌、亚马逊这四家云厂商的服务器采购量可能从年增6.9%放缓至4.4%。
不过,拐点很快到来。在ChatGPT出现后,即使行业需求放缓,国内外云服务商们也在积极将业务重心转移至AI领域。
可见云服务商们逐渐从上半场的“求速度”转变为落地于产业深处,去寻求更高的价值增量。
随着第一波上云的完成,企业正在进入深度用云阶段。AI与云的结合不仅能够进一步降低企业上云的门槛,还能为企业实现业务深度的智能化。
根据Gartner《2022年人工智能技术成熟度曲线》报告,尽早采用复合型人工智能(AI)、决策智能等AI技术将给企业机构带来明显的竞争优势,缓解AI模型脆弱性引发的问题,有助于捕捉业务背景信息,推动价值实现。
今年4月中旬,阿里云智能首席商业官蔡英华对外表示,算力的飞速发展使数字化成为确定,使智能化成为可能。
未来阿里云将以云计算为基石,以AI为引擎,参与到从数字化迈向智能化的划时代变革中。
AI走向普惠的一大步
英伟达第二财季的业绩惊艳众人,其背后是生成式AI革命中,行业对高性能算力的迫切需求,然而现在,昂贵的算力成本下,AI大模型似乎仍是个“富人游戏”。
面对GPU价格的暴涨与未来可能到来的“算力荒”,大公司砸钱囤卡,尚可悠然步入AI竞技场,而中小企业没有“钞能力”,在发展AI模型、应用过程中,更容易受算力制约。
拿什么来拯救AI算力资源极度不均衡的现状?如何让更多创业者参与到大模型的市场竞争中?
作为全球GPU龙头供应商、此轮AI热潮最大的受益者,英伟达给出了破局之道——算力租赁。
今年3月,英伟达正式推出算力租赁服务方案“DGX云”,该方案由英伟达与微软云、谷歌云、甲骨文等全球top10的云服务商共同打造,企业通过一个浏览器就可以按月租用英伟达DGX AI超级计算机,不需要采购与拥有服务器设备。
事实上,英伟达DGX云并非AIGC产业首例,但由于DGX AI超级计算机的杰出性能,DGX云将AIGC云算力产业推向了更高的起点,该服务推出标志着AI云算力进入新阶段。云算力采用“化整为零”的方式赋能产业链各方,具备可持续性。
算力租赁,即对算力进行出租,是一种通过云计算服务提供商租用计算资源的模式。算力生产商与云平台的合作由来已久,用户可以通过阿里云、腾讯云等平台租用英伟达的显卡与AI处理器。
对于英伟达与云服务商来说,算力租赁是实现双赢的策略。
全球第七大云服务商甲骨文是最先响应英伟达DGX云计划的大厂,该公司于2022年10月将英伟达加速计算堆栈工具(包括GPU 、系统、软件)迁移到其IaaS业务的旗舰产品——云服务平台OCI(Oracle Cloud infrastructure)上。
从最新的季报数据来看,这对甲骨文的业绩有非常显著的拉动作用。
2023年第四财季(自然年3月1日-5月31日),其云业务(IaaS+SaaS)营收达44亿美元,同比增加54%;其中,IaaS业务营收14亿美元,同比大增76%,云厂商中单季度云业务增收增速第一。
于英伟达而言,这亦是一笔回本周期短且毛利率可观的生意。
以A100(80G)租赁服务为例,A100(80G)显卡单价成本取10万元,现假设每张卡都得到充分租用,则按照2023年8月19日国内云算力平台租用A100(80G)服务器的均价15.1元/小时,考虑到各大平台竞争客户,经常性推出优惠活动,则假设平均实际租金为7.6元/小时,投入10亿元资金的实际回本周期为1.5-2年,按照平台最低定价计算,毛利率至少为46.3%。
目前,英伟达正积极拓展“朋友圈”,与领先的云服务商联合托管DGX云基础设施,甲骨文之外,微软Azure也已开始托管DGX云,这项服务还将在不久之后扩展到谷歌云。
基于算力租赁,用户只要按需付费,不用承担硬件设备的采购、维护、升级等费用,也不用担心设备闲置或者过时造成浪费;用户可随时随地通过云端访问所需的算力资源,快速开始训练和应用;用户可根据需求选择不同算力平台和机型,也可以不受地域或者时间的限制模型、工具等资源,进行更多的尝试和探索。
当多云遇到生成式AI
为了向大模型客户提供高稳定性和高性价比的AI基础设施,生成式AI+多云的模式成为科技厂商们新的角力点。云被看作是AI的承载,而AI也是云的核心抓手,开展大模型所需要的算法、算力和数据等能力,以及覆盖IaaS、PaaS、MaaS的解决方案。
近期,VMware 推出Intelligent Assist、Private AI架构方案。在此之前,阿里云提出了“Model as a service”的概念,亚马逊云科技推出了包括Amazon Bedrock和Amazon Titan模型等生成式AI新工具。
VMware CEO Raghu表示:“生成式AI与多云可谓珠联璧合。客户的数据无处不在,遍布其数据中心、边缘、云等多处。
我们将与NVIDIA一同助力企业放心地在数据附近运行生成式AI工作负载,并解决其在企业数据隐私、安全和控制方面的问题。”
NVIDIA创始人兼首席执行官黄仁勋表示:“我们能够训练AI模型,微调AI模型,为了跨多个GPU部署AI模型和大语言模型,特别是大语言模型,一台计算机运行不了,必须将其分配到多机多卡上,并对其进行推理、生成token,实现交互,其速度可媲美人类日常交互。”
同时他表示,通过与VMware扩大合作,我们将能够为金融服务、医疗、制造等领域的成千上万家客户提供其所需的全栈式软件和计算,使其能够使用基于自身数据定制的应用,充分挖掘生成式AI的潜力。
Private AI由一套集成式AI工具组成,能够使企业自定义模型并运行各种生成式AI应用,如智能聊天机器人、助手、搜索和摘要等。
该平台将作为全集成式解决方案,采用NVIDIA提供的生成式AI软件和加速计算,基于VMware Cloud Foundation构建,并针对AI进行了优化。
VMware AI Labs副总裁Chris Wolf表示:“最开始,AI是由一部分数据科学家为方便其他的数据科学家而构建和设计的。
随着全新VMware Private AI产品的推出,VMware正在让计算和AI模型的选择更加贴近数据,从而使未来的AI服务于企业中的每一个人。”
AI能拉动云服务增长吗?
行业研究机构IDC日前发布的2022年全球云计算追踪数据显示,全球云计算IaaS市场规模增长至1154.96亿美元,同比去年上涨26.2%。
全球前三名云厂商依次为亚马逊、微软、阿里云,所占份额分别为48.9%、14.4%、6.2%,谷歌和IBM紧随其后,所占份额分别为5.6%和2.9%。华为云、中国电信、腾讯云、中国移动和百度云位列六至十名。
与2021年相比,阿里云市场份额在减少,而亚马逊和谷歌所占市场份额在增加。
移动互联网发展见顶之后,全球云服务商收入增长都在放缓,AWS增速从40%下降到12%,微软Azure增速从31%下降到15%,但显然阿里云面临的挑战更大一些,增速已降至不足10%,上个季度首次出现负增长。
反观紧随其后的谷歌云仍保持近30%的增长,极有可能取代阿里云占据全球云厂商第三的位置。
2023年第二季度,阿里云的收入同比增长了4%。财报显示,阿里云本季度收入增长主要受到存储、网络和AI计算相关产品驱动,部分被CDN需求正常化抵消增幅。
从客户分布维度,收入增长主要受到金融服务、教育、电力和汽车行业驱动,部分被主动缩减项目式收入的举措所抵消。
AI热潮带来的算力和模型服务需求,正在推动云计算巨头重回增长,那么这种增长能否长期持续?
IDC统计了全球主要云计算厂商的收入拆分,阿里云、AWS的收入结构基本接近, 均主要以IaaS业务为主,辅以一部分PaaS业务,而微软Azure的PaaS和SaaS的收入占比超过60%。
实际上,云计算产业链中,从底层的IaaS,到中间层的PaaS,再到上层的SaaS,越往上产品差异化越大,毛利率越高。
微软Azure正是将自身的Windows、Office、SQL Server等软件与云服务打通,获得了更高的毛利率。
IDC在7月6日发布的《全球公共云服务半年度跟踪报告》显示:2022年全球公共云服务市场收入总计为5458亿美元,其中,SaaS(软件即服务)是公共云服务收入的最主要来源,占2022年总收入的45%以上。
面对全球市场以及国内市场激烈的IaaS竞争,阿里云发力PaaS和MaaS,微软Aure是可以参考比较的对象。
作为OpenAI的投资方,微软显然更受益于生成式AI的发展。今年初,微软宣布Azure OpenAI服务在全球Azure平台发布,该服务旨在为开发人员提供对大型语言模型的便捷访问,这些模型可以跨其他Azure产品无缝集成,以协助企业开发和部署对话式AI服务和解决方案。
此外,微软在其全球合作伙伴大会上宣布了Microsoft 365 Copilot定价、推出Bing Chat Enterprise AI聊天机器人、和Meta联合宣布将Llama 2开源大模型引入Azure云和Windows。
微软2023年第四财季电话会议上,微软首席财务官Amy Hood则表示,尽管目前对Azure AI服务的需求强劲,但目前AI服务对Azure的收入贡献仅有约1个百分点,随着微软加速投资云基础设施,AI对微软收入带来的影响将集中在2024财年的下半年。
张勇在财报会议上也说:“人工智能AI革命是一个增量机会,各行各业,所有公司他们都会希望利用人工智能来提升他们的服务。
但是这个是离不开要利用大量高性能的算力,不仅是用于现阶段模型的训练,还要用于支撑以后他们提供各种的服务。因此我们认为这是非常重要的、长期的一个带动增长的引擎。”
企业数字化、产业智能化是一条漫长的路,但云计算大厂们则通过不断的技术革新、开放赋能,正助力更多企业大步快跑进产业智能化的升级浪潮中,大大缩短了这一升级路径所需时间。
在人工智能技术融入万物,技术、需求与产业进化永不停歇、奔涌向前的现实下,未来的技术框架又会进步到何种程度,让我们拭目以待。
榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。