2023/09/01 11:35 Chaos新观察
是时候冷静下来,重新思考大模型的价值了。
短短一个月,隔壁看大模型的记者已经跑了不下5场发布会。
8月31日,国内AI视频技术头部公司百家云召开战略发布会,推出全新大模型产品「百问大模型」。就在两个月前,百家云刚刚发布面向企业市场营销需求的「市场易」GPT大模型。
同样是在8月,百川智能发布公司旗下第三款大模型产品Baichuan-53B。这家创业不到半年的公司,在过去三个月里,连续发布了三个大模型。
......
密集的产品发布,只是今年大模型创业潮的冰山一角。从年初到现在,短短九月间,AIGC创业者数量一路狂飙,“百模大战”带来的硝烟弥漫开来。
有业内人士向Chaos新观察表示,中国目前已发布的大模型早已接近 200个。有通用大模型、垂直行业大模型;有已经落地的、即将落地的,甚至还有一些根本没有考虑落地的。上半年,无论行业、什么领域,似乎都能与大模型来个“沾亲带故”。
有人在狂热中野蛮生长,有人在狂热中黯然离场。大模型创业这场热潮似乎还没有消退,就已经有玩家倒下,成为了*批炮灰。
行业真的需要这么多大模型吗?大模型创业是否会带来泡沫?哪些大模型真正有价值,哪些只是“套壳产品”?国内外大模型较为成熟的落地应用,有哪些经验可以借鉴......
是时候冷静下来,重新思考大模型的价值了。
大模型狂飙,百模大战开启
2022 年底,OpenAI 正式发布 ChatGPT,迅速破圈,短短 2 个月便用户过亿,引发了全球科技爱好者的狂欢。随着 AIGC、大模型概念井喷,大批创业者涌入,大模型数量呈现爆发式增长。
与此同时,在二级市场,国内A股多家企业接连发布定增预案,拟定增募集资金用于训练大模型,募资金额常常动辄数亿、数十亿。
据科技部5月份发布的《中国人工智能大模型地图研究报告》,中国已发布79个10亿参数规模以上的大模型。其中,自然语言处理仍是最为活跃的重点领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。有业内人士估算,目前,国内大模型数量早已逼近200个,甚至有券商报告称,行业正在步入“万模大战”的时代。
在同一时期,硅谷也爆发了一波AIGC创企投融资与收并购的高潮。除了最受关注的OpenAI外,欧美许多行业巨头通过收并购AIGC创企,抢滩打造细分领域的护城河。
其中,最受关注的包括AI初创公司Anthropic获得4.5亿美元C轮融资,其大模型产品Claude被视为OpenAI GPT-4的主要竞争对手;估值超过550亿美元的云计算巨头Snowflake收购Neeva,后者是一家由两位前Google员工创立的生成式AI搜索公司;估值380亿的大数据巨头Databricks斥资13亿美元,收购生成式AI公司MosaicML,帮助企业进行大模型训练。
全球的目光再次聚焦到硅谷。可以看到,人工智能已经成为今年科技领域当之无愧的主战场。然而,频发的大额融资与收并购,也意味着许多初创公司面临着资金枯竭的局面,开始寻求抱紧巨头大腿。
有人开始倒下
AIGC绕不开商业化大考
在千行百业之间的大模型之战一触即发之际,已经有创业者开始倒下。
今年7月,来自美国的AI聊天机器人明星创业企业Jasper宣布裁员,给大模型的创业热泼了一盆凉水。Jasper靠OpenAI的GPT-3发家,而当更强的GPT-3.5/4发布,Jasper就瞬间丧失了产品竞争力,颇有点“长江后浪推前浪,前浪死在沙滩上”的意味。
同样是在 7 月,国内一款名为“妙鸭相机”的 C 端应用上线,爆火出圈。“只需 9.9 元,上传照片就能获取 AI 写真集”、“让海马体们失业”......不过很快,妙鸭相机就受到了用户数据隐私与安全的质疑,其产品价值也被认为“天花板太低”,同质化产品迅速涌现。
热潮之下,创业者们需要更多的冷思考。大模型在今年成为了风口,但它并非是新概念,以百度、腾讯、阿里、华为为代表的国内互联网大厂及科技巨头,均已布局多年。百度在今年 3 月推出文心一言,其前身可追溯到 2019 年的预训练模型 ERNIE 1.0;华为在 2021 年 4 月就发布了盘古大模型;2022 年,腾讯混元大模型问世,阿里则在同年发布通义大模型。
要想打造一个技术成熟的大模型,算法、数据、算力缺一不可,这无不需要庞大的人才与资金投入。国盛证券曾估算,GPT-3 训练一次的成本约为 140 万美元,对于更大的大型语言模型,训练成本甚至在 200 万美元至 1200 万美元之间。
不是所有入局者都能玩得起、玩得转大模型。
在国内,一级市场大额融资越来越难,是国内许多AIGC创业企业面临的尴尬处境。有业内人士评价,目前国内许多AICG创业主要围绕小参数大模型,并且喜欢在各类参数评测上进行比拼,缺乏核心竞争力。
而在二级市场,许多A股上市公司借机炒作概念,也让投资人对于AI项目的出手慎之又慎。
随着竞争提速,国内外的大模型更加需要重点思考如何商业化落地,如何开始通过自身业务造血。
国内的互联网和科技巨头倾向于结合大模型的力量,进一步发布自身所长。百度聚焦搜索、小度智能音箱等场景;腾讯则仰仗微信、QQ 等社交领域的优势;阿里发挥办公、电商等应用所长,华为则拥有 5G、通信等产业基座实力。
新入局的企业,需要避开正面交锋,找出差异化发展之道。
百川智能创始人、CEO 王小川与曾在与极客公园的对话中表示,一家公司不可能把所有赛道都做完。”百川智能在B端选择做开源模型,赋能行业企业,同时内部部署了C端的超级应用。“我们在思考如何追上 GPT-4,思考大模型到底能给 C 端带来哪些应用。”
走向B端,能否成为制胜法宝?
在一场商业化浪潮之中,只有极少数人才能站上浪潮之巅,笑到最后。
“百模大战”并非只有大厂能赢,提升自身技术实力、抓住产业应用场景才是硬道理。
随着时间的推移,公众对于许多AIGC领域C端应用已经开始“去魅”。即使是“老大哥”ChatGPT,也变得不再如原先那般吸引人。分析公司Similarweb数据显示,在今年6月份,ChatGPT网站的阅读流量与访问者数据首次出现了下降。
目前,无论是通过GPT生成文本,还是通过Stable Diffusion生成图像,亦或者通过Llama模型进行多模态任务应用,都还没达到促进产业变革的节点。
这就是AIGC实力的天花板吗?显然不是。
许多企业开始避开C端应用的聚光灯,探索让大模型走进B端,深度赋能产业。
今年6月,腾讯才姗姗来迟般首次正式公布行业大模型研发进展,并发布面向B端客户的腾讯云 MaaS(Model-as-a-service,模型即服务)服务解决方案。不同于百度、阿里等聚焦的通用大模型,腾讯云MaaS的技术底座则是一系列的行业大模型,包括金融、政府、文旅、传媒、教育等,与产业结合,致力于让大模型可以长期可持续发展。
百家云发布的百问大模型也是一个典型的案例。作为一个AIGC场景化平台,百问主打的就是帮助企业私有化部署GPT大模型。
目前来看,大模型要想变成生产力工具,就必须进入应用场景,而百问确实做到了“让新技术更接地气”:一方面百问具备将现有的软件Copilot化,给传统的软件增加更加智能的能力,如在业务系统、办公软件、搜索引擎中加入智能问答,以及帮助企业低成本接入数字人互动直播、智能客服、自动写作等各类AIGC服务等;而另一方面,则是百问可以帮助企业基于AIGC开发全新应用,更好地解决客户问题。
可以明显看到,一些企业在布局AIGC赛道时,选择避开聊天机器人、AI制图等C端爆款应用,转而聚焦相对“无聊”的to B产业端口。
这种打法,也是国外一些AIGC创企的选择。一个有意思的案例是Databricks与MosaicML之间的联姻。
今年6月27日,大数据巨头Databricks斥资13亿美元,收购生成式AI公司MosaicML,成为年度AIGC收购热点。让人出乎意料的是,这场收购竟来源于一场“巧合”。在今年3月份之前,Databricks没想买,而MosaicML也没想卖,双方CEO甚至素未谋面。
Databricks的CEO Ali Ghodsi与MosaicML的CEO Naveen Rao,在今年的一场AI会议中认识。在交流之后,他们意识到两家公司的目标极为相似:1、让AI变得触手可及,人人都能训练自己的大模型;2、保护用户的数据隐私安全;3、聚焦toB赛道。
这是一条小众的路。“ChatGPT带动了生成式对话应用的狂热,但我们都对这些不感兴趣。”Ali Ghodsi说,“我们聚焦B2B业务,这个赛道很无聊,也没有多少人关注。”
MosaicML瞄准的是中小企业训练、部署自身垂直行业大模型的需求。比如通过MosaicML,仅需5万美元,花35天的时间,就可以根据客户需求训练出一个Stable Diffusion模型。
Databricks发现,双方不仅有着同一个客户群体,很多客户在训练自己的大模型时,会同时用到Databricks与MosaicML,这构成了双方合作的基础。
很多巨头都想买MosaicML,但最终只有Databricks的offer打动了他们。MosaicML的CEO Naveen Rao本身就是AI大神级人物,当初从Intel跳槽出来创业,就是不希望被大公司体系束缚。
而Databricks收购MosaicML这件大事,却在短短几周就推进了下去——双方的谈判,只需要一个简单的Zoom链接。这让Naveen Rao好感倍增,认为Databricks没有Intel般的“大公司病”。
国外另一家在数据库领域关注度极高的公司Snowflake同样聚焦B端,也常常被拿来与Databricks比较。Snowflake市值超过550亿美元,目前主要聚焦“数据云”业务,并通过对Neeva(企业级AI搜索引擎)的收购,强化AI能力,加速企业与数据的交互和搜索。
随着Databricks、Snowflake等科技巨头陆续落子,各家在AIGC领域下一个十年之争的版图也逐渐明晰——从B端企业入手,真正让AI引领产业变革。
结语
ChatGPT的诞生,意味着奇点时刻降临,它引发了更底层的变化,大模型之争已经开启。没有疑问的是,人工智能是未来必争的战场。
然而,大模型并非越多越好。通用大模型耗资巨大,只是少数玩家的游戏。可以预见的是,不久的将来会有越来越多的低质量大模型出现,也会有一大批跟风企业倒下。未来,“百模大战”、“千模大战”、“万模大战”究竟是否会引发多大泡沫,又有多少投资人会血本无归?
大模型的产业价值仍待挖掘,与B端深度融合给它带来了更为广阔的想象空间。在数据隐私、数据安全方面,大模型无疑会引发公众更大的担忧。安全性和可信性将成为学术界和工业界关注的重点。
榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。