首页 > 资讯 > 数字化

年内狂揽五项第一，“字节系大模型”何以后发先至？

2024/09/20 17:20 第一新声

　　作者/琳玉

　　“600亿”、“1000亿”、“5000亿”、“1万亿”……

　　这不是拍卖会的叫价现场，而是国内大模型的日均Tokens处理量。据各厂商最新消息，这一数据正在不断被刷新。近日，MiniMax再宣布，已达单日超3万亿Tokens处理量。每一步跨越，都是大模型的又一次飞跃。

　　然而，随着模型竞赛步入下半场，Tokens处理量已非衡量大模型价值的唯一标尺，行业关于“第一”的较量转向应用落地。其中，素有“卷王”之称的字节，虽然入局大模型仅有不足两年的时间，如今已在行业内成功拿下了多项第一：

　　·一季度，豆包登顶七麦数据《2024年第一季度ios实力AI产品排行榜》

　　·在高考新课标Ⅰ卷全科目大模型测试中，字节豆包以542.5分获得国内大模型排名文科总分第一;

　　·智源研究院发布解读国内外140余个大模型全方位能力评测结果，字节豆包Skylark2位列第一;

　　·Unique Capital报告显示，今年7月，字节旗下CapCut和Doubao在全球人工智能(AI)应用下载超越了OpenAI的ChatGPT，斩获全球第一。

　　·官方数据，当前豆包支持50+下游业务，已成为中国市场用户量最大的AIGC 应用。

　　上半场低调蓄力，下半场火力全开。当下，字节庞大的大模型帝国仍在不断扩张。作为大模型战场的“后来者”，字节是如何实现逆袭的?背后有哪些关于创新、决心与速度的故事?在当今大模型时代下，值得深思与探讨。

　　巨资揽才

　　中科系、百度系撑起字节半壁江山

　　追溯中国大模型的发展历程，“字节”身影的出现，已在相当靠后的阶段。

　　早在2019年，百度凭借其“人工智能研究中心”的技术积累，率先在国内推出文心大模型，这也成为我国在大模型领域的重要里程碑。随后，阿里巴巴“达摩院”与“腾讯研究院”的成立加速了自研大模型的开发。

　　2021年，阿里成功发布全球首个10万亿参数的多模态大模型;同一时期，腾讯连续推出多个千亿至万亿参数级别的大模型;为后续更大规模的研发奠定了基础。

　　时间来到2023年，国产大模型迎来爆发期。众多大厂及创新型企业纷纷亮出自研大模型产品，阿里通义千问1.0、腾讯混元、360智脑、华为盘古、科大讯飞星火、商汤日日新、百川大模型，以及智谱AI的GLM等均诞生于这一时期。

　　国内大模型发展时间线

　　当行业发展渐行至深水区，字节才姗姗来迟。

　　2024年年度全员会上，字节跳动CEO梁汝波反思字节的技术敏感度不如创业公司：“公司层面直到2023年才开始讨论GPT，而业内做得比较好的大模型创业公司都是在2018年至2021年创立的。”然而，似乎“颠覆传统，又保持一定的秩序”是字节发展的独特风格。一旦入局，就迅速集结精兵强将、光速启程。

　　2023年1月，字节正式成立大模型研发团队。据悉，当时最核心的两个小组主要来自内部其他业务线：一个来自原搜索部门，负责开发语言模型;另一个则来自产品研发与工程架构部下的智能创作团队，负责图片模型的开发。

　　大模型新部门成立之后，字节在AI大模型方面形成了“三管齐下”的策略：由TiKTok产品技术负责人朱文佳、字节ALLab(人工智能实验室)总监李航、数据-应用机器学习(Data-AML)负责人项亮分别领导三大团队，方向侧重于业务落地、学术研究和介于两者之间的应用研究。

　　2023年8月，仅数月之后，大模型研发团队迎来重要进展：自研“云雀”大型模型完成网信办备案工作(后更名“豆包”)。同一时期，字节还推出了一款多模态大型模型——BuboGPT，可见其研发与发展的高效率。

　　2023年11月，为进一步推动AI技术的深度应用，字节宣布成立全新部门——“Flow”，直接归属于研发与工程部门(PDI)。据悉，该部门有四个主要业务线：AI教育、国际化、社区和豆包。

　　Flow成立时就形成了强大的领导阵容：包括由原大模型团队负责人朱文佳担任业务负责人、字节技术副总裁洪定坤担任技术负责人、字节产品和战略副总裁朱骏担任产品负责人。紧接着，飞书产品副总裁齐俊元、抖音社交负责人陆游也转至该部门，分别负责PC端和移动端产品。随着Flow部门的快速发展，逐渐成为字节大模型业务中主要的活跃部门。

　　此后，字节仍持续深化大模型团队架构的优化布局。

　　2024年2月初，张楠宣布卸任抖音集团CEO，转战AI生成式视频领域的剪映。

　　2024年4月，朱文佳获得了进一步的晋升，直接向CEO梁汝波汇报。据悉，朱文佳领导的AI团队被称为“Seed”，由原来的搜索团队、AILab团队、AML团队强强联合而成。

　　随着字节大模型的逐渐成熟，抖音、火山引擎、巨量引擎等业务部门也都开始加入 AI 探索。抖音负责人韩尚佑、字节跳动商业产品技术负责人刘小兵带领项目组研究 AI 与抖音、商业化产品的结合;谭待领导的火山引擎发布了大模型服务平台“火山方舟”，为开发者和企业提供模型训练、推理、评测、精调等全方位的平台服务。

　　若深入分析字节系大模型团队的核心领导层，不难发现几个显著的特征：

　　一是高管团队几乎都拥有国内外顶尖学府的学历背景，其中，中科系贡献突出。此前媒体爆料的豆包大模型关键8人中，有半数来自“中科系”;可以说，清华系撑起了大模型创业企业，而中科院系则撑起了字节大模型。

　　二是众多高管成员来自BAT，其中，有百度背景的高管比例显著。

　　发展至今，大模型技术已跃升为字节跳动的核心业务支柱。有消息称，字节主要高管将人工智能视为公司“输不起的战役”，已经进入“全力以赴(all in)”状态。想必这也是近期字节持续大手笔招揽人才的原因。

　　今年5月，字节启动了针对应届博士生的“Top Seed”校园招聘计划，该计划提供行业内顶级薪资待遇和充足的算力资源支持，重点寻找拥有顶会顶刊论文或专利的学术人才、在国际知名竞赛中取得优异成绩的竞赛人才，以及参与过重大项目，擅长解决难题的实战人才。

　　近期，有消息证实原零一万物核心成员黄文灏、原面壁智能核心成员秦禹嘉已加入字节大模型团队，汇报给朱文佳。这也标志着字节在吸引外部高端人才方面迈出了重要一步。

　　近期，豆包大模型Vsion团队、Foundation团队、Speech也相继启动热招。脉脉高聘人才智库数据显示，今年上半年，字节成为新发“人工智能岗位”最多的企业。从招聘指数上看，字节跳动以9.53位居第一，大幅领先于其他互联网大厂。

　　国产大模型市场：三大势力圈地，各自为营

　　如今，国内大模型野蛮生长的时代已经结束，取而代之的是精细布局、抢占先机的跑马圈地新阶段。各大模型厂商正凭借自身独特优势，加速抢占市场高地。随着字节系大模型的崛起，市场也逐步形成三大势力割据的竞争格局：

　　首先，大厂阵营，BAT等传统巨头及华为、科大讯飞等科技企业，凭借深厚的资金积累和庞大的数据资源，迅速构建起大模型发展的坚实基础。而国产大模型的竞争战役，也已率先在大厂之间打响。

　　在B端，“模型大战”与“Token价格战”轮番上演;两年前，GPT 3.5每百万Token的价格约为60美元，而今天，不少大厂的价格一降再降，甚至开始推出免费模式;在C端，内容生成、AI助手等大模型应用层出不穷。区别在于，各大厂凭借其独特的业务生态与优势业务领域，在大模型的发展道路上自然而然地孵化出了各具特色的应用方向。

　　阿里大模型主要在工业、金融、媒体、教育等领域有广泛应用前景。例如，中国科学院国家天文台基于通义千问开源模型开发的“星语3.0”大模型引领中国大模型技术进入天文观测。目前，通义大模型赋能超9万企业，下载量超700万。

　　腾讯大模型深度融入腾讯生态，覆盖社交、游戏、内容等场景，已接入700+款产品，包含腾讯元宝、腾讯云、QQ、微信读书、腾讯新闻、腾讯客服等。

　　百度大模型则覆盖创作、分析、客服等多领域，提供一站式内容解决方案和优质客服体验。例如，在智能内容创作方面，百度大模型可以为企业提供专业的营销内容创作服务，包括素材库对接、AI作图、AI海报等;

　　其次，以“大模型五虎”为代表的头部创业公司，拥有行业顶级的技术尖兵与高校智囊团。成为大模型创新的中坚力量。

　　与大厂的大模型团队主要来自内部组建不同，创业公司则明星人才云集、依托高校教授技术指导，不仅技术过硬，且具备高度的灵活性和创新力。这类公司往往能迅速捕捉市场趋势，推出差异化的解决方案。

　　例如，智谱AI近日宣布清言 app 公开“视频通话”功能，跨越文本模态、音频模态和视频模态，并具备实时推理的能力。作为国内首个面向 C 端开放的视频通话功能，迅速收获全网关注。MiniMax在近期推出的abab6.5s系列模型的MOE架构，实现了处理速度比同类模型快3-5倍的速度。

　　最后，众多潜力公司正在为行业提出新的解决方案。相比于大厂和巨头，处在长尾阶段的潜力公司倾向于探索垂类模型与应用。

　　例如，云启智行专注自动驾驶创新，其大模型技术精准识别路况、规划路径，融合多源传感数据，全面感知环境，推动自动驾驶与智慧城市绿色转型;绿野智能则专注在环保监测领域，其大模型技术助力高效精准监测环境、助力科学决策、促进可持续发展。这些企业的崛起也彰显了大模型行业的多样化活力。

　　在三大势力割据的行业竞争格局中，字节凭借模型的稳定性、可靠性，以及强大的应用开发能力，逐渐形成了形成了独有优势：

　　1、技术创新与高效性：字节AI实验室推出MegaScale系统，专为万卡集群训练设计。该系统结合Transformer并行化与滑动窗口注意力，提升训练效率与模型精准度，增加吞吐量并降低成本。同时，采用LAMB优化器与16位混合精度训练，减少内存使用，加速计算。

　　2、用户基础与市场影响力：凭借多元化的应用推荐策略，字节成功汇聚庞大用户群，稳居国内大模型APP用户规模前列，构建起坚实的用户基石，为未来发展注入动力。

　　3、全球化战略与布局：字节系大模型不仅在国内市场稳固根基，更以全球化视野积极拓展海外版图，构建起独特的国际竞争优势。

　　4、系统承载力与安全保障：字节利用火山引擎云服务，拥有丰富GPU资源和分钟级千卡扩缩容能力，能够智能调度应对高峰，保障高并发下系统稳定。此外，豆包大模型提供覆盖全生命周期的安全可信解决方案，从数据保护到模型运行，为用户构建坚实的信任防线。

　　践行实用主义：字节大模型，如何跳动?

　　“无论中国还是美国，大模型今年都开始更务实了。”金沙江创投董事总经理朱啸虎在近期接受媒体采访是如是说到：“大家普遍认为，大模型的技术迭代曲线已经明显放缓，今年中美的AI创业都会更看重如何实现大模型在应用层的落地。”

　　知名经济学者盘和林也指出，大模型企业仅靠在To B、To G等方面打转或许难以真正打开市场的。可见，大模型产品商业化正在成为行业升级的关键。字节作为短期内发展起来的企业，其商业模式具有一定的前瞻性和创新性：

　　首先，字节正在打造超级AI应用工厂，巩固用户盘。

　　伴随团队力量的完善，豆包成为大模型行业的“顶流”。在字节跳动内部上线以来，深度融入公司50多个业务线，其中包括抖音、头条等数亿DAU产品。

　　今年5月，火山引擎FORCE原动力大会上，字节正式推出豆包大模型家族、火山方舟2.0以及一系列前沿的AI应用与云基础设施产品。截至目前，豆包大模型家族已扩展至9大产品线，涵盖通用、角色扮演、语音合成、声音复刻、文生图、语音识别、向量化及Function call等多种模型，全方位满足用户与企业的多样化需求。

　　字节的AI布局远不止于此。从大模型产品、基础AI开发、到AI社交，再到AIGC创作，字节已构建起一个全面的AI产品生态体系和超级AI应用工厂。

　　字节已在国内外推出了包括豆包、扣子、星绘、猫箱、小黄蕉等近6款APP，并且在大模型基座赋能下，还诞生了即梦、小悟空、豆包爱学、即创等基于原生业务的大模型工具应用。覆盖AI智能助手、创作、社交及教育等多个热门赛道。

　　这些产品大都来自于上文提到的人工智能应用部门“Flow”，及字节原生业务部门。

　　字节系大模型应用布局

　　此外，字节大模型还在不断进行产品升级和迭代，以适应市场的变化和客户的需求。

　　近日，字节跳动火山引擎再发宣布，豆包大模型将在9月24日发布视频生成模型，并将带来更多模型家族的能力升级。此前有消息称，未来豆包或将涉足体育、点餐等，推出豆包体育、豆包点餐等服务，进一步丰富豆包生态。

　　其次，低价策略正在为字节争取来更大的市场份额。

　　今年5月份，字节宣布其主力模型在企业市场的定价仅为0.0008元/千Tokens，比行业价格降低了99.3%，这一举措被认为吹响了大厂价格战的号角。对中小企业而言，极大地降低了企业采用AI大模型的门槛，可以大幅提升其业务创新和竞争力。

　　极致的低价来自字节良好的成本控制。字节大模型通过持续优化模型结构，如采用混合专家模型(MoE)等技术提高模型性能效率、运用分布式训练加速模型训练过程，从保证效果、降低推理成本。此外，字节还根据各业务流量高峰时段差异，灵活调配大模型推理资源，以降低总成本。如飞书的主要流量高峰在工作时间，抖音则在休闲时段，通过智能管理优化资源利用。

　　通过大幅降低价格，字节大模型吸引了大量客户和使用量。有业内消息透露，在国内云计算市场中，火山引擎的采购量尤为显著，其计算卡规模已达数万张。据悉，火山引擎去年与英伟达签订的订单量已超越前一年BAT三家的总和。这也进一步凸显了字节在当前大模型领域的发展势头。

　　对此，火山引擎总裁谭待认为：大的使用量能够打磨出更好的模型，而好的模型又会吸引更多人使用，形成良性循环。

　　最后，多渠道合作和多样化盈利模式联合增收。

　　字节大模型采取了全方位、多维度的推广策略，深度融合线上线下资源，以精准触达并激发目标客户群体的兴趣与需求。包括在B站、小红书、抖音等平台投放广告，以及在一二线主要城市的写字楼、地铁、机场等白领聚集的场所进行宣传。这些推广活动不仅提高了品牌知名度，还吸引了大量潜在客户。

　　当前，字节已经建立起与行业领先企业的深度合作。例如，火山方舟已与汽车、手机、金融、食品饮料等领域的龙头企业展开了密切合作，包括吉利汽车、长城汽车、OPPO、vivo、小米、华硕、招商银行、海底捞等。

　　此外，字节还探索出了多元化创新的盈利模式：

　　1、API接口调用费用：对于B端客户主要通过API接口调用技术来收费。尽管价格大幅降低，但由于使用量的增加，这一收入来源仍然可观。

　　2、广告收入：在C端市场，字节大模型可能通过广告模式来回收成本。例如，通过在APP中展示广告或与其他广告商合作，实现盈利。

　　3、增值服务与定制化解决方案：除了基础的API调用服务外，字节大模型还提供增值服务和定制化解决方案，以满足客户的特殊需求。这些增值服务可能包括数据分析、智能客服、个性化推荐等。

　　当前，“更高、更快、更强”不仅是体育精神，更成为大模型的发力方向。行业正在持续追求更高性价比、更快的运行速度、更强的性能。在国内市场中，字节系以其后发先至的强劲增长态势，成为了业界瞩目的焦点，但放眼国际，国产大模型的发展仍然拥有很多堵点，如技术能力局限、算力供需失衡、数据安全、伦理法规等等。

　　在技术创新、政策引导、市场需求等多重因素的共同驱动下，未来国产大模型的发展将是一个多方协同、持续迭代的过程。近期，字节火山方舟大模型服务平台推动共建 “多云多模型” 生态，接入了包括智谱AI、MiniMax、百川智能、月之暗面、澜舟科技等国内领先的大模型。通过深化合作与资源共享，共同发力，将共同推进国产大模型迈向下一个高峰。

　　榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn（把#换成@）。

分享到微博分享到微信

年内狂揽五项第一，“字节系大模型”何以后发先至？

相关阅读

新动态

关注度

最话题