2024/04/08 12:01 数智前线
如果说2023年是通用大模型的元年,2024年将是行业大模型落地元年。
文|赵艳秋
从去年底到今年初,各行各业正迎来大模型落地潮。“大家都马不停蹄的。”
就在这样的热潮之中,政企市场的资深玩家浪潮云,在青岛发布海若大模型业务战略,定位行业大模型市场,首批面向政府、交通、应急、制造、医疗、农业六大行业,通过培育“三位一体”的数字生态创新共同体,加速行业大模型在百城落地。
01
大模型落地热开始了
“大模型的行业落地需求来的又快又猛。”一位赶到青岛参加浪潮云数字创新生态大会的大模型落地服务商说。“从去年底到今年初,这样的氛围特别浓,大家都马不停蹄的,这个潮流来的太快了。”另一位现场人士说。
一位正在与医院合作大模型落地的浪潮云人士说,原来每家医院都有自己的一个小生态,其他人想进入都有壁垒。“但我们现在用大模型去聊,医院都很开放。双方在一起碰撞的思路特别多,大家都愿意做出一些创新的东西。”
在医院,一位科室主任告诉浪潮云人士,自己手下那么多博士,80%的时间都花在文书上了。“一点都不夸张。”另一位参观的服务商说,现在实习生就是在办公室写病历,根本接触不到患者。“所以他们就想解决这个问题。”目前,浪潮云与一家三甲医院合作,采用大模型的即时病例生成,准确率已达90%。
在经历了近一年的市场培育和摸索后,各行各业正迎来大模型落地潮。背后根本的原因是,传统技术已不能解决企业当下面临的问题,而大模型在降本增效上确实效果明显。正是在这样的形势下,浪潮云正式发布海若大模型业务战略。
“现在是很宝贵的时间窗口。”一位浪潮云人士说,“我们在一些行业中不是走在最前面的厂家,但大模型我们是比较快的。我们一旦用大模型形成方案,占领市场,就可能建立自己的护城河。”
浪潮集团执行总裁、总工程师,浪潮云董事长肖雪在大会上表示,政府工作报告首项任务即是加快新质生产力。“新质生产力起点是‘新’,关键在‘质’,落脚于‘生产力’。大模型的问世,让我们有新的抓手,去培育新质生产力。”
浪潮云总经理颜亮介绍,浪潮海若大模型定位在行业大模型,首批面向政府、交通、应急、制造、医疗、农业六大行业。浪潮云将投入50亿元资金,通过培育“三位一体”的数字生态创新共同体,推动海若大模型在100个城市快速落地。
“如果说2023年是通用大模型的元年,2024年从浪潮云的角度来看,是行业大模型落地的元年。”浪潮云首席技术官孙思清说,浪潮云正在与生态伙伴,跑通行业大模型商业闭环。
02
行业大模型必须下场
去年,全国掀起了百模大战。“前期的同质化比较严重,大家尤其关注通用大模型的基础能力。”颜亮说,“但在后续的裂变中,我们意识到,大模型要能快速展现场景价值、快速落地,行业大模型必须下场。”
现在各个城市已意识到这个趋势,都在加大行业大模型投入力度。
那么,一个行业大模型是怎么炼成的?孙思清告诉数智前线,在每个行业,浪潮云都有“灯塔客户”,合作去训练行业模型。
在数据方面,大模型的训练使用了公开数据、授权数据和私有数据。其中,公开数据集完全能对外,是浪潮云经过治理形成的;如果用到了行业授权数据,要保障不出域;而针对私有数据则是本地化的。“每个行业的数据安全分级不同,要根据不同的法规解决这件事。”孙思清说。
“有些数据不容易确权怎么办?就在域内做模型训练,训练后模型能不能出域,就涉及到安全审查或安全评估。”颜亮进一步分析,“因为模型可以加噪,如果技术能证明原始数据是不可复原的,模型就可以出域,这是下一个课题,业内还在探讨。”
在训练行业大模型时,浪潮云会沉淀每个行业的通用智能体,这是一些共性应用,发布在智能体商店。每个行业智能体商店将覆盖200多个典型应用场景,加快复制推广。行业大模型在进入企业或政府内部,可以再结合专有数据、专有场景调优。
以医疗行业为例,浪潮云收集了1800多本医学书籍、1200多万个医疗问答等100万条以上的公开数据,训练医疗行业大模型。这个行业大模型应用到一家三甲医院的病历生成上,准确率为50%。浪潮云进一步采用该医院1.2万份脱敏住院病历、300小时入院问诊对话等更高质量的数据,进行监督训练和强化学习,生成的准确率逐步达到90%。
“行业大模型落地的一个特点,是必须有一个对专有数据的精调过程。”颜亮说。
“从浪潮云来讲,我们必须跟别人不一样,会考虑标准化、规模化,同时一定会考虑定制化。”孙思清说。
有趣的是,通用大模型参数已经从上千亿走到万亿级,但在浪潮云在行业落地中发现,参数不是越多越好。“在行业中,我们认为7B-70B性价比最佳。”孙思清说,因为国民经济共有97个行业,每个行业采用的数据集通常是2T、3T,不会很大。这一实践得到不少服务商的认同。
对于大模型落地路径,业界有不同观点。“大家现在有一个很大的概念,叫做大模型的原生,但我不这么认为。”颜亮告诉数智前线,“我们的想法是针对原有的生产系统或管理系统,植入大模型能力,这既能快速体现行业价值,也能对原有架构挑战最小。”
现场一位资深服务商表示赞同。他们从去年开始与一些地市合作,将行业大模型植入到原有的投诉举报系统,实现了效果提升,目前已在几个地市推广复制。
当下大模型处于场景点的挖掘,颜亮认为,要真正让行业产生质变,大模型需要全流程植入。这可能需要1-2年,其中关键是大模型要经过周期性迭代,才能达到可用。“最多两年时间。竞争会促成大家的互相学习和投入,我们感知到,2024年用户在大模型上的投入,是2023年水平的3-4倍以上。”
03
行业落地关卡和三个解法
在这一年的实践中,浪潮云观察,政企用户在接纳、落地行业大模型上,要过四大关卡:
首先是数据隐私的保护和合规,这是客户的底线,这个问题不解决,很多行业客户就不会进场;其次是复杂的定制化需求,这是政企行业的基本要求;再次是人工与智能的协作,这是当下每个人都面临的新变化;最后是持续的学习和优化,大模型落地不是一个项目,而是服务与运营。
浪潮云也摸索出三个解法,将其提炼为可信赖、易落地和可持续。
首先是可信赖,核心要解决的问题是本地化部署。政府有明确的“数据不出域”的边界,行业和企业也有“模糊的”数据不出域的边界。本地部署是行业大模型的必备条件,满足用户的底线要求。
其次是易落地。大模型企业要提供完整的产品矩阵。“算力一定是大模型厂商带着入场的。”颜亮说。数据治理能力是必不可少的。而大模型引擎是最基本的要求。要在行业里实现价值,要靠智能体工厂,这是一个面向行业的人工智能低代码开发平台。最终,做出的智能体要发布到商店里。
最后是可持续。“如果不可持续,得不偿失,因为我们去做一个大模型验证的试验环境,投入量级都是几百万元。”颜亮在大会上介绍说,我们建议“平台+服务”模式,购买MaaS服务。从持续性上看,核心问题是数据的持续供给,现在95%的政企客户,数据质量不高,要做数据治理。
浪潮云在这三方面已有明确布局。浪潮云已在120个城市部署了云中心。预计今年6月,基于浪潮政务云,会在90个城市部署大模型引擎和智能体平台,提供从底层分布式算力,到上层治理好的数据集,再到上面的海若大模型、智能体工厂和智能体商店,以及安全卫士的整个体系。
在这样的体系下,云上的政务客户,在一天内可以接入大模型,开箱即用。在云中心覆盖的城市,不能直接用政务云的非政务客户,浪潮云一周可以在云中心内为企业和行业做部署;如果是基于客户自有云中心或第三方云中心,部署周期为一个月。
04
大模型的“三位一体”创新生态
大模型带来了新的生态结构。颜亮告诉数智前线,这是一个“三位一体”的创新共同体,分别是算力层生态伙伴、行业数据层生态伙伴,以及智能体运用生态伙伴。
从算力角度讲,浪潮云自身有一定算力,但因为大模型下场会带来很大的算力消耗,所以各地建设的算力中心,包括政府平台公司建设的算力平台,都在浪潮云的生态伙伴范畴。
在智能体开发商伙伴方面,大模型也改变了传统的开发形态。软硬件厂商、端厂商会融合起来一同创新。比如在医院病历生成应用中,医生会挂采集端。“我们甚至有个想法,是把模型小型化之后,植入到采集端,突破效率、环境的局限性。这在发展之中。”颜亮说。
一位从华中地区赶来的制造行业服务商告诉数智前线,他感到,经过一年多的实践,浪潮云在政企市场的落地思路和实践打法已非常清晰,他期望加入到浪潮海若大模型的生态中,参与到当下行业大模型的落地热潮中。
榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。