2024/07/14 18:56 IT产业网
2024年7月14日,第二十六届中国北京国际科技产业博览会(简称 “北京科博会”)在北京国家会议中心举行,由北京市政府主办。本届科博会首次推出“未来产业”系列推介发布活动,汇聚了中国联通研究院、北京智源人工智能研究院、北京工业大学北京人工智能研究院等知名科研院所,以及IBM、高通、诺基亚贝尔等全球科技企业,共同分享对未来产业新技术、新产品、新模式等创新应用的见解和展望。
高通公司中国区研发负责人徐晧在该活动中发表了题为《让智能计算无处不在 加速开启数字化未来》的演讲。他阐述了人工智能(AI)在无线通信领域,尤其是在5G和6G技术演进中的关键作用。徐晧还探讨了如何运用模型量化和压缩技术将大规模AI模型应用于手机等终端设备,并对AI在机器人等领域的应用前景进行了展望。
高通公司中国区研发负责人徐晧在2024年北京科博会“未来产业”系列推介发布活动上发言
以下为演讲实录:
很高兴有机会与大家分享高通关于人工智能方面的规划和布局。我们正处于一个技术创新的时代,作为一个系统开发者,我深感幸运,因为众多技术方向都涌现出了大量创新。
在此,我想简要介绍几个方向以及我们正在推进的技术项目。首先,关于5G到6G的发展演进。今年标志着中国商用的第五年。业界普遍认为,中国已成为全球5G商用的领跑者。我们欣喜地看到,从5G-A到6G在中国正稳步推进。从人工智能(AI)的角度来看,当前最显著的趋势是生成式AI的广泛应用,涌现出诸多创新,例如ChatGPT和Stable Diffusion等大模型。这些模型会首先在云端上得到应用,接下来,我们将探讨如何更有效地将这些大型语言模型集成到终端设备中。此外,除了智能手机,我们还在不断探索将人工智能扩展到其他终端形态,如AI PC、机器人和XR(扩展现实)等。另一个值得关注的终端形态是软件定义的汽车。中国在电动汽车领域同样取得了全球领先的出口量,这为技术创新提供了广阔的空间。最后,空间计算是一个新兴领域,它预示着从2D到3D交互形式的转变。未来,我们可以期待通过XR头显等设备获得更加沉浸式的体验,并采用更先进的交互方式,如语音交互和手势识别等。
首先,让我们探讨人工智能与无线通信的紧密结合。在从5G到6G的技术演进中,除了传统的编码和调制解调技术,一个重要的新方向是如何将人工智能应用于无线通信。虽然无线通信已有几十年的历史,拥有成熟的解决方案,但仍存在一些挑战,这正是人工智能可以发挥作用的领域。我们将从网络和终端两个层面,全面探讨AI对无线通信的影响。
将AI应用于无线通信网络可以分为三个阶段:第一阶段,在现有的无线通信系统中引入AI,替代某些模块。例如,探索使用AI进行信号处理与传统方法相比有何不同。第二阶段,实现跨节点的AI应用,即如何让手机与网络之间,以及不同厂商的基站与手机之间,通过AI实现顺畅的交流。这是当前5G-A阶段关注的重点问题。第三阶段,期望在6G时代,网络在设计之初就融入AI的原生应用。
在端到端系统中,我们从网络训练到终端设备(如手机、电脑、机器人、汽车等)的应用,都需要考虑AI的整合。最近,我们与诺基亚合作进行了互操作性测试,旨在验证网络端和终端各自采用的AI算法如何协同工作。我们发现,只需交换训练数据,而不必支持模型共享,双方就能独立训练并实现良好协作。这一发现为AI在无线通信领域的推广提供了有力证据。同时,我们还证明了不同手机采用不同训练方式时,都能通过AI与基站实现顺畅连接。这表明AI为无线通信带来了全新的可能性。
接下来,我们将探讨近年来在AI领域实现终端侧生成式AI的关键技术方向。首先,我们需要了解大语言模型通常拥有从十几亿到百亿乃至千亿级别的参数。如何将如此庞大的模型成功部署至终端设备,是一个至关重要的问题。其中一个解决方案是通过模型量化和压缩技术,将大型模型进行有效缩减,使其能够在手机等实际终端设备上正常运行。
第二点是预测性解码,即利用小型模型提供高效的多个解码结果的猜测(Token),然后使用大语言模型一次多个token,从而快速提供解码结果。
另一个方向是模仿学习思路,即将大型模型的知识迁移至小型模型。这类似于让小型模型(学生)学习大型模型(老师)的行为。在终端或手机上运行的小型模型会根据大型模型的输入输出进行学习,不断模仿老师的操作。未来,我们将在手机上看到一个不断学习、模仿老师模型的学生模型。
第四点是高效的图像和视频处理框架架构,以及异构计算技术,这些技术专业性较强,这里不再详细解释。
通过上述技术,我们可以将原始的大型模型大幅度压缩,并使其在实际应用中保持高效运行。正如我们所见(见下图),老师模型可能包含16个浮点运算,我们可以将其输入输出用于教导学生模型。这样一来,学生模型便可以在手机上运行,这种方式被称为知识提炼,它允许我们在手机上运行小型模型,同时每隔一段时间使用大型模型对小型模型生成的结果进行验证和调整,从而使大型模型的知识和性能得以在小型终端模型上得到有效利用。
另一个关键技术是Orchestrator规划器系统,它实际上是当前 AI Agent底层支持的重要组成部分。我们的目标是使手机不仅仅能够回答问题或讲笑话,而是能够根据用户的想法去规划一整套复杂的任务。这意味着AI Agent不仅仅是调用一两个程序,而是能够调用手机上任何一个应用程序。例如,如果你想要从北京规划一次前往新疆的旅行,AI Agent可以根据你的日历确定空闲时间,然后为你规划最合适的行程,包括提供酒店信息。目前我们的手机还无法实现这样的功能,但如果有一个AI Agent或具体化的AI操作,它能够调用不同的应用程序,了解你的喜好,掌握酒店和航班的最新情况,就能够完成这些任务。在这个体系中,上层是一个应用程序,即AI Agent,而下层则是Orchestrator规划器系统,负责调动所有资源。这是我们目前正在布局的一个新的发展方向。
另一个重要的人工智能应用领域是在机器人技术中。例如,在计算机视觉方面,机器人可以利用多种算法。借助大语音模型和AI,机器人实际上可以理解人类的需求和情感,从而执行一系列复杂的操作。例如,机器人可以根据你的需求在货架上选择你需要的物品,并将其递给你。
举一个最近的演示例子,我们将大模型集成到了最新的高通骁龙支持的AI PC上。这台AI PC能够理解用户的需求,生成相应的指令,驱动机器人执行明确的匹配任务,并指挥机器人完成各种操作。例如,我们能够与机器人进行对话。在聊天过程中,如果对机器人表示口渴,询问有什么饮料可选,机器人会查看吧台上的饮料,如水、可乐等,并询问你想要哪一种。当你选择要一杯水时,机器人会自动操作,走到吧台,通过人工智能识别并取回矿泉水,递给用户。这样的用例已经是我们目前能够实现的。
在未来五年内,我们将看到越来越多这样的AI在终端设备上的应用,包括在无线技术方面的应用。我们非常期待在技术创新中,与国内合作伙伴进行更多合作,共同推进人工智能的技术能力演进。谢谢。
榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。