2023/10/17 14:41 DoNews
近两三个月出现各种AI Agent项目,谷歌Deepmind推出了robotic agent,利用机械臂自动执行各种工作;亚马逊推出了Amazon Bedrock Agents,可以自动分解企业AI应用开发任务;AI独角兽Inflection也在开发私人AI助理,可以帮助你完成订酒店等私人任务;哥伦比亚大学最近也公布了用于科研的AI Agent项目GPT Researcher。
有人说,至少有100个项目正致力于将AI代理商业化,近10万名开发人员正在构建自主Agent。这一轮的热潮离不开OpenAI,有两位关键人物发挥了重要作用。
简单说,AI聊天机器人主要靠“说”来回答你的问题,而AI Agent则会“动”起来完成具体的任务,就像人类助理一样,在你忙不过来的时候替你完成一些工作,区别就是用AI来驱动而不是人脑驱动。
在国内,虽然AutoGPT早在4月份就与国外同步火了,但限于大部分人对其背后的AI Agent缺少了解,开始的反响并不是太热烈。直到7月初OpenAI应用人工智能研究负责人Lilian Weng那篇关于AI Agent的博文刷爆AI圈后,媒体圈、学研界、投资领域才真正开始热烈讨论AI Agent。
由此国内真正开启了探索与研究AI Agent的热潮,并且也有一些厂商开始以AI Agent模式重构产品架构与商业模式。随着AI Agent原理、模式以及构建方式越发明朗,很多受困于技术、模式、生态乃至政策的创业者都是眼前一亮。
国内已推出的AI Agent
(内容引用自:王吉伟)
经过持续探索与尝试,国内AI智能体相关的产品也开始崭露头角,下面介绍五款产品。
1、阿里云ModelScopeGPT
阿里云Mota社区推出的国内首个大型模型调用工具魔搭GPT(ModelScopeGPT),通过这一款工具,使用者们可以通过一键发送指令调用Mota社区中的其他人工智能模型,从而实现大大小小的模型共同协作,进而完成复杂的任务。
ModelScopeGPT基于开源大语言模型(LLM)的AI Agent(智能体)开发框架ModelScope-Agent。这是一个通用的、可定制的Agent框架,用于实际应用程序,其基于开源的大语言模型 (LLMs) 作为核心,包含记忆控制、工具使用等模块。
开源 LLM 主要负责任务规划、调度以及回复生成;记忆控制模块,主要包含知识检索以及 prompt (提示词)管理;工具使用模块,包含工具库以及工具检索和工具可定制化。
2、实在智能TARS-RPA-Agent
实在智能在超自动化领域首发的TARS-RPA-Agent,是一个基于“TARS+ISSUT(智能屏幕语义理解)”双模引擎、有“大脑”,更有“眼睛和手脚”的超自动化智能体,是能够自主拆解任务、感知当前环境、执行并且反馈、记忆历史经验的RPA全新模式产品。
TARS-RPA-Agent采用以TARS大模型和ISSUT智能屏幕语义理解为基座的技术框架。该技术框架分为两层结构:底层是包括通用基础模型和各个垂直行业基础模型在内的TARS系列大模型和智能屏幕语义理解技术;上层是依托这两项关键技术完成全面升级和改造的超自动化产品。
TARS-RPA-Agent的核心LLM是实在智能基于通用大模型基座的自研垂直“塔斯(TARS)”大模型,TARS大模型具备优异的文本生成、语言理解、知识问答、逻辑推理等主流能力。
3、OmBot欧姆智能体
2023 世界人工智能大会上,联汇科技发布了基于大模型能力的自主智能体(Auto AI Agent )——OmBot 欧姆智能体,并针对典型场景需求推出了首批应用。
联汇自主智能体包含了认知、记忆、思考、行动四大核心能力,作为一种自动、自主的智能体,它以最简单的形式中在循环中运行,每次迭代时,它们都会生成自我导向的指令和操作。因此,它不依赖人类来指导命令,具备高度可扩展性。
4、澜码科技Ask XBot
澜码科技构建的Agent平台“Ask XBot”,平台分两层:第一层是专家赋能,专家通过拖、拉、拽以及对话交互的方式定义工作流程,教给机器,从而协助一线员工构建更高效工作的方法论;第二层是员工使用Agent,一线员工可以通过自然语言和Agent沟通并下达指令,让Agent协助完成数据分析、资料调取等工作。
该公司计划将Ask XBo打造成一个兼具通用性和易用性的平台,把这些API和Agent做好管理,让Agent包装不同的API,不同模型的Agent能够在上面更好地协作,让它们可以在平台上更有效率、更智能地服务好客户。
5、ChatDev
由清华大学、北京邮电大学、布朗大学联合研究团队推出的ChatDev,是一个生成式智能体。它基于聊天的端到端软件开发框架,能够利用大型语言模型(LLMs)促进软件开发过程中多角色(ChatGPT 的 “gpt3.5-turbo-16k” 版本)之间的有效沟通和协作。
ChatDev的主要目的是通过聊天来进行游戏开发。用户只需提出想法,从设计到测试的整个流程都由AI完成,整个过程只需七分钟即可完成。
AI Agent不仅让大家看到了大语言模型(LLM,Large language Model)落地的方向,让更多创业者进一步燃起了LLM创业的希望,也让广大企业看到了高效应用LLM的未来趋势。
榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。