开源化、多元化、商业化，谷歌杠上了大模型

2024/08/09 09:20 DoNews

　　撰文 | 曹双涛

　　编辑 | 杨博丞

　　在日前谷歌举办的2024年I/O Connect China谷歌开发者大会上，AI大模型多元化成为市场关注的焦点。

　　围绕APP软件开发，谷歌推出三种不同规格的Gemini模型。谷歌方面称，Gemini Nano是最高效的模型，适合处理设备端任务。

　　据悉，Gemini 1.5 Flash是谷歌迄今为止最快、最经济的模型，适合处理高容量任务。面对所有开发者开放的Gemini 1.5 Pro，支持200万token 上下文窗口。为减少算力消耗，Gemini 1.5 Pro和1.5 Flash均已上线上下文缓存功能。

　　考虑到开发者可能需要更大的灵活性和掌控力，谷歌推出Gemini姊妹大模型Gemma。新发布的Gemma2相较于Gemma，新增90亿和270亿参数两种规格。其中，270亿参数版本经过优化，同时支持Google Cloud上的单个英伟达GPU以及Vertex AI单个TPU运行。

　　目前Gemini相关大模型已集成到Android Studio、Chrome DevTools、Project IDX、Colab、VS Code、IntelliJ和 Firebase等开发工具中，可帮助开发者编写、调试、测试代码、生成文档、理解代码库等。

　　以Flutter为例，小米SU7配套应用就是基于Flutter所打造。在原有Flutter基础上，谷歌推出Flutter 3.24和 Dart 3.5。新版最大看点是“Flutter GPU”新API的早期预览版。如通过内置 Flutter SDK，开发者可使用Dart代码访问GPU，进而提高图像渲染能力。

　　为方便开发者使用，谷歌推出多个Package。如Flutter_Scene可将3D项目直接导入，进而提高游戏体验。

　　此外，谷歌也推出Android Studio ON IDX早期预览版，和原有Android Studi不同的是其支持在浏览器中完全运行。为保证借助AI构建应用的可靠性、合规性和安全性。谷歌推出包括如Firebase AI Monitoring 信息中心、Checks AI Safety等开发组件。

　　在AI大模型开源席卷全球下，谷歌推出开源大模型项目Project Oscar。但初始阶段，Project Oscar仅支持93000条代码提交以及2000名开发者Go编程语言项目。

　　围绕Web网站开发，随着Web GPU、WASM和Gemini内置到Chrome中，谷歌全新推出的Speculation Rules API可做到搜索即时导航，摆脱冗长页面加载。面向单页应用推出的View Transitions API，可提高页面过渡体验。二者结合，进而保证页面过渡的无缝衔接。

　　为保证Web开发者开发效率，谷歌顺势推出试和优化应用Chrome DevTools，其在开发者网站出现问题时会发出警告和错误提示。该应用已内置到Gemini中。

　　围绕下一代安卓原生应用开发，谷歌推出多款新产品。设备端AI模型Gemini Nano和系统服务AI Core;用于业务逻辑共享代码，适用于移动端、Web、服务器和桌面平台的Kotlin Multi Platform;并为DataStore、Room和ViewModel等多个Jetpack库添加Kotlin Multi platform支持。

　　测试平台Android Device Streaming，则联合小米、OPPO、一加、三星等手机厂商，方便开发者进行终端测试，现处于Beta阶段。Gemini in Android Studio纳入Android Studio稳定版，新增代码生成和代码转换功能，以及AI隐私设置控制数据分享功能。

　　围绕云业务，谷歌提出的云端新旅程具有五大特点：一是云上开发新范式，新推出的Vertex AI功能可实现上下文缓存和接地功能。二是自成体系的灵活扩展，新推出150多种模型，包括Gemini系列、Gemma开源模型、Anthropic Claude模型、Meta Llama模型和Hugging Face模型库。

　　三是打破壁垒的跨云之旅，新推出的优化PostgreSQL数据库和BigQuery Omni功能，支持跨云互联和联合查询以及多“云”协同。四是轻松实现强大功能，新推出的自动化与智能默认设置，搭建全套云基础设施只需45分钟，包括网络、身份验证和日志记录等。

　　五是AI智能助力，新推出的Gemini Code AssistIDE插件，提供代码生成、补全、解释和测试生成功能。Gemini in Databases则提供SQL生成和数据库操作智能化。

　　围绕开发者发布多款大模型，无疑彰显谷歌想要加速推进大模型商业化的决心。但目前谷歌的AI能力，尤其是输出和检索能力可能仍需提高。

　　今年6月份海外用户在询问谷歌“制作披萨使用多少胶水”问题时，谷歌AI搜索给出的答案为：据Business insider2024年5月的相关显示文章，谷歌Al搜索结果建议在披萨酱中加入1/8 杯，即2汤匙，白色无毒的胶水，以防止奶酪滑落。

　　文章作者KatieNotopoulos 表示，胶水没有明显改变酱汁的稠度，而披萨呈现出诱人的橙色。海外媒体The Verge验证后发现，该截图并非伪造。因披萨中不能加入任何胶水，该答案也引发海外用户对谷歌AI检索能力的质疑。

　　图源：The Verge

　　我们在对Gemini实测过程中发现，一方面Gemini文生图能力已被关闭，且Gemini暂时也不支持文生视频。另一方面，Gemini的逻辑推理、数学计算能力仍需提高。

　　图源：Gemini官网

　　我们将2024年高考数学真题给到Gemini且特意强调是多选题，三道题目正确答案分别为(BD)(ACD)(ABC)，但Gemini给出的答案分别是(AC)(AD)(AB)，虽说第10题和第11题Gemini的答案包括正确选项，但第9题却全部是错误选项。

　　图源：2024年高考数学真题

　　图源：Gemini官网

　　此外，随着谷歌大模型日益增多，正面临数据中心电力消耗产生的二氧化碳排放迅速增加的棘手问题。

　　谷歌相关环境报告指出，2023年仅谷歌数据中心电力消耗就增长17%，由电力消耗所产生的二氧化碳污染较2022年同期增长13%至1430万吨，大致相当于38家燃气发电厂每年可能排放的二氧化碳量。

　　不仅仅是谷歌，Microsoft2023财年的温室气体排放量比 2020年高出约30%。对于未来如何降低碳排放，谷歌相关报告指出，随着我们进一步将人工智能集成到我们的产品中，由于人工智能计算强度的增加导致的能源需求增加，以及与我们的技术基础设施投资预期增加相关的排放，减少排放可能具有挑战性。

　　按照当前AI大模型发展速度，未来对电力需求或将成倍增长。作为全球拥有最多数据中心的美国，引发当地民众对人工智能压倒电网的电力需求急剧上升的担忧，并可能使煤炭和天然气工厂的存在时间比其他方式更长。

　　商业化、输出质量稳定化、减碳化等各种问题的存在，即使对于谷歌这样的全球大厂短期内也难言轻松。

　　榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn（把#换成@）。

开源化谷歌大模型

分享到微博分享到微信

开源化、多元化、商业化，谷歌杠上了大模型

相关阅读

新动态

关注度

最话题