开源化、多元化、商业化,谷歌杠上了大模型
撰文 | 曹双涛
编辑 | 杨博丞
题图 | IC Photo
在日前谷歌举办的2024年I/O Connect China谷歌开发者大会上,AI大模型多元化成为市场关注的焦点。
围绕APP软件开发,谷歌推出三种不同规格的Gemini模型。谷歌方面称,Gemini Nano是最高效的模型,适合处理设备端任务。
据悉,Gemini 1.5 Flash是谷歌迄今为止最快、最经济的模型,适合处理高容量任务。面对所有开发者开放的Gemini 1.5 Pro,支持200万token 上下文窗口。为减少算力消耗,Gemini 1.5 Pro和1.5 Flash均已上线上下文缓存功能。
考虑到开发者可能需要更大的灵活性和掌控力,谷歌推出Gemini姊妹大模型Gemma。新发布的Gemma2相较于Gemma,新增90亿和270亿参数两种规格。其中,270亿参数版本经过优化,同时支持Google Cloud上的单个英伟达GPU以及Vertex AI单个TPU运行。
目前Gemini相关大模型已集成到Android Studio、Chrome DevTools、Project IDX、Colab、VS Code、IntelliJ和 Firebase等开发工具中,可帮助开发者编写、调试、测试代码、生成文档、理解代码库等。
以Flutter为例,小米SU7配套应用就是基于Flutter所打造。在原有Flutter基础上,谷歌推出Flutter 3.24和 Dart 3.5。新版最大看点是“Flutter GPU”新API的早期预览版。如通过内置 Flutter SDK,开发者可使用Dart代码访问GPU,进而提高图像渲染能力。
为方便开发者使用,谷歌推出多个Package。如Flutter_Scene可将3D项目直接导入,进而提高游戏体验。
此外,谷歌也推出Android Studio ON IDX早期预览版,和原有Android Studi不同的是其支持在浏览器中完全运行。为保证借助AI构建应用的可靠性、合规性和安全性。谷歌推出包括如Firebase AI Monitoring 信息中心、Checks AI Safety等开发组件。
在AI大模型开源席卷全球下,谷歌推出开源大模型项目Project Oscar。但初始阶段,Project Oscar仅支持93000条代码提交以及2000名开发者Go编程语言项目。
围绕Web网站开发,随着Web GPU、WASM和Gemini内置到Chrome中,谷歌全新推出的Speculation Rules API可做到搜索即时导航,摆脱冗长页面加载。面向单页应用推出的View Transitions API,可提高页面过渡体验。二者结合,进而保证页面过渡的无缝衔接。
为保证Web开发者开发效率,谷歌顺势推出试和优化应用Chrome DevTools,其在开发者网站出现问题时会发出警告和错误提示。该应用已内置到Gemini中。
围绕下一代安卓原生应用开发,谷歌推出多款新产品。设备端AI模型Gemini Nano和系统服务AI Core;用于业务逻辑共享代码,适用于移动端、Web、服务器和桌面平台的Kotlin Multi Platform;并为DataStore、Room和ViewModel等多个Jetpack库添加Kotlin Multi platform支持。
测试平台Android Device Streaming,则联合小米、OPPO、一加、三星等手机厂商,方便开发者进行终端测试,现处于Beta阶段。Gemini in Android Studio纳入Android Studio稳定版,新增代码生成和代码转换功能,以及AI隐私设置控制数据分享功能。
围绕云业务,谷歌提出的云端新旅程具有五大特点:一是云上开发新范式,新推出的Vertex AI功能可实现上下文缓存和接地功能。二是自成体系的灵活扩展,新推出150多种模型,包括Gemini系列、Gemma开源模型、Anthropic Claude模型、Meta Llama模型和Hugging Face模型库。
三是打破壁垒的跨云之旅,新推出的优化PostgreSQL数据库和BigQuery Omni功能,支持跨云互联和联合查询以及多“云”协同。四是轻松实现强大功能,新推出的自动化与智能默认设置,搭建全套云基础设施只需45分钟,包括网络、身份验证和日志记录等。
五是AI智能助力,新推出的Gemini Code AssistIDE插件,提供代码生成、补全、解释和测试生成功能。Gemini in Databases则提供SQL生成和数据库操作智能化。
围绕开发者发布多款大模型,无疑彰显谷歌想要加速推进大模型商业化的决心。但目前谷歌的AI能力,尤其是输出和检索能力可能仍需提高。
今年6月份海外用户在询问谷歌“制作披萨使用多少胶水”问题时,谷歌AI搜索给出的答案为:据Business insider2024年5月的相关显示文章,谷歌Al搜索结果建议在披萨酱中加入1/8 杯,即2汤匙,白色无毒的胶水,以防止奶酪滑落。
文章作者KatieNotopoulos 表示,胶水没有明显改变酱汁的稠度,而披萨呈现出诱人的橙色。海外媒体The Verge验证后发现,该截图并非伪造。因披萨中不能加入任何胶水,该答案也引发海外用户对谷歌AI检索能力的质疑。
图源:The Verge
图源:The Verge
我们在对Gemini实测过程中发现,一方面Gemini文生图能力已被关闭,且Gemini暂时也不支持文生视频。另一方面,Gemini的逻辑推理、数学计算能力仍需提高。
图源:Gemini官网
我们将2024年高考数学真题给到Gemini且特意强调是多选题,三道题目正确答案分别为(BD)(ACD)(ABC),但Gemini给出的答案分别是(AC)(AD)(AB),虽说第10题和第11题Gemini的答案包括正确选项,但第9题却全部是错误选项。
图源:2024年高考数学真题
图源:Gemini官网
此外,随着谷歌大模型日益增多,正面临数据中心电力消耗产生的二氧化碳排放迅速增加的棘手问题。
谷歌相关环境报告指出,2023年仅谷歌数据中心电力消耗就增长17%,由电力消耗所产生的二氧化碳污染较2022年同期增长13%至1430万吨,大致相当于38家燃气发电厂每年可能排放的二氧化碳量。
不仅仅是谷歌,Microsoft2023财年的温室气体排放量比 2020年高出约30%。对于未来如何降低碳排放,谷歌相关报告指出,随着我们进一步将人工智能集成到我们的产品中,由于人工智能计算强度的增加导致的能源需求增加,以及与我们的技术基础设施投资预期增加相关的排放,减少排放可能具有挑战性。
按照当前AI大模型发展速度,未来对电力需求或将成倍增长。作为全球拥有最多数据中心的美国,引发当地民众对人工智能压倒电网的电力需求急剧上升的担忧,并可能使煤炭和天然气工厂的存在时间比其他方式更长。
商业化、输出质量稳定化、减碳化等各种问题的存在,即使对于谷歌这样的全球大厂短期内也难言轻松。