谷歌团队“今年很忙”。“好久没看到 Google 线下活动在国内有这样的影响力了。”8月7日至8日,谷歌在北京举办2024年Google开发者大会,一位参会者感慨,“每一个展台都是人满为患,主要还是AI相关。”
在生成式AI成为大势的当下,谷歌这场国内的大会也获得了比以往更多的关注度。在展示区,从设备端生成式AI、多模态搜索、生成式AI革新电子商务的展示到各种应用案例的展示,包括Gemma应用智能大黄、Polyverse的Gemini 1.5 Pro应用展示以及高尔夫陪练,每一个展台前都围满了人。
相比去年的开发者大会,今年的展区已经基本上都是生成式的内容,谈及这一点,谷歌大中华区总裁陈俊廷表示,“这确实是谷歌的一个重点,所有人核心的一个任务。”
“AI的题目很大,AI有时候并不是一个单一的全新工具,而是将原有的工具进化,所以我相信做游戏的、做应用的、包括你知道的成功的企业,他们现在的能力都进化了,把AI的能力都加进去了。”陈俊廷表示。
All in AI
在keynote演讲环节,从开发者的工具到安卓团队、云团队,所有演讲者提到的产品都是基于生成式AI的。
在开场演讲中,陈俊廷就提到了谷歌AI赋能的网易游戏营销,他提到,网易游戏在海外借助谷歌Cloud和Vertex AI平台,提升了广告文案创作效率,工作时间从原本一周缩减到了几个小时,每月可生成700多条定制化的文案。在演讲中,陈俊廷还提到了小米新一代旗舰设备将利用谷歌Cloud和Gemini,为海外用户带来更智能的体验。
陈俊廷在演讲上手机厂商在这一届开发者大会的存在感很强,OPPO出现在了大会上,软件工程事业部总裁唐凯来到了现场分享生成式 AI 为手机行业在全球市场带来的创新及 OPPO 在 AI手机领域的最新战略。
“作为一项革命性的技术,生成式 AI 对包括移动终端行业在内的各行各业都有着深远的影响。”唐凯提到,OPPO结合 Google Gemini 模型,在全球市场上推出了一系列创新的 AI 功能,包括AI录音摘要和AI工具箱。
其中,AI 录音摘要支持多说话人识别,能够自动识别并提取关键信息,智能地将冗长的会议内容整理成摘要,帮助用户快速捕捉并理解录音中的重点内容。AI 工具箱则集成了 AI 文章摘要、AI 文案生成和 AI 语音朗读三大功能,帮助用户高效阅读、产出创意文案。据介绍,这些工具都集成在 ColorOS 智能侧边栏中,用户可以随时轻松调用。
唐凯表示,这些 AI功能已经在全新的 ColorOS 14 上实现,并在海外发布的 OPPO Reno12 系列机型上落地。他提到,通过与谷歌等伙伴的合作,OPPO 正大力推动 AI 手机普及。
谷歌 Core ML 和谷歌 Cloud 工程副总裁Bill Jia在大会上表示,谷歌AI 正在助力 OEM 厂商打造更智能的设备。谷歌的测试平台Android Device Streaming,联合小米、OPPO、一加、三星等手机厂商,方便开发者进行终端测试,现处于Beta阶段。
一些初创公司也在大会上展示了一些落地的案例。专注于出海和游戏应用的初创公司Guru Network也正在将谷歌的模型Gemma2用于播客应用Castbox,用户不用收听整集播客,就能快速掌握内容要点。Polyverse 开发的 AI Mirror 应用,通过 Gemini 的多模态功能优化了广告素材分析、文案和创意生成,显著降低了内容创作的时间和成本。
谷歌“今年很忙”
“这里的团队今年很忙(The team here has had quite a busy year)。”谷歌Developer X 和开发者关系副总裁兼总经理 Jeanine Banks今年是第二年来中国这一大会,她在大会分享了谷歌三种不同规模的大模型和技术更新,可以满足不同开发者的需求。
在谷歌的大模型系列中,Gemini Nano是最高效的模型,可以直接在移动设备上运行,提供低延迟响应和数据隐私保护。Gemini 1.5 Flash是谷歌迄今为止最快、最经济的模型,适合处理高容量任务,提供100万token 上下文窗口。Gemini 1.5 Pro则支持200万token 上下文窗口,适合需要最高质量响应的复杂任务。
此外,为了满足开发者对灵活性和掌控力的需求,根据具体应用场景对 AI 进行微调、增强和接地,谷歌推出了与 Gemini 系列模型一脉相承的 Gemma 系列开放模型,并于近期正式发布了比第一代模型更强大、更高效的新一代 Gemma 2 模型 ,安全性也有了显著提高。
据介绍,Gemini 已集成到众多开发工具中,包括Android Studio、Chrome DevTools、Project IDX、Colab、VS Code、IntelliJ和 Firebase,可以帮助开发者编写、调试和测试代码,还可以生成文档、理解整个代码库等,成为开发助手。
在大会上,Jeanine Banks提到,小米汽车SU7配套应用是基于开发框架Flutter所打造。在原有Flutter基础上,谷歌推出Flutter 3.24和 Dart 3.5。新版最大看点是“Flutter GPU”新API的早期预览版。如通过内置 Flutter SDK,开发者可使用Dart代码访问GPU,进而提高图像渲染能力。
Android 开发技术推广部主管史婧羽在大会上分享了 Mobile 的最新动态,一些更新可以使得开发者利用Gemini构建下一代Android应用。比如,Gemini Nano可以在移动设备端运行,提供低延迟响应和数据隐私保护,例如在聊天应用中实现智能回复等功能,同时确保数据不会离开设备端。即使在没有蜂窝网络的情况下,Gemini Nano也能保证AI功能的可用性。
“这真是令人惊叹的一年,”在接受第一财经等媒体的采访时Jeanine Banks表示,“去年我在上海的时候接触了很多中国的初创企业,当时我的感觉是这些企业在尝试各种各样的事情,去做一些 AI 方面的探索。一年过去了,我们不只是看到现在有更多的一些AI模型的建构,新的AI应用的开发,我还看到了大家正在开发出更复杂更精妙的一些AI系统。”
在这些复杂的AI系统中,不是只有一个智能 Agent,而是有多个智能Agents,他们互相协同共同完成任务。“在一年之中就能够有这么多的变化,速度还是非常喜人的。”Jeanine Banks说,一年之后,她看到了非常多的机会,服务市场的愿望也更强烈。
同时Jeanine Banks观察到了第二个比较大的重心转移是,“以前大家非常多的重心是放在如何快速把更多的解决方案和应用交付给更多的用户,这一点当然还是重要的,但是现在大家也非常重视一点,就是当我们把AI的规模做大的同时,要达到合规,要履行负责任的AI的原则。”
陈俊廷认为,AI 推动的进步不仅限于尖端生产力,在促进文化传承与造福社会上,同样有无限可能。广西民族大学运用 Google 全球 AI 开源技术,保护和传承少数民族非物质文化遗产;在四川的高原牧场,西南民族大学借助 Google AI 开源技术,改善了当地牧民的生活;谷歌公益与欣欣教育基金会合作,通过 “编译梦想” 项目为 26 所偏远地区小学的 900 多名学生提供 AI 入门教育。
谈及谷歌未来的计划,Jeanine Banks认为,一方面是要坚持开源,帮助中国的开发人员更好出海,另一方面也会使用谷歌的技术专长,帮助出海的中国开发者、开发公司去面临复杂的海外业务,实现对海外不同市场的合规服务,进行产品的适配。