亚马逊宣布推出Nova多模态AI模型系列

亚马逊的云计算部门亚马逊网络服务（AWS）在其 re:Invent 2024 大会上宣布了一个名为 Nova 的新的生成式人工智能多模态模型系列。该系列共有四种以文本为重点的模型（可接收文本、图像或视频并输出文本的模型）：Micro、Lite、Pro 和 Premier。

亚马逊首席执行官安迪-贾西（Andy Jassy）在台上说，Micro、Lite 和 Pro 目前已面向 AWS 客户提供，而 Premiere 将于 2025 年第一季度推出。

除此之外，还有一个图像生成模型 Nova Canas 和一个视频生成模型 Nova Reel。这两个模型目前都可以公开使用。

贾西说："我们正在继续研究我们自己的前沿模型，在过去的四五个月里，这些前沿模型取得了巨大进步。我们认为，如果我们发现了它们的价值，你们也可能会发现它们的价值。"

基于文本的 Nova 模型主要根据其功能和大小来区分。

Amazon Nova Micro - 纯文本模型，具有最低的延迟响应，上下文长度为 128K 标记。它还支持微调和模型提炼，以提高准确性。目前已全面上线。
Amazon Nova Lite - 一种成本极低的多模态模型，可处理图像、视频和文本输入，并生成文本输出。它支持长度达 300K 标记的输入，可在单次请求中分析图像或长达 30 分钟的视频。它还支持微调和模型提炼，以提高准确性。目前已全面上线。
Amazon Nova Pro - 高性能多模态模型，可处理多达 30 万个输入词元。这款新模型在关键基准上实现了最先进的性能。它支持 30 万个代币的输入上下文，可作为教师模型，用于提炼亚马逊 Nova Micro 和 Lite 的自定义变体。目前已全面上线。
Amazon Nova Premier - 亚马逊即将推出的用于复杂推理任务的能力最强的多模态模型，目前仍在培训中。预计将于 2025 年初全面上线。
Amazon Nova Canvas - 一种图像生成模型，可根据提示中提供的文本或图像创建图像。它还支持使用文本输入和用于调整配色方案和布局的控件编辑图像。目前已全面上线。
Amazon Nova Reel - 一种全新的先进视频生成模型，可根据文本和图像创建高质量的 6 秒视频。亚马逊将在 2025 年支持 2 分钟的视频。亚马逊 Nova Reel 将支持控制视觉风格和节奏的功能，包括使用文本提示控制摄像机运动。它已于今日全面上线。

Jassy 说："亚马逊正在开发语音到语音模型和"任意到任意"模型，应该会在 2025 年年中左右推出。您可以输入文本、语音、图像或视频，也可以输出文本、语音、图像和视频。"

对文章打分

亚马逊宣布推出Nova多模态AI模型系列

最新资讯

编辑精选

热门评论

相关文章

诞生了DeepSeek的中国AI生态为何与美国不同？

Monica：7天有200万人等候体验使用Manus AI Agent

DeepSeek带来的关键转折令春节后中国AI创企融资井喷

机场广告牌上女士有6根手指当事公司回应：系AI生成已更换

DeepSeek眼中不会被AI替代的职业：只有5个

西班牙将对未标注人工智能生成内容的行为处以巨额罚款

Top 10

亚洲最大露天煤矿百米厚煤层足足开采了118年古代植物咋都埋那了？

消息称中国开发出国产EUV工具挑战ASML的垄断地位

婉拒马斯克现在不回来特朗普阴阳滞留太空美宇航员：希望擦出爱的火花

亚洲最大露天煤矿百米厚煤层足足开采了118年古代植物咋都埋那了？

消息称中国开发出国产EUV工具挑战ASML的垄断地位

OpenAI发布最新论文：DeepSeek和Kimi发现了o1的秘密