Mistral 发布首款多模态模型 Pixtral 12B

法国人工智能初创公司Mistral发布了首款可处理图像和文本的模型。该模型名为 Pixtral 12B，拥有 120 亿个参数，大小约为 24GB。参数大致相当于模型解决问题的能力，参数越多的模型通常比参数越少的模型性能越好。

图片.png

新模型建立在 Mistral 的文本模型 Nemo 12B 上，可以回答关于任意数量、任意大小的图片的问题，这些图片可以是图片 URL，也可以是使用二进制文本编码方案 base64 编码的图片。与 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4o 等其他多模态模型类似，Pixtral 12B 至少在理论上可以完成为图片添加标题和计算照片中物体数量等任务。

Pixtral 12B 可通过GitHub和人工智能与机器学习开发平台Hugging Face 上的 torrent 链接下载、微调，并根据 Mistral 的标准许可使用。

遗憾的是，在本文发表时，还没有任何可用的网络演示。Mistral 开发者关系主管 Sophia Yang 在 X 上发表文章称，Pixtral 12B 将很快在 Mistral 的聊天机器人和 API 服务平台 Le Chat 和 Le Platforme 上进行测试。

目前还不清楚 Mistral 可能使用了哪些图像数据来开发 Pixtral 12B。

Pixtral 120 亿美元的融资是在 Mistral 获得由 General Catalyst 领投的 6.45 亿美元融资之后进行的，该轮融资使该公司估值达到 60 亿美元。刚刚成立一年多的 Mistral 被人工智能界的许多人视为欧洲对 OpenAI 的回应。迄今为止，这家年轻公司的战略包括发布免费的"开放"模型，对这些模型的托管版本收费，以及为企业客户提供咨询服务。

对文章打分

Mistral 发布首款多模态模型 Pixtral 12B

最新资讯

编辑精选

热门评论

相关文章

DeepSeek眼中不会被AI替代的职业：只有5个

西班牙将对未标注人工智能生成内容的行为处以巨额罚款

经济学人：DeepSeek一场春雨，中国人工智能百花齐放

OpenAI称已训练出“非常擅长创造性写作”的AI

2025年将是智能体爆发年？OpenAI全新开发工具上线

新研究发现人工智能搜索工具的平均准确率仅为60%

Top 10

亚洲最大露天煤矿百米厚煤层足足开采了118年古代植物咋都埋那了？

消息称中国开发出国产EUV工具挑战ASML的垄断地位

婉拒马斯克现在不回来特朗普阴阳滞留太空美宇航员：希望擦出爱的火花

亚洲最大露天煤矿百米厚煤层足足开采了118年古代植物咋都埋那了？

消息称中国开发出国产EUV工具挑战ASML的垄断地位

OpenAI发布最新论文：DeepSeek和Kimi发现了o1的秘密