微软发布全新多模态人工智能小语种模型Phi-3-vision

今年 4 月，微软首次发布了新的Phi-3 系列人工智能小语言模型（SML）。这些模型旨在设备上运行，而不是在云服务器上运行。今天，作为Build 2024的一部分，微软又发布了另一款Phi-3模型，其主题有所不同。

新模型名为 Phi-3-vision，顾名思义，这种 SML 不仅可以处理文本提示，还可以接受图像和文本提示来生成问题答案。微软表示，使用这种模式的人可以获得有关他们提交的图表的问题答案，也可以就 Phi-3-vision 模式接收到的图像提出任何开放式问题。

Phi-3-vision 包括 42 亿个参数，比 38 亿个参数的 Phi-3 迷你模式大，但比 70 亿个参数的 Phi-3 小型模式和 140 亿个参数的 Phi-3 中型模式小得多。微软表示，Phi-3-vision 可以回答有关"一般视觉推理任务以及图表、图形和表格推理"的问题。

新的Phi-3-vision模型目前是预览版，但还不知道何时会全面上市。不过，Phi-3 Mini、Phi-3 Small 和 Phi-3 Medium 现在都可以通过微软的 Azure AI 模型即服务进行访问。

在 Build 2024 的相关新闻中，微软表示 Azure AI Studio 现已全面可用。该公司表示：

pro-code 平台支持负责任的生成式人工智能开发，包括开发协同驾驶员，以支持复杂的应用程序和任务，如内容生成、数据分析、项目管理、日常任务自动化等。

该公司表示，Azure AI Studio 支持"代码优先"功能和"友好的用户界面"，因此开发人员可以选择如何在自己的编码项目中使用这些工具。

微软还宣布，OpenAI 的最新大型语言模型ChatGPT-4o 现在可以通过 Azure AI Studio 和 API 普遍使用。

最新资讯