OpenAI向开发者开放语音AI引擎

OpenAI 正在向其他开发人员开放其语音AI引擎，该引擎为 ChatGPT 的高级语音模式提供支持。开发人员将能够实时访问这项技术，AI 可以理解语音命令，并在类似通话的现场场景中进行语音交谈。该过程之前要求开发人员至少经历三个步骤：首先转录音频，然后运行生成的文本模型来得出查询的答案，最后使用单独的文本转语音模型。

此举为提供对话式语音界面的人工智能应用浪潮铺平了道路。

新的语音转语音功能是 OpenAI 在周二旧金山举行的 DevDay 活动上发布的几个公告之一。

该功能的早期测试者包括营养和健身应用程序 Healthify 和语言学习应用程序 Speak。

向开发人员提供的其他新功能包括基于图片微调模型的能力。

在为记者进行的演示中，OpenAI 高管展示了新的音频功能与 Twilio 的 API 相结合的示例，该功能允许 AI 助手致电虚构的糖果店并订购 400 个巧克力草莓。

在工具的定制演示中，有一个例子是与人工智能系统对话，帮助寻找本地产品，比如草莓。然后，人工智能会打电话给商家订购草莓，并接受用户关于订购数量和期望花费的指示。

OpenAI 表示，任何使用此类技术的人都不得隐瞒它是人工智能而非人类，而且只向开发人员提供六种预设，而不是创建新的声音。

开发人员只能使用 OpenAI 提供的声音——与 ChatGPT 中的选项相同。

虽然声音不会以任何方式被加水印，开发人员也不必让人工智能系统识别自己，但 OpenAI 表示，使用其系统发送垃圾邮件或误导人们违反了公司的服务条款。

这些公告是在围绕 ChatGPT 制造商的一系列新闻中发布的，包括其正在进行的大规模融资活动以及上周首席技术官 Mira Murati和另外两名高管的离职。

对文章打分

OpenAI向开发者开放语音AI引擎

最新资讯

编辑精选

热门评论

相关文章

OpenAI开发者大会派礼包：大幅降低模型成本 AI语音加持App

研究发现AI编程助手无法提高工作效率或防止职业倦怠

孙正义向OpenAI投资5亿美元估值1500亿美元

OpenAI重组成营利性公司：怎么做？有多难？

软银愿景基金投资5亿美元于OpenAI最新融资

Top 10

孙凝晖院士：华为搞封闭垄断，难以对抗西方

小米澎湃OS国际版也开始限制解锁BL 不少国外网友抱怨无法解锁

厄瓜多尔不断增长的养虾业让沿海生态系统付出了代价

用了这台泰国版的Pura 70 我怀疑华为有事瞒着我们

一种日本植物入侵美国本土后当地房价暴跌在中国却是一道美味

国内唯一一台上牌的特斯拉Cybertruck皮卡现身广东不锈钢车身被改成黑色