英伟达推全新视觉语音模型NVEagle 可以看图聊天

2024年09月02日 15:27 次阅读稿源：Pingwest品玩条评论

英伟达联合 Georgia Tech、UMD 和 HKPU 的研究团队推出了全新的视觉语言模型 ——NVEagle。据悉，NVEagle 能够理解复杂的现实场景，通过视觉输入进行更好的解读和回应。

它的设计核心在于将图像转化为视觉标记，再与文本嵌入相结合，进而提升了对视觉信息的理解。NVEagle包括了三个版本:Eagle-X5-7B、Eagle-X5-13B 以及 Eagle-X5-13B-Chat。其中，7B 和13B 版本主要用于一般的视觉语言任务，而13B-Chat 版本则专门针对对话式 AI 进行了微调，能够更好地进行基于视觉输入的互动。

NVEagle 的一个亮点在于采用了混合专家（MoE）机制，能够根据不同任务动态选择最合适的视觉编码器，这极大提升了对复杂视觉信息的处理能力。该模型已在 Hugging Face 上发布，方便研究人员和开发者使用。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道，更好阅读体验，更及时更新提醒，欢迎前来阅览和打赏。

对文章打分

英伟达推全新视觉语音模型NVEagle 可以看图聊天

2 (67%)

1 (33%)

已有条意见

编辑精选

加载中...

Top 10

本周本月

1
中国最大沙漠被围起来了

阅读 (3647) 评论 (3)
2
100%国产的麒麟9020和世界最高水平差距还有多大？

阅读 (3610) 评论 (7)
3
解决方案在技术上过于落后中国企业仍然不愿采用国产芯片

阅读 (1860) 评论 (6)
4Linus Torvalds：AMD/英特尔的x86微架构级别是"完全崩溃的垃圾"
5iOS 18.2即将发布大量AI功能值得关注
6贾跃亭又卖一台国际超模喜提FF 91
7《消费者报告》最新全球汽车可靠性排行榜头名易主
8微信查删单向好友功能上线周鸿祎点赞马化腾
9全球最热销iPhone、Android手机是哪些？两大机构数据差异不小
10成为最大二手交易网站后闲鱼卖家的路子越来越野

招聘

英伟达推全新视觉语音模型NVEagle 可以看图聊天

对文章打分

英伟达推全新视觉语音模型NVEagle 可以看图聊天

最新资讯

编辑精选

热门评论

相关文章

英伟达中国：断供传闻不实中国是重要市场

英伟达在华员工将增至4000 大力推进自动驾驶技术研究

传英伟达下架天猫官方旗舰店所有商品客服：仅展示不出售任何产品或服务

英伟达天猫官方旗舰店所有商品突然下架

法院裁定NVIDIA必须面对指控其淡化加密货币对其成功影响的诉讼

RTX 5080爆料汇总：有24G版本性能提升10%

Top 10

中国最大沙漠被围起来了

100%国产的麒麟9020和世界最高水平差距还有多大？

解决方案在技术上过于落后中国企业仍然不愿采用国产芯片

中芯国际将继续采用7纳米光刻技术至少到2026年尽管政府的预算几乎无上限

微软：今天起中国区Windows可以直接运行安卓手机App了

幽灵巨狮吃掉35名工人 126年后人们从它的牙缝毛发中发现一份惊人食谱