DeepSeek多模态Janus-Pro-7B模型发布并开源击败OpenAl DALL-E3

2025年01月28日 08:51 次阅读稿源：新浪科技条评论

深度求索（DeepSeek）创始人梁文锋深夜发文官宣，DeepSeek刚刚发布并开源了一款名为Janus-Pro-7B的多模态AI模型，可以生成图像。据梁文锋介绍，在 GenEval和DPG-Bench基准测试中，Janus-Pro-7B击败了OpenAI的DALL-E3和Stable Diffusion。”

就在今日凌晨，DeepSeek工程师们已经在Hugging Face平台上传了Janus Pro 7B和1.5B模型。这俩模型是去年DeepSeek 10月发布的Janus模型升级版。

据DeepSeek介绍，Janus-Pro是一个新颖的自回归框架，统一了多模态理解和生成。Janus-Pro 是基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 模型构建的。

在多模态理解任务中，Janus-Pro 采用 SigLIP-L 作为视觉编码器，支持 384 x 384 像素的图像输入。而在图像生成任务中，Janus-Pro 使用一个来自特定来源的分词器，降采样率为 16。

对文章打分

DeepSeek多模态Janus-Pro-7B模型发布并开源击败OpenAl DALL-E3

3 (60%)

2 (40%)

已有条意见

编辑精选

加载中...

Top 10

本周本月

招聘

DeepSeek多模态Janus-Pro-7B模型发布并开源击败OpenAl DALL-E3

对文章打分

DeepSeek多模态Janus-Pro-7B模型发布并开源击败OpenAl DALL-E3

最新资讯

编辑精选

热门评论

相关文章

Mistral发布AI模型Mistral Medium 3 平衡效率与性能

OpenAI计划将“星门”AI项目扩展到美国以外

DeepSeek致谢腾讯技术团队：对DeepEP的优化是一次“huge speedup”代码贡献

AI伴侣：是心灵避风港，还是新型精神依赖？

OpenAI重组伤及微软软银？非营利架构成上市"紧箍咒"

英伟达CEO黄仁勋：不会使用人工智能的人将失业

Top 10

传小米正与步步高集团合作开发不集成Google Play的HyperOS 3以应对不测

华为384颗自研芯片方案揭秘领先英伟达AMD一代

雷军曾看好的国产导航之光，为何沦为资本弃子？

这种“厨房纸”真的别再拿来直接接触食物了

五一假期来了下下周上4休5

爆火的新物种：为了偷食时不被发现它们全身“戴满”其它动物遗骸

对文章打分

DeepSeek多模态Janus-Pro-7B模型发布并开源 击败OpenAl DALL-E3

最新资讯

编辑精选

热门评论

相关文章

Top 10

DeepSeek多模态Janus-Pro-7B模型发布并开源击败OpenAl DALL-E3