AMD发布完全开源的3B语言模型"Instella"

2025年03月06日 13:18 次阅读 稿源:cnBeta.COM 条评论

AMD 今天宣布了 Radeon RX 9070 系列开源 Linux 驱动程序,同时宣布开源 Instella 作为其全新的完全开放式 3B 参数语言模型。AMD 宣称 Instella 代表着"完全开放的最先进的 30 亿参数语言模型 (LM)"。

这些模型是在 AMD Instinct MI300X GPU 上训练的,根据 AMD 公布的数据,其性能与 Llama 3.2 3B、Gemma-2 2B 和 Qwen 2.5 3B 等同类产品相比具有很强的竞争力。

image.webp

AMD的Instella模型是在Instinct MI300X硬件上从头开始训练的,并且完全开源:

"完全开放、可访问:

...

通过完全开源Instella模型,包括权重、训练超参数、数据集和代码,我们旨在促进人工智能社区内的创新与合作。 我们相信,透明度、可重复性和可访问性是人工智能研究与开发取得进展的关键驱动力。 我们邀请开发人员、研究人员和人工智能爱好者探索 Instella,为其不断改进献计献策,并与我们一起推动语言模型的发展。"

想要了解有关 AMD Instella 语言模型的更多信息,请访问 rocm.blogs.amd.com 。 AMD Instella 托管于GitHub

对文章打分

AMD发布完全开源的3B语言模型"Instella"

1 (50%)
已有 条意见

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      Top 10

      招聘

      created by ceallan