零一万物回应大模型架构争议:对模型和训练的理解做了大量工作

2023年11月14日 16:44 次阅读 稿源:科创板日报 条评论

李开复旗下AI企业零一万物开源大模型被指责完全使用LLaMA的架构 ,只对两个张量(Tensor)名称进行修改。对此,零一万物表示:GPT是一个业内公认的成熟架构,Llama在GPT上做了总结。

零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。

相关文章:

李开复旗下AI公司“零一万物”开源Yi大模型被指抄袭LLaMA

对文章打分

零一万物回应大模型架构争议:对模型和训练的理解做了大量工作

1 (50%)
已有 条意见

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      Top 10

      招聘

      created by ceallan