梁文锋幻方创业往事

2025年02月07日 14:50 次阅读 稿源:石头学习笔记 条评论

最近,DeepSeek引发了全球范围内的关注。在整理英文相关的内容时,也想到了一些做记者时记录的幻方早期的笔记, 重新做了下梳理。虽然DeepSeek在英语语境里是一家“新公司” , 但在中国随着2018年前后,这家公司逐渐成为中国市场上拥有最多数量GPU的几家公司之一,幻方在AI领域的知名度逐步提高。

与过去十年,AI领域的诸多创业公司不同,这家公司一直相对低调,很少接受采访。少有的几次接受采访,也只是为了招聘更优秀的人才。


1、 中国量化基金开始被关注是从一个俄罗斯程序员一夜暴富传闻开始的

2014年开始,我开始关注和报道中国的AI创业公司。

2015年开始,一些中国的AI创业公司开始尝试将NLP、深度学习等技术应用在金融领域。当时,有2个事件,使得量化基金的概念在中国市场上开始受到关注。

第一个是政策,2015年4月,中证500股指期货上市,这被认为量化基金可以有更大发挥空间。第二个是传闻,当时中国A股有一个传闻,一个俄罗斯的高级程序员团队,在2014-2015年间,借助量化交易,仅用一两千万元本金,赚到了五六百亿。

DeepSeek的母公司幻方也是在当时成立的。

2015年,成立幻方的时候,梁文锋当时是看到了在美国,量化交易的日成交量已经占据金融市场的近八成份额;但中国刚刚起步。这其中,最主要的促成因素应该就包括了2015年4月,中证500股指期货上市。他预见,随着中国金融衍生品的日趋丰富,特别是股指期权和个股期权的上市,中国的量化交易将迎来一个快速发展的黄金时代。

成立幻方而不是继续做雅克比的原因是,他觉得当时中国量化交易将从“单兵游侠”的时代转向极客汇聚的私募基金时代。

给公司取名“幻方科技”,是因为“幻方”取自于中国古代洛书《九宫图》,是一种特殊的矩阵,是科学的结晶与吉祥的象征。

幻方早期成立的时候,作为创业公司,关注度其实是不高的。比如,也有过靠一夜成名一夜暴富的真实案例、美女HR同事照片、Herman Miller Embody豪华办公椅这样的故事,来吸引候选人,来招聘人才的阶段。

创始人当时能找到的宣传的点还不多,讲的公司的主要价值还是为市场贡献了超额的交易印花税。不过,“幻方”成立没多久就已经实现了每年交易流水股票数百亿,期货过万亿。即使如此,当时公司的公开信息里,梁文锋就提到了自己的理想是有朝一日能够与世界级的量化交易泰斗——西蒙斯的文艺复兴公司相媲美。 

这里还有一段和大疆创始人汪涛的交集。梁文锋创业做幻方前,大疆的创始人汪涛曾想招募梁文锋。主要也与梁文锋当时的研究方向相关。

1985年,梁文锋出生于广东湛江。2002年,17岁的梁文锋考入了浙江大学电子信息工程专业。2007年,22岁的梁文锋考上浙江大学信息与通信工程专业研究生。他师从项志宇,主要做机器视觉研究。梁文锋当时在读大学期间写了“ 一种鲁棒的PTZ摄像机目标跟踪算法” 相关的论文。

2、梁文锋个人很早就财富自由了

2015年幻方刚刚成立的时候,梁文锋就讲了自己的故事。

2008年,他带着8万元本金,开始了自己独立的量化交易之路。2015年,经历过7年熊市牛市大轮回,以每年超过100%的复合收益率迈入了亿元富豪的队伍。这亿元的财富全部来自于中国证券和期货市场,秘诀他自己独立开发出的量化交易系统。

梁文锋认为量化交易的特点注定了成功的量化交易者必须是一个高水平编程者。当时也分享了他的实现方法。最初他是通过数字图像处理的方法来截取行情软件中的数据,进而写外挂程序,破解交易软件接口,在国内量化交易还是荒蛮时代的2008年就挖掘到了自己的第一桶金。

2013年,28岁的梁文锋与同样来自浙江大学的同学徐进一起创办了杭州雅克比投资管理有限公司。到2015年,幻方成立时,他自己就宣称有过亿元的资产。

此后的幻方迎来了快速发展。2016年,管理的资金规模已经大约10亿元。2017年,达到30亿元。2019年,超过百亿元。巅峰期是2021年,规模达到1000亿人民币。但是,当年因为业绩不好,此后自己也在缩减规模。

在2019年前,幻方的手续费是很高的。业绩也很好。当时,梁文锋也对外讲过压力很大,因为“如果一年跑赢指数低于25%,投资人是不满意的。”

因为不是上市公司,幻方的收入不公开,但外界从可以查到的资产规模和产品收益来推测,幻方这几年的管理费在每年10亿左右,业绩提成好的年份可能在几十亿。近年来,幻方已经很少对外募资,基本都是自有资金。 

梁文锋和幻方也基本秉持着中国量化基金的传统,会定期做公益。据相关数据,2022年幻方量化共计向慈善机构捐赠2.2138亿元;梁文锋个人以“一只平凡的小猪”的名义向慈善机构捐赠1.38亿元。 

3、2018年后,梁文峰就是国内AI圈里的知名创业者 

幻方在AI上的投入,在2018年左右就在中国市场上被关注到,从18年开始,幻方一直是中国AI公司里GPU拥有量最高的几家公司之一。

2018年左右,幻方的GPU数量就已经达到千卡;2019年,梁文锋创办幻方AI公司,投资2亿元自主研发深度学习训练平台“萤火一号”,搭载了1100块GPU显卡;2020年,“萤火一号”投入使用。

幻方“萤火一号”超算占地面积相当于一个篮球场,功耗400KW,由一个存储集群和一个计算集群组成。存储集群提供每秒1.3亿次IO响应、4.1Tbps读写带宽以及1.2PB容量。计算集群搭载1100张高端显卡,每秒可以进行1.84亿亿次浮点运算(18.4PFLOPS, 32位精度),相当于4万台个人电脑算力。所有节点通过200Gbps Infiniband交换机进行互联。

传统AI集群的设计目标往往是支持多个小型模型同时进行训练,而“萤火一号”专门设计为训练一个超大规模的模型。一个4亿参数的大型经济分析模型,在幻方上一代高性能集群(4台DGX-2, 100G-IB互联)上训练需要2个月时间,而“萤火一号”仅需84小时。

2021年前后,幻方是国内为数不多的万卡集群的公司。一个说法是,幻方很可能与商汤是仅有的2家GPU过万的创业公司。另一个说法是,当时国内超过1万枚GPU的企业不超过5家,而且除了幻方之外,其他4家公司都是互联网大厂。2021年,幻方斥资10亿元建设“萤火二号”,当时采购的主要是英伟达A100显卡。

“萤火二号”规划中的AI算力为1550PFLOPS(TF32)。按照当时的预估,应该是当时全球算力最强大的AI超算之一。在2021年初的时候,已交付的AI算力为325PFLOPS(TF32),是“萤火一号”的18倍,性能上有质的飞跃。“萤火一号”当时也在拆解。后续卖卡,据说也没有亏损特别多钱。

事实上,2018年,梁文锋确立公司以AI为主要发展方向,幻方量化也遇到了算力瓶颈,日益增加的训练需求受限于有限的计算资源,梁文锋开始寻求大规模算力解决方案。2019年前后,幻方还成立过专门的团队做过AI NPU芯片的业务,当时的招聘薪资基本上是在杭州50-150万元级别。 

算力的需求大一个原因是业务需要。2016年10月21日,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行,使用GPU进行计算,在此之前,梁文锋团队的算法主要依靠线性模型和传统机器学习算法,模型计算主要依赖于CPU。2017年,幻方几乎所有的量化策略已经都采用AI模型计算。 

4、DeepSeek并不是幻方的第一次“第二曲线”尝试

事实上,除了NPU的业务,幻方在2020年前后,还尝试过几次不同的第二增长曲线业务。但最终都因为不达预期,最后放弃了。

2023年4月,幻方官方发表过文章 《幻方新征程》,提出要全力打造AGI。当时的宣传海报上,用的就是特吕弗的一句写给年轻导演的忠告,务必要疯狂地拥抱雄心,同时疯狂地真诚。 这句话的后面一句是“明天的电影将会片如其人。明天的电影将是一次爱的行动”。


2023年7月,梁文锋创办了杭州深度求索人工智能基础技术研究有限公司,就是DeepSeek。到11月时,发布了第一款模型,是一款名为Coder 的代码模型。12月,又发布了通用大语言模型:DeepSeek LLM 67B。

相比开源的同级别模型 LLaMA2 70B,DeepSeek LLM 67B 在近20个中英文的公开评测榜单上表现更佳。尤其突出的是推理、数学、编程等能力(如:HumanEval、MATH、CEval、CMMLU)。当时就选择了完全开源,在中国市场也引发了轰动。

DeepSeek在中国市场上第一次引起大范围关注是在2024年 5 月 6 日。当时,DeepSeek发布二代MoE大模型DeepSeek-V2,能力对标 GPT-4、llama 3-70B,定价为每百万 tokens 的输入和输出分别是1 元和2元,是GPT-4 Turbo价格的近百分之一,掀起了中国市场上的降价潮。字节、智谱、阿里、百度、讯飞、腾讯等也先后加入到降价浪潮中。到 5 月 22 日,ERNIE Speed、ERNIE Lite、讯飞星火 Lite、混元-lite 模型等均已实现限定条件下免费。 

事实上,Deepseek的创新能力一直很强。不同的是,Deepseek几乎从基础设施搭建,到底层硬件优化,到模型算法创新,一整个自己重做了一遍。 

在近期发布的V3的论文里,专门提出了一系列对硬件厂商设计下一代芯片的方案的建议。从零散的员工分享信息来看,目前他们应该也在做AI芯片。

5、梁文锋和他的联创们

DeepSeek所在的公司为杭州深度求索人工智能基础技术研究有限公司,由宁波程恩企业管理咨询有限公司持股99%,梁文锋持股1%。

股权穿透后,可以看到,公司主要有四位合伙人,分别是:梁文锋、郑达韡、陈哲、李欢。这也是梁文锋在浙大期间的同学。 


几位创始人都是同学,相互很熟悉很了解,早期加入的很多员工也都是同学或者低一两届的师弟师妹。其中,郑达韡和李欢负责人工智能,陈哲主要负责定价方面的事,就期权和债券,他曾在广发证券资管从事量化策略研究及投资工作。

郑达韡在加入幻方前身雅克比投资管理有限公司前,就有比较长时间的技术工作经验,2011年到2012年期间,也曾在盛大创新院做研究员。

另外,经常出现在公开报道的另一位高管是徐进。他是浙江大学竺可桢学院混合班,浙江大学信号与信息处理博士,博士期间主要研究方向为机器人自主导航、立体视觉、模式识别、路径规划及机器学习等。最早与梁文锋一起创办 了雅克比投资管理有限公司。2023年,因为出轨的绯闻事件,暂时被停职。

DeepSeek团队以90后、95后为主,喜欢“高潜力年轻人”。据报道,DeepSeek的员工规模不到140人。梁文锋曾在采访中表示,留住年轻人才的方法主要是“高薪”和“算力管够”两条路。 

一名曾与DeepSeek有过合作的猎头表示,DeepSeek非常偏爱没有工作经验的年轻人,而且指明不要资深人士,“工作经验在3~5年已经是最多的了,工作超8年的基本就pass了”。

有公开信息跟据领英网站检索样本整理,发现DeepSeek员工85%以上拥有硕士学位,40%以上有博士学位。团队成员平均年龄约为28岁,90后占比超75%,95后(1995年后出生)员工占比50%以上。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。使用教程

对文章打分

梁文锋幻方创业往事

1 (50%)
已有 条意见

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      Top 10

      招聘

      created by ceallan