首富从AI浪潮开始 第232节

  瑞恩心里一动,这个突然冒出来的TangYuan,和御风有关?他问道:“这是什么发布会?”

  御风现在是他的心头大患,任何和御风有关的消息都值得格外关注。Nexus AI的工程团队已经在格林威治时间4月1日0点实施了新的用户鉴权方案,按照计划,御风现在应该已经瘫痪了。

  “你自己看吧。”约翰示意他按下播放键。

  两人一坐一站、一前一后的看起了视频。

  很快瑞恩就看出,这是源码科技针对Nexus AI的断供事件进行的一场危机公关,而汤圆模型就是他们搬出来救场的关键。

  现在的问题是,这个模型究竟是真有这么强,还是这只是源码科技临时想出来的应急之策,公布一个假的高分模型,稳定用户,之后再想办法。

  如果汤圆是别家发布的,瑞恩自然百分之百认为是假的。

  可是看见韩路一,瑞恩又不敢确认了。毕竟这个神奇的中国CEO已经干出太多不可思议的成就了。

  但是,这个韩路一,他真能训练出这个级别的模型?在这么短的时间里?

  瑞恩轻轻地摇了摇头,他希望这不是真的。

  因为如果这是真的,那远比输给OpenAI还要可怕。

  “你验证过了吗?”瑞恩转头看向约翰。

  “还没有。”约翰回答道,“我也是刚看到,第一时间就发给你了。”

  瑞恩没有犹豫,第一时间关掉了浏览器,打开了自己电脑上的御风。

  看什么发布会、什么测评,都不如自己亲手试一下来得确定。

  事实上,为了评估Atlas和御风的差距,他自己本人就是御风的重度用户,他自信,如果能力退化,他可以第一时间判断出来。

  瑞恩依旧拿出他的专用测试项目,输入了一个很复杂的改动需求。

  御风开始拆解需求,等待的时间明显变长了,但是瑞恩不确定这种变长是由于模型的处理能力还是网络延迟引起的。毕竟如果他们的新模型部署在中国,通信本身就会造成很高的延迟。

  很快,御风接到了回应,开始工作了起来。

  很快,工作完成,一段对刚才改动的总结信息输出在屏幕上。

  瑞恩盯着屏幕,手指停在键盘上。

  他原本还准备输入第二个测试任务,但是过了很久,他都没有动。

  第一个测试任务的结果,已经足够说明问题了。

  能力没有退化,甚至更好了,好的很明显。

  在这一刻,瑞恩终于意识到,他的敌人不只是同在美国加州的谷歌和OpenAI,远在大洋彼岸,还有个更可怕的敌人,而那个敌人曾经离他那么近。

  他开始怀疑自己刚刚公布的用户限制政策是不是一个正确的决定了。

  “他们真的做出来了。”约翰在旁边轻声说道。

  曾经,御风发布的那个晚上,他们讨论御风的时候,唯一能带来安慰一句话是:“他们没有模型”。

  现在他们有了。

  更讽刺的是,从训练模型所需要的时间倒推,在瑞恩和约翰安慰自己的那个晚上,这个叫TangYuan的模型的训练已经接近尾声了,而他们当时一无所知。

  ……

  同一时间,旧金山市区,OpenAI办公室。

  发布会结束之后,员工们回到办公室办了一场小型的庆功会。山姆在知道Nexus AI的发布会计划之后,特意把发布会定到了对方发布会的两个小时之后。

  这样的安排果然形成了强烈的对比,OpenAI刚刚发布的两款新模型,对Nexus AI的挑战者地位进行了毁灭性的打击。

  员工们都很兴奋,这代表着他们还是AI这条路上走的最快最远的公司。

  庆功会走向尾声,员工们陆陆续续的离开了,很多人走之前会过来和山姆打声招呼,说声恭喜。

  山姆坐在角落的一个座位上,旁边是落地窗,从窗户望出去,可以看到海上的海湾大桥。

  夜色已经深了,海湾大桥亮起了冷白色的灯光。

  他对面坐着的是马库斯,一个他在Y Combinator时就认识的老朋友,也是OpenAI最早的机构投资人之一。

  桌上放着两杯鸡尾酒,已经快空了。

  马库斯刷着手机,突然,他的手指停了下来,安静的阅读了一会,然后他把手机转过来,让山姆看到。

  是X上有人发的一张第三方AI模型测评榜单的截图。

  榜单第一,TangYuan-0.9。

  “你听说过这家公司吗?“马库斯问道。

  “源智科技。“山姆把手机推回去,“源码科技关联的模型公司,韩路一做的。“

  马库斯挑了挑眉,没想到山姆这么快就说出了名字。

  “你在关注这个团队?”

  “刚才他们开庆功会的时候,我已经研究了两个小时了。”山姆把从桌上拿起自己那剩的半杯鸡尾酒,“你知道御风在开发者社区的口碑怎么样吗?”

  大家都在开庆功会的时候,你在研究远在中国的一个小公司?

  马库斯惊讶地看着山姆,没有回应他的问题。

  山姆等了一会,意识到马库斯没听到,于是他又问了一遍:“你知道,御风在开发者社区的口碑,怎么样吗?”

  马库斯想了想,然后摇了摇头,他最近已经不太投小公司了,甚至自己见创始人都少了,根本没有机会接触开发者。

  “我让团队做了一个调研,编程智能体这个赛道,御风现在在美国的渗透率和Atlas不相上下,而他们完全没有在美国做过任何宣发。”山姆看着马库斯说道,“你知道这意味着什么吗?”

  作为一个资深的投资人,马库斯当然知道。

  宣发不足,但是用量相似,这证明产品能力的大幅领先,使用户自发推荐所引发的自然增长达到了宣发的效果。

  “所以,”马库斯问道,“那个分数,你觉得是真的?”

  “真的也好,假的也罢。”山姆笑着说,“这其实不重要,今后大模型之间的竞争不是靠比榜单的排名。”

  说完,山姆站了起来,走到落地窗前,看着外面的夜景。

  “我更担心的是他们的应用能力。”

  马库斯也站起身,走到了山姆旁边。

  “你觉得,ChatGPT最大的护城河是什么?”山姆问道。

  “是模型能力?”

  山姆摇了摇头。

  “是用户量?”

  山姆又摇了摇头,说出了自己的答案:“是习惯。”

  “几亿人每天打开ChatGPT,不只是因为它是最聪明的模型,还是因为它是他们第一个学会用的AI。这个习惯一旦形成,很难被替换掉。”

  他顿了顿,语气变得低沉:“但是御风不一样,他切入的是一个完全不同的赛道,在我们瞄准普通用户的时候,他们瞄准的程序员。”

  马库斯微微皱起了眉头。

  “开发者把项目放进去,上下文、版本记录、工作流配置,全都在里面。你换一个工具,不只是换个聊天窗口,你要把整个工作环境都换了。”山姆转过头,看向马库斯,“这个迁移成本,比换掉ChatGPT高一个数量级。”

  “所以你担心的是锁定效应。”马库斯说。

  “不止。”山姆说,“这其实暴露了我们的一个问题,没有生产力工具,就没有强绑定。Codex的研发必须得加快进度了,我们至少要把对标御风的面向程序员的版本先放出来,不然迟早会输给他们。”

  “我会让团队一周内就把Codex预览版放出来,应对御风的冲击。”

  这些话,山姆只会给马库斯说,面对其他的投资人,面对手下的员工,他都没把这种危机感表现出来。

  马库斯看着自己的老朋友,他如今已经是科技界最有权势、最有影响力的人之一,可是面对挑战者的威胁,他也从不掉以轻心。

  “你觉得……他们有威胁?”马库斯问道。两人之前的聊天中,山姆一直把Nexus AI视为最大的威胁。

  山姆沉默了很久才开口。

  “今天以前,我还没听说过这个公司。”他说,“但是今天开始,他们是比Nexus更大的威胁。”

  马库斯也沉默了一会,然后缓缓举起手中的空杯,两人轻轻地碰了一下杯。

  “为了OpenAI。”马库斯说。

  “为了AGI。”山姆说。

  ……

  圣克拉拉,英伟达总部。

  英伟达的CEO詹森黄还坐在办公室里,这个时间办公楼里的人已经走得差不多了,但他的秘书知道,只要有事,他可以工作到任何时候。

  他的办公室里还坐着两个人。

  一个是负责数据中心业务的副总裁菲利普,另一个是战略研究部门的负责人特拉维斯。

  特拉维斯把一份刚整理出来的简报放到了詹森面前的桌上。

  “今天中国有一家叫源智科技的初创公司发布了一个大模型。”特拉维斯说,“叫TangYuan,0.9版本。发布的方式很低调,就是一场线上直播,没有专门的发布会,但是数据放出来之后,现在第三方榜单上排第一。”

  詹森没有去拿那份简报,他静静的坐在椅子上。

  TangYuan这个名字,对欧美人来说没什么意义,但是詹森知道那是什么,他小时候就爱吃,黑芝麻馅的、红豆馅的。

  没想到有人拿小吃来命名模型,真有意思。

  “他们的算力是哪儿来的?”詹森问出了他最关心的问题。

  榜单这种事情不重要,今天在硅谷,英伟达的两家客户刚打了一架,打的就是榜单排名。

  对英伟达来说,这种竞争是好事,只要他们用的都是英伟达的GPU。

  模型越大,竞争越激烈,算力需求就越高。

  不管最后是谁赢,都需要更多GPU,这是英伟达最喜欢看到的局面。

  但是一个从没听说过的中国公司突然发布一个大模型,能力还超过了OpenAI和Nexus AI的模型,那它背后肯定有一个巨大的训练集群。

  那这个集群有多少卡?什么型号?在哪里?谁提供的?

  最关键的是,有没有绕开英伟达的生态?

  这才是詹森真正需要知道的事情。

  菲利普接过了这个问题,他在来之前已经做过了功课。

  “从我们掌握的信息来看,他们采购的是中国另外一家初创企业刚刚量产的GPU,规格比我们的H100还要低,只买了五百张。”

  詹森原本靠在椅背上,听到这句话的时候,突然坐直了身子,动作大的吓了两个下属一跳。

  “不可能!”詹森脱口而出。

  才五百张?训练SOTA大模型?这不符合他的认知。

  “没有人能用这个规模训练超大模型。”詹森肯定地说。

  特拉维斯在旁边清了清嗓子。

  “我这边还有一些别的信息,是我从特殊渠道收集到的。”他说,“这个源智科技,应该用的是鼎盛的算力。”

  “鼎盛采购了多少?”詹森问道。

首节上一节232/248下一节尾节目录