首富从AI浪潮开始 第138节

  橙红色几乎消失了,只剩下零星几个边界条件外的数据在蓝色的水流里若隐若现。那些暗蓝色的误杀数据也大幅减少,偶尔闪过一两条,韩路一记下来,又微调了一轮参数。

  第三轮跑完,视界里只剩下干净的蓝色。

  关掉视界的时候,已经凌晨两点了。

  他靠在椅背上,看着最终的清洗报告。

  原始数据的有效留存率从赵文渊之前标注的41%降到了29%但这29%是真干净的。同时误杀率从12%降到了不到3%,被之前的管线错杀的好数据也救回来了一批。

  清洗质量提升的同时,处理速度也快了不少,时间大概只有之前的一半。

  韩路一给赵文渊发了消息,把改好的脚本和清洗报告一起传了过去。

  “文渊,你明天试试这版,我改了三个地方,垃圾分类器、语义去重和困惑度过滤。”

  赵文渊秒回:“你还没睡啊?”

  紧接着第二条消息来了:“我看看。”

  又过了半小时,赵文渊发了一条长信息:

  “你是怎么一晚上搞出来这个的?一般的团队光迭代这个清洗管线就得两三个月,你刚才发我的这个比行业基准的有效率和误杀率都要优秀!按这个效率和精度,全量数据清洗大概一周能跑完!一周后就可以开始预训练了!两个月就能看见第一版模型了!”

  难得赵文渊发这么多感叹号,有这么高质量的原始数据和标注数据,他实在是太期待看见训练出来的结果了。

  不过这时候韩路一已经睡了。

  ……

  时间往回拨十几个小时,在太平洋的另一边。

  美国太平洋时间。

  12月27号,周日,下午。

  洛斯阿尔托斯山(Los Altos Hills),约翰的独立屋坐落在这。

  约翰斯诺(John Snow)是Nexus AI的CTO。

  不同于CEO瑞恩,有人工智能领域的博士学位,还一路在AI研究院工作。

  约翰只有本科学历,他从斯坦福还没毕业就开始创业,前后一共创立和联合创立过五家企业,其中两家分别被谷歌和Meta收购,收购后没过几个月他就又离职,继续创业。

  约翰在硅谷的风投和技术圈都有很多人脉,自己也做投资人。

  像他这样已经财富自由的人,其实已经不再为钱工作了,之所以受瑞恩的邀请加入Nexus AI,是因为他看好这个方向,也看好瑞恩本人。

  约翰的家,从大门进去是一段爬坡的车道,停着四五辆车,走到主楼后面才能看到院子。后院很开阔,一棵宽得过分的橡树,阴影覆盖了将近一半的草坪。

  这里正在举办一场烧烤派对。

  派对从两点就开始了,到下午三点多,客人的酒杯已经空了两三轮。

  圣诞的装饰灯还绕着廊柱和几棵树。白天光线强,灯亮着,但看不太出来,风一吹,轻轻动了动。

  烤架那边,有专职的厨师还在翻烤肋排,油脂滴进炭火,滋的一声。

  加州的十二月,十八度上下,天气晴朗,微微有些风,不冷,但也不值得脱掉外套。

  约翰每年都会在圣诞节后举办这样的小聚会,会邀请他比较熟的科技圈里的人,被邀请的人也可以带朋友。

  这个场合被视为硅谷科技和创投圈的一个小沙龙。

  瑞恩到的时候约翰正在烤架旁边和厨师讨论肋排的火候,看到他来了,举起手里的夹子打了个招呼,然后把夹子还给厨师,走了过来。

  瑞恩和约翰是谷歌时候就认识的老朋友了。

  “你每次都带这个。”约翰看了一眼瑞恩手里的Opus One。

  “你每次的酒都不行。”瑞恩笑了笑,把瓶子递给他,“帮我打开吧。”

  约翰接过来,从旁边的桌上找了个开瓶器,熟练地拧开,倒进一个玻璃醒酒器里,放在阴凉处。

  “行,这瓶确实比我这的好。”约翰说,“但是至少还得等半小时。”

  “我知道。”瑞恩从冰桶里先摸了瓶啤酒,“等着呗。”

  两人在院子里走了一圈,和几个认识的人打了招呼。

  约翰的社交方式和瑞恩不一样。

  瑞恩在人群里很自然,八面玲珑,跟谁都能聊三五分钟,然后体面地抽身,让人不觉得被冷落。

  约翰是主人,他更随意,有时候跟一个人聊很久,有时候路过直接点个头就走了,全凭心情,也不在乎对方怎么想。

  有人问起Nexus最近的动态,瑞恩一律微笑着说“还不错”,不多也不少。约翰在旁边听着,偶尔补一句无关紧要的话,两个人配合得很默契。

  后来瑞恩在靠近烤架的位置找了把椅子坐下来,约翰去招呼别的客人了。

  不远处,一个戴眼镜的中年男人正在给旁边两个人讲他最近看的一个物流AI的创业项目:

  “我让他们给我看个原型演示,你们猜怎么着,那个CEO打开电脑,放出来一张幻灯片,跟我说「这是我们的愿景。」”

  旁边的人哄笑起来。

  另一侧,一个金发的女士,身材胖胖的,穿一身深色的长裙,正靠着木栏杆,一脸疲惫,跟旁边的朋友抱怨找不到技术合伙人:“简历我收了几十份,聊下来没有合适的。要么经验不够,要么对薪资不满意。现在这些人要求太高了,只出技术,还想要多少啊?”

  约翰从人群里穿过来,把手搭在她肩上。

  “别在聚会上聊这个。”

  “那聊什么?”

  “聊吃的。”他朝烤架方向抬了抬下巴。

  她有点儿畏缩地抬头看他一眼,举起酒杯喝了一口,换了话题。

  约翰家的黄色拉布拉多在草坪靠边的位置趴着,肚皮贴地,下巴搁在前爪上,眼睛闭着,只有尾巴时不时地扫一下。

  两个孩子不知道正在踢什么规则的球,从草坪这头追到那头,过了一会儿连球都不见了。

  一个之前聊过两句的投资人走了过来,朝瑞恩伸出手:“瑞恩,好久不见。Nexus最近怎么样?听说水星模型(Mercury)3.1在做推理这方面的研究?”

  “还不错。”瑞恩握了一下,“我们在几个垂直场景上跑出来了一些结果。”

  “准备什么时候发论文啊?”

  “不一定会发表。”瑞恩说,“主要是产品层的验证,不一定值得发论文。”

  对方点了点头,没有追问,被旁边另一个人拉走了。

  约翰走回来,在旁边的椅子上坐下,接过瑞恩手里的酒瓶,给自己倒了一杯,把瓶子放到地上。

  “你刚才说的是真的?”

  “哪句?”

  “不发表论文那句。”

  瑞恩端起酒杯:“发表论文是为了什么?招人、刷排行、让同行引用,这些我们现在都不缺。”

  约翰没说话,也端起自己的酒杯。

  两人的酒杯碰了一下。

  约翰看着瑞恩喝酒的样子,想起第一次见他的时候。

  那是在谷歌内部一个很小的技术分享会上,瑞恩当时还是个研究员,讲的是他刚发表的一篇关于注意力机制优化的论文。

  讲得很好,但让约翰印象最深的不是内容,而是瑞恩讲完之后回答提问的方式。

  瑞恩从来不说那些可以赢得一点思考时间的套话,什么“好问题”,什么“让我再想想”,他会直接告诉你,你的问题哪里是对的,哪里是错的,然后给出他的答案。

  那种确定感,在学术界很少见,在工业界也很少见。

  后来两人慢慢熟了,约翰才意识到,那可能不是来源于对专业领域的了解。

  只是瑞恩这个人,他真的不怎么怀疑自己。

  这个特质让他成了一个出色的CEO。

  做决策快,方向清晰,永远能领着团队前进。

  但约翰有时候也会想,一个不怀疑自己的人,不代表他做的决定就是对的。

  ……

  五点多,太阳已经快沉到山脊后面了,气温稍微凉了一点。

  陆陆续续有人过来和约翰打招呼,说谢谢招待,还想留下一点好印象。

  等人走的差不多了,约翰和瑞恩搬了两把椅子到泳池边,各自从冰桶里摸了瓶啤酒。

  泳池这个季节没人用,水面平静,偶尔有一片落叶漂进来。

  夕阳把水面染了一层浅橙,山脊线还亮着最后一点光。

  瑞恩喝了一口,把手机掏出来。

  “给你看个东西。”他把屏幕转向约翰,“和我们合作的、中国的那个公司,这一个多月的API调用分析。”

  约翰接过去翻了翻。

  “在任务规划的层面上,全走的水星模型。”瑞恩说,“他们产品上面,每接到一个用户指令,后面的思考部分意图理解、任务拆解这一层完全是我们的。他们自己接在后面跑代码执行。”

  约翰慢慢划着屏幕,没说话。

  “产品体验很好,”瑞恩接着说,“用起来很流畅,用户满意度很高,我们这边收集到的数据也很高质量。但让这个产品聪明的部分,是水星模型,他们自己的模型就是个代码执行器。”

  约翰把手机还给他:“他们那边的代码生成能力也不差。”

  “不差。”瑞恩接过来,“但那没用,这个参数量级,代码生成的差距已经很小了,再往上很难拉开差距。意图理解是水星模型的杀手锏,他们自己知道这一点,这也是他们接受我们合作的原因。”

  他退出报告,重新打开了一个文件。

  “我们现在是第一阶段。”

  语气平静,像在复述一个已经跑过很多遍的逻辑:

  “现阶段,让他们做产品,积累用户,打磨体验。我们收收入,同时把所有真实任务场景的数据都攒下来。这批数据是下一代金星模型(Venus)智能体(Agentic)能力的核心训练材料,用户场景比我们自己构造的基准线可值钱太多了。”

  约翰喝了口啤酒。

  “等合同到期的时候,他们的用户盘子已经建起来了,整个意图层是跑在水星模型上的,到那时候我们提高分成比例,再收API费用。”他停了一下,“他们的选择是什么?迁移到别的模型,然后改架构、重训、验证、产品回归,还是接受新条款?”

  约翰没答话。

  “他们没得选,用户的基本盘是水星模型建起来的,迁移成本太高,时间也不允许。”

  “金星模型之后,”瑞恩把手机放到膝盖上,“我们的Agentic能力有真实数据撑着,用户场景也摸透了,那时候我们自己下场做一个开发者工具,用这段时间积累的数据,做个比他们更好的产品。”

  约翰仰起头,看了一会儿上面的天,然后晃了晃手里的酒瓶。

  “他们会发现吗?”

  “会。”瑞恩说,“到那时候他们已经没有选择了。”

  “我是说……”约翰把视线收回来,“他们现在知道吗?”

  “他们可能能感觉到吧。”瑞恩说,“他们的CEO不傻,应该能看到这条逻辑线。但他们需要我们,现阶段没有水星模型给出的意图理解能力,他们的产品跑不起来。他们应该是想再合同到期之前把护城河建起来,然后开发自己的模型。”

  “能吗?”

  “开发一个模型要多久?一年?最快最快也要半年吧,我们的合同到四月就到期了。”

首节上一节138/248下一节尾节目录