吕云当年能推动鼎支付拆分,靠的是十几年积累的绝对威望。他韩路一现在还没有这个分量,只敢让最信任的人知道这件事。
但成果可以替代威望。
等到模型做出来,所有人都会发现,他不是在损害任何人的利益,而是在开凿一个新的金矿。
到时候,没有人会反对一个让自己赚更多钱的决定。
三天后。
韩路一把八千一百条标注好的开源语料发给了赵文渊。
格式如他之前规划的,原始文本、上下文拆解、真实意图标注,全部来自公开数据。
赵文渊打开文件,大概上下拉动扫了一下,然后开始逐条看标注细节。
数据质量极高,每条标注不是简单的意图分类,而是对用户真实需求场景的深度还原。
他调出原始数据做对照。
一条问答社区的帖子,用户在问怎么跟下属开绩效面谈,正文三百多字,开头有一句“上个月有个员工直接当场哭了”,按标准流程,这句话是背景描述,清洗管线直接砍掉。
韩路一把这句留下来了,意图标注里写的是:提问者的核心诉求不是面谈话术,而是如何处理情绪失控的现场。
赵文渊把这条翻来覆去看了三遍。信息确实在原文里。但那句话,任何标注员看了都会当废话处理。
他又翻了十几条,规律是一样的。
“这套标注逻辑”赵文渊把椅子转过来,“是你定的规范?”
“对。”
“规范在哪?”
“没有写下来的规范。”
赵文渊看着他:“八千条,找了多少标注员?”
韩路一没有回答。
赵文渊意识到了什么:“就你一个人标的?”
还是没有回答。
赵文渊重新看向屏幕,如果是一个人,三天,八千条,这是什么概念?
这个量,读都读不完吧?更别说标注了。
“你怎么判断哪些细节该留?”
“看起来不相关,但实际上相关的。”
“这是废话。”赵文渊说,“我是说判断标准,能写成规范吗?能教给别人吗?”
韩路一看着他:“先去跑模型吧,记得在个人电脑上跑。”
赵文渊明白了,不能。
他拷走数据,当晚训练任务提交,赵文渊盯着屏幕,等第一轮训练跑完。
同时,韩路一在家,躺在床上,准备看看精力值。
这三天视界用得太狠了,八千多条开源数据的筛选加标注,每一条都要让视界扫描原始文本中所有人类容易忽略的关联信号:措辞背后的现实背景、提问方式暗示的真实场景、字面意思与实际需求之间的偏差。
突然,视线左下角的提示吸引了他的注意力。
视界的经验值在上次升级之后就一直没动过了,他还以为Lv.3是满级了。
但是现在,那条好久没动过的经验条
变成了1%。
第一百三十一章 人傻钱多,速来
六点十五,闹钟响了。
韩路一睁眼的第一件事不是看手机,而是调出视界面板。
经验条没变,Lv.3,1%。
跟昨天睡前一样。
韩路一盯着那条几乎看不出进度的细线,脑子里开始回想过去的升级经历。
Lv.1到Lv.2,靠的是举报快闪。他先是发现修复现实里的漏洞可以获得经验。然后发现快闪数据造假和贩卖用户隐私,戳穿了这个骗局之后,直接获得了两百点经验升级。
Lv.2到Lv.3,情况不太一样,当时他总结要免费帮助人才能获得经验,选择用网名去技术论坛回答疑难问题。后来做了BugKiller,更间接,经验也更少,还没有提示,但免费用户使用多了,他也会加经验,后来经验够了自动升级。
升级Lv.3之后,到现在已经好几个月了,经验一动不动。
他还以为满级了。
但昨天晚上经验条突然动了。
韩路一仔细回忆这最近有什么不同的地方:在三天时间里高强度使用视界,把精力条都用空了几次。
量确实大。可是他这几个月用视界扫描代码、扫描文档、扫描商业方案,用量积累起来也不少,经验条愣是纹丝不动。
是因为标注这个用法?
还是因为训练开始了?
韩路一想要查查系统记录,看看经验到底是什么时候加的。
视界:无此功能。
韩路一又对着视界问:“视哥,怎么升下一级啊?”
视界毫无回应。
垃圾游戏,游戏引导做的稀烂,设计师拉去枪毙五分钟。
想了半天毫无头绪,韩路一从床上跳起来。
八点钟还要跟Nexus开会,苏念念特意嘱咐他别迟到。
洗漱的时候他突然想到一个问题:视频通话,瑞恩在旧金山,距离起码九千公里。
视界能看到些什么?
……
七点出头,韩路一到了公司。
张彪去停车,韩路一先在楼下买了一杯美式和一杯拿铁。
在会议室等了一会,苏念念才来。她画了精致的妆,但是看起来还有点不太精神。
“没睡好啊?”韩路一说着把拿铁递给苏念念。
“谢谢。”苏念念接过咖啡放在桌子上,另一只手捂住嘴打了个哈欠,“昨天晚上又过了一遍Nexus的资料,临时抱佛脚。你这两天忙,估计还没来的及看吧,先看看。”
看她打哈欠,韩路一忍不住也打了一个。
苏念念笑了:“这也传染啊?”
韩路一接过苏念念递过来的平板,上面开着一个飞书页面,是苏念念从官网和媒体采访整理的资料,底下还有苏念念的标注。
「Nexus AI,总部在硅谷,2024年初成立,种子轮就获得Y Combinator的融资,之后每年都会融资,最近一次是26年7月获得Foundry Capital领投的五亿八千万美元,现在估值五十亿美元。团队成员不到一百人,主要是AI研究员和一些资深程序员,大部分都来自硅谷知名大厂,另外还有各领域的资深人士负责对齐方面的工作。」
(B轮融资只稀释了大约11.6%,说明投资方对Nexus极度看好,至少有多家竞价,才能在B轮有这么低的稀释比例。)
「CEO瑞恩米勒,四十一岁,履历闪闪发光。多伦多大学的博士,师从AI教父辛顿,博士毕业即进入谷歌研究院,OpenAI成立早期加入,后来一路做到高管,在2023年11月的奥特曼罢免事件后出走,创立了Nexus AI。」
(从研究员做到高管再到创业,手腕和商业嗅觉都不简单,小心别被学术光环晃到。)
看到这里,韩路一也不禁砸了咂舌。
不看不知道,一看吓一跳,这纯纯是个AI皇族啊。
「Nexus AI现在的拳头产品是他们的自有通用大模型Nexus Mercury(水星),在多项测试中达到行业顶尖水平,尤其是代码生成方面有独特优势,在技术圈里名声很好。他们现在主要的收入来源是API收费和网页聊天机器人的订阅收入。」
(API+订阅是AI企业的标准打法,利润率不会高。他们找我们合作最大的目的应该是想开拓产品线,补齐产品生态。)
韩路一点了点头,认同苏念念的判断。
源码科技现在最拿的出手的就是产品方面的积累。
BugKiller的检测引擎也是代码生成很好的补充,但是总得来说,代码生成准确率越高,对BugKiller的需求就越低。
“还有点时间,要不要跑一跑,试用一下?”苏念念打开笔记本电脑,问韩路一。
Nexus Playground的页面已经在打开状态了。
“你已经测过了?”
“昨天晚上。”苏念念把屏幕转过来给他看,“你自己也测一测。”
韩路一没急着开始,先开启视界,深度扫描Nexus模型的代码生成输出。
然后他在输入框里打了一行字:帮我做一个客户管理的东西。
回车。
水星的回复速度很快,光标闪了两下,代码就开始往外吐。先是一段项目结构的说明,然后是一个接一个的代码块:React前端、Node.js后端、PostgreSQL建表语句,文件名标得清清楚楚,注释用的全是英文,很规范。
韩路一往下滚了滚,权限管理、数据导出、邮件营销模块的代码都有。
一个聊天框,二十几个巨大的代码块,一套完整的客户关系管理(Customer Relationship Management,CRM)系统。
视界看过去,Bug只有零星几个,而且不在核心模块,水平确实高。
但有两个问题,门槛太高了、东西太多了。
用户说客户管理,水星就真的生成了一整套CRM,而且需要自己手动部署前端后端和数据库到服务器。
假设用户是一个小公司的销售,软件的两个问题,就会变成他面临的两个难题:有代码不会跑,也不会部署;生成的很多功能用不到。
这基本就意味着没法用。
韩路一想象了一下那个场景,一个销售拿着这堆代码,水星告诉他要去哪个网站,怎么注册,点哪个键部署……但他真的会去做吗?大概率直接关掉,然后去下载一个现成的表格软件的模板。
韩路一关掉视界,心里有数了。
水星的代码生成能力很硬,代码规范、结构清晰,单看质量不输天工。但在端到端体验上,理解用户到底要什么、给出刚好够用的东西、让客户直接能用上这些他们都没有。使用门槛太高了,推广不出去。
换句话说,他们不缺天工,缺开物。
这个优势的核心,就是开物从诞生以来一直在做的事:让用户不用懂代码,就能拿到最终产品。
紧接着他想到了另一层。
这还只是代码和工具的场景。如果新模型做出来,能在所有场景下解决意图理解
那就是另一个量级的市场了。
他收住这个念头,转向苏念念:“我看你对他要谈的事情有预期了,我也认同。”
“他来找我们的主要目的就是开物的产品经验,至于具体的合作方式,先听听他们怎么说。但是我们不承诺任何东西。”
苏念念点了点头:“既然是合作,还要看看他们能给出什么好处再说,他们的模型就是再好,对我们现在的产品线来说也没什么意义。”
“对,多套套话,听说外国人都人傻钱多。”