淡蓝色面板
【刘大海|42岁|鼎盛集团首席科学家】
【情绪:心不在焉】
【当前状态:想赶紧做完演示回去做研究】
【核心驱动:纯粹技术好奇心(极强)|对商业博弈无兴趣】
和程远完全不同。
程远的面板写满了权力,预案,控制。而刘大海的面板里只有对技术的渴望。
刘大海一坐下就打开了工作站的投影,动作很快,明摆着想赶紧演完赶紧走。
投影亮起来,是鼎盛内部评测系统的界面。
“咱就长话短说,不浪费韩总时间哈。”刘大海切出一组数据,指着屏幕,“这是鼎盛内部的通用基座大模型项目坤元,目前还在比较早期的阶段,但是已经有一些成绩了。你看,这是最新的评测结果,和GPT-4o差大概三个百分点。”
“咱们的目标就是冲着GPT去的,有信心明年就能发布哈。尤其是意图理解这块是咱们的绝对强项。”
他切到实时演示窗口,上传了一个包含原始数据的表格(xlsx)文件,然后快速输入了一段模糊需求:“帮我做一份销售团队的绩效分析。”
坤元回复很快,一秒多钟就开始流式弹出回复,大概几十秒结束了。屏幕上是一份结构完整的报告,数据维度、对比指标、可视化建议全列了,格式工整。
韩路一和赵文渊对视了一眼,点了点头。
鼎盛果然也在做通用大模型,而且成果确实不差。
二百多人的团队、十几亿的投入,做出来的东西配得上这个评价。
程远一直在边上观察着他的表情,没看到预期中的震惊。
这让他有些意外。
“韩总觉得怎么样?”程远问。
“坤元确实很强,”韩路一说,“国内能做到这个水平的团队不超过三家。”
程远微微一笑,心想你知道就好,接下来就是我的节奏了。他刚想顺着往下接
韩路一从背包里拿出了笔记本电脑。
“不过,程总,刘博士,”韩路一打开电脑,“我也准备了一点东西想给你们看一下,Wi-Fi密码是多少?”
连上Wi-Fi,他把屏幕转向对面两人。
“这是我们最近用开源基座微调的一个通用模型,内部代号是汤圆,7B参数,训练数据不到一万条。”
汤圆是前两天刚起的名字,当时韩路一正在吃黑芝麻汤圆。
刘大海看着韩路一的屏幕,眉毛拧在了一起。
这啥意思啊?
7B参数,不到一万条数据。
鼎盛训练坤元是几百亿参数,训练时间已经三个多月了。
光是标注数据就攒了几十万条,专门雇了两百人的标注团队干了半年。
你说你7B的参数加一万条标注数据?那连一个实验室的暑期实习项目都不如。
“您来出题?”韩路一看着一脸迷惑的刘大海,淡定地说。
刘大海瞥了程远一眼,程远点了一下头:咱有点礼貌,配合,配合一下。
“行吧。”
刘大海拉过韩路一的笔记本电脑,在浏览器打开的聊天界面里打了几行字。
先是一段背景:“某互联网公司产品经理,上周参加了三次跨部门会议,周五被总监单独约谈半小时,周末主动到公司加了一天班。”
然后是需求:“帮他整理一下上周的工作。”
突然他想起了什么,没有按回车,而是先转头在坤元那边先输入了同样的内容,回车。
先给你们看看标准答案是什么样的。
坤元很快给出结果:“该产品经理上周主要工作包括:1.参与三次跨部门协调会议;2.与总监进行一对一工作沟通;3.周末加班处理待办事项。建议按时间线梳理各事项的具体内容与产出。”
标准的信息归纳,不错不错,这不是会出错的地方。
刘大海这才在韩路一的电脑上也按下回车,汤圆的回答弹出来。
直接是一份完整的周报模版。
一、跨部门协调推进(3次会议):主导XX项目资源对齐,输出会议纪要X份,推动X项跨部门待办落地。
二、与总监专项沟通:主动汇报项目进展与风险预案,明确下阶段优先级。
三、文档归档与交付准备(周末):完成XX方案终稿整理,确保周一可交付评审。
---
刘大海看了一眼,眨了眨,又看了一眼。
周报而已,格式也不算特别,但是……哪里不对。
他又读了一遍坤元的回答。
坤元在“整理工作”,汤圆也在“整理工作”。
但坤元整理出来的是流水账,汤圆整理出来的每一条都在强调主动性和产出。
再看回韩路一的电脑,回答框上面有一行小字,浅灰色的,写着“查看思考过程”。
刘大海没见过这个。
他点了一下。
一段折叠的文字展开了
“分析用户的真实意图:他要准备一份有说服力的周报,核心目的是自我保护。「被总监单独约谈」结合「周末主动加班」构成焦虑-补偿行为链,暗示约谈涉及绩效压力或岗位变动风险;三次跨部门会议说明他正在被要求证明协调价值。「整理上周的工作」不是回顾,是建档他需要一份能在后续谈话中自证产出的文档。”
刘大海的背腾地一下挺直了。
他盯着屏幕上的这段话看了好几秒,没有说话。
不对劲,这个回答很不对劲。
第一百四十一章 好戏连台(为盟主【独步啸天】加更)
好半晌,刘大海缓过劲来,没有从题库里选第二道,而是直接在输入框里现场打了一段话。
他有点儿怕是题流出去了,他在被人做局。
“某公司技术负责人收到通知,要求参加下午两点与外部公司的业务对接会。他回复:「收到,我把最新的评测数据整理一下带过去。对了,这个会大概多长时间?我四点有个组内的技术评审会。」”
打完这段,同样粘贴到坤元,两边同时发出指令。
坤元的回复是:“该技术负责人确认参会,并计划准备评测数据作为支撑材料。同时需协调下午四点的技术评审会时间,建议提前做好日程管理。”
汤圆的思考过程是:
“该技术负责人不想参加这个会议。「把评测数据整理一下带过去」将自身角色限定为技术展示而非业务讨论,暗示他认为自己只需要走个过场。「大概多长时间」不是时间管理,是在确认最早什么时候可以离开。「四点有个技术评审会」预设的退出机制,高概率不存在或可以改期。综合判断:参会原因是上级安排,非自身意愿。”
赵文渊没有错过刘大海的反应
他呼吸都急促了起来。
刘大海不再和程远交流,转身打开自己的笔记本电脑,翻出一个文件夹。那是他做基准测试用的私人题库,鼎盛内部都没几个人见过。
他挑了一道最难的,传送到韩路一的电脑上,直接粘贴进对话框。
题目很长,涉及多角色、多目标、隐含冲突的复杂决策场景,其中藏了一个他自己设计的陷阱:表面上的主要需求,其实是用来掩盖真实的次要需求的。
上次内部评测的时候,坤元没通过这道题。
汤圆“思考”了十几秒后,结果出来了。
它精准地识别出了三层嵌套的隐含意图,当然也包括那个陷阱。
刘大海的手停在键盘上,僵住了一样,没有声音也没有动作。
整个会议室都安静了下来。
韩路一把电脑转回来,打开了一份文档,又把屏幕转过去。
“对了,这是我们完整的基准测试数据。意图理解,85.2。”
85.2。
比坤元高了七个百分点。
不是零点几。
七个点!
比OpenAI的GPT也高了七个点!
程远整个人也僵在椅子上一言不发。
他的脑子在飞速运转,技术震慑不成立了,收购引导没有基础了,郑晓波给他的预案、他提前准备的话术、甚至“价格上浮两倍”的授权。
全废了。
他的框架不适用了。
许久之后,还是刘大海先打破了沉默,语气有些艰难地开口道:
“你们……是怎么做的?”
韩路一看向他。
视界面板上刘大海的情绪标签已经变了。
【情绪:高度专注】
和两分钟前判若两人。
“嗨,刘博士您这问的……这是我们的核心壁垒,”韩路一笑了笑,“真没法透露。”
刘大海点了点头,发问是本能,此刻也意识到自己失言了。
现在这个只是个原型,等到产品做出来,赵文渊应该会发论文,这个可以期待一下。
程远终于缓过劲来,清了清嗓子。
“韩总,鼎盛一直很看重源码的产品能力,也许我们可以换个角度谈合作”
韩路一没让他把话说下去。
“程总,我今天来不是代表源码的。”
程远再次愣住。
“我和赵总正在筹备一家新公司,专注于通用基座模型。”韩路一停顿了一下,“我希望鼎盛以算力入股,GPU使用权折算为投资,换取新公司的股份。”
程远这下再也淡定不了了,激烈的情绪涌到脸上。
他从郑晓波那拿到的授权是“收购价格上浮两倍”。