韩路一知道她在说什么,心里也是一咯噔,怎么还想到一起去了?
他很快答道:“当然,心诚则灵,源码必须顺利!”
话已至此,韩路一悄悄地关掉视界,然后又立刻打开了
经验值什么时候变成8%了?
第一百三十九章 国内第一梯队
这顿饭韩路一吸取教训,确认不用再加菜之后,手速很快地从小程序早早买了单。
吃完正要起身,赵文渊的电话打进来了,韩路一又重新坐下接起电话。
“韩总,最新一轮的结果出来了!”赵文渊的声音带着那种连续熬夜之后特有的沙哑,但语气很亢奋:“意图理解基准从83.7涨到了85.2,其他几项基础指标也在上升,语义连贯提了0.8个点,多轮推理提高了1.2个点!”
“综合性能呢?”
“综合得分比之前那版高了将近两个百分点。这个提升幅度,在7B参数的量级上已经很夸张了。”赵文渊停了一下,“业内现在的主流猜测一直都认为数据标注的质量能提高模型的上限,但是我是真没想到影响能这么大。从结果来看,之前一定没有人用这种质量的数据训练过大模型!”
“提升的空间还有吗?”
“基本到头了,我下午换了学习率策略,看看接下来两天能不能再挤一点。”
“学习率那边别动了,”韩路一说,“两个点的提升够用了。你明天看看能不能先把模型部署下来,我们做些场景测试。”
赵文渊愣了一下:“这么快就上实测?”
“训练集上再刷分意义不大,实测一下真实场景的实际用例,周二去给鼎盛一点小小的震撼。”
“哈哈哈!”赵文渊觉得跟着韩路一自己的心态都变年轻了,虽然他本来也不老,“我这辈子没调过这么爽的参数。”
挂了电话,这两个曾经狼狈离开鼎盛的人,此刻都迫不及待想地要杀回那扇大门。
苏念念听完这通电话,虽然不知道对面说了啥,但听说要去给鼎盛一点震撼,知道一定是好消息。
韩路一没有立刻起身,陷入了短暂的沉思:原来刚才经验值的变化是从这来的,上午看的时候还是7%,刚才变成8%。现在韩路一可以确定是因为赵文渊跑完这一轮微调带来的经验值上涨。
控制变量,基本可以肯定模型训练和视界经验值之间存在正相关,就这么干下去,下一级触手可及。
那之前训练天工代码模型的时候没有涨经验,是因为没有使用他自己的标注数据吗?这到底和标注的被使用量有关还是和产出的模型准确率有关?
“走吗?”苏念念说话间已经站起来穿上了外套。
被这么一叫,韩路一回过神,说:“念念,我发现我还是挺擅长推理的。”
苏念念不置可否。
两人继续出去完成清单上最后一项特别奖,苏念念一路领着韩路一直奔二楼的大疆/哈苏体验店。
店里装修风格清冷但不失调性,正中间是一个长条形的玻璃展柜,往里走还有台面上更多的产品展示。
韩路一来到陈列的产品前,拿起一台Pocket 4翻看起来,入手扎实,比他想象的小。
“这个员工拿到真的会用吗?”他问。
“当然啦,”苏念念说得很肯定,“上周我在办公室听见小杨他们聊天,说朋友刚买了这个去云南拍了一路,回来素材剪出来放在小黄书上,涨了好多粉。”
韩路一若有所思,他上次旅游是什么时候……
苏念念继续说道:“而且现在大家都爱往户外跑,徒步,骑行,露营,滑雪,这个都用得上。”
不愧是产品经理,说起别人的产品也头头是道的,有理有据令人信服。
韩路一看了眼旁边的价格牌,想了想今年的账:源码虽然创立才几个月,但每一步都踩在点上,钱赚到了,团队也在扩张,大家都越干越有劲头。
他是第一次当老板。以前当打工牛马,年终礼品发什么他没资格管,现在轮到他了,他也想激发一下凝聚力,搞点拿得出手的东西,让员工用着就能想起来今年干得不错的那种。
他看看手上的Pocket,再看看Action,都不错嘛。
小孩子才做选择,大人我全都要。
“各买三台吧!”他决定,“做抽奖,全员参与。”
苏念念没有显出很意外,但还是肯定了他一下:“韩总大气!”
……
12月15日,周二,下午一点半。
鼎盛大厦三十三层,图灵厅。
程远提前半个小时就到场了。
会议室不大,八人座的椭圆桌,中间摆着矿泉水、烧水壶和一盒没拆封的挂耳咖啡。投影幕布已经拉下来了,连着一台鼎盛内部配发的工作站。
虽然秘书已经做过一遍了,但他还是又检查了一遍会议室的设备,确认投影、网络、白板笔都没问题,又把桌上的水瓶标签朝外转了转。
门开了,刘大海走了进来。
他光头,穿着一件灰色的连帽衫,下面穿了条宽松的运动裤,脚上是一双跑鞋。和程远的西装革履站在一起,像两个不同次元的人。
“刘博士,辛苦了。”程远站起来。
“嗨,这不外道了么,都咱份内的事儿。”刘大海是北方人,特别能唠嗑,绝不会把话落在地上。他把笔记本往桌上一放,就开始接线调试。
程远把这个内部会议的时间提前了半小时,也是借这个机会对自己模型组的最新进度先深入了解一下,对齐颗粒度。郑总似乎很挂心这事,他也得赶紧把优先主次调整清楚了。
刘大海调完设备,坐下来喝了口水。
“今天来的谁(sei)啊?”
“源码科技,一个AI创业公司。”程远简短地说,“做应用层的,最近想往大模型方向走。”
刘大海抬了一下眉毛:“啥?多大规模?”
“五十人左右,A轮。”
刘大海皱着眉头,头顶飘着两个为什么
为什么五十人就敢做大模型,光数据清洗的团队都凑不齐,虎了吧唧的。
为什么这么不切实际的公司今天能来鼎盛开会,还是郑总发话,需要他亲自来给演示。
“郑总的意思,你把坤元最新的评测结果给对方演示一下就行。”程远说。
“坤元”是鼎盛内部通用大模型的代号。乾元是代码大模型,已经公开发布了。坤元是通用模型,还在内部测试阶段,没有对外公布过。
“现在我们内部做到什么水平了?刘博士,能不能先给我解解惑?”
刘大海点了点头,打开了演示界面,顺手调出了一组数据。
“上周刚跑完的结果,”刘大海指着屏幕,“咱们最强的在这,意图理解直接干到了78,比上一版提了将近两个点,老猛了!”
刘大海切到一张对比图,纵轴是综合得分,横轴排着国内外十几家模型。
“你瞅这,综合跑分这个位置,”刘大海用手指点了一下点状图最高的那个点,“GPT-4o。”
然后他的手指往左移了两格:“咱在这,差距大概三个百分点,放在国内这是第一梯队,稳稳当当的!”
接着他切了一张图:“只看意图理解这个单项,咱和OpenAI的差距已经缩到不到0.2个点了,而且在中文场景下咱还能加加,支棱支棱超过去也不是啥大问题。”
程远看着那张图,心里踏实了不少,这个数字拿出去,足够让任何一个创业公司掂量掂量自己几斤几两。
“刘博士,演示的时候你把这张对比图放出来就行,不用太详细,点到为止。”
“嗨,妥妥的。”刘大海关掉了屏幕,“说实话我不太乐意整这种对外演示,但郑总发话了,那就走个过场呗。”
程远笑了笑,没接话。
刘大海也不在乎,掏出手机开始接着看论文。
一点五十。
还有十分钟就又要和韩路一见面了,程远拉了拉看完表的袖口,嘴角不自觉地挂上了一抹势在必得的笑意。
第一百四十章 好戏开场
两点整,韩路一一行人走出电梯。
鼎盛大厦三十三层的走廊很宽,铺着浅色的地砖,墙上挂着几幅画,看不出画的是什么,有点抽象。
张彪在走廊尽头的休息区坐下来,开始刷手机,连刷手机的时候背都挺的笔直。
前台引着韩路一和赵文渊走向图灵厅。
程远已经站在会议室门口了,看到韩路一过来,笑着伸出手。
“韩总,欢迎欢迎。”
手握得有力,节奏控制得很好,不松不紧,三秒松手,掌握着主动权,带一点“我比你年长”的上位感。
然后他看到了韩路一身后的赵文渊,脸上的笑容一僵。
当初收购CodeSafe的时候,就是程远出的面。程远做得比较绝,没有给赵文渊留岗位,股价压得也很低。赵文渊被逼出局之后他再也没有关心过弃子的动向。
虽然那是王志远促成的收购,但是现在,在这个场合碰见赵文渊,程远还是觉得不妙。
“赵总,没想到会在这见到你。”程远伸出手。
赵文渊握了一下,客气但不多余:“程总,又见面了。”
两个人都没提上次的事,但各自怀着不同的心境。
韩路一打开视界。
淡蓝色面板浮现
【程远|43岁|鼎盛集团战略投资部VP】
【情绪:自信】
【隐藏情绪:惊疑】
【当前状态:收购谈判预案执行中】
这惊疑是从哪来的?
“请进,”程远侧身让路,“给你们介绍一下,这位是我们的刘大海刘博士,鼎盛集团模型方向的首席科学家。”
刘大海本来在看手机,听到动静抬起头,站起来和两人颔首示意,算是打了个招呼。
“那啥?韩总是吧,幸会幸会。”
可能是口音加持,听着语气还挺诚恳,就是过于随和,像在澡堂偶遇了朋友的朋友。
赵文渊主动伸出手:“刘博士,久仰。你在OpenAI做Scaling Law那篇论文我读过很多遍,对我们自己的训练策略影响很大。”
刘大海愣了一下,显然没预料到对面还有人认识自己的学术工作,他看了看赵文渊,又看了看程远,表情像在问“这位是?”
“赵文渊,源码科技的模型负责人。”赵文渊自己介绍了。
“哦哦,”刘大海握了下手,“你们几个人搞模型啊?”
今天谈的是新公司、新项目,不是源码的天工,赵文渊犹豫了一下,说:“目前就我一个。”
刘大海的表情有点没绷住,像是听到有人说自己在家里拿电饭锅炼钢。
“那挺牛的。”他把赵文渊当成哪来的民科了,“坐坐坐,来都来了。”
韩路一对准刘大海开了视界。