包间不大,装潢也很朴素,里面已经坐了三个人。
随着陆正平进门,里面的人都站了起来。
先发话的是一个老人,头发白了不少,但是精神头很好,穿一件灰色夹克,一看就是老干部风。
“陆总,好久不见啊,怎么今天有空来看我们这些穷教书的。”
陆正平走上前,笑着和他握了握手:“庄院士,多谢赏脸。”
随后他侧身介绍道:“这位就是源智科技的韩路一,韩总。”
这位庄院长倒是自来熟,也可能是和陆正平非常熟悉,一边向韩路一伸手,一边开玩笑:“我今天就是为见韩总来的,托了陆总的福,不然韩总这两天炙手可热,我恐怕是没机会见到哦。”
韩路一和庄院长握了握手:“庄院士,久仰您大名了,很荣幸今天能见到您,请多多指导。”
他也不是客套,做他这一行的,见到水木计算机学院的老教授,同时也是两院院士,可以说是做科研做到头了。
韩路一开着视界扫了一眼。
【庄治|58岁|水木大学教授/科学院院士】
【情绪:好奇】
【隐藏情绪:欣赏】
好奇+欣赏,有点儿骄傲了怎么办。
庄治松开手,开始介绍现场的几位。
“这位是邵教授,专门做大模型训练和分布式训练的,你们应该聊得来。”
邵教授四十多岁,戴着细框眼镜,脸上带着点儿浅浅的笑意,看起来挺温和。
“韩总,久仰久仰,我一直是源码的忠实用户,御风把我们日常科研的效率大大提升了。”邵教授说道。
韩路一也上去握了握手。
【邵池越|48岁|水木大学教授】
【情绪:友善】
【隐藏情绪:好奇】
最后一个年轻人看起来甚至比韩路一还年轻一点,瘦瘦高高的,带一副黑框眼镜,穿着棉质衬衫。
“这位是章闻铎同学,是邵教授带的博士生,就快答辩了,我们院里很看好他的研究方向啊。”庄治介绍道。
韩路一自然也是握手,但是感觉这个章同学握起手来有点儿不情不愿的。
视界扫过去,果然。
【章闻铎|27岁|水木大学博士生在读】
【情绪:忍让】
【隐藏情绪:质疑】
看了一圈,今天的安排韩路一已经了然了。
陆正平看出来韩路一对人才这一点格外重视,所以除了打算给钱之外,直接把自己认识的学术界顶级人脉介绍给他。
邵教授呢,因为方向相关,是被庄院士邀请过来的,汤圆这么大的热度,可能邵教授自己也好奇。
至于最后的这个章同学,则真的是邵教授得意门生,这种场合也愿意带他来涨涨见识,结交结交人脉。
可惜这位章同学却不太领情。
其实不难理解,汤圆的成绩,其实越是在这行深耕的人越不容易相信。
你跟普通老百姓说,源智科技这个公司做出来了一个世界第一的人工智能模型。他虽然也惊讶,但是不会那么惊讶,因为他根本不知道模型训练所需要花费的资源,所需要克服的挑战有多少。
但是对那些前沿研究者来说,他们每天的工作就是在现在的极限上再怎么往前突破一点,你现在跟他们说我直接断层世界第一。
那他们的第一反应肯定是
凭什么?
第二百五十九章 情商这一块
这个疑问,恐怕不只是章同学,在座的两位教授也有同样的问题。
只不过年纪大了,见的事情多了,逢场作戏也学会一些。
即使是内心里对汤圆的真实能力有怀疑,也不会表现在脸上。
要是将来真在技术上发现你作假的痕迹,那社交媒体、网络媒体,不都是交流的地方吗。
没必要当面打假。
可惜,章同学在学术训练中还没学到这一步上。
几人入座之后,菜单递到陆正平手上。
他看了看菜单,准备叫服务员点菜,庄院士指了指旁边的二维码。
陆正平扫了码,一边点单一边说:“这是什么小程序,怎么开的不是千帆的APP?”
邵教授笑了笑,回答了这个问题:“这我还真找老板问过,我第一次见的时候还以为是找学校哪个学生做的小程序,功能还挺完整。”
他说到这顿了一下,转向韩路一,说道:“结果您猜怎么着,这是韩总的那个人工智能无代码平台叫开物的生成出来的。”
“完成度真不错。”邵教授夸了一句这个小程序,也暗暗地捧了一句韩路一。
陆正平听着也来了兴趣:“韩总,听说你们源码科技现在和千帆在抢商户?”
韩路一笑了笑:“这个事情不是我在管,我最近全专注在模型研发上面了,陆总要有兴趣,我可以请我的合伙人给您讲讲。”
话题移到了模型上面,在座的几个人兴趣都被提起来了。
庄院士先开口:“韩总,这个训练流程,你是亲自参与的?”
“我主要是负责一些收集数据方面的工作,真正的训练还是由我们的科学家团队负责。”韩路一谦虚道。
视哥给建的数据清洗管线,视哥给做的标注。
可不就是收集数据方面的工作吗?
邵教授接过话题:“汤圆一出来,动静很大啊,从我个人使用御风的体验来说,确实比之前用水星模型的时期要更智能一些。”
他一边说一边斟酌着问题的边界。
“我比较好奇一个问题,这么超出预期的一个表现,贵公司是怎么实现的呢?”邵教授问完,又赶紧补了一句:“您挑方便说的说,要是都不方便说也没关系,我绝对没有要问商业机密的意思啊。”
陆正平看了邵教授一眼,又看了韩路一一眼,想了想,还是没有出声制止。
韩路一倒是没什么感觉:“数据好。”
他自己知道,赵文渊对训练管线做了相应的微调,但那也是为了适应汤圆的原始数据和标注数据。
归根结底,汤圆能做出这个成绩,还是来源于韩路一出的数据。
毕竟,汤圆在训练的过程中也没有发明什么新的算法,也没切换什么新的路线。
它只是在这个方向上,这个规模上,把数据卷到极致了。
出来的效果就是这么好。
听了韩路一这么直接的回答,邵教授一愣。
他其实第一反应是不信,因为这条路不是没人走,包括硅谷的顶尖模型也在走,如果汤圆走的是同一条路的话,她凭什么做到了世界第一呢?
韩路一这边话没停,还详细地解释了一下:“汤圆的模型架构、训练方法都不是什么独特的发明,汤圆之所以能做到这个程度,核心原因就两点”
“一是在预训练阶段,数据的质量足够高。”
“二是在后训练和对齐阶段,标注数据的质量足够高。”
“我们不是把大量的垃圾喂进去,然后指望模型从垃圾堆里学知识,我们做的工作在训练之外,保证让每一个词元都有价值。”
这没有什么好隐瞒的,汤圆的护城河在数据上,不在训练方法上。
况且韩路一还馋着在座两位教授的影响力,自然愿意表现出一点儿诚意来。
在座的几个人,除了陆正平之外,都是业内的行家里手了,听了韩路一的话,都思考了起来。
这个理论不是新理论,但是方法听起来是个笨方法。
最大的问题是,这个方法很难scale(规模化)。
现在一个大模型几千上万亿的词元,你怎么去保证质量?
倒是陆正平听出来一点儿别的东西:韩总刚才是不是说他负责的部分就是数据收集来着?他刚才说的这两点,不都和数据有关吗?
这时候服务员开始进来上菜了,也就打断了几个人的思考。
菜上的很快,陆正平先起来提了一杯酒,庄院士又提了一杯酒,最后韩路一也提了一杯酒。
韩路一已经有点儿适应这种流程了,他也能看出坐着的章同学很不适应。
这不适应都快写到脸上了,不用视界也看得出来。
但是韩路一心里还有个小小的疑问:上次见周涵的时候,她小心翼翼的样子让韩路一印象深刻。不是说不让喝酒宴请了吗?怎么陆正平不在乎这个?
吃了会菜,章同学也过来和韩路一敬了一杯酒,是老师让他来敬的。
但他喝完酒没走,接着刚才的话题又聊了起来:“韩总,我觉得光凭数据做不到这么强。”
这话声音不大,只有韩路一听见了。
苏念念平时说我情商低,这有一个比我还低得多的啊。韩路一默默想到。
“章博士,那你有什么看法?”韩路一问道。
章同学先是摆摆手,说道:“我还不是博士呢,下个月才答辩。”
然后他又换了个方向:“韩总,汤圆的API现在还没开放吧?你说欢迎同行交叉测评,发布会那天我就发了邮件申请,到现在都没回复。”
“御风虽然好用,但是严格来说,这不能说明汤圆这个模型能力强,甚至也不能证明它真的是自研的。”
韩路一听了这话,才是真对章同学的情商服气了。
这是怀疑我造假呢。
真的猛。
他这话旁边的陆正平也听见了。陆正平清了清嗓子,正要说话,韩路一先开口了。
“章同学,自从发布会之后,我们确实接到了很多想要开放API进行验证的申请,是有同事去逐一验证之后才开放的,也不可避免地遇到了一些蒸馏的行为。你的申请可能还没被处理到,希望你理解,这样,我这边有权限,你把邮箱告诉我,我给你通过一下。”
邵教授也注意到了这边的动静,听了韩路一的话,心里暗自感激。
这傻徒弟怎么净干傻事呢。
章同学还没意识到什么,只是报了自己edu.cn结尾的邮箱,韩路一找了找,给他现场通过了。
之后章同学几次还想再聊模型的话题,都被自己的老师给适时地带开了。
庄院士看出桌子上的气氛有点儿冷下来了,看了一眼章同学,放下筷子,开口道:“我们学校有个故事,挺好玩的,也是个博士生的,不过不是我们计院,是隔壁化学系的。”
邵教授已经笑了,知道是哪个故事。
“这位同学有个困扰他已久的问题。”庄院士比划了一下,“珍珠奶茶喝到最后,杯底会剩一层珍珠,吸管怎么也吸不上来。正常人忍一忍就算了,但这个孩子较真,说这是个流体力学问题,他要解决。”