首富从AI浪潮开始 第198节

  等到周牧之读完书,别说博士,就是本科,四年的时间,AI和现在肯定完全不是一个样子了。

  他想了想,回答道:“牧之啊,学你喜欢的就行。”

  这就是他的真实感受,在AI正在快速抹平大量经验鸿沟的现在,热爱本身比以前任何时候都更重要、也更珍贵了。

  周牧之对这种老生常谈式的回答完全不满意。

  周牧之心想:路一哥,你怎么也成谜语人了。

  不过高中生还不太习惯长时间地处于这种对人生的思考之中,很快他的注意力就被转移了。

  “诶,你们看那个!”周牧之指着小区门外停着的一辆SUV叫道。

  李维和韩路一顺着他的目光看过去。

  “这是那个!旗舰款!星空蓝的!”周牧之兴奋地说,他平时没事就喜欢刷汽车论坛,对市面上的各种车型都如数家珍。

  “这车不便宜吧。”李维评价道。

  “那可不!”周牧之扬了扬下巴,那骄傲的语气,仿佛车就是他自己的,“得五十多个呢!”

  “哥,你买车了吗?”韩路一不动声色的岔开了话题。

  李维忍不住笑了笑,回答道:“还没,但是攒了点钱,准备今年去提一辆。”

  “维哥!你预算多少,你到时候带我一起去啊!”周牧之在旁边都着急了,“我肯定帮你挑个性价比最高的。”

  韩路一轻轻的打了一下他的头:“你哪有那么多时间看这个,不好好复习,一会儿告诉我妈。”

  这时,韩路一的手机响了起来。

  他拿起手机低头一看,是鼎盛云账号上弹出的一个报警提示。

  预训练有一轮训练失败了。

第二百一十六章 要问你问,我反正不问

  这种报警信息倒是不急着处理,既然看到了,回去再处理也行。

  况且他也没带电脑出来。

  大年初一,让显卡集群也放几个小时的假吧。

  韩路一没有放下手机,而是打开微信,给张彪发了条消息:“彪哥,别在门口等我,你真出去转转,不然我妈那可不好糊弄。”

  等到韩路一和周敏回到家,已经是两个小时以后了。

  韩路一回到卧室,打开电脑,登入鼎盛云的账户。

  看了看最近的活动日志,这两小时之间一直有访问记录,但是训练还没有重新开始。

  看来赵文渊也看到了,正在检修。

  但是卡住了。

  韩路一皱了皱眉头,能让赵文渊卡两小时的Bug,看来不简单。

  他看了一眼飞书,赵文渊在线,于是他向对方发起了一个视频通话请求。

  很快,视频接通了,赵文渊的脸出现在屏幕中。他穿着一件大红毛衣,看起来喜气洋洋的,但是表情很严肃,和衣服形成了反差。

  “怎么样?问题定位了吗?”韩路一开门见山的问道。

  “Loss飘了,从一点多开始,回滚checkpoint不行,重启不行,分布式检查没有问题,参数也没问题。我怀疑是数据问题,新加的过滤规则是小牛他们前几天加的批次,我现在正在对照规则文档看代码。”赵文渊的语速很快,但是并不慌张。

  现在这个阶段,每个检查点之间一般间隔十个小时。也就是说,就算最后能修好,至少也要从十个小时前的检查点重跑,再加上这两小时的Debug,至少十二个小时白费了。

  “不急。”韩路一开口道,“异常batch的数据采样发我一份。”

  “好。”

  韩路一接收文件,快速的扫了一眼。

  此前,韩路一用视界做出来的数据清洗管线,已经把最明显的污染样本打过一遍。

  后来为了增加模型能力,赵文渊带着数据团队在这个基础上继续扩展,增加了规则集和数据源。

  这是必要的,原始管线再强,也不可能覆盖所有新场景,随着训练数据来源扩大,团队自然会进行工程化。

  但是扩大之后的规则集对新场景的覆盖程度比韩路一一开始设计的管线是要低很多的。

  这种差异导致训练精度在某个进度的时候会突然发生大的偏离。

  现在的关键是找到扩展规则集在哪个部分出了纰漏。

  韩路一一边滑动样本一边在心里过了一遍管线结构。

  屏幕另一头,赵文渊还在敲键盘,时不时停下来盯着输出皱眉。

  这对普通人来说是很难的,因为数据量太大了,而所谓的数据的好与坏、干净与杂乱,都是人为定义的主观判断标准。

  现在赵文渊唯一能看到的症状就是Loss值突然剧烈波动,但是在他不熟悉的巨大规则集和更巨大的原始语料里找出问题,不啻于大海捞针。

  唯一的办法就是现写脚本帮助诊断,这也是赵文渊正在做的事情。

  但是对赵文渊来说难的事情,对韩路一来说却未必难。

  或者说,对视界来说不难。

  视界,开。

  一瞬间,熟悉的颜色浮了上来。

  大部分样本是淡蓝色的正常文本。

  少量灰色,这些是重复文本,没被剔除,但是问题不大。

  几段橙红色的低质量内容已经被规则标记出来,本来不应该进入训练主数据。

  但很快,韩路一的目光停在了其中一片奇怪的颜色上。

  暗紫色。

  这不是之前出现过的颜色。

  他微微一怔。

  注意力移过去。

  视界里弹出一行说明。

  【疑似类型:伪结构化残片】

  【HTML/Markdown/JSON标记残片混合乱码,现行规则集将其误判为代码片段,词元化后重复符号占比异常,易造成异常长序列,引发训练曲线波动】

  韩路一看了一下原始数据。

  乍一看,这些片段确实很像代码,但是仔细一看,就发现不合语法,也没有实际意义。

  就像是有人专门投的毒。

  韩路一迅速的更新了几条新的规则来抓住这些数据,然后在赵文渊发来的异常样本上测试了一下。

  有效。

  韩路一一边把改好的规则集上传,一边在视频通话里把发现的问题和解决方案跟赵文渊同步了一下。

  赵文渊本来正在埋头写检测脚本,才写了一半,听到韩路一的话,茫然地抬起头。

  怎么?不是我在给你讲状况吗?

  你怎么已经解决了?

  但是很快他就释然了。

  哦对,韩总是我的随身老爷爷,那没事了。

  快速查看了一下规则集里新添加的几条规则,赵文渊把这批原始数据又跑了一遍,然后把清洗后的新数据加入管线,重新开始训练。

  按下开始的时候,他的心里莫名的安心。

  ……

  与此同时,鼎盛大厦。

  刘勃敲门进了王总监的办公室。

  “王总。”

  “刘总。”

  两人现在是一条绳子上的蚂蚱,感觉革命友谊都比以前深厚了。

  刘勃也不绕弯子,直接说道:“我刚下去看了一圈,前端的进度不错,御风现在只有一个终端命令行工具,我们加上前端是个竞争力。但是模型这边,用乾元的效果不太好,还是得有个好基座。”

  王总监点了点头,没说话。

  刘勃猜他根本就没听,或者没听懂:“王总……你是不是得给张总报一下?”

  王总监笑了笑:“这事是不是不用麻烦张总?放假前张总不是说的挺明白的,让咱们抓紧出活。”

  “是。”刘勃也笑了,“所以我才来跟你商量,我实话说,可能做不出来,到时候张总问起来”

  “张总能问到谁头上?”王总监坐直了身子,“开发是你带的。”

  刘勃脸上的笑容收敛了一点:“王总,御风也是你拆的,需求也是你的团队定的。”

  办公室里安静了一会儿。

  王总监掏出烟:“抽一根?”

  刘勃心想,在办公室抽烟,还挺刺激,这能算是加班福利吗?

  可惜

  “戒了。”

  王总监把烟又收了回去:“要不这样,咱俩再观察观察,明天下午要还是没进展,再说。”

  “行。”刘勃站起来,“那我先回去盯着。”

  “辛苦辛苦。”

  王总监看着刘勃往外走的背影,在心里想:要问你问,我反正不问。

  最后谁也没有和张弛打电话。

  其实就算他们打了,张弛也接不到。

  他的手机锁在更衣室里,人正在做SPA。

  ……

  “阿,爸爸妈妈也不是老古董,非得让你去相亲。”

  顾妈妈坐在沙发的另一头,面前的茶几上摆着一盘已经剥了一大半的砂糖橘,橘子皮散落在桌子上,堆成了一座小山。

  她说这话的时候手没停,把剥好的橘子放到碗里,又拿了一个橘子,剥了起来。

  顾司蜷在沙发的另一端,腿盘着,膝盖上压着一只抱枕,手里的手机屏幕一直亮着。她心不在焉地看着手机里的案子资料,连眼皮都没抬,仿佛没有听见。

  “你要是想自由恋爱,我们也支持啊。”顾妈妈把面前一小碗剥好的橘子推到女儿的面前,旁边还放着一盘草莓,没有动过。

首节上一节198/248下一节尾节目录