首富从AI浪潮开始 第137节

  然后,马小飞才转过头来,问道:“张浩然你什么情况啊?这么着急把我们叫过来?有什么你马哥能帮忙的?是不是老韩的存款不太够啊?”

  韩路一也好奇的看向张浩然。

  这确实是张浩然今天想说的正题了,他没理会马小飞的玩笑,表情严肃,声音低沉:“老韩上次不是给了我们一个内测账户吗?你回去用了吗?”

  马小飞被他的神情搞得有点不自在:“我打开看了一眼,不是跟什么ChatGPT、豆包之类的一样吗?”

  “不一样。”张浩然说:“老韩这个模型,真的会读心术。”

  这下别说马小飞,连韩路一也一头雾水了,读心术什么的,是因为汤圆在意图理解这方面确实不错,他说着玩的,看张浩然的样子,怎么好像真信了?

  “我给你详细讲讲,我们银行之前不是新换了行长吗,最近总行又在推国产系统迁移,行长助理和直管我的副行长对上了,僵持了两三周。我为这个事儿愁死了不知道多少脑细胞,生怕站错队。结果你猜怎么着,我把这个事儿跟汤圆一说,她全给理清了。”

  张浩然说到这,声音压得更低了一点,脑袋往前凑了凑,然后做了个手势,让另外两人也把头凑过来。

  “我觉得她说的有道理,然后开会的时候,我就跳船了,力挺行长助理。结果你猜怎么着,行长助理还真是代表着行长的意思,我现在直接进了委员会了,委员会里除了我之外,就是总行下来的经理和我们行的另一个副行长。”

  听到这,马小飞开口了:“卧槽,我他妈鸡皮疙瘩起来了啊。”

  他转头看了一眼架在桌子上的Pocket 4P,伸手过去拿了回来,关机了。

  “你放心,刚才这段我肯定不播出去。”马小飞保证道。

  张浩然这时候举起手里的可乐,对着韩路一说:“老韩,我今天就是想谢谢你,你这个AI真是太牛逼了,给我在职场省了三五年的努力啊。”

  韩路一却有点儿高兴不起来。

  他先和张浩然碰杯,喝了一口可乐,然后才开口道:“我是真没想到能用它来干这个。”

  韩路一确实没想到,他有点儿受限于现在市面上的大模型的能力,脑子里想的应用场景都是在上下文不足的情况下让模型更好的理解用户真正的需求,好帮助他们解决问题。

  张浩然这种用法,既出乎他的意料之外,又似乎在情理之中。毕竟它的标注数据来源于金手指,说是简易版的读心术也不为过。而且大模型能做得更进一步的是,基于分析的结果,他还能给出行动建议。

  但是恰恰也是它最危险的地方。

  张浩然刚才说的这些事情,现在别的大模型能做吗?

  能做。

  但是人们会去听吗?

  大概率不会。

  不会的原因是什么?

  因为它们分析得不够好。

  但是汤圆在意图理解这个方向的能力异常高了之后,导致它分析别人的意图时,可以分析得头头是道。

  这样它再给出行动建议的时候,人们就很难不会相信。

  可是连原版的金手指都不能预测未来。

  何况是一个 7B模型,加上弱化版的金手指呢?

  如果说对了还好,可是如果说错了呢?

  其实说起来,大模型在很多场景下都已经表现得非常好了。比如医疗诊断、法律分析,它们都能给出头头是道的建议。

  但是为什么在这些场景下,反而应用推广得最慢呢?

  因为这些场景都是典型的高代价场景。

  你可以正确率达到 99%,但是 1%的错误会造成严重的后果。

  在以前,有专业人士来承担这些后果,但是如果使用 AI的话,谁来承担呢?

  想到这,韩路一表情严肃,对张浩然说道:“你以后,别再这么用了。”

  张浩然一愣:“什么意思?”

  韩路一整理了一下思路,说道:“你没意识到吗?它不止在分析,还给了你具体的建议,然后你照做了。”

  然后他加重了语气,一字一顿的说:

  “你把判断权交出去了。”

  张浩然一下就明白了韩路一的意思,感觉浑身一冷。

  是啊,他这次是站对了队,但是他真的知道为什么吗?

  下一次呢,怎么办?

  他回想一下,最近越来越多的在和汤圆交流职场上自己看不懂的事,她说的都有道理,他也基本上都会采纳。

  韩路一的话没有停:“浩然,一旦你越来越依赖它,你的大脑会退化的”

  “到那个时候,你就废了!”

  这句话落下,旁边的马小飞忍不住咽了口口水。

  张浩然说:“那……我该怎么办?”

  韩路一想了想,说:“换一种用法。”

  “什么用法?”

  “你可以把它当一个朋友,一个老师,但是不能当成先知。咱们上学的时候怎么学习?看见不会的东西先自己思考,实在想不出来,再带着思考的过程和卡住的地方去问老师。或者和朋友交流,你也会先把自己的想法说出来,再去问别人的意见。不放弃自己思考,先思考,带着思考的结果再交流,这才是正确的用法。”

  马小飞听到这,忍不住开口说道:“老韩啊,你说的那是你的学习方法吧。我都是看见不会就直接去问老师的。”

  韩路一神色怪异的转过头:“海城人上交大的要求就这么低吗?”

  “你是不是在阴阳我?”

  有马小飞打断,包厢里的气氛没有刚才那么压抑了,恰好这个时候菜上来了。

  韩路一不知道张浩然听进去没有,但是三人默契的转移了话题,聊起了别的事情。

  张浩然虽然没有升职,但是得到了大领导的赏识,还拿到了实权的工作,值得庆贺。

  “说起来,你的烟戒的怎么样了?”马小飞说道。

  “还行,没破戒。就是每天晚上加班比较辛苦,你看今天连酒都没点。”张浩然笑着说。

  “不是?谁问你了啊?”马小飞提高了声音,“不要欺负我们单身狗啊!”

  说到这,马小飞又转向韩路一:“呃,老韩,你跟我还是同一个阵营吧?”

  韩路一点了点头。

  马小飞好像松了口气,又接着问道:“那你跟苏女神是怎么回事啊?还没确定关系吗?”

  “咱不聊这个,行吗?”韩路一看向了烤鱼。

  “行吧……”马小飞叹了口气,“我周六去医院看见苏女神了,还打了个招呼。”

  “什么?她去医院干什么?”韩路一转向马小飞,急切的问道。

  “不是,你怎么不问我去医院干什么啊?”马小飞“嘿”了一声,“重色轻友了吧?”

  然后他看了看韩路一的神情,赶紧说道:“好像是她家人住院了吧,我没细问,她看起来气色不太好,可能是太累了。”

  韩路一想起今天早晨苏念念的身姿,其实会前能从她的神态中看去一点疲惫,但是会一开始,她就火力全开了。

  那个样子,大概是在强打精神吧。

  韩路一从桌上拿起手机,打开和苏念念的对话框,打了几个字,又删掉了。

  问什么呢?问“你家人还好吗”?他连是谁住院都不知道。问“你还好吗”?今天早上刚见过,她在会上那个状态,说明她不想让别人看出来。

  最后他只发了一条:“念念,今天辛苦了,早点休息。”

  发完之后他看着那条消息,总觉得说得太少了,但又想不出更合适的话。

  苏念念没有秒回。

  韩路一把手机放回桌上,继续吃鱼。又过了几分钟,手机亮了一下,他低头看了一眼。

  “好的!”

  “你也是啊!”

  韩路一盯着这六个字看了一会儿,然后锁了屏,没再回复。

  吃完饭,张浩然提前去把单买了,临走之前和韩路一说:“老韩,你还是把我的那个内测账号关了吧。我怕我忍不住。”

  韩路一想了想,说:“好,我把服务器关了,回去再调整调整,这样确实不能放出去给普通用户用。”

  马小飞赶紧说:“诶,你关他一个人的好了,我这边还没用过呢。”

  他看到两人神色不善,赶紧又加了一句:“至少明天再关,明天再关吧,让我今天晚上试试先。”

  ……

  回到家,韩路一打开电脑,从赵文渊分享的资料里拉出一部分原始数据,然后用赵文渊放在同一个文件夹里的数据清洗的脚本,跑了起来。

  一边跑,韩路一一边打开了视界。

  视哥,看看实力。

第一百六十章 你什么都不知道

  视界打开的瞬间,屏幕上正在滚动的日志变得不一样了。

  每一条经过清洗管线的数据,在韩路一眼中都浮现出一层薄薄的色彩。

  干净的、有信息量的数据泛着淡蓝色的光,像水流一样顺畅地通过管线;被规则正确拦截的垃圾数据是灰色的,在某个节点处被清理出去,不再被下面的环节处理;而那些有问题却没被拦住的数据,发着刺眼的橙红色,混在蓝色的水流中间,格外扎眼。

  韩路一还注意到另一种颜色,偶尔有几条数据闪着暗蓝,但在灰色数据中格外显眼,它们被规则误判为垃圾扔了出去,但其实是有价值的内容。

  就像站在流水线旁边,别人只能看到传送带上的产品在动,而韩路一的眼睛能给每一个产品,甚至每一条传送带本身做质检。

  韩路一盯着屏幕看了大概十分钟,先从最明显的橙红色开始分析,逐渐摸清了规律。

  主要是三个问题。

  最多的是纯垃圾没有清干净。菠菜广告、瑟瑟引流、关键词堆砌,这些最低级的垃圾,现有的规则只做了关键词匹配,但变体太多了。

  用谐音字、用emoji替代、把敏感词拆成两段分别塞进前后文里,简单的正则表达式根本防不住。视界里这类数据发着最亮的橙红色,数量不少。

  然后是语义重复。两段话用词完全不同,但表达的意思几乎一样,基于关键词和格式的规则识别不了。

  最后一个最隐蔽,是低质量内容的伪装。有些内容的格式、长度、关键词分布都符合优质内容的特征,但实际上是洗稿或者机器生成的填充物,里面的内容好多有事实性错误。

  这三个加在一起,占了所有数据的将近七成。

  韩路一退出视界,开始改脚本。

  用传统的垃圾分类规则,想要全涵盖工程量很大,韩路一直接换了个思路。

  汤圆的模型不是还在吗,直接把数据发给汤圆做个检测,意图识别。别管你是怎么变体、怎么拆字、怎么用emoji,只要最后是“引导点击”或者“诱导付费”的内容,一律会被标出来。

  同样的,用汤圆给数据做精简化处理,再合并就简单多了。

  最后一个识别伪装内容稍微难了一点,但是难不倒视界,在视界的提示下,韩路一加了一层基于困惑度的筛选。

  真正有信息量的文本,语言模型预测下一个词的不确定性会更高;而那些洗稿和填充内容,因为套路化严重,困惑度反而很低。

  改完之后重新跑了一遍。

  再用视界看过去。

首节上一节137/248下一节尾节目录