鼎盛集团总部,48层的大会议室。
林绍峰走进来的时候,会议室已经坐了不少人了。
技术线、产品线、市场线、法务线、公关线,还有集团战略投资部的人,全都到了。
这在鼎盛内部并不常见。
鼎盛是巨头,不是创业公司。
巨头的好处是资源多,但坏处是层级也多。大部分项目推进到一定阶段,都要经过一层又一层的汇报,推进速度极慢。
但今天不一样。今天坐在会议室主位上的,是鼎盛集团的董事长吕云。
他只是列席参会,会议进程由CEO郑晓波主持。
但吕云出现在这里,已经足够体现这个会议的级别了。
今天这个会,是要出结果的。
林绍峰就是今天的主汇报人,他把笔记本接到会议室的大屏上,屏幕亮起。
幻灯片上有一个大标题坤元。
底下是一行英文副标题KunYuan。
郑晓波看着屏幕,脸上没什么表情。
AI赛道上,鼎盛在国内的几家大厂里不算落后,乾元的发布也很成功。但是现在的问题是,还没有能在国际上拿得出手的产品。
在AI这件事上,吕云有他自己的判断,也和郑晓波分享过。他觉得这是一个赢家通吃的游戏,为了不被吃掉,鼎盛必须得成为赢家。鼎盛的对手不在国内,而在国际。
这也让郑晓波知道,吕云对他现在的成绩还不满意。
他心里也急,在AI赛道上做出成绩,是董事会,也就是吕云对他的要求。
但他知道,急也没用,事情得一步一步做。
坤元就是第一步。
昨天训练的结果出来,几个公开测试集都跑过了,还没有去网上发布结果,林绍峰已经私底下把结果向郑晓波汇报过了。
今天的这个会议,是演示,是告知,不是决策讨论。
“吕总,郑总。”林绍峰开门见山,“坤元的内部测评已经完成了,从综合能力来看,坤元1.0的各项能力已经进入全球第一梯队。”
开篇先强调了一下成绩,林绍峰环顾了一下观众,重点注意了吕云的反应,但是没看出什么来。
他按了一下手中的翻页器,大屏幕上出现了一张综合数据。
数学,代码,多语言理解,长上下文,逻辑推理,知识问答,意图理解。
每一项都有分数、排名、对标模型。
“如果只看通用能力,坤元1.0目前落后于GPT最新一代旗舰模型,但是差距已经不大。”林绍峰说道:“和Gemini、水星的最新版本相比,我们在部分项目上互有胜负。尤其是在中文任务、企业场景、复杂指令遵循这几个维度,坤元的表现非常突出。”
然后他切到下一页。
这一页的标题是:中文意图理解专项评测。
屏幕上是一组更夸张的数据。
坤元1.0在中文复杂需求理解、隐含条件识别、业务流程补全、用户真实意图判断这些项目上,全面高于所有对标模型。而且不是小幅领先,而是跨越式的高。
断层碾压。
会议室里响起了低声的讨论声。
大部分人都知道这个结果意味着什么。
大模型研究在国内是后发,如果能做出第一个在单项领域全世界登顶的大模型,对鼎盛的行业地位都有重大意义。
林绍峰紧接着讲了具体的测评标准,包括公开测试集、内部自建题库、第三方公开任务集,和企业真实场景脱敏数据。
“国产大模型最大的问题,是大家做的比较像。正落到业务场景里,经常听不懂人话。用户说一句‘帮我弄一下这个’,模型不知道‘这个’是什么,用户说‘老板要看’,模型不知道重点应该放在风险、结果还是汇报口径上。”
会议室里不少业务线负责人都点了点头,他们对这些场景都深有体会。
大部分大模型演示的时候看起来很强,真正接入业务系统,就像一个刚毕业的实习生。
做业务的能力比写代码的能力差多了。
这也不怪大模型,代码本身是可验证的,对就是对,错就是错,做业务可不是这样,模糊的地方很多。
到了问答环节,市场部的负责人先站出来说话了。
他知道今天会议的目的,就是为坤元的发布定计划。
刚才林绍峰展示的数据很好看,拿出去说是一回事,但是真的有几斤几两,不好说。
他还得先弄清楚坤元的真实水平,才好制定相应的计划。
“林总,这个成绩很惊人。我不是不信任测评,但是咱们能不能搞个演示,看看真实场景的效果?”
市场部负责人的这句话一问出来,吕云的目光就转了过来。
第二百二十七章 让AI听懂中国
听了这个问题,林绍峰轻轻吸了一口气,然后微微一笑,说道:“当然可以。”
现场演示有风险,因为你总能发现测试的时候测不到的东西。
不是对自己的产品有足够的信心,一般是不会做现场演示的。
不过,话又说回来,现在是内部会议,演示就算出问题了,也只是在内部丢脸,要是真在发布会上现场演示出了问题,那是要上新闻、上热搜的。
林绍峰又扫了一眼吕云和郑晓波,两人都很专注地看着这边,他把刚才那口气吐出来,打开了坤元的交互界面。
既然要进行现场演示,他准备的材料当然已经私底下跑了很多次了,但是大模型的特点就是不可预测,懂得都懂。
输入:【就快双十一了,帮我把这份备货方案过一遍,看看有没有问题。】
然后上传了附件,附件是一份备货预案的文档,几十个SKU的库存计划、仓储分配、物流时效节点全都在里面。
坤元处理之后,输出里没有列出所有风险。
而是只列出了三条。
头部爆款SKU在主仓的备货量按照去年销售曲线估算,峰值时段可能断货;华南仓到主力配送区的物流时效节点恰好在第一天的晚上,高概率会有延误;还有两个促销组合的定价存在漏洞,导致某些商品折上折后低于成本价。
每一条后面,都还带了修复建议,全是可以在几天内完成的具体动作。
作为对比,林绍峰把同一份附件和同样的提示词发给了ChatGPT。
ChatGPT的回复非常详尽从仓储布局到长期供应商关系,从流量预测模型到客服应急预案,洋洋洒洒写了十几条。先不说给出的答案是不是正确,光这个体量的文本就让人看了头皮发麻,不想读。
林绍峰把两个输出并排放在大屏幕上。
“这是我们团队里的研究员找电商部门的小伙伴要来的真实案例,他们看过输出之后,觉得坤元的输出更好。”林绍峰说到这,转向了电商部的VP,“许总,您觉得呢?”
许总没想到自己会被点名,愣了一下,但是反应很快,笑了一下,回答道:“当然,从我的角度上看,坤元的回答明显更实用一些,我希望现在就能给运营团队的同事们都安排上。”
会议室里响起了一阵低笑声,连吕云的脸上都挂上一点笑意。
“当然,这件事GPT也可以做到。”
林绍峰话锋一转,说道:“但是想要这个效果,提示词就得这么写”
他切了一下屏,是另外一个文档,屏幕上出现了一段提示词:
【请分析以下备货方案,要求:
只列出三天内可以解决的问题;
按照对双十一峰值销售的影响程度从高到低排序;
每条问题后附出具体可执行的动作建议;
忽略需要长期优化的结构性问题。】
“按这个提示词,GPT大概率也能输出差不多的结果。”
林绍峰停顿了一下,环顾了一下在座的人。
“但问题是,这段提示词是研究员和运营专员花了二十分钟写出来的。”他说,“大部分用户想的就是:双十一快到了,帮我看看有没有问题。他不会知道要说「只看三天内能解决的」,要说「按影响程度排序」,要说「忽略结构性问题」。他只想直接要一个有用的答案。”
会议室里安静了下来,有些人的表情明显带着思考。
“用户说的是「就快双十一,帮我过一遍」,他没有说只看几天内能解决的、只看影响峰值的、结论要可执行。但坤元知道「就快」这个时间窗口意味着什么,知道双十一备货的语境下「有没有问题」问的是什么问题。”
“这是对中文业务场景的理解,这种理解摆脱了提示词的限制。”林绍峰总结道。
这样一比较,即使两者在解决复杂问题的方面不相上下,坤元模型在交互这一块已经胜出了。
如果是公开演讲,这里可能会有掌声,但这是内部会议,没人鼓掌。
这个演示做完之后,市场负责人没有再提出新的问题。
他已经在想该用什么样的宣传词来抓人的眼球了。
这次,是有真东西的。
林绍峰其实还准备了其他的几个演示例子,但是没人提出,他也没有拿出来。看来刚才的那个演示已经足够证明坤元的价值了。
停顿了一会儿,林绍峰又补充了一句话。
“还有一件事。”他扫了一眼在座的各事业部VP、业务线负责人,“坤元是独立研发,独立部署,数据都在鼎盛自己的服务器上,这解决了最大的一个隐患。每年双十一的备货方案、定价策略,这些东西,传给外部的AI,你们放心吗?”
听了这句话,吕云微微点了点头,然后终于开口问出了他的第一个问题,却和演示的内容无关:“这个项目的技术负责人是谁?”
林绍峰犹豫了一下,技术的方向和进度都是刘大海定的,但是在训练的最后阶段,因为两人对数据质量的判断产生分歧,被他报到郑晓波那,换去别的项目了。
这种层次的变动,虽然审批线上不会过吕云,但要说他一点儿也不知道,林绍峰也不相信。
“坤元的技术架构和方向,主要是首席科学家刘大海博士带队攻关的。”他紧接着补充道,“整个团队最近都很辛苦,才把坤元做出来。”
“嗯,那他怎么没在场?”吕云说这话的时候,转头看了郑晓波一眼。
吕云的声音并不严厉,但是林绍峰的心里咯噔了一下。
林绍峰正要回答,郑晓波却先开口了:“刘博士最近调到另一个项目上攻坚了。坤元交付在即,琐事比较多,但是技术团队的整体推进没有停下来。”
吕云又点了一句:“下次做这种汇报,技术负责人还是要在场。”
然后不等有人回答,他转开了话题:“完成度可以,讲讲发布的计划吧。”
郑晓波接到了信号,站起身来,走到屏幕前。
林绍峰自觉地退到了一边,用电脑把刚才展示数据的幻灯片又调了出来。
郑晓波指着屏幕上的测评数据,说道:“这次发布会,不能当做一个普通的技术发布来做,大家有什么想法,都可以提出来。”
然后他转向市场部负责人:“市场部这边有什么想法,先说说。”
市场部负责人站起来:“郑总,按照国际上的发布惯例,先放技术报告,公布测评数据,再做一个线上直播发布会,安排媒体做深度解读,邀请生态合作伙伴站台。”
郑晓波听完,摇了摇头:“太平庸。”
他看了吕云一眼,又对所有人说道:“国内现在没有能站上第一梯队的大模型,鼎盛今天能拿出坤元来,就是一个宣言:互联网时代鼎盛是第一个,AI时代,鼎盛还是第一。”
众人都听明白了,郑晓波是对坤元寄予厚望,准备靠它让鼎盛站到全球AI的叙事中心去,和OpenAI、谷歌一个级别。
而且吕云在场,郑晓波当他的面说这些话,说明这也是吕云的意思。