首富从AI浪潮开始 第211节

  “等到发布会之后再行动。”顾司说道。

  韩路一看了她一眼。

  顾司解释了一下自己的判断:“现在发,是提醒他们,发布会之前,他们还有时间调整口径、暂停演示、替换模型版本,甚至把风险包装成内部测试问题。但如果等发布会结束再发,就不一样了。”

  这个判断和韩路一的一致,他没说话,等顾司说下去。

  顾司继续说道:“到那个时候,他们已经公开宣布坤元的能力,公开展示它的商业价值,公开接受媒体、客户和合作伙伴的背书。坤元就不再是一个还没落地的内部项目,而是鼎盛面向市场作出的正式承诺。”

  她顿了顿,然后才说:“承诺越大,违背承诺的后果也就越严重,函件的份量也就越重。”

  说完了时机的判断,她开始阐述具体的函件内容。

  “在发布会之后,发一封律师函,正式警告对方,我方已知晓对方的侵权行为,并且明确表示我方数据仅用于自身模型的训练,不对对方开放使用授权。”

  “同时在函中明确,我方已掌握对方侵权的切实证据,我们已通过技术水印、输出比对、数据分布特征等手段,确认了对方已正式发布并对外宣传的坤元模型中,使用了源智科技的私有标注数据。”

  顾司说到这顿了顿。

  韩路一听她列举的这些证据,心中一笑。这些证据自然都有,但是最关键的一条她却没说坤元会自己承认自己违规使用私有数据的事实。

  这其实是一个经典的悖论,你要向人证明你有一件东西,却又不能让他知道这东西是什么。比如说,如果告诉鼎盛我可以让坤元说出这句话,鼎盛干脆在模型调用层包一层服务,只要检测到“源智”两个字就拦截回复呢?

  顾司之所以建议隐瞒不说,就是防止这种情况的发生,只说其他的证据已经足够引起对方的重视了,也避免把杀手锏透露出去的风险。

  但其实,韩路一又岂止在里面加入了这一条逻辑水印呢?鼎盛就算在回复之前再怎么拦截,只要他们不重新训练,都不可能把韩路一在数据中埋下的陷阱拦截完。

  韩路一微微点头,示意顾司继续。

  “第三,给侵权行为定性”

  顾司说到这里又顿了一下,这是整个律师函的核心。

  “并非只是投资协议中的数据侵权,而是涉嫌违反云服务协议中的数据隔离和保密义务,涉嫌未经授权访问、复制、使用客户数据。”顾司说道,这才是能让鼎盛真正重视的东西,把对源智科技一家的侵权扩展到对所有用户的有可能侵权上。

  如果是“鼎盛私自使用源智的数据”,这是两家之间的纠纷,但如果是“云服务商非许可占用客户数据”,那就不仅仅是一个案子,受到影响的可能是所有的企业客户、政府项目,所有正在谈的云服务大单。

  “最后一件事,就是提出要求。”顾司说道,“立即停止坤元模型的进一步商用、对外测试、客户部署和合作签约流程;封存相关模型版本、训练日志、数据流转记录和云平台访问记录;书面说明坤元训练数据来源;并在二十四小时内安排具备决策权限的人与源智科技进行沟通。”

  韩路一端起咖啡喝了一口。

  然后他问了一个问题:“如果他们不愿意呢?”

  “他们会愿意的。”顾司说。

  韩路一微微一笑。

  “发布会之前,他们还可以选择不发”

  “发布会之后,他们就只能选择怎么收场了。”

  他看向顾司办公室的窗台,在那上面,那盆绿萝正旺盛的生长着,叶子从窗台垂到了地面上。

  韩路一回想起最初找鼎盛谈算力投资的时候。

  那个时候他就说过了,数据,那可是另外的价格。

第二百三十章 坤元发布

  美国,西海岸,硅谷。

  下午五点五十七分,Nexus AI总部的大会议室里坐着几十个员工。

  这个时间,本来大部分员工都要下班了。

  但是今天不同,京城时间的上午十点,鼎盛集团即将召开一场发布会。

  换算到美国西海岸的时间,就是下午六点。

  CEO瑞恩安排助理点了几十份比萨,组织了这场集体观看直播的活动。

  鼎盛是一家传统互联网企业,在瑞恩心里,可以把它当成一个中国版的亚马逊,电商、云,业务渗透在各个领域。

  但是在AI方面,他们并不是领先者。

  那为什么他还要组织全公司的人一起来看这场发布会呢?

  因为最近在大模型排行榜上出现了一个新的模型

  KunYuan-1.0

  这个新模型在各个测试集都取得了不错的成绩,而且还特意测试了中文特化的测试集,业内人士都猜测这是中国的哪家研究团队做出来的新成果。

  瑞恩也有自己的猜测。

  他在市面上已知的各种大模型里搜索了一番,鼎盛之前发布的代码大模型QianYuan这个名字一看就是一起的。

  再联系上鼎盛最近宣传的声势浩大的发布会,有很大的可能,这个KunYuan就是鼎盛的新模型。

  在过去十几年里,鼎盛几乎就是中国互联网和云服务产业的代表之一。

  在AI大模型时代,他们虽然起步慢了一点,到现在也只有QianYuan这一个模型比较知名,但底蕴在那,没有人会小瞧他们。

  就像Meta、亚马逊、苹果,在AI时代一直没做出东西来,也不妨碍人们相信他们早晚会做出成果来。

  尤其是这一次。

  鼎盛的预热做得太大了。

  过去一周,中文互联网、产业媒体、开发者社区、投资人圈子,都在讨论这场发布会,甚至传到了瑞恩的耳朵里。

  从测试数据就可以看出,KunYuan是通用大模型,而且已经接近了市面上顶尖闭源模型的水平。

  让瑞恩最担心的还不止是这个KunYuan。

  而是源码科技的御风。

  御风已经展现了非常高超的工程能力,在智能体这条路上走在了行业的最前面,现在唯一的限制就是制作出御风的那个中国公司源码科技,还没有自己的大模型。

  没有大模型,就没有底牌,暂时够不成威胁。

  但是另一个中国企业恰好在这个时候发布了通用大模型。

  如果这个叫KunYuan的大模型真的能达到测试所展现出的水平,这两家中国企业完全可以合作。

  这才是让瑞恩最担心的情况。

  所以他才想亲眼看看,自己将要面临的是什么样的对手。

  鼎盛,作为中国互联网的传统大厂,能在AI时代拿出什么样的作品。

  会议室前方的大屏幕已经接入了直播间,画面暂时还是发布会倒计时。黑色背景中,一道橙色的光线缓缓流动,像是某种正在被点亮的神经网络。

  中间只有一行字,原本的邀请函上,有两个字被高斯模糊掉了,随着倒计时越来越小,模糊的程度也在变动。

  上面写的是“让AI听懂中国”,底下有一行英文翻译,“Let AI Understand China.”

  Nexus AI的市场负责人迈克尔低声说了一句:“他们很会做传播,这个主题很抓人眼球。”

  CTO约翰低头看了眼放在大腿上的电脑屏幕:“这个叫KunYuan的模型,不只是中文能力很突出,综合能力也不差。”

  迈克尔看了约翰一眼,问道:“和水星比怎么样?”

  约翰回答他:“各有各的强项(Horses for courses),但是金星快要出来了,它们和金星比不了。”

  金星是Nexus正在训练的秘密项目,已经快要训练完成了,而金星的目标直指世界第一。

  迈克尔吃了颗定心丸,把注意力转回到发布会上。

  这个时候画面已经亮了起来。

  一个中年男人走上舞台。

  瑞恩低声说了一声:“郑晓波。”

  上台的正是鼎盛集团的CEO,郑晓波。

  他站在画面中央,等掌声落下,缓缓开口:“过去两年,AI大模型改变了世界。”

  在会议室里的人都听不懂中文,但是画面下放有英文字幕是用大模型实时生成的。

  “但我们也发现一个问题。”

  “很多模型可以回答中文问题,却未必真正理解中文世界的表达。”

  “它们知道词语的意思,却不知道场景的重量。”

  “它们知道用户说了什么,却不知道用户真正想要什么。”

  产品负责人萨拉看着字幕,深感共鸣。

  这是所有AI产品的产品经理都在思考的问题。

  AI很强,但AI不够懂用户,尤其是当用户提供的上下文不够的时候。

  郑晓波已经继续了:“所以今天,我们鼎盛,带来了全新的通用大模型坤元。”

  屏幕上,两个巨大的中文字浮现。

  坤元。

  现场响起热烈的掌声。

  Nexus AI的会议室里没人说话。

  按照一般大模型发布会的惯例,第一部分应该是模型参数、训练规模、基准评测推理能力、代码能力、数学能力。

  事实上,这些分数早在一星期前就出现在榜单上了,在坤元名字揭晓的一瞬间,关心的人已经把它的分数对应上了。

  但是郑晓波没有展示这些。

  他从一个业务案例讲起,在鼎盛的电商活动双十一期间,很多商家会对活动准备有很多问题,运营根本应对不过来,但是坤元模型,不需要经过任何调教,不需要专门写客服程序,直接开放给商家,就能给出很好的答案。

  他现场演示了这个例子,拿来对比的另一家大模型,就是现在的世界第一OpenAI的GPT模型。

  迈克尔低声地给旁边的约翰解释道:“双十一,11月11日,就是中国人的黑色星期五。”

  美国人会在每年感恩节前的星期五在各个行业各个品类举办大型促销活动,也叫黑色星期五。

  约翰心领神会。

  这些事情,很难要求模型知道,但是坤元这个模型就知道。

  “这个例子选的好。”迈克尔说,和实际场景结合的太好了,尤其是和他们自己的实际场景。

  演示结束,现场又响起了热烈的掌声。

  “有可能是规则层调教过的。”约翰说,“提前写好了提示词,究竟是真理解了,还是提前透过题,这么看可看不出来。”

  “就当他们没有规则层。”瑞恩回应了他的假设。

  他不忌惮夸大对手的实力,但他担心因为傲慢而低估了对手。

  发布会还在继续。

  第二个演示是政务场景。

  郑晓波现场输入了一段口语化的问题:“我们区里想搞一个给小微企业的扶持政策,但是之前有几个补贴项目效果不好,这次想避免被薅羊毛,也别搞得企业申请起来太麻烦,帮我想想怎么设计。”

  坤元回答的很有条理,也都解释了理由,可行动项就三个:明确扶持对象,官方数据验证;补贴不发现金,而是以数字化方式减免;压缩申请材料,电子化流程,自动与政务数据库交叉验证。

  这些行动都切实有效。

首节上一节211/248下一节尾节目录