新京报贝壳财经记者罗一丹利用人工智能生成了这些数据。北京时间2月24日,中国三大AI公司DeepSeek、月之暗面、MiniMax被领先AI编程模型Claude母公司Anthropic“点名批评”。 Anthropic 表示,中国公司“使用 24,000 个‘马账户’进行了 1,600 万次对话,以解锁 Claude 训练自己模型的能力。”他还创造了“工业规模蒸馏攻击”一词。然而,这一指控很快就遭到了埃隆·马斯克的无情“嘲笑”:“他们怎么可能偷走Anthropic从人类程序员那里偷来的东西呢?” “Anthropic大规模窃取训练数据,并支付数十亿赔偿,这是不争的事实。”马斯克在社交平台上发文。另一方面,近年来,国产车型的性能不断提升,不少厂家都将发展目标聚焦在克劳德傲人车型上。t 编程能力。在“点名”的同时,MiniMax、Kimi等国产机型的营收、通话量等指标再创新高。中国人工智能企业正在用事实证明,技术封锁和空洞指责阻挡不了国内人工智能的发展。蒸馏也可以用作“攻击方法”吗?蒸馏技术本质上是无害的。问题是谁使用它以及如何使用它。模型蒸馏是人工智能领域的标准学习技术。允许大型模型指导较小模型的学习可以实现知识转移和模型压缩。例如,DeepSeek 在金融场景练习中将参数模型从 1750 亿压缩到 70 亿,将推理成本降低了 98%,并保留了 95% 以上的核心指标。 MiniMax 模型 M2.5 在 SWE 基准验证中达到了 80.2%。这与 Claude Opus 4.6 的 80.8% 大致相同,但成本仅为 lat 的二十分之一呃。目前,蒸馏技术为 OpenAI、Google 和 Meta 等领先公司提供动力。它被世界各地的人工智能公司普遍使用,包括所有将蒸馏技术应用到自己的模型中的公司。事实上,Anthropic本身在批评这三家中国公司后补充道:“蒸馏方法是合理的。人工智能研究所使用蒸馏方法为其客户创建更小、更便宜的模型。”但随后又发文称:“一些国外实验室非法提炼制造的模型后,具体一个研究机构,甚至提到了一家中国公司的名字,理由是“对公开的员工信息进行核实。”但目前来看,这些指控只是人类学的“片面言论”。有人说,在法律层面上很难建立这样的溯源方法。蒸馏技术传递的是功能逻辑,而不是直接复制数据。这就是结论这是法律允许的“逆向工程”。简单地将事件定性为“抢劫”并不能掩盖证据薄弱的事实。这种指责给人一种“贼喊捉贼”的感觉。 Anthropic本身就有一段“数据盗窃”的“黑历史”。 2025年9月,Anthropic从LibGen、PiLiMi等盗版网站非法大量下载了超过700万本正版图书,并利用这些盗版图书训练其AI模型。以作家安德里亚·巴茨 (Andrea Bartz) 为代表的国际作家团体被迫支付 15 亿美元的和解金。正如马斯克所说:“这是不争的事实。”目前,AI行业仍处于规则空白之中。我们需要共同制定蒸馏技术的局限性和数据使用的底线的全球标准。商业竞争并没有错,但频繁的标签和双重标准只会阻碍创新和包容。 OpenAWhen I、Google 和 AnthrOpic 使用未经授权的数据来训练大规模模型,他们对“蒸馏”的指责类似于保护既得利益的防御反应。中国的人工智能模型不惧批评,正在迎头赶上。月之暗面和 MiniMax 都没有对 Anthropic 主动提出的指控做出回应。他的意图很明确。让数据和事实来说话。 DeepSeek自2026年以来发表多篇文章,不断将最新研究成果开源,全面落实“降本增效”。同时,DeepSeek 也正在对新模型进行灰度测试,V4 已“准备推出”。壳牌财经记者从知情人士处获悉,Dark Side of the Moon已完成新一轮超过7亿美元的融资,并计划再次融资,距离完成上一轮5亿美元融资仅一个多月。此轮融资由阿里巴巴、腾讯、婺源、九安等共同领投。一个新的本轮融资已启动,估值在100亿至120亿美元之间,已有多家机构表达了兴趣。其连续第二轮融资超过12亿美元,创下了过去一年主要模特行业融资最多的记录。此前,字节达到百亿美元估值用了四年多的时间,拼多多则用了三年多的时间。在短短两年多的时间里,Kimi 的估值就增加了 30 多倍。按照这种观点,Kimi有望创下国内公司从成立到估值超过100亿美元的最快增速。从模型调用次数来看,《月之暗面》模型 Kim K2.5 上线不到一个月,但近 20 天的累计收入超过了其 2025 年的总收入。根据 OpenRouter 的数据,Kim K2.5 调用量在 OpenClaw 的模型调用榜上排名第一。 MiniMax 告诉壳牌财经记者,我将于春节前夕开源新一代M2.5车型。上线12小时内就登上OpenRouter人气榜榜首,一周内就登上调用量榜首,每周调用量飙升至3.07万亿代币。 OpenRouter 上的通话量也在同时增加。官方后来证实,M2.5正在推动100k到1k长文本范围.lon的增量呼叫需求,这是座席工作流程的典型消费场景。事实上,中国AI企业的快速进步来自于庞大的工程师群体、丰富的数据资源、完整的产业链以及对开源和开源的承诺。 DeepSeek、Kimi和MiniMax在编程、多模态和代理领域的进步是技术创新和场景深化的结果。新京报贝壳财经记者 编辑:罗一丹 纠错:岳彩洲 刘宝庆