安思罗普指责三种中国模式“非法蒸馏”；马斯克：抓小偷 – 新京报

新京报贝壳财经记者罗一丹利用人工智能生成了这些数据。北京时间2月24日，中国三大AI公司DeepSeek、月之暗面、MiniMax被领先AI编程模型Claude母公司Anthropic“点名批评”。 Anthropic 表示，中国公司“使用 24,000 个‘马账户’进行了 1,600 万次对话，以解锁 Claude 训练自己模型的能力。”他还创造了“工业规模蒸馏攻击”一词。然而，这一指控很快就遭到了埃隆·马斯克的无情“嘲笑”：“他们怎么可能偷走Anthropic从人类程序员那里偷来的东西呢？” “Anthropic大规模窃取训练数据，并支付数十亿赔偿，这是不争的事实。”马斯克在社交平台上发文。另一方面，近年来，国产车型的性能不断提升，不少厂家都将发展目标聚焦在克劳德傲人车型上。t 编程能力。在“点名”的同时，MiniMax、Kimi等国产机型的营收、通话量等指标再创新高。中国人工智能企业正在用事实证明，技术封锁和空洞指责阻挡不了国内人工智能的发展。蒸馏也可以用作“攻击方法”吗？蒸馏技术本质上是无害的。问题是谁使用它以及如何使用它。模型蒸馏是人工智能领域的标准学习技术。允许大型模型指导较小模型的学习可以实现知识转移和模型压缩。例如，DeepSeek 在金融场景练习中将参数模型从 1750 亿压缩到 70 亿，将推理成本降低了 98%，并保留了 95% 以上的核心指标。 MiniMax 模型 M2.5 在 SWE 基准验证中达到了 80.2%。这与 Claude Opus 4.6 的 80.8% 大致相同，但成本仅为 lat 的二十分之一呃。目前，蒸馏技术为 OpenAI、Google 和 Meta 等领先公司提供动力。它被世界各地的人工智能公司普遍使用，包括所有将蒸馏技术应用到自己的模型中的公司。事实上，Anthropic本身在批评这三家中国公司后补充道：“蒸馏方法是合理的。人工智能研究所使用蒸馏方法为其客户创建更小、更便宜的模型。”但随后又发文称：“一些国外实验室非法提炼制造的模型后，具体一个研究机构，甚至提到了一家中国公司的名字，理由是“对公开的员工信息进行核实。”但目前来看，这些指控只是人类学的“片面言论”。有人说，在法律层面上很难建立这样的溯源方法。蒸馏技术传递的是功能逻辑，而不是直接复制数据。这就是结论这是法律允许的“逆向工程”。简单地将事件定性为“抢劫”并不能掩盖证据薄弱的事实。这种指责给人一种“贼喊捉贼”的感觉。 Anthropic本身就有一段“数据盗窃”的“黑历史”。 2025年9月，Anthropic从LibGen、PiLiMi等盗版网站非法大量下载了超过700万本正版图书，并利用这些盗版图书训练其AI模型。以作家安德里亚·巴茨 (Andrea Bartz) 为代表的国际作家团体被迫支付 15 亿美元的和解金。正如马斯克所说：“这是不争的事实。”目前，AI行业仍处于规则空白之中。我们需要共同制定蒸馏技术的局限性和数据使用的底线的全球标准。商业竞争并没有错，但频繁的标签和双重标准只会阻碍创新和包容。 OpenAWhen I、Google 和 AnthrOpic 使用未经授权的数据来训练大规模模型，他们对“蒸馏”的指责类似于保护既得利益的防御反应。中国的人工智能模型不惧批评，正在迎头赶上。月之暗面和 MiniMax 都没有对 Anthropic 主动提出的指控做出回应。他的意图很明确。让数据和事实来说话。 DeepSeek自2026年以来发表多篇文章，不断将最新研究成果开源，全面落实“降本增效”。同时，DeepSeek 也正在对新模型进行灰度测试，V4 已“准备推出”。壳牌财经记者从知情人士处获悉，Dark Side of the Moon已完成新一轮超过7亿美元的融资，并计划再次融资，距离完成上一轮5亿美元融资仅一个多月。此轮融资由阿里巴巴、腾讯、婺源、九安等共同领投。一个新的本轮融资已启动，估值在100亿至120亿美元之间，已有多家机构表达了兴趣。其连续第二轮融资超过12亿美元，创下了过去一年主要模特行业融资最多的记录。此前，字节达到百亿美元估值用了四年多的时间，拼多多则用了三年多的时间。在短短两年多的时间里，Kimi 的估值就增加了 30 多倍。按照这种观点，Kimi有望创下国内公司从成立到估值超过100亿美元的最快增速。从模型调用次数来看，《月之暗面》模型 Kim K2.5 上线不到一个月，但近 20 天的累计收入超过了其 2025 年的总收入。根据 OpenRouter 的数据，Kim K2.5 调用量在 OpenClaw 的模型调用榜上排名第一。 MiniMax 告诉壳牌财经记者，我将于春节前夕开源新一代M2.5车型。上线12小时内就登上OpenRouter人气榜榜首，一周内就登上调用量榜首，每周调用量飙升至3.07万亿代币。 OpenRouter 上的通话量也在同时增加。官方后来证实，M2.5正在推动100k到1k长文本范围.lon的增量呼叫需求，这是座席工作流程的典型消费场景。事实上，中国AI企业的快速进步来自于庞大的工程师群体、丰富的数据资源、完整的产业链以及对开源和开源的承诺。 DeepSeek、Kimi和MiniMax在编程、多模态和代理领域的进步是技术创新和场景深化的结果。新京报贝壳财经记者编辑：罗一丹纠错：岳彩洲刘宝庆