一个拥有万亿参数的神秘免费AI模型突然上线,关于DeepSeek V4将发布的猜测再一次涌现。

据路透社3月18日报道,一款名为“Hunter Alpha”的AI模型近日在开发者平台OpenRouter匿名上线,引发全球开发者社区关注。该模型未标注开发者身份,但观察其性能参数与时间节点,市场猜测这可能是DeepSeek在正式发布前对其下一代系统进行的秘密测试。

Hunter Alpha于3月11日以“隐身模型”形式发布,且目前向开发者提供免费访问。测试显示,该系统具备1万亿参数规模和高达100万token的上下文窗口。

在测试中,该模型自称“主要以中文训练的中国AI模型”,知识截止时间为2025年5月,这一点与DeepSeek现有模型一致。但当被问及开发者时,其回应:“我只知道自己的名字、参数规模和上下文长度。”

OpenRouter平台未披露模型来源,DeepSeek亦未回应置评请求。

性能参数触发市场敏感点

Hunter Alpha的核心指标迅速成为讨论焦点。

其参数规模达到1万亿级别,属于当前最前沿模型梯队。同时,该系统宣称拥有高达100万token的上下文窗口,远高于多数商业模型,意味着可处理更长文本与复杂任务。

构建AI代理系统的工程师Nabil Haouam表示:“Hunter Alpha的100万token上下文与推理能力相结合,且免费访问,这一组合非常引人注目。”

凭借高性能与零成本的优势,Hunter Alpha在开发者中迅速普及。据OpenRouter统计,截至周日,该模型已处理超过1600亿个token。

数据截止期与推理风格指向DeepSeek

将Hunter Alpha与DeepSeek联系起来的线索,主要来自其底层数据特征和运行逻辑。

在媒体测试中,该聊天机器人自称是“主要用中文训练的中国AI模型”,并透露其训练数据截至2025年5月。这一时间节点与DeepSeek自家聊天机器人报告的知识截止点完全一致。

当被问及开发者身份时,该系统拒绝回答。聊天机器人回应称:“我只知道我的名字、参数规模和上下文窗口长度。”

在技术层面,部分开发者认为模型的运行方式暴露了其“血统”。在模型发布后对其进行分析的AI工程师Daniel Dewhurst表示:“思维链模式可能是最强烈的信号。推理风格很难掩饰,往往反映了模型的训练方式。”

Daniel Dewhurst补充称,Hunter Alpha的规模和记忆容量,也与今年早些时候流传的DeepSeek V4规格预期相符。据多家媒体曾报道,DeepSeek的下一代V4模型最早可能在4月发布。

匿名发布:行业默认的“灰度测试”机制

在AI行业,通过匿名发布模型来获取真实反馈已成为一种标准做法。OpenRouter等平台允许开发者通过单一接口向数十个AI模型发送查询,使其成为新系统理想的测试场。

Hunter Alpha的个人资料页上的一则通知印证了这一点。通知称,该模型的所有提示和完成内容“均由提供商记录,并可能用于改进模型”。

这种做法在业内并不罕见,例如今年2月,一个名为Pony Alpha的匿名模型出现在OpenRouter上,五天后中国公司Zhipu AI确认这是其GLM-5系统的一部分。

尽管有诸多相似之处,部分开发者仍对Hunter Alpha就是DeepSeek V4的结论持谨慎态度。运行独立AI基准测试的Umur Ozkul表示:“我的分析表明Hunter Alpha可能不是DeepSeek V4。”他指出,与DeepSeek现有系统相比,该模型在token相关行为和架构模式上存在差异。

不过,Umur Ozkul也承认,考虑到发布时机和所宣传的功能,市场将该模型与DeepSeek联系起来的猜测是完全可以理解的。