Qwen新架构又快又便宜Qwen新模型秒解AIME数学题
Qwen下一代模型架构,抢先来袭!
Qwen3-Next发布,Qwen团队负责人林俊旸说,这就是Qwen3.5的抢先预览版。
基于Qwen3-Next,团队先开源了Qwen3-Next-80B-A3B-Base。
模型参数80B,但训练成本连Qwen3-32B的十分之一都不到,并且在32 k以上的上下文推理吞吐能达到后者的十倍以上。
基于这一模型,团队接连出手,同步开发并发布了两大新模型:
- Qwen3-Next-80B-A3B-Instruct:在256K超长上下文处理任务中展现出显著优势。
- Qwen3-Next-80B-A3B-Thinking:在多项基准测试中超越闭源模型Gemini-2.5-Flash-Thinking。
网友表示,这更新频率令人震惊。话不多说,赶紧来看看新模型有哪些改进吧。