(官方 Model Card)OpenAI发布的gpt-oss-120b与gpt-oss-20b两款开源推理模型,兼具强大推理能力和工具使用能力,支持多级推理强度调节,适配agentic工作流。核心亮点包括:
• 规模与架构:120b参数1168亿,20b参数209亿,均基于Mixture-of-Experts架构,配备128/32专家组,支持超大上下文(13万+tokens)与高效Flash Attention训练。
• 训练与数据:采用2024年6月前知识库,过滤有害生物安全内容,训练耗时210万H100 GPU小时(120b),专注STEM、代码与通用知识。
• 推理与工具使用:支持链式思维(CoT)、分层指令优先级(harmony chat format)、工具调用(网页浏览、Python代码运行、开发者自定义函数),实现复杂任务动态规划。
• 性能表现:120b模型在数学竞赛(AIME)、科学知识(GPQA)、多语言(MMMLU)及健康对话(HealthBench)等多项基准测试中接近甚至超越OpenAI官方o4-mini模型,20b表现同样优异,性价比突出。
• 安全与鲁棒性:模型默认遵循OpenAI安全政策,具备抵抗越狱攻击能力;虽然开放权重存在潜在风险,OpenAI通过预训练过滤、深度对抗训练及外部安全专家评审保障模型安全性。
• 风险评估:对生物化学和网络安全领域进行了敌对微调测试,未发现模型达到高级别危害能力,且未显著领先现有开源模型,AI自我提升能力有限。
• 开源与应用:模型基于Apache 2.0许可证发布,配套开源tokenizer和示例工具,便于开发者自定义与部署,推动安全可靠的AI生态构建。
深入了解OpenAI如何平衡开放性与安全性,推动AI技术惠及更广泛应用场景,详见:arxiv.org/abs/2508.10925
人工智能 开源模型 大规模语言模型 AI安全 机器学习 生物安全 网络安全