6月30日,华为正式宣布开源盘古70亿参数的稠密模型、盘古ProMoE720亿参数的混合专家模型和基于昇腾的模型推理技术。
据悉,盘古ProMoE72B模型权重、基础推理代码,已正式上线开源平台。基于昇腾的超大规模MoE模型推理代码,已正式上线开源平台。盘古7B相关模型权重与推理代码将于近期上线开源平台。
据介绍,盘古Embedded7B模型参数规模为70亿,采用双系统框架,具备「快思考」和「慢思考」能力。盘古ProMoE72B模型总参数量720亿,激活参数量160亿,推理速度最高可达单卡1528tokens/s。