Easy同学正在独立开发 Mac M4 Mini 32G 跑 bytedance/seed-oss-36b 。
3.94 token/s ,速度不太行。
qwen/qwen3-30b-a3b-2507 能到 42.82 token/s ,但只有 3b 激活,适合干输出多的活。
目前智能和速度综合起来看,还是 gpt-oss-20b 裁剪得最好… 25.71 token/s
Easy同学正在独立开发 Mac M4 Mini 32G 跑 bytedance/seed-oss-36b 。
3.94 token/s ,速度不太行。
qwen/qwen3-30b-a3b-2507 能到 42.82 token/s ,但只有 3b 激活,适合干输出多的活。
目前智能和速度综合起来看,还是 gpt-oss-20b 裁剪得最好… 25.71 token/s
作者最新文章
热门分类
科技TOP
科技最新文章