Qwen3
302.AI 基准实验室丨编程能力超越Claude Opus 4?DeepSeek V3.1最新版本实测
DeepSeek 昨晚在 Hugging Face 发布了其最新升级模型 DeepSeek-V3.1-Base。这次更新并没有任何预热宣传,甚至没有放上模型卡。唯一已知的信息是:上下文窗口从原有的64k扩展至128k,从网页、App、小程序都可体验这一模型。从上传的模型版本看,模型尺寸达 685B,支持 BF16、F8_E4M3、F32 等张量类型,平衡模型…
302.AI 基准实验室丨开源新SOTA? Open AI GPT-OSS系列模型对决国产开源模型评测
2025 年 8 月 5 日,OpenAI 突袭发布了两款全新的开源推理模型——gpt-oss-120b 和 gpt-oss-20b。这是 OpenAI 自 2019 年 开源 GPT-2 以来,时隔 6 年首次重返开源生态。 本次开源的 gpt-oss 系列包含两个高性能版本,均采用混合专家架构(MoE) 与 Apache 2.0 开源许可,支持自由修改、…
302.AI 基准实验室 | 阿里推出Qwen3新系列模型 ,性能全面测试对比
4月29日凌晨,阿里通义千问团队宣布推出全新一代的混合推理模型—— Qwen3 系列模型。 Qwen3 系列包含了两款MoE模型: Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参) Qwen3-30B-A3B(300亿总参数、30亿激活参数) 以及六款 Dense 模型: Qwen3-32B、Qwen3-14B、Qwen3-8B、Qw…