Qwen3

编程能力超越Claude Opus 4？DeepSeek V3.1最新版本实测丨302.AI 基准实验室

DeepSeek 昨晚在 Hugging Face 发布了其最新升级模型 DeepSeek-V3.1-Base。这次更新并没有任何预热宣传，甚至没有放上模型卡。唯一已知的信息是：上下文窗口从原有的64k扩展至128k，从网页、App、小程序都可体验这一模型。从上传的模型版本看，模型尺寸达 685B，支持 BF16、F8_E4M3、F32 等张量类型，平衡模型…
2025 年 8 月 20 日 • 基准实验室
3.2K10
302.AI 基准实验室丨开源新SOTA? Open AI GPT-OSS系列模型对决国产开源模型评测

2025 年 8 月 5 日，OpenAI 突袭发布了两款全新的开源推理模型——gpt-oss-120b 和 gpt-oss-20b。这是 OpenAI 自 2019 年开源 GPT-2 以来，时隔 6 年首次重返开源生态。本次开源的 gpt-oss 系列包含两个高性能版本，均采用混合专家架构（MoE）与 Apache 2.0 开源许可，支持自由修改、…
2025 年 8 月 6 日 • 基准实验室
7.0K00
阿里推出Qwen3新系列模型，性能全面测试对比 | 302.AI 基准实验室

4月29日凌晨，阿里通义千问团队宣布推出全新一代的混合推理模型—— Qwen3 系列模型。 Qwen3 系列包含了两款MoE模型： Qwen3-235B-A22B（2350多亿总参数、 220多亿激活参） Qwen3-30B-A3B（300亿总参数、30亿激活参数）以及六款 Dense 模型： Qwen3-32B、Qwen3-14B、Qwen3-8B、Qw…
2025 年 4 月 30 日 • 基准实验室
16.4K2812

Qwen3

编程能力超越Claude Opus 4？DeepSeek V3.1最新版本实测丨302.AI 基准实验室

302.AI 基准实验室丨开源新SOTA? Open AI GPT-OSS系列模型对决国产开源模型评测

阿里推出Qwen3新系列模型 ，性能全面测试对比 | 302.AI 基准实验室

阿里推出Qwen3新系列模型，性能全面测试对比 | 302.AI 基准实验室