基准实验室 -

302.AI 基准实验室 | Mistral AI推出多模态模型Pixtral Large，实测结果让人眼前一亮？

11月19日，Mistral AI宣布推出新视觉模型——Pixtral Large。 Pixtral Large是基于Mistral Large 2构建，具有124B开放权重的多模态模型，支持128K上下文窗口，能够理解文档、图表和自然图像的同时保持了 Mistral Large 2 领先的纯文本理解能力。根据Mistral AI提供的Pixtral La…

2024 年 11 月 21 日 • 基准实验室

43400

302.AI 基准实验室 | 阿里发布长上下文模型Qwen2.5-Turbo，实测结果不达预期？

继9月Qwen2.5发布后，11月18日，阿里巴巴通义千问团队再次发布新模型Qwen2.5-Turbo，大幅提升了上下文处理能力与推理速度。据了解，Qwen2.5-Turbo上下文长度从 128k 显著增加到 1M 个 tokens，约相当于 100 万个英文单词或 150 万个中文字符。这一容量可容纳 10 部长篇小说、150 小时的语音记录或 3 万行…

2024 年 11 月 20 日 • 基准实验室

83500

302.AI 基准实验室 | DeepMind新模型Gemini-exp-1114模型霸榜第一？实测结果出人意料

11月15日，谷歌DeepMind推出Gemini-exp-1114，这是一个实验性模型。据了解，在经过6000+网友匿名投票后，Gemini-exp-1114模型在AI基准测试中位居总体排名第一，Gemini-exp-1114模型分数直涨40+，与GPT-4-latest并列第一，并超越了o1-preview。 Gemini-exp-1114在处理复杂提…

2024 年 11 月 18 日 • 基准实验室

38800

302.AI 基准实验室 | “Thinking Claude”prompt真的这么神？302带你实测揭秘看看

最近，又一个prompt在网上火了起来，这一prompt名为“ Thinking Claude”，有网友称它为Claude3.5的神级prompt，而更让人意想不到的的是，这个prompt背后的作者，居然是一个十七岁的少年！ “Thinking Claude”的核心在于它引导Claude进行一种更为“人性化”的思考方式，强调思维过程的自然流动，而非简单的结构…

2024 年 11 月 15 日 • 基准实验室

67400