LLM
-
302.AI 基准实验室 | 中秋国庆调休来了,哪个AI模型能算明白?
不知不觉中,2024年的时光已悄然流逝了三分之二。 许多打工人和学生党即将迎来中秋和国庆两个假期。放假是件开心的事情,然而,有网友发现,今年的中秋国庆假期放假和调休时间安排颇为复杂,这一话题因此登上了社交平台热搜榜,引发了广泛关注,阅读量激增至4亿,讨论量也高达11.3万。 对于接下来从九月第二周开始到十月“上6休3上3休2上5休1上2休7再上5休1”的放假…
-
302.AI 新品发布 | MIT本科生打造AI编程利器,Cursor助力程序员提升编码效率
从MIT的校园到硅谷,是年轻人追逐梦想的脚步,也是科技诞生的创新之旅。 最近,AI代码生成平台Cursor背后公司Anysphere成功获得6000万美元的A轮融资,获得了包括Google Brain前负责人Jeff Dean、OpenAI科学家John Schulman、AI研究先驱Noam Brown,以及Stripe和Github创始人在内的多位科技界…
-
302.AI 新品发布 | AI文档编辑器,让AI与文本编辑无缝融合
7月中,微软公司发布技术支持文档,宣布对其Word办公软件中的“Draft with Copilot”功能进行了升级,主要包括改写、扩充内容以及将内容转换成不同的格式或语言,旨在帮助用户更轻松地完善文档,提高工作效率。 随着技术的不断进步,AI工具已经渗透到我们的工作和生活中,成为了一种全新的工作方式和生活方式。这些工具不仅提高了效率,还为我们的日常任务带来…
-
302.AI 基准实验室 | 中文大模型多模态理解评测,腾讯混元大模型获榜单国内第一
8月初,中文多模态大模型SuperCLUE-V基准发布8月榜单,其中腾讯混元大模型斩获国内大模型排名第一。 测评涵盖了国内外最具代表性的12个多模态理解大模型,包含4个海外模型和8个国内代表性多模态模型,评估内容包含基础能力和应用能力,以开放式问题对多模态大模型进行评估。其中,腾讯混元大模型Hunyuan-Vision凭借其卓越的多模态基础能力和出色的应用能…
-
302.AI 基准实验室 | OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?
8月12日,ChatGPT官方账号在社交媒体平台发文称ChatGPT推出了新的GPT-4o模型,但同时也明确,这次推出的GPT-4o模型是对GPT-4o的改进,而不是新的前沿模型。而且,ChatGPT官方表示这次的更新“难以明确说明”。 然而,这一最新的模型ChatGPT-4o-latest在LMSYS的LLM竞技场排行榜中,已经以1314的综合分数超越曾经…
-
302.AI 基准实验室 | 阿里千问发布数学模型Qwen2-Math,最好的数学模型出现了?!
8月9日,阿里通义团队发布新一代数学模型Qwen2-Math,据官方称,Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型,其数学能力显著超越了开源模型,甚至超过了闭源模型(如 GPT-4o),Qwen2-Math包含1.5B、7B、72B三个参数的基础模型和指令微调模型。 在一系列数学基准评测上,Qwen2-Math-…
-
302.AI 基准实验室 | GPT-4o新版本突然上线,结构化输出是什么?
8月6日,OpenAI的官网悄悄上线了新版本gpt-4o-2024-08-06模型。去年的DevDay活动中,OpenAI推出了JSON模式,而这次升级的新版本在API中引入了结构化输出,这一新功能旨在确保模型生成的输出与开发人员提供的 JSON 架构完全匹配。 gpt-4o-2024-08-06采用结构化输出的新模型在复杂 JSON 模式跟踪的评估中获得了…
-
302.AI 基准实验室 | 当提示词使用”过去时”,就能突破各AI模型的安全防线?
近日,洛桑联邦理工学院的研究人员发现,当使用AI模型的时候,只要在提示词中把时间设定成过去,就能突破大模型的安全防线。原本只有1%的攻击成功率飙升至88%,几乎达到了“有求必应”的境界。这项发现不仅在英文环境下有效,在中文语境中同样适用,让网友们惊叹于破解大模型漏洞的简便性。 实验中,研究人员从JBB-Behaviors数据集中挑选了100个有害行为,通过将…
-
302.AI 实战教程 | 跨境电商翻译,AI顶替小语种翻译员?
是的没看错!AI翻译已经强大到可以顶替一个小语种翻译员了~直接给大家分享一个302.AI重度用户的跨境电商翻译实战案例: 做跨境电商的过程中,会发现语言其实是一个蛮大的障碍,尤其是小语种。今年我们的电商项目开拓了泰国市场,增加了一个泰国站点。放在以前,如果没有一个懂泰语的人,几乎是不可能建立泰国站点的,这次完全使用了302.AI的AI翻译大师来翻译整个站点,…
-
302.AI 基准实验室 | Meta号称最强的开源模型Llama3.1,却数不清strawberry有几个“r”?
7月23日,Meta AI发布最新开源模型 —— Llama 3.1 !在多项测试中超越闭源模型,开源模型的时代要来了吗? Llama3.1共包含8b、70b和405b三种模型,支持八种语言包括英语,德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语,具备 128K 扩展上下文长度,该模型提供通用知识、数学计算、多语言翻译和工具使用等能力。 其中,8B、…