AI资讯
-
Ideogram推出2.0版本,连Midjourney都感受到了压力?看看到底有多厉害?!
8月21日,由Ideogram团队倾力打造的创新型文本生成图像模型 Ideogram 2.0正式发布。 其实早在今年2月,Ideogram团队就发布了Ideogram模型1.0版本,但是其在AI生图领域并未引起太大波澜,但在这一次 Ideogram 2.0版本发布后,Ideogram官方直接在社交媒体平台自信宣称,这一版本比FLUX Pro和DALL·E3要…
-
中文大模型多模态理解评测,腾讯混元大模型获榜单国内第一
8月初,中文多模态大模型SuperCLUE-V基准发布8月榜单,其中腾讯混元大模型斩获国内大模型排名第一。 测评涵盖了国内外最具代表性的12个多模态理解大模型,包含4个海外模型和8个国内代表性多模态模型,评估内容包含基础能力和应用能力,以开放式问题对多模态大模型进行评估。其中,腾讯混元大模型Hunyuan-Vision凭借其卓越的多模态基础能力和出色的应用能…
-
OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?
8月12日,ChatGPT官方账号在社交媒体平台发文称ChatGPT推出了新的GPT-4o模型,但同时也明确,这次推出的GPT-4o模型是对GPT-4o的改进,而不是新的前沿模型。而且,ChatGPT官方表示这次的更新“难以明确说明”。 然而,这一最新的模型ChatGPT-4o-latest在LMSYS的LLM竞技场排行榜中,已经以1314的综合分数超越曾经…
-
阿里千问发布数学模型Qwen2-Math,最好的数学模型出现了?!
8月9日,阿里通义团队发布新一代数学模型Qwen2-Math,据官方称,Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型,其数学能力显著超越了开源模型,甚至超过了闭源模型(如 GPT-4o),Qwen2-Math包含1.5B、7B、72B三个参数的基础模型和指令微调模型。 在一系列数学基准评测上,Qwen2-Math-…
-
当FLUX结合LoRA技术,你还分得清现实和AI吗?
8月初,由Stability AI 前创始成员创立的新公司Black Forest Labs推出了图像生成模型FLUX.1,而FLUX.1模型不仅在生成效果上超越Stable Diffusion,还能与 Midjourney 直接对打。如果想了解FLUX.1模型的朋友可以翻阅小编往期作品,因为今天的主角,不止是FLUX.1。 AI领域一直被形容为“内卷王者”…
-
Stable Diffusion原班人马打造FLUX.1模型,推出的三个版本有什么不同?
就在不久前,Stable Diffusion开源图像模型推出后,在网络上引发了热烈的讨论和广泛关注。后来,Stable Diffusion 部分创始成员创建了新公司Black Forest Labs,8月1日,Black Forest Labs推出了新研发的图像生成模型FLUX.1 。 FLUX.1 拥有12B参数,是迄今为止参数最多图像生成模型之一。该模型…
-
智谱清影AI视频还在内测阶段,背后的模型CogVideoX 突然宣布开源?!
近日,国外的AI视频生成模型竞争依然在不断升温,国内的AI视频模型赛道也迎来了前所未有的“内卷”潮。 7月26日,智谱清影(Ying)AI视频生成工具正式上线,这款由智谱AI推出的视频生成工具,允许用户通过输入文本描述或上传图片,在大约30秒内生成一段6秒长的视频。 而在8月6日,智谱AI宣布清影背后的视频生成模型——CogVideoX正式开源。 或许很多人…
-
GPT-4o新版本突然上线,结构化输出是什么?
8月6日,OpenAI的官网悄悄上线了新版本gpt-4o-2024-08-06模型。去年的DevDay活动中,OpenAI推出了JSON模式,而这次升级的新版本在API中引入了结构化输出,这一新功能旨在确保模型生成的输出与开发人员提供的 JSON 架构完全匹配。 gpt-4o-2024-08-06采用结构化输出的新模型在复杂 JSON 模式跟踪的评估中获得了…
-
视频太长不想看怎么办?来试一试AI音视频总结工具
7月,夸克推出AI搜索并升级“超级搜索框”,在搜索框中加入了多个强大并实用的AI功能。其中的AI视频总结工具,这一工具不仅可以基于视频生成文稿,还能分段总结、生成思维导图以及智能生成课件,辅助用户高效学习。来看看官网的演示: 然而,目前小编只在夸克移动端找到了AI视频总结工具,而且根据页面提示,这一AI视频总结工具仅支持:上传视频和网盘视频两种方式,这意味着…
-
可灵AI全面开放,引领视频创作新时代
7月下旬,可灵AI(Kling AI)宣布全面开放,曾经在国内外内测名额“一号难求”的可灵成为了历史。可灵AI是由快手科技自研的视频生成大模型,能够根据文本提示生成长达2分钟、帧率为30fps的高质量视频,支持1080p分辨率,并支持多种宽高比,陆续升级推出了图生视频等功能。 从上线到全面开放,可灵历经了一个多月的时间: 6月10日,快手科技宣布推出了可灵大…