302.AI
302.AI 新品发布 | AI语音生成器,不同方言也能轻松拿捏
近期,AI语音领域的热度急剧上升,备受瞩目。 前段时间,字节跳动豆包大模型团队发布了宣称可以生成自然真实语音的Seed-TTS,Seed-TTS在官方Demo中展示了适用不同场景的语音且非常自然,引发了越来越多用户的关注,但Seed-TTS目前仅发布了技术论文,尚未对外开放使用。 而同样由字节跳动开发的语音技术产品豆包语音,是字节跳动在C端产品中应用的技术,…
302.AI 基准实验室 | OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?
8月12日,ChatGPT官方账号在社交媒体平台发文称ChatGPT推出了新的GPT-4o模型,但同时也明确,这次推出的GPT-4o模型是对GPT-4o的改进,而不是新的前沿模型。而且,ChatGPT官方表示这次的更新“难以明确说明”。 然而,这一最新的模型ChatGPT-4o-latest在LMSYS的LLM竞技场排行榜中,已经以1314的综合分数超越曾经…
302.AI 基准实验室 | 阿里千问发布数学模型Qwen2-Math,最好的数学模型出现了?!
8月9日,阿里通义团队发布新一代数学模型Qwen2-Math,据官方称,Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型,其数学能力显著超越了开源模型,甚至超过了闭源模型(如 GPT-4o),Qwen2-Math包含1.5B、7B、72B三个参数的基础模型和指令微调模型。 在一系列数学基准评测上,Qwen2-Math-…
302.AI 新品发布 | 当FLUX结合LoRA技术,你还分得清现实和AI吗?
8月初,由Stability AI 前创始成员创立的新公司Black Forest Labs推出了图像生成模型FLUX.1,而FLUX.1模型不仅在生成效果上超越Stable Diffusion,还能与 Midjourney 直接对打。如果想了解FLUX.1模型的朋友可以翻阅小编往期作品,因为今天的主角,不止是FLUX.1。 AI领域一直被形容为“内卷王者”…
302.AI 新品发布 | 小白不会修图怎么办?来看看这个AI图片工具箱
2024上海国际视觉影像产业展览会在8月7日开幕,展会吸引了来多个国家和地区。而在展会中,多个AI智能化后期领域的代表品牌云集,我们可以看到,“AI工作流”正在颠覆传统工作流。 其中,美图云修在展会现场演示了智能曝光、色彩迁移、换背景等商业摄影相关功能。而百度网盘也在展会中正式推出百度网盘AI修图。在此次展会上,可以明显观察到,无论是应用于产品图片的优化,还…
302.AI 基准实验室 | Stable Diffusion原班人马打造FLUX.1模型,推出的三个版本有什么不同?
就在不久前,Stable Diffusion开源图像模型推出后,在网络上引发了热烈的讨论和广泛关注。后来,Stable Diffusion 部分创始成员创建了新公司Black Forest Labs,8月1日,Black Forest Labs推出了新研发的图像生成模型FLUX.1 。 FLUX.1 拥有12B参数,是迄今为止参数最多图像生成模型之一。该模型…
302.AI 基准实验室 | 智谱清影AI视频还在内测阶段,背后的模型CogVideoX 突然宣布开源?!
近日,国外的AI视频生成模型竞争依然在不断升温,国内的AI视频模型赛道也迎来了前所未有的“内卷”潮。 7月26日,智谱清影(Ying)AI视频生成工具正式上线,这款由智谱AI推出的视频生成工具,允许用户通过输入文本描述或上传图片,在大约30秒内生成一段6秒长的视频。 而在8月6日,智谱AI宣布清影背后的视频生成模型——CogVideoX正式开源。 或许很多人…
302.AI 基准实验室 | GPT-4o新版本突然上线,结构化输出是什么?
8月6日,OpenAI的官网悄悄上线了新版本gpt-4o-2024-08-06模型。去年的DevDay活动中,OpenAI推出了JSON模式,而这次升级的新版本在API中引入了结构化输出,这一新功能旨在确保模型生成的输出与开发人员提供的 JSON 架构完全匹配。 gpt-4o-2024-08-06采用结构化输出的新模型在复杂 JSON 模式跟踪的评估中获得了…
302.AI 新品发布 | 视频太长不想看怎么办?来试一试AI音视频总结工具
7月,夸克推出AI搜索并升级“超级搜索框”,在搜索框中加入了多个强大并实用的AI功能。其中的AI视频总结工具,这一工具不仅可以基于视频生成文稿,还能分段总结、生成思维导图以及智能生成课件,辅助用户高效学习。来看看官网的演示: 然而,目前小编只在夸克移动端找到了AI视频总结工具,而且根据页面提示,这一AI视频总结工具仅支持:上传视频和网盘视频两种方式,这意味着…
302.AI 基准实验室 | 可灵AI全面开放,引领视频创作新时代
7月下旬,可灵AI(Kling AI)宣布全面开放,曾经在国内外内测名额“一号难求”的可灵成为了历史。可灵AI是由快手科技自研的视频生成大模型,能够根据文本提示生成长达2分钟、帧率为30fps的高质量视频,支持1080p分辨率,并支持多种宽高比,陆续升级推出了图生视频等功能。 从上线到全面开放,可灵历经了一个多月的时间: 6月10日,快手科技宣布推出了可灵大…