AI资讯
-
资讯丨302.AI已支持Anthropic最新模型Claude 3.5 Haiku,与其他模型对比表现如何?
11月5日,Anthropic在社交媒体平台宣布Claude 3.5 Haiku可以通过API访问。Claude 3.5 Haiku是Anthropic公司在10月22日发布的新模型,在许多评估中的性能与 Claude 3 Opus不相上下,而成本和速度却与上一代Haiku相当。 根据官方介绍,Claude 3.5 Haiku 在各种编码、工具使用和推理任务…
-
Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?
10月22日,Stability AI推出最新图像生成模型Stable Diffusion 3.5,其中包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo两个版本,并宣布预计在10月29日上线Medium版本。 10月29日,Stable Diffusion 3.5 Medium如期推出…
-
Claude升级PDF解析功能,302.AI实际上早已支持
11月2日,Anthropic在社交媒体平台宣布,在其Claude 3.5 Sonnet 模型中增加了PDF理功能,这一功能不仅能读懂PDF中的文字,还能看懂图表、图片等视觉元素。 目前这一新功能已进入公开测试阶段,用户可以利用该模型来分析PDF文档中的文本和视觉元素(如图像、图表和表格),适用于财务报告、数据分析、法律文件和文档翻译等多种场景。 而这一PD…
-
揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果
近日,一个名为red_panda的模型在Hugging Face的文本生成图像模型排行榜中位居榜首, 这引起了许多网友对这一神秘“小熊猫”背后公司身份的种种讨论。 有网友猜测小熊猫会不会是Midjourney的新产物,也有网友猜测可能是来自OpenAI: 甚至有网友猜测,因为熊猫生活在亚洲,而中国公司在视频生成方面表现卓越,所以猜测它来自像百度或腾讯这样的中…
-
302.AI带来实时语音便捷方案,让你快速体验AI语音通话
在10月初,OpenAI在旧金山召开了开发者大会。在发布会中,OpenAI推出了Realtime API 的公开测试版。 Realtime API是一种实时多模态API,它允许开发人员构建低延迟、多模态的AI应用体验。这个API背后的技术是GPT-4o模型,它支持音频输入和输出,能够实现超越传统基于文本的AI对话的实时、自然的语音交互。 像Realtime这…
-
最近爆火的AI播客工具,302.AI竟然开源了!
最近,随着NotebookLM的爆火,AI播客生成领域迎来了前所未有的热闹。 AI播客生成的兴起并不是偶然的,在信息爆炸的时代,用户往往会被海量的内容所淹没,很难去有效筛选和吸收有价值的内容,从而导致时间和精力的浪费。 而AI播客的出现改变了这一现状,比如曾经需要用3小时的时间才能通读一篇长论文才能提炼有效的关键信息,现在只需要3分钟,获取信息的过程也不再受…
-
Genmo推出全球最大开源视频生成模型Mochi V1,实测效果到底行不行?
10月22日,Genmo在社交媒体平台发布消息,推出最新的开源视频生成模型 Mochi V1。Mochi V1采用创新的 Asymmetric Diffusion Transformer(AsymmDiT)架构,拥有高达100亿个参数,是迄今为止公开发布的最大视频生成模型。 根据Genmo官方介绍,Mochi V1模型在提示词遵循和动作质量方面表现十分出色:…
-
告别繁琐配置,来302.AI一键部署GraphRAG
您是否遇到过这样的问题?大语言模型回答答非所问,或者直接在胡说八道。这种情况一般是因为大语言模型产生了幻觉。在开发和实际应用中,幻觉问题是一个常见且严重的问题,因为幻觉的存在,会导致回答的可信度大大降低。 幻觉出现的原因通常是模型对于某些特定领域或最新信息缺乏了解的情况下,而RAG(Retrieval-Augmented Generation)技术通过结合检…
-
英伟达微调Llama3很强?来302竞技场跑跑分!
10月17日,英伟达(Nvidia)开源了微调后的Llama3.1——Llama-3.1-Nemotron-70B-Instruct。 Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 使用私有数据集微调后的Llama3.1,旨在提高 LLM 生成的响应对用户查询的帮助性。 根据官方Tech Report,Llama-3.1-…
-
OpenAI推出meta-prompt提示词优化功能,提升AI互动精准度!
据了解, OpenAI在10月11日更新了提示词优化功能 Playgound,新增引入“元提示”(meta-prompt)工具。“元提示”(meta-prompt)工具主要帮助用户更高效地创建、改进针对大型语言模型(LLMs)的提示,节省开发高质量 AI 提示的时间。 OpenAI 表示,“元提示”结合了实际应用中的最佳实践和经验,旨在为用户提供快速的起点,…