LLM

302.AI 基准实验室 | xAI官宣Grok API开启公测，grok-beta表现能否达到预期？

11月6日，备受瞩目的2024年美国总统选举结果终于揭晓，马斯克公开支持的美国共和党总统候选人特朗普获得最终胜利。作为特朗普的“榜一大哥”马斯克，是人工智能初创公司xAI的始人之一和主要投资者。在11月4日，xAI刚刚官宣Grok API正式开启公测。根据xAI公司官方发布的文档，可以看到xAI的API目前只有一个模型——“grok-beta”。从官方…
2024 年 11 月 8 日 • 基准实验室
1.5K10
302.AI 基准实验室 | Anthropic最新模型Claude 3.5 Haiku，与其他模型对比表现如何？

11月5日，Anthropic在社交媒体平台宣布Claude 3.5 Haiku可以通过API访问。Claude 3.5 Haiku是Anthropic公司在10月22日发布的新模型，在许多评估中的性能与 Claude 3 Opus不相上下，而成本和速度却与上一代Haiku相当。根据官方介绍，Claude 3.5 Haiku 在各种编码、工具使用和推理任务…
2024 年 11 月 6 日 • 基准实验室
3.7K1110
302.AI 新品发布 | 提示语专家工具，让人机交互更精准、更高效

在众多AI产品中，自然语言处理（NLP）技术是连接人类与机器的桥梁。NLP使得机器能够理解、解释和生成人类语言，从而实现更自然、更高效的交互。它允许用户通过文本或语音与AI进行实时对话，获取信息、解决问题或执行任务。随着对话式交互的广泛普及，提示词（prompt）的精确度对AI产出内容的质量起到直接影响，它们已成为引导AI模型生成预期响应的关键因素。一个好…
2024 年 11 月 1 日 • 新品发布
2.2K111
302.AI 实战教程 | 让所有大模型轻松开启Artifacts可视化交互！

什么是Artifacts？在数字化时代，AI对话工具已经成为我们日常工作的得力助手。然而，这些工具通常局限于输出纯文本内容，如Markdown和代码，使得用户在验证AI生成内容的实际效果时，不得不在多个软件和平台间频繁切换，这一过程不仅耗时耗力，还极大地降低了生产力和工作流畅性。如今，Claude 3.5 Sonnet的Artifacts功能以其创新的技…
2024 年 10 月 29 日 • 实战教程
3.4K421
302.AI 实战教程 | 告别繁琐配置，来302.AI一键部署GraphRAG

您是否遇到过这样的问题？大语言模型回答答非所问，或者直接在胡说八道。这种情况一般是因为大语言模型产生了幻觉。在开发和实际应用中，幻觉问题是一个常见且严重的问题，因为幻觉的存在，会导致回答的可信度大大降低。幻觉出现的原因通常是模型对于某些特定领域或最新信息缺乏了解的情况下，而RAG（Retrieval-Augmented Generation）技术通过结合检…
2024 年 10 月 23 日 • 实战教程
1.8K32
302.AI 基准实验室 | 英伟达微调Llama3很强？来302竞技场跑跑分！

10月17日，英伟达（Nvidia）开源了微调后的Llama3.1——Llama-3.1-Nemotron-70B-Instruct。 Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 使用私有数据集微调后的Llama3.1，旨在提高 LLM 生成的响应对用户查询的帮助性。根据官方Tech Report，Llama-3.1-…
2024 年 10 月 22 日 • 基准实验室
1.5K00
302.AI 新品发布 | AI视频实时翻译工具，再也不用等美剧翻译！

看视频已经成为了现代人不可缺少的娱乐放松方式，尤其是随着全球化的发展和互联网的普及，人们接触的内容越来越多，观看国外的视频也很方便，比如一些有趣的短视频、电视剧电影、演讲、纪录片等。然而对于一些观众来说，没有中文翻译的外语视频犹如天书一般，听不懂外语、看不懂内容，就无法享受看视频带来的乐趣了。试想一下，作为一个追剧爱好者，好不容易等到新剧集更新，却看到一…
2024 年 10 月 17 日 • 新品发布
1.9K191
302.AI 实战教程 | OpenAI推出meta-prompt提示词优化功能，提升AI互动精准度！

OpenAI在10月11日更新了提示词优化功能 Playgound，新增引入“元提示”（meta-prompt）工具。“元提示”（meta-prompt）工具主要帮助用户更高效地创建、改进针对大型语言模型（LLMs）的提示，节省开发高质量 AI 提示的时间。 OpenAI 表示，“元提示”结合了实际应用中的最佳实践和经验，旨在为用户提供快速的起点，避免从零开…
2024 年 10 月 15 日 • 实战教程
1.7K40
302.AI 基准实验室 | 火星文避雷评价帖，AI到底能不能看懂？！

AI到底能不能看懂火星文差评！看看哪个模型表现更好！大家都知道，在《歌手2024》播出的时候，13.8和13.11哪个大的问题难倒了不少AI模型。而最近，AI模型迎来了新一轮考验来了，起因是这样的，为了防止外国人通过翻译软件看懂原意，一些中国人在海外订酒店吃亏后，用火星文提醒同胞不要再来，而这些帖子被截图搬运到了国内的社交媒体平台后很快就火了，引发了不少网…
2024 年 9 月 29 日 • 基准实验室
1.3K00
302.AI 基准实验室 | 时隔两月Meta再发布新模型Llama 3.2，视觉理解方面媲美GPT-4o-mini？！

距离7月23日Llama 3.1发布才刚刚过去 2 个月，Meta公司在9月26日又官宣推出最新AI模型系列Llama 3.2，此次Llama 3.2系列包括四个版本：1B、3B、11B和90B。 Llama 3.2 1B和Llama 3.2 3B都是轻量级的模型，适合边缘和移动设备的轻量级纯文本模型。而Llama 3.2 11B和Llama 3.2 90B…
2024 年 9 月 27 日 • 基准实验室
1.3K00

9 / 12
7
8
9
10
11
12