302.AI带来实时语音便捷方案,让你快速体验AI语音通话

在10月初,OpenAI在旧金山召开了开发者大会。在发布会中,OpenAI推出了Realtime API 的公开测试版。

Realtime API是一种实时多模态API,它允许开发人员构建低延迟、多模态的AI应用体验。这个API背后的技术是GPT-4o模型,它支持音频输入和输出,能够实现超越传统基于文本的AI对话的实时、自然的语音交互。

像Realtime这一类AI实时语音通话工具的应用场景非常广泛,比如OpenAI在发布会上展示了一个通过Realtime API构建的旅行规划应用,用户可以通过语音与AI助手互动,迅速获取关于伦敦旅行的建议,从餐厅推荐到景点信息,充分体现了语音交互技术的便捷性与实用性。

Realtime API价格

Realtime支持文本和音频两种方式,在10月30日,OpenAI官网更新调整了Realtime的API价格,其中音频的输入输出价格不变,新增缓存输入令牌,具体价格是:

输入:100美元/1M tokens;

缓存输入:20美元/1M tokens;

输出:200美元/1M tokens;

即使做了调整,价格也还是很贵!

302.AI带来实时语音便捷方案,让你快速体验AI语音通话

这样一来,用户想要直接在官网使用,不仅价格昂贵,还有可能受到地区限制。而302.AI给用户提供了一个极具性价比的选择,且无需OpenAI会员也能体验!具体步骤如下:

AI语音通话工具介绍

1、首先打开302.AI,进入工具超市,找到AI语音通话工具:

302.AI带来实时语音便捷方案,让你快速体验AI语音通话

2、302.AI的AI语音通话提供了【对讲机】【电话】两种模式:

【对讲机】模式可以手动控制输入和输出,一问一答,比较传统;

302.AI带来实时语音便捷方案,让你快速体验AI语音通话

【电话】模式用户使用通话开关键控制通话开始和结束,更接近于传统的打电话,AI实时回复,用户可以对AI进行打断;

302.AI带来实时语音便捷方案,让你快速体验AI语音通话

3、【对讲机】和【电话】这两种方式都可以进行高级设置,比如可以手动设置自动挂断时间,当连接时间超过设定的值时就能够自动挂断,这样用户能够更好管理消耗,防止消耗太大。

302.AI带来实时语音便捷方案,让你快速体验AI语音通话

4、在高级设置中,用户除了可以选择语音音色外,还能够自定义人格指令,通过设置不同的人格指令,AI能够展现出不同的性格特征,使得对话更加个性化和有趣。例如,用户可以要求AI接收中文回复英文,或采用特定的情绪说话,这可以使得交流更具有多样性。

302.AI带来实时语音便捷方案,让你快速体验AI语音通话

302.AI提供按需付费的使用方式,用户只需根据自己的实际使用情况支付费用,灵活且经济实惠。

开源链接

为方便企业和用户能快速将AI语音通话技术集成到各种第三方应用中,302.AI已经将AI语音通话工具开源,感兴趣的用户可以进入下方链接获得源代码进行定制化开发:

302.AI AI语音通话工具开源链接:https://github.com/302ai/pub_realtime

总结

根据了解,OpenAI后续会通过收集到的反馈继续改进Realtime API,比如添加视觉和视频等其他模式等,同时还宣布会在Realtime API即将推出的版本中支持 GPT-4o mini模型,价格应该会大幅降低,大家可以一起期待下!

随着语音技术的日渐成熟和成本下降,AI语音通话工具的实际应用场景会越来越广阔。通过将AI语音通话技术集成到各类第三方应用中,我们有望在未来看到客服、教育培训、医疗、娱乐等领域实现更高效的用户交互和体验。与此同时,302.AI也会不断进步,紧密关注社会趋势,为现有使用者带来更便捷的体验。

Like (1)
302.AI302.AI
Previous 2024 年 10 月 29 日 下午7:00
Next 2024 年 11 月 1 日 下午6:09

相关推荐

  • “草莓”终于现真身了,OpenAI发布最新o1大模型!

    北京时间9月13日凌晨,OpenAI发布o1大模型,“草莓”终于现真身了,酝酿已久的“草莓”终于面世。 据了解,OpenAI o1模型经过强化学习训练可以执行复杂的推理,还能解决比以前更难的科学、编码和数学问题。官方称,OpenAI o1模型在美国数学奥林匹克 (AIME) 预选赛中跻身美国前 500 名学生之列,并在物理、生物和化学问题 (GPQA) 基准…

    2024 年 9 月 13 日
    28900
  • 视频太长不想看怎么办?来试一试AI音视频总结工具

    7月,夸克推出AI搜索并升级“超级搜索框”,在搜索框中加入了多个强大并实用的AI功能。其中的AI视频总结工具,这一工具不仅可以基于视频生成文稿,还能分段总结、生成思维导图以及智能生成课件,辅助用户高效学习。来看看官网的演示: 然而,目前小编只在夸克移动端找到了AI视频总结工具,而且根据页面提示,这一AI视频总结工具仅支持:上传视频和网盘视频两种方式,这意味着…

    2024 年 8 月 7 日
    15500
  • Stable Diffusion原班人马打造FLUX.1模型,推出的三个版本有什么不同?

    就在不久前,Stable Diffusion开源图像模型推出后,在网络上引发了热烈的讨论和广泛关注。后来,Stable Diffusion 部分创始成员创建了新公司Black Forest Labs,8月1日,Black Forest Labs推出了新研发的图像生成模型FLUX.1 。 FLUX.1 拥有12B参数,是迄今为止参数最多图像生成模型之一。该模型…

    2024 年 8 月 13 日
    17900
  • 什么是RAG?什么是GraphRAG?一文带你读懂知识库机器人原理

    在人工智能领域,知识库机器人已经成为推动智能化发展的重要力量。它们能够高效地处理海量信息,为用户提供精准、及时的知识服务。今天,我们将一起揭开知识库机器人的神秘面纱,探讨知识库机器人的原理。 什么是RAG? 知识库的整套技术在学术界有一个专业名词,叫RAG,即Retrieval-Augmented Generation,翻译成中文就是检索信息增强,是一种将信…

    2024 年 9 月 11 日
    23800
  • GPT-4o新版本突然上线,结构化输出是什么?

    8月6日,OpenAI的官网悄悄上线了新版本gpt-4o-2024-08-06模型。去年的DevDay活动中,OpenAI推出了JSON模式,而这次升级的新版本在API中引入了结构化输出,这一新功能旨在确保模型生成的输出与开发人员提供的 JSON 架构完全匹配。 gpt-4o-2024-08-06采用结构化输出的新模型在复杂 JSON 模式跟踪的评估中获得了…

    2024 年 8 月 8 日
    23100

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注