11月2日,Anthropic在社交媒体平台宣布,在其Claude 3.5 Sonnet 模型中增加了PDF理功能,这一功能不仅能读懂PDF中的文字,还能看懂图表、图片等视觉元素。
目前这一新功能已进入公开测试阶段,用户可以利用该模型来分析PDF文档中的文本和视觉元素(如图像、图表和表格),适用于财务报告、数据分析、法律文件和文档翻译等多种场景。
而这一PDF功能实现原理也非常好理解,大致可以分为三步:
1、首先系统会提取PDF文件的内容
2、将每一页转换为图像,并提取每页的文本
3、Claude模型进行内容分析,不仅理解文档中的文字内容,还处理图表、图片等视觉元素
但其实,302.AI的聊天机器人早已支持这一功能,并兼容所有模型,接下来给大家展示一下如何使用:
聊天机器人PDF功能使用教程
1、创建聊天机器人:找到聊天机器人——模型——选择模型,用户可以根据不同需求选择合适的模型。302.AI的所有模型均支持PDF解析功能:
2、上传PDF文件:选择好模型后进入聊天机器人,点击对话框左侧上传PDF文件,示例上传的PDF文件为一篇英文版的论文,内含有图表、图片、公式等元素:
3、AI分析并总结:上传PDF后,AI会进行全面分析,并自动识别PDF中使用的语言,随后,会运用相同的自然语言进行精准的要点总结,确保回复内容既准确又易于理解。
示例中如果想要切换成中文,只需要在输入框中输入“请用中文回复”,AI模型就会将要点总结翻译成中文:
对于PDF中的图片,可以进一步提问,AI模型能够精准识别并对图片进行详细分析:
PDF工具箱使用教程
除此之外,想要更全面的PDF功能,可以使用302.AI工具超市中的PDF全能工具箱,以下是具体的使用步骤:
1、创建工具:找到【工具超市】——【学术相关】——PDF全能工具箱;
302.AI的PDF全能工具箱支持多种最新AI模型, 比如claude-3.5-sonnet-20241022(最新Claude3.5)、GPT-4o等,用户可以根据不同需求选择合适的模型,快速完成PDF文档的处理任务,如提取文字、转换格式、全文翻译等,选择好模型后点击【创建】即可。
2、上传文件:进入PDF全能工具箱后,首先需要上传PDF文件,文件大小限制在50M以内:
3、功能选择:上传文件后可以看到页面的上方有五个功能选择,分别是:提取文字、转换格式、全文翻译、全文摘要、AI问答;可以按照自身业务需求选择对应的功能。
PDF工具箱功能展示
提取文字:这一功能能够识别PDF中的文本内容,并将它们转换为可复制和可编辑的文本格式,转换后可以选择导出为DOCX格式或者HTML格式,这对于需要引用或编辑PDF文档的用户来说非常有用。
转换格式:这一功能能够将PDF文件转换成多种其他格式,比如HTML、Markdown、DOCX、JPEG、PNG。转换完成后,文件将自动下载,更加节省时间,简化文件处理流程。
全文翻译:此功能可以将整篇论文翻译成选择的语言,示例的PDF文件为一篇英文版的论文,内含有图表、图片、公式等元素,可以将其翻译成中文,无论是需要理解论文内容但不熟悉英文的用户,还是需要将研究成果分享给不同语言背景的读者,都是非常便捷的。
翻译后的PDF文件,可以直接选择【下载文件】,操作流程简单快捷:
全文摘要:全文摘要功能中,AI会分析整篇论文的内容,并提供一个简洁的摘要,概括论文的主要观点和结论。这有助于用户快速把握论文的核心内容,节省阅读全文的时间。
AI问答:在获得摘要分析后,可以继续向AI提出有关论文内容的具体问题,AI将根据文档内容给出答案,这可以帮助深入了解论文的特定部分或概念。
PS:302.AI的PDF解析功能由合作伙伴Doc2x支持,Doc2x是专注于文档解析的一家公司,在多个指标均达到业内领先水平。
总结
无论是对于学生、普通上班族、研究人员、法律工作者及需要频繁处理大量文档的专业人士来说、PDF解析功能的出现,都大大简化了PDF文档中信息的提取和理解过程,使得复杂的文件处理任务变得更加高效和便捷。
而302.AI不仅仅满足于聊天机器人中的PDF功能和PDF全能工具箱,未来,302.AI会始终以用户需求为核心,积极探索更多可能的AI应用场景,不断给用户带来真正实用、便捷的AI工具!