近日,一款来自初创公司的识别神器Doc2X备受关注。小编为此也特意去了解了,发现非常有意思的是,为了让用户更直观的看到Doc2X的实力,Doc2X在官网中以文档的形式给大家展示了Doc2X与市场上各竞品的识别能力做对比分析。
竞品主要包括:mathpix、庖丁PDFlux、pix2text、合合信息TextIn、腾讯云大模型知识引擎文档解析。测评范围主要包括:教育、金融、论文、国标等,内容包括复杂合并单元格、大型表格、复杂嵌套公式、arxiv论文-作者信息等14项。
来摘取Doc2X官网竞品分析中的其中一个arxiv论文-作者信息的对比效果:
先来看下Doc2X的结果:
其中,Mathpix也正确。
其余的庖丁PDFlux、pix2text、合合信息TextIn、腾讯云大模型知识引擎文档解析都未能正确识别出。
由于内容非常的多,小编就不一一列举,总的来说Doc2X的识别能力是一流的,除了识别能力,Doc2X还有翻译对照的功能,这个功能可以完美保留论文的公式,表格,图片而不崩溃,翻译模型有glm4和deepseek两种选择。
小编简单测试后发现,由于翻译模型有限,所以翻译出来的结果有些时候还是不够自然。然而,就在7月初,302.AI与Doc2x合作,在302.AI工具超市上线了AI PDF翻译工具,其中PDF转换格式由Doc2x实现,翻译模型包括最新的gpt-4o、claude-3.5-sonnet等八种。
302.AI的AI PDF翻译工具能够帮助我们更准确的翻译、同时完美保留格式,而且302.AI提供按需付费,没有月费没有捆绑套餐,性价比非常高。最后来看下使用实例:
302.AI和Doc2x的结合,让我们见证了AI技术的无限潜力。302.AI-AI PDF翻译工具不仅提高了工作效率,还为用户带来了更加个性化和智能化的服务体验。在未来,我们可以预见到更多的行业将会采纳这种跨领域的合作模式,以实现更高效的工作流程和更优质的服务。