AI文献阅读ChatDOC 、ChatPDF 哪个好?

作为AI产品的深度使用者,基本每天都在使用AI。AI诞生后仿佛给所有的产品打开了新世界大门。当然AI在文献阅读方面自然也不会缺席。

 

6d6165e5b32c8fcdbaf1b647386520cb.png

先来简单对比一下ChatDOC vs ChatPDF

 

36dd0f2585c0d027cd541b091c94bbe3.png

从表格里可以看到ChatDOC与ChatPDF都是基于GPT的产品,但在功能上ChatDOC还是比ChatPDF功能强大的多

  • 文件格式

在对文件格式的支持,ChatDOC支持PDF/DOC/markdown/txt/OCR/epub/website多种格式而ChatPDF只支持PDF文件。

  • AI模型

ChatDOC除了默认gpt-3.5-turbo外,还可以通过付费支持gpt-4o。如果你不想使用这些,在控制台还可以配置自己的AI模型。而从ChatPDF官网能查询到的它使用的是gpt-3.5的版本,并没有发现对gpt-4o的支持说明。

  • 语言支持

ChatDOC与ChatPDF官网的平台都可以发现是对多语言的支持,ChatPDF官网“全球通用!ChatPDF接受任何语言的PDF,并可以用任何语言聊天。”而ChatDOC语言下拉可以选择10几种语言,从这方面来说ChatPDF对多语言的支持能力是比ChatDOC强大的。

  • 图像和表格

ChatDOC官网有说明通过OCR可以解析文件中的图像并与之对话。而ChatPDF尚无法读取PDF中的图像,包括由扫描文本组成的图像。ChatPDF读取表格中的文本,但它可能在关联正确的行和列时遇到问题。在这方面ChatDOC要强一些。

 

 

下面我们就具体来使用一下ChatDOC与ChatPDF:

ChatDOC

 

668ec12bb895f4fe8a64fc65fb8bf41c.png

ChatDOC之前也有看到不少文章对它的介绍,都是比较推荐使用的,号称“最好的PDF AI Chat”,这里就来测试一下。

 

5eaa0188e8c01e7738df333d284545e1.png

生成文件摘要

上传一个文件,然后点击左上角工具栏中的“摘要”按钮或输出生成摘要,就可以从非常长文件中生成关键点和见解的摘要。只需几秒钟,就可以从文件中提炼出一个简明的摘要。

 

9df0df0ec87ad63b378b42261eca1dcd.png

从多个文件中提取见解

通过上传文件夹的方式,在多个长篇的文件中进行沟通对话,提取重点和关键发现。

 

ddc318dcaadc5fcb8247059e059da672.png

内容定位能力

要求AI从文件中检索详细内容。例如

在文件中“在使用 java.util.stream.Collectors 类的 toMap() 方法转为 Map 集合时,一定要注意当 value为 null 时会抛 NPE 异常”这条规范中举的例子中pairArrayList列表增加的第一个变量version1的值是多少?并指出你的依据在文件中的位置。

 

5242306a106c6423d8de26172c90b696.png

可以看到,这种定位能力并不是单纯的类似查找的功能,ChatDOC理解了我们的问题,并也能理解文件中的内容、代码或公式表达的意思。从而得出相应正确的回答,同时还能给出ChatDOC依据在文件中的出处。

 

强大的翻译能力

无论文件原始是什么语言都能进行语言的切换,用你熟悉的语言进行聊天,ChatDOC具有强大的翻译能力。

 

298962d94e052ef7d35b3da8d2b82d85.png

选择特定内容询问

我们可以选择特定的表格/文本/公式,要求ChatDOC用简单的术语解释它。

 

18f142f7f0e000b2af717879e6247dc5.png

 

ChatPDF

 

7b5e02dae9029173d6ca78c33a5d5d22.png

网站主页:直接上传PDF文件。

 

5fb2054b7155c3f516a8769ac1d9853a.png

上传后左边是文件列表,中间是上传的PDF预览图,右边会出来文件的主要内容,及参考的问题,选中后会出现功能菜单(解释、总结、改写)。

生成文件摘要

这里的总结也类似生成文件摘要的功能,我们来看看

 

f8e3496a1def940535dc681fd42359df.png

基本和其它AI一样都能大致提取并总结文件。

ChatPDF的总结没有像copilot那样进行总结分类,看着没那么精简。

提问+定位能力

 

16b88aef2ee4c86418eedd939a456e0c.png

ChatPDF也能正确的理解文字、代码或公式的意思,快速定位内容及找出答案

翻译能力

这是一份《Attention Is All You Need》的英文论文

 

c00169851deddf9f57388b6f20f8b1f7.png

让AI提炼PDF文件中的主要内容,并与AI对话,提相应的问题。

 

8e01c2407497a187a2d9c26a313d3c9d.png

可以看到中文问题给出来中文回答,这些AI产品基本都带有强大的翻译能力。

 

f3a96bd25e0a43549f3bdabae6cb14c8.png

上图是Leaderboard显示的ChatPDF每天的访问量。

总体来说还是不错的,从功能、使用界面及文件定位等方面。不足就是每天只能免费上传2个文件

 

3509eb3916249159a9101ec6530d93be.png

 

 

Copilot

Copilot也就是之前的new bing,可以看到微软的edge浏览器自带了Copilot插件,在浏览器的右上角的copilot logo。打开pdf文件后,点击copilot logo就会显示相应的功能项:

  • 生成文件摘要
  • 请提出关于这份文件的问题
  • 从此文件生成关键见解

生成文件摘要

 

bef064ad083f506b1dd38b33024f6ea5.png

手册简介:《Java 开发手册》是阿里巴巴和开课吧技术团队的经验总结,经过实战检验并不断完善。最新版本为黄山版,涵盖了编程规约、异常日志、单元测试等七个维度。

编程规约:手册提供了详细的编程规约,包括命名风格、代码格式、OOP 规约等,旨在提高代码质量和协作效率。

规约分类:规约分为【强制】、【推荐】、【参考】三类,以不同的约束力度指导开发者。

附加资源:手册配套有 IDE 插件和《码出高效》图书,提供了更多编程知识和实践经验。手册和图书的收入均捐赠公益事情。

摘要的简单,但又把文件中所有的内容都有提到。

这时你会想,我想了解更具体点的摘要,不要担心,copilot也有考虑到。

你可以点击“显示更多摘要”会进一步出来。

提问+定位能力

copilot不支持上传图片以外的文件,但可以通过edge浏览器打开,再使用copilot插件与文件对话

 

d9a8c92aed64ad5d91c8cdc94c5efd84.png

相同的问题,既然没找出来。

换个问题,是可以找出来的

文件中“浮点数类型的数值后缀统一为大写的 D 或 F”这条约定中,作者使用的例子中变量WEIGHT的数值是多少?并指出数值在文档的出处?

 

279994cb4533c880e92231bac6ea9f19.png

当然copilot是可以完全免费使用,它是包括文本语言、搜索引擎、绘画、翻译、阅读、编码等综合型AI产品。

 

2435638f1a3181d326832c67d974b190.png

当然像chatgpt、kimi等等这些不支持预览文件的AI,也可以通过上传文件的方式来实现对文件内容的解读。

在这个信息爆炸的时代,高效获取和处理知识真的太重要了。可以看到AI在帮我们阅读文献方面真的特别给力。想想那些500甚至上千页的PDF文件,以前看一眼就头疼,现在有了AI,根本不用一页一页地啃了。

 

 

其它AI阅读工具

司马阅SmartRead

司马阅SmartRead是一款国内的AI文件阅读工具,提供智能阅读、AI摘要、AI问答等服务。

 

b68fc568251eb3cc2d8a30cf3d85b263.png

讯飞星火知识库文件问答

讯飞星火知识库文件问答提供Al分析、阅读、问答工具,让大模型助你高效了解文件内容。

用户可以免费使用,可以对我的问题分析和定位到文件出处。

 

6318caaf2497e2b1aabb68f8d49282d8.png

WPS AI

PDF AI 支持总结长文信息、追溯原文、外文翻译提炼等文章处理任务,助你轻松高效阅读 PDF科研论文、报告、产品手册、法律合同、书籍等文件。

 

290a83f2b36bffb2eb79e75c02c49fc9.png

总结

可以看到不少统计网站,它们收集了全球出现的AI产品,从这些网站大概可以了解的目前全球已经出现1.5w+的AI产品,其中中国也已经超1000+。短短的1年多AI产品如雨后春笋般大量出现。AI已经覆盖了很多类别,包括聊天、绘图、阅读、写作、翻译等等。

 

462810648edca943be7410a59d8f2b07.png

 

 

8fb69a18eb2352e91fe26528856f1cf2.png

在AI辅助阅读工具这块我们可以发现它们具有共同的特征:

  • 摘要总结:能够生成文件的摘要。
  • 智能问答:用户可以向工具提问、聊天。
  • 多语言支持:支持多语言翻译能力。

 

  • 国外花钱

可以选择chatgpt-4:gpt是综合性AI产品,集文本语言、搜索、绘画、翻译、阅读、编码以一身的综合型AI产品。

  • 国内不花钱

专注于文献的可以选择司马阅SmartRead试试,当然kimi是综合性AI产品,虽然没有文档预览效果的,但功能也非常强大。

  • 国内花钱

如果只可以选择专注于文献ChatDOC。

对于需要使用要非常简单好用的人来说花点钱或许是更好的选择,这类AI会更专注某个领域的功能。

对于一些技术人员来说,不想花钱就可以选择new bing、kimi这类的免费的综合性AI产品。

 

 

我是栈江湖,如果你喜欢此文章,不要忘记点赞+关注

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/65492.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flutter DragTarget拖拽控件详解

文章目录 1. DragTarget 控件的构造函数主要参数: 2. DragTarget 的工作原理3. 常见用法示例 1:实现一个简单的拖拽目标解释:示例 2:与 Draggable 结合使用解释: 4. DragTarget 的回调详解5. 总结 DragTarget 是 Flutt…

【Rhino】【Python】将beam线的端点沿着自身方向移动到column轮廓线上

#codingutf-8 import rhinoscriptsyntax as rs import Rhino.Geometry as rgdef extend_lines_to_columns():print("开始运行脚本...")# 定义要处理的图层名称beam_layer "Make2D::Visible::Curves::02 STR. SOLID MAMBER::1*.1.BEAM MAIN (UNIONED)"colu…

Huggingface数据集采样之后得到的arrow文件无法用Dataset.load_from_disk加载解决方法

问题起源 我现在有数据集 我想要采样1/10构成一个新的数据集。起初我只是简单的使用save_to_disk保存,如下代码: from datasets import Dataset import os# 原数据集路径 source_dataset_path "~/.cache/huggingface/datasets/allenai___tulu-3-…

js版本之ES6特性简述【Proxy、Reflect、Iterator、Generator】(五)

目录 Proxy Reflect 静态方法 部分实例 Iterator 实际开发迭代器的使用实例 迭代器(Iterator)应用 Generator Proxy Proxy 是 ES6 中新增的对象 Proxy 是JavaScript中的内置对象,它提供了一种机制,可以拦截并自定义各种…

React 组件通信完整指南 以及 自定义事件发布订阅系统

React 组件通信完整指南 1. 父子组件通信 1.1 父组件向子组件传递数据 // 父组件 function ParentComponent() {const [data, setData] useState(Hello from parent);return <ChildComponent message{data} />; }// 子组件 function ChildComponent({ message }) {re…

mac中idea菜单工具栏没有git图标了

1.右击菜单工具栏 2.选中VCS&#xff0c;点击添加 3.搜索你要的工具&#xff0c;选中点击确定就添加了 4.回到上面一个界面&#xff0c;选中你要放到工具栏的工具&#xff0c;点击应用就好了 5.修改图标&#xff0c;快捷键或者右击选中编辑图标 6.选择你要的图标就好了

Linux实验报告7-文件管理

目录 一&#xff1a;实验目的 二&#xff1a;实验内容 (1)查看/etc/inittab文件的权限属性&#xff0c;并指出该文件的所有者以及文件所属组群。 (2)新建文件test&#xff0c;设置文件权限为r--r-----。 (3)新建文件test2&#xff0c;设系统中有用户study和用户组studygr…

CPT203 Software Engineering 软件工程 Pt.4 软件设计(中英双语)

文章目录 6. 设计概念6.1 Principle6.2 Concepts6.2.1 General design concepts&#xff08;常见的设计概念&#xff09;6.2.1.1 Abstraction&#xff08;抽象&#xff09;6.2.1.2 Modularity&#xff08;模块化&#xff09;6.2.1.3 Functional independence&#xff08;功能独…

JSON 系列之4:JSON_VALUE

JSON_VALUE的作用&#xff0c;简单来说&#xff0c;就是从JSON到SQL&#xff1a; SQL/JSON function JSON_VALUE selects JSON data and returns a SQL scalar or an instance of a user-defined SQL object type or SQL collection type (varray, nested table) 所以&#xff…

[wzoi]Help Bubu

题目描述: Bubu的书架上乱成一团了&#xff01;请帮助他一下吧&#xff01; 他的书架上一共有n本书。我们定义混乱值是连续相同高度书本的段数。例如&#xff0c;如果输的高度是30,30,31,31,32&#xff0c;那么混乱值为3,30,32,32,31的混乱度也是3&#xff0c;但31,32,31,32,…

嵌入式AI STM32部署卷积神经网络的魔法棒

基于STM32部署卷积神经网络控制设备方案-AI项目-STM32部署卷积神经网络方案-红外信号复制方案-轨迹识别 项目包含下述内容 硬件部分、PCB制板、BOM表文件等等 (Hardware)外壳、3D打印文件 (3D_print)软件程序、用于电子法棒的软件程序 AI Keil等等(Software)QT上位机动作识别…

【代码分析】Unet-Pytorch

1&#xff1a;unet_parts.py 主要包含&#xff1a; 【1】double conv&#xff0c;双层卷积 【2】down&#xff0c;下采样 【3】up&#xff0c;上采样 【4】out conv&#xff0c;输出卷积 """ Parts of the U-Net model """import torch im…

[Leetcode] 最大子数组和 [击败99%的解法]

解法1&#xff1a; 暴力解法 遍历每个元素&#xff0c;从它当前位置一直加到最后&#xff0c;然后用一个最大值来记录全局最大值。 代码如下&#xff1a; class Solution {public int maxSubArray(int[] nums) {long sum, max nums[len-1];for (int i0; i<nums.length;…

系统压力测试助手——stress-ng

1、背景 在系统性能测试和压力测试中&#xff0c;stress-ng 是一个非常强大的工具&#xff0c;广泛应用于对 Linux 系统进行各种硬件和软件方面的负载测试。它能够模拟多种极端负载情况&#xff0c;帮助开发人员和运维人员检查系统在高负载下的表现&#xff0c;以便发现潜在的…

计算机网络500题2024-2025学年度第一学期复习题库(选择、判断、填空)

一、单选题 1、&#xff08; &#xff09;是实现两个同种网络互连的设备 A. 网桥 B. 网关 C. 集线器 D. 路由器 2、10M以太网有三种接口标准&#xff0c;其中10BASE-T采用&#xff08; &#xff09; A. 双绞线 B. 粗同轴电缆 C. 细同轴电缆 D. 光纤 3、HDLC是哪…

在JavaScript文件中定义方法和数据(不是在对象里定以数据和方法,不要搞错了)

在对象里定以数据和方法看这一篇 对象字面量内定义属性和方法&#xff08;什么使用const等关键字&#xff0c;什么时候用键值对&#xff09;-CSDN博客https://blog.csdn.net/m0_62961212/article/details/144788665 下是在JavaScript文件中定义方法和数据的基本方式&#xff…

基于SpringBoot的垃圾分类系统设计与实现【源码+文档+部署讲解】

系统介绍 基于SpringBootVue实现的垃圾分类系统设计了三种角色、分别是管理员、垃圾分类管理员、用户&#xff0c;实现了个人中心、用户管理、垃圾分类管理员管理、垃圾分类管理、垃圾类型管理、垃圾图谱管理、系统管理等功能 技术选型 开发工具&#xff1a;idea2020.3Webst…

今日总结 2024-12-28

今天全身心投入到鸿蒙系统下 TCPSocket 的学习中。从最基础的 TCP 协议三次握手、四次挥手原理重新梳理&#xff0c;深刻理解其可靠连接建立与断开机制&#xff0c;这是后续运用 TCPSocket 无误通信的根基。在深入鸿蒙体系时&#xff0c;仔细研读了其为 TCPSocket 封装的 API&a…

springboot启动不了 因一个spring-boot-starter-web底下的tomcat-embed-core依赖丢失

这个包丢失了 启动不了 起因是pom中加入了 <tomcat.version></tomcat.version>版本指定&#xff0c;然后idea自动编译后&#xff0c;包丢了&#xff0c;删除这个配置后再也找不回来&#xff0c; 这个包正常在 <dependency><groupId>org.springframe…

前后端分离(对话框的使用)

1.首先先定义两个按钮(一个添加按钮&#xff0c;一个修改按钮) <el-button type"primary" click"openDialog(true)">添加员工</el-button> <el-button size"mini" click"openDialog(false, scope.row)">编辑</…