上传与设置
📝
点击上传 或拖放PDF文件
从PDF提取全部文字 — 复制或下载.txt文件
从PDF提取全部文字 — 复制或下载.txt文件
提取的文本
上传PDF — 然后点击提取文本
什么是PDF转文本工具?
PDF转文本工具读取PDF中的文字,并以可复制或保存的纯文本形式返回。它按原始阅读顺序提取每页的内嵌文本层,让您保留页面换行或将折行合并为段落。对于扫描或仅图像的PDF,可运行OCR从页面图像中识别文字。整个过程在浏览器中完成,合同、发票、对账单等文档不会离开您的设备。
如何从PDF复制文字
放入PDF,选择输出样式,点击提取文本。代码、表格和列表用保留换行,文章和散文用合并段落。然后复制结果或下载为.txt文件。
扫描PDF?使用OCR
如果PDF没有文本层(扫描件和文档照片常见),工具会切换到OCR。选择文档语言,即可直接从每页图像中读取文字。OCR较慢且取决于扫描质量,但能恢复被锁在图像中的文字。
常见问题
如何从PDF提取文字?
上传PDF,选择文本布局样式,然后点击提取文本。工具会读取每页的文本层并显示在输出面板,您可以复制或下载为.txt文件。一切都在浏览器中运行,PDF不会被上传。
“保留换行”和“合并段落”有何区别?
“保留换行”将每行精确保留在原位,最适合代码、表格、地址和列表。“合并段落”把段落内折行合并为连续文本块,更适合文章与散文阅读。提取后可随时切换,无需重新运行。
对扫描PDF有效吗?
有效,需借助OCR。从Word或Google Docs导出的PDF可立即从文本层读取。对扫描或仅图像的PDF,工具会自动切换到OCR模式 — 选择文档语言即可识别每页文字。OCR较慢,首次会下载引擎,且取决于扫描质量。
我可以复制文本或保存为文件吗?
都可以。提取后,使用复制按钮将全部文本放入剪贴板,或下载.txt以PDF同名保存为纯文本文件。输出面板可选取,因此您也能只取需要的部分。
我的PDF会被上传到服务器吗?
不会。PDF使用pdf.js在浏览器中解析,扫描文件的OCR也在本地运行。文件不会离开您的设备,因此适合处理合同、对账单等敏感文档。