Ekstrak semua teks dari PDF β salin atau unduh file .txt
Apa itu konverter PDF ke teks?
Konverter PDF ke teks membaca kata-kata di dalam PDF dan mengembalikannya sebagai teks biasa yang dapat Anda salin atau simpan. Alat ini mengekstrak lapisan teks tertanam setiap halaman sesuai urutan baca aslinya, lalu memungkinkan Anda mempertahankan jeda baris halaman atau menggabungkan baris terbungkus menjadi paragraf. Untuk PDF pindai atau hanya gambar, alat dapat menjalankan OCR. Semuanya bekerja di browser, jadi dokumen seperti kontrak dan laporan tidak pernah meninggalkan perangkat Anda.
Cara menyalin teks dari PDF
Masukkan PDF, pilih gaya keluaran, lalu klik Ekstrak Teks. Gunakan Pertahankan baris untuk kode, tabel, dan daftar, atau Gabung paragraf untuk artikel dan prosa. Lalu salin hasilnya atau unduh sebagai file .txt.
PDF pindai? Gunakan OCR
Jika PDF tidak punya lapisan teks β umum pada hasil pindai dan foto dokumen β alat beralih ke OCR. Pilih bahasa dokumen dan teks dibaca langsung dari setiap gambar halaman. OCR lebih lambat dan bergantung kualitas pindaian, tetapi memulihkan teks yang terkunci dalam gambar.
Pertanyaan yang Sering Diajukan
Bagaimana cara mengekstrak teks dari PDF?
Unggah PDF Anda, pilih gaya tata letak teks, lalu klik Ekstrak Teks. Alat ini membaca lapisan teks setiap halaman dan menampilkannya di panel keluaran, tempat Anda bisa menyalinnya atau mengunduhnya sebagai file .txt. Semua berjalan di browser, jadi PDF tidak pernah diunggah.
Apa beda 'Pertahankan baris' dan 'Gabung paragraf'?
'Pertahankan baris' menjaga setiap baris visual tepat di posisinya, paling cocok untuk kode, tabel, alamat, dan daftar. 'Gabung paragraf' menyatukan baris yang terbungkus dalam satu paragraf menjadi blok mengalir, yang lebih nyaman dibaca untuk artikel dan prosa. Anda dapat berganti tanpa menjalankan ulang ekstraksi.
Apakah berfungsi pada PDF hasil pindai?
Ya, dengan OCR. PDF yang diekspor dari Word atau Google Docs dibaca instan dari lapisan teksnya. Untuk PDF pindai atau hanya gambar, alat beralih otomatis ke mode OCR β pilih bahasa dokumen dan teks tiap halaman dikenali. OCR lebih lambat, mengunduh mesin saat pertama, dan bergantung kualitas pindaian.
Bisakah saya menyalin teks atau menyimpannya sebagai file?
Keduanya bisa. Setelah ekstraksi, gunakan tombol Salin untuk menaruh seluruh teks ke clipboard, atau Unduh .txt untuk menyimpannya sebagai file teks bernama sesuai PDF Anda. Panel keluaran juga dapat dipilih, jadi Anda bisa mengambil bagian yang diperlukan saja.
Apakah PDF saya diunggah ke server?
Tidak. PDF diproses di browser dengan pdf.js dan, untuk file pindai, OCR juga berjalan lokal. File Anda tidak pernah meninggalkan perangkat, sehingga aman untuk kontrak, laporan, dan dokumen sensitif lainnya.