Extrahieren Sie Text aus PDF-Dateien

Beim Umgang mit Dateien im PDF- oder Portable Document Format möchten Sie möglicherweise den gesamten Text aus einer PDF-Datei extrahieren . In diesem Handbuch zeigen wir Ihnen, wie Sie Text aus PDF-Dateien extrahieren oder PDF-Dateien in Textdateien in Windows mit oder ohne Hilfe von Online-Tools konvertieren können.

Die einfachste und schnellste Möglichkeit, Text aus PDF-Dateien zu extrahieren, ist die Verwendung kostenloser Online-Dienste. Für diese Online-Dienste ist keine zusätzliche Software erforderlich. Das bedeutet, dass Sie Ihre Arbeit erledigen können, ohne zusätzliche Software auf Ihrem PC installieren zu müssen.

Wenn unten aufgeführte Onlinedienste nicht die gewünschten Ergebnisse liefern oder Sie Text aus einem vertraulichen Objekt extrahieren möchten, das Sie nicht auf einen Remote-Server hochladen möchten, können Sie die kostenlose Windows-Software aus den Methoden 3 bis 5 ausprobieren. Lesen Sie auch Unsere 6 Möglichkeiten, PDF-Dateien zu komprimieren.

Methode 1 von 6

ExtractPDF

ExtractPDF ist ein kostenloser Online-Service zum vollständigen Auslesen von Text und Bildern aus PDF-Dateien. Der Service bietet ein leicht verständliches Layout. Klicken Sie nach dem Öffnen der ExtractPDF-Seite in Ihrem Webbrowser auf die Schaltfläche Durchsuchen, um Ihre PDF-Datei auszuwählen. Klicken Sie auf die Schaltfläche Hochladen, um die ausgewählte Datei auf den ExtractPDF-Server hochzuladen und die Extraktion zu starten.

Sobald der Job abgeschlossen ist, werden Optionen zum Herunterladen von Textkontext, Schriftarten und Bildern aus der hochgeladenen PDF-Datei angezeigt. Um den extrahierten Text als TXT-Datei herunterzuladen (zum Öffnen in Notepad oder Word), wechseln Sie zur Registerkarte Text und klicken Sie dann auf Ergebnis als Datei herunterladen.

Wie Sie im obigen Bild sehen können, unterstützt der Dienst keine Dateien mit mehr als 12 MB. Diese Einschränkung sollte kein Programm sein, da die meisten PDF-Dateien unter 12 MB liegen.

Bei unserem Test haben wir festgestellt, dass der Dienst bei einigen PDF-Dateien nicht die gewünschte Ausgabe liefert. Wenn Sie Probleme mit diesem Dienst haben, lesen Sie den nächsten.

Methode 2 von 6

Online-OCR

Online-OCR ist ein Online-Tool, mit dem Sie Text aus PDF-Dateien mit weniger als 5 MB extrahieren können. Der Dienst konvertiert PDF-Dateien in bearbeitbare Microsoft Word-Dateien (.docx) oder Textdateien (.txt).

Methode 3 von 6

STDU Viewer

Grundsätzlich ist STDU Viewer eine kostenlose Software zum Öffnen und Anzeigen mehrerer Dateiformate. Darüber hinaus unterstützt die kostenlose Version von STDU Viewer den Export von Textinhalten aus PDF-Dateien.

Um den Textinhalt einer PDF-Datei zu exportieren, öffnen Sie die PDF-Datei mit STDU Viewer, klicken Sie auf Datei, klicken Sie auf Exportieren, klicken Sie auf In Text, wählen Sie einen Speicherort für die neue Textdatei aus und klicken Sie auf die Schaltfläche OK.

Mit der Exportoption können Sie Text aus einer, mehreren oder allen Seiten extrahieren. Die Downloadgröße von STDU Viewer beträgt weniger als 3 MB. Die kostenlose Version von STDU Viewer ist nur für den persönlichen und nicht kommerziellen Gebrauch bestimmt.

Methode 4 von 6

PDF2Text Pilot

PDF2Text Pilot ist eine kostenlose Software für Windows, um PDF-Dateien mit einem Mausklick in Textdateien zu konvertieren. Nach dem Installieren und Ausführen der Software müssen Sie nur die PDF-Dateien auswählen, die Sie als Textdateien anzeigen möchten, und dann auf die Schaltfläche Konvertieren klicken. Ihre konvertierten Dateien sind in wenigen Sekunden fertig.

Die Stärke von PDF2Text Pilot ist die einfache Benutzeroberfläche und die Möglichkeit, mehrere PDF-Dateien gleichzeitig zu konvertieren.

Methode 5 von 6

A-PDF Text Extractor

A-PDF Text Extractor ist eine weitere Windows-Software zum Extrahieren von Text aus PDF-Dateien. Die Software ist für den persönlichen und gewerblichen Gebrauch absolut kostenlos.

Starten Sie nach der Installation von A-PDF Text Extractor (Installationsgröße unter 1 MB) den A-PDF Text Extractor. Klicken Sie auf die Schaltfläche Öffnen, um die PDF-Datei zu öffnen, und klicken Sie dann auf die Schaltfläche Text extrahieren, um mit dem Extrahieren von Text zu beginnen.

Methode 6 von 6

Gaaiho PDF Reader

Gaaiho PDF Reader ist eine hervorragende Software, die für den Umgang mit PDF-Dateien entwickelt wurde. Diese kostenlose Software bietet eine Vielzahl von Funktionen, die Sie nicht finden können, andere kostenlose PDF-Reader-Software. Eine der Funktionen ist die Möglichkeit, Text aus PDF-Dateien einfach zu extrahieren.

Um eine PDF-Datei als Textdatei zu speichern, klicken Sie nach dem Öffnen der PDF-Datei in Gaaiho Reader auf Menü Datei, klicken Sie auf Speichern unter, und wählen Sie dann im Dropdown-Menü neben Dateityp die Option PDF in Text aus.

Was denkst du über diese Tools? Kennen Sie ein besseres kostenloses Tool für den gleichen Job? Lass es uns in Kommentaren wissen.