Viele PDF-Dateien sind geschützt. Das bedeutet: man kann sich den Inhalt nur am Rechner anschauen oder ausdrucken. Mehr nicht. Kopieren oder exportieren lassen sich die Inhalte nicht. Mit einem Trick klappt’s trotzdem. Wer an die Texte einer geschützten PDF kommen möchte, nutzt einfach die Texterkennung von Google Drive. Damit lassen sich Texte beliebiger PDFs oder von eingescannten Bildern erkennen. Sehr zuverlässig sogar.
PDF-Texte per Google-Drive kopieren
Wenn Sie eine geschützte PDF-Datei im Adobe Reader oder einem anderen PDF-Betrachter ansehen, lassen sich die darin enthaltenen Texte zwar markieren, nicht aber exportieren oder in die Zwischenablage kopieren. Der Kopieren-Befehl im Bearbeiten-Menü ist dann ausgegraut und nicht verfügbar.
Mit einem Trick kommt man trotzdem an die Texte ran und kann sie beliebig weiterverwenden. Dazu verwenden Sie einfach die Texterkennung von Google Drive. Mit der OCR-Funktion (Optical Character Recognition) von Google lassen sich Texte nicht nur aus PDF-Dateien, sondern aus eingescannte Dokumente erkennen und extrahieren.
So geht’s:
1. Rufen Sie Ihre Google-Drive-Seite auf, klicken Sie oben rechts aufs Zahnrad,und aktivieren Sie im Untermenü Upload-Einstellungen die Option Text aus hochgeladener PDF- oder Bilddateien konvertieren. Vor dem Befehl muss also ein kleines Häkchen erscheinen; nur dann ist die Texterkennungsfunktion aktiv.
2. Anschließend klicken Sie in der linken Spalte auf den roten Upload-Button mit dem Pfeil nach oben, wählen den Befehl Dateien.
3. Wählen Sie die gewünschte PDF- oder Bilddatei aus, und klicken Sie aufÖffnen. Die Datei wird daraufhin nicht nur vom Rechner in die Google-Cloud kopiert, sondern direkt per Texterkennung analysiert.
Das Ergebnis: Im Google-Drive-Bereich finden Sie die hochgeladene PDF-Datei, die nicht nur die einzelnen PDF-Seiten, sondern auch den erkannten Text enthält. Im Drive-Dokument müssen Sie jetzt nur noch die Bilder löschen, und übrig bleibt der erkannte Text. Die Texterkennung liefert nicht immer eine hunderprozentig richtiges Ergebnis; insgesamt kann sich die Erkennungsrate aber sehen lassen.
Um OCR in Google Drive zu verwenden, müssen Sie nur eine Funktion aktivieren. Öffnen Sie die Web-App von Google Drive und klicken Sie auf das Zahnradsymbol in der oberen rechten Ecke. Sie finden dort das Untermenü «Upload-Einstellungen». Darunter wählen Sie «Text aus hochgeladenen PDF- oder Bilddateien konvertieren».
Drive wird automatisch jedes hochgeladene Bild oder PDF mit OCR analysieren. Wenn Sie bei jedem Dokument separat entscheiden möchten, wählen Sie die Option «Einstellungen vor jedem Upload bestätigen». Mit dieser Option fragt Drive jeweils beim Upload von einem Bild oder PDF, ob OCR verwendet werden soll.
Da Google Drive eine Weile braucht, um OCR auszuführen, dauert der Upload der Datei entsprechend ein wenig länger. Bei Bildern sind es einige Sekunden, bei PDF-Dateien kann sich der Upload um fast eine Minute verlängern. Drive speichert die OCR-Dateien jeweils als Dokument. Das Original bildet dabei die obere Hälfte einer Seite, der erkannte Text die untere Seite.




