PDF

Gemarkeerde tekst uit PDF extraheren als tekstbestand zonder opmaak?

Gemarkeerde tekst uit PDF extraheren als tekstbestand zonder opmaak?

Het markeren van tekst in een PDF-document is handig om de belangrijke gebieden te markeren die u later snel kunt openen. U kunt Microsoft Edge gebruiken om PDF te markeren of andere software die wordt geleverd met de functie voor het markeren van PDF's. Soms heb je misschien ook de behoefte gevoeld om alleen de gemarkeerde tekst te hebben, zodat je de samenvatting van de PDF kunt hebben die alle essentiële tekst bevat. Als u op zoek bent naar manieren om alleen gemarkeerde tekst uit een PDF op te slaan als een TXT-bestand, dan kan dit bericht nuttig zijn.

Gemarkeerde tekst uit PDF extraheren

Er is een aantal gratis software en een service om gemarkeerde tekst uit een PDF-bestand te extraheren en op te slaan als een tekstbestand:

Laten we deze PDF Highlight Extractor-software een voor een bekijken.

1] PDF-markeringsextractor

PDF Highlight Extractor is een van de gemakkelijkste opties om de gemarkeerde tekst uit een PDF-bestand te extraheren. Dit open source Extractor voor pdf-tekstmarkering heeft twee kenmerken die de aandacht trekken:. Jij kan voorbeeld gemarkeerde tekst van PDF op de software-interface.

De tweede functie is dat je kunt stel start- of eindpagina of paginabereik in om de tekst te extraheren. Dus in plaats van de hele PDF te scannen, kunt u paginanummers definiëren om de gemarkeerde tekst te krijgen.

Een andere goede eigenschap is dat je de mogelijkheid hebt om: tekst opslaan als platte tekst of Excel bestand.

Voeg op de interface uw PDF-bestand toe met behulp van de gegeven optie en druk vervolgens op de Extract knop. Schakel het vinkje uit Alle pagina's optie als u het paginabereik wilt instellen of het wilt laten zoals het is. Zodra de tekst is opgehaald, kunt u er een voorbeeld van bekijken. Druk tot slot op de Tekst of Excel knop om de gemarkeerde tekst op te slaan.

U kunt deze software hier downloaden. Java is ook nodig om deze software te gebruiken. Installeer dus Java (indien nog niet) en voer deze software uit om te gebruiken.

2] Foxit-lezer

Foxit Reader is een van de beste gratis PDF-lezers. U kunt meerdere PDF-bestanden openen in aparte tabbladen, PDF markeren, een notitie toevoegen, opmerkingen exporteren, handtekeningen toevoegen, en meer. Onder de enorme lijst met functies is het extraheren van gemarkeerde tekst uit PDF ook aanwezig. Het beste van deze functie is dat het ook slaat paginanummers op samen met de geëxtraheerde tekst.

Om gemarkeerde tekst uit PDF op te halen, opent u het PDF-bestand op de interface en opent u de Commentaar tabblad. Klik in dat tabblad op Exporteren optie beschikbaar in Opmerkingen beheren sectie. Je ziet de Gemarkeerde tekst keuze. Gebruik die optie en dan kun je alle gemarkeerde tekst opslaan als een tekstbestand.

Hier is de downloadlink voor deze software. Tijdens de installatie moet u selecteren: aangepaste installatie om alleen de vereiste componenten van deze software op te nemen.

3] Somnoten.netto-

Somnoten.net is een gratis service waarmee u aantekeningen kunt maken in PDF's en de gemarkeerde tekst kunt extraheren. Alle gemarkeerde tekst is afzonderlijk zichtbaar in de linkerzijbalk. Met behulp van die zijbalk kunt u ook verwijder gemarkeerde tekst die je niet nodig hebt en download vervolgens de rest van de gemarkeerde tekst.

Voordat u de gemarkeerde tekst downloadt, kunt u ook paginanummers en uitsluiten de gemarkeerde tekst van specifieke kleur.

Je hebt ook de mogelijkheid om bewaar gemarkeerde tekst uit PDF als Excel of Woord het dossier. Dus de functies zijn goed. U kunt zich aanmelden met een gratis abonnement en dan 50 hoogtepunten extraheren of annotaties per download, wat in de meeste gevallen voldoende is.

Hier is de link naar de homepage. Om gemarkeerde tekst uit PDF te extraheren, voegt u een PDF toe vanaf pc of Google Drive. Wanneer de PDF is geüpload, zijn aan de linkerkant annotaties en gemarkeerde tekst zichtbaar. Gebruik de Annotaties downloaden optie en dan kunt u de gemarkeerde tekst opslaan in tekst, XLSX, of DOC formaat bestand.

4] DyAnnotationExtractor

DyAnnotationExtractor-software kan u helpen gemarkeerde tekst te extraheren en opmerkingen van een PDF-document. Het is een opdrachtregel software, maar het gebruik ervan is heel eenvoudig. Slechts een enkele opdracht haalt de tekst op die is gemarkeerd in het invoer-PDF-bestand.

Je kunt deze software krijgen via deze link. Download het ZIP-bestand en pak het uit. Om het gemakkelijker te maken om de opdracht uit te voeren, moet u de PDF ook in dezelfde map plaatsen waar u deze software hebt uitgepakt. Daarna openen Opdrachtprompt venster in die map. Dat doe je door te typen cmd in het adresvak van die map en druk vervolgens op Enter sleutel.

Wanneer het CMD-venster wordt geopend, voegt u het BAT-bestand van deze software, de invoeropdracht inclusief het pad van de invoer-PDF, de uitvoeropdracht en de naam van het uitvoerbestand toe, samen met '.txt' extensie. De volledige opdracht zal zijn:-

DyAnnotationExtractor.bat -invoerpad van invoer PDF -uitvoer uitvoerbestandsnaam.tekst

Voer de opdracht uit. Wacht een paar seconden en het platte tekstbestand is klaar met alle gemarkeerde tekst en opmerkingen die uit die PDF zijn gehaald. Het uitvoerbestand wordt opgeslagen in dezelfde invoermap.

Dit zijn dus enkele opties die u kunt gebruiken om gemarkeerde tekst uit PDF te extraheren en de uitvoer vervolgens op te slaan als een tekstbestand. Ik hoop dat deze helpen.

Hoe AutoKey te gebruiken om Linux-spellen te automatiseren
AutoKey is een hulpprogramma voor desktopautomatisering voor Linux en X11, geprogrammeerd in Python 3, GTK en Qt. Met behulp van de scripting- en MACR...
Hoe FPS-teller in Linux-games te tonen
Linux-gaming kreeg een grote duw toen Valve in 2012 Linux-ondersteuning voor Steam-client en hun games aankondigde. Sindsdien hebben veel AAA- en indi...
Sid Meier's Civilization VI downloaden en spelen op Linux and
Inleiding tot het spel Civilization 6 is een moderne versie van het klassieke concept dat werd geïntroduceerd in de serie Age of Empires-games. Het id...