Ištraukite tekstą iš PDF failų

Susidūrę su PDF ar nešiojamų dokumentų formato failais, kartais galbūt norėsite išgauti visą tekstą iš PDF failo . Šiame vadove parodysime, kaip galite lengvai išgauti tekstą iš PDF rinkmenų arba konvertuoti PDF failus į tekstinius failus Windows sistemoje, naudodami internetinius įrankius arba be jų.

Paprasčiausias ir greičiausias būdas išgauti tekstą iš PDF failų yra naudoti nemokamas internetines paslaugas. Šios internetinės paslaugos nereikalauja jokios papildomos programinės įrangos, o tai reiškia, kad jūsų darbas gali būti atliktas be jūsų kompiuteryje įdiegtos papildomos programinės įrangos.

Jei toliau pateiktos internetinės paslaugos nesuteikia pageidaujamų rezultatų arba norėtumėte išgauti tekstą iš jautraus, kurio nenorite įkelti į nuotolinį serverį, galite patikrinti nemokamą „Windows“ programinę įrangą, nurodytą 3–5 metoduose. Taip pat skaityti mūsų 6 būdai suspausti PDF failus.

1 metodas iš 6

ExtractPDF

„ExtractPDF“ yra nemokama internetinė paslauga, skirta tekstams ir vaizdams iš PDF rinkmenų. Paslauga siūlo lengvai suprantamą išdėstymą. Atidarę „ExtractPDF“ puslapį savo žiniatinklio naršyklėje, spustelėkite naršymo mygtuką, kad pasirinktumėte PDF failą, spustelėkite Įkelti mygtuką, kad įkeltumėte pasirinktą failą į „ExtractPDF“ serverį ir pradėtumėte ištraukimą.

Kai darbas bus atliktas, pamatysite parinktis atsisiųsti teksto kontekstą, šriftus ir vaizdus iš įkeltos PDF rinkmenos. Norėdami atsisiųsti išgautą tekstą kaip .txt failą (norėdami atidaryti Notepad arba Word), pereikite į skirtuką Text ir spustelėkite failo mygtuką Atsisiųsti rezultatą.

Kaip matote pirmiau pateiktame paveikslėlyje, paslauga nepalaiko didesnių nei 12 MB failų. Šis apribojimas neturėtų būti programa, nes dauguma PDF failų bus mažesnis nei 12 MB.

Bandymo metu pastebėjome, kad kai kuriems PDF failams paslauga nesuteikia norimo išėjimo. Jei turite kokių nors su šia paslauga susijusių problemų, patikrinkite kitą.

2 metodas iš 6

Dabar naršo OCR

Internetinis OCR yra internetinis įrankis, leidžiantis ištraukti tekstą iš mažiau nei 5 MB dydžio PDF failų. Ši paslauga konvertuoja PDF failus į redaguojamus „Microsoft Word“ (.docx) arba „Text“ (.txt) failus.

3 metodas iš 6

STDU peržiūros programa

Iš esmės STDU Viewer yra nemokama programinė įranga, skirta atidaryti ir peržiūrėti kelis failų formatus. Be to, nemokama STDU Viewer versija palaiko teksto turinio eksportavimą iš PDF failų.

Norėdami eksportuoti PDF failo turinį, atidarykite PDF failą su STDU Viewer, spustelėkite File (failas), spustelėkite Export (eksportuoti), spustelėkite To text (tekstą), pasirinkite vietą, kurioje norite išsaugoti naują tekstinį failą, tada spustelėkite OK (gerai).

Eksporto parinktis leidžia ištraukti tekstą iš vieno, kelių ar visų puslapių. STDU Viewer atsisiuntimo dydis yra mažesnis nei 3 MB. Nemokama STDU Viewer versija skirta tik asmeniniam ir nekomerciniam naudojimui.

4 metodas iš 6

PDF2Text Pilot

PDF2Text Pilot yra nemokama programinė įranga, skirta „Windows“ konvertuoti PDF failus į tekstinius failus su pele. Įdiegę ir paleisdami programinę įrangą, tiesiog reikia pasirinkti PDF failą (-us), kurį norite matyti kaip tekstinius failus, tada spustelėkite mygtuką Konvertuoti. Jūsų konvertuoti failai bus paruošti per kelias sekundes.

PDF2Text Pilot stiprybė yra jos paprasta sąsaja ir galimybė konvertuoti kelis PDF failus vienu metu.

5 metodas iš 6

PDF teksto ištraukiklis

PDF teksto ištraukiklis yra dar viena „Windows“ programinė įranga, skirta tekstui išgauti iš PDF rinkmenų. Programinė įranga yra visiškai nemokama tiek asmeniniam, tiek komerciniam naudojimui.

Įdiegus A-PDF teksto ištraukiklį (diegimo dydis yra mažesnis nei 1 MB), paleiskite „PDF“ teksto ištraukiklį. Spustelėkite mygtuką Atidaryti, kad atidarytumėte PDF failą, tada spustelėkite Ištraukti teksto mygtuką, kad pradėtumėte ištraukti tekstą.

6 metodas iš 6

Gaaiho PDF skaitytuvas

„Gaaiho PDF Reader“ yra puiki programinė įranga, skirta tvarkyti PDF failus. Ši nemokama programinė įranga siūlo daugybę funkcijų, kurių negalite rasti kitos nemokamos PDF skaitytuvo programinės įrangos. Vienas iš bruožų yra galimybė lengvai išgauti tekstą iš PDF rinkmenų.

Jei norite išsaugoti PDF failą kaip tekstinį failą, atidarę PDF failą „Gaaiho Reader“, spustelėkite „File“ meniu, spustelėkite „Save as“, tada išskleidžiamajame meniu šalia „Save as type“ pasirinkite „PDF to Text“.

Ką manote apie šias priemones? Ar žinote apie geresnį nemokamą įrankį tam pačiam darbui? Praneškite mums apie komentarus.