Page 1 of 1

PDF's in txt Dateien umwandeln.

Posted: 2004-04-21 14:30
by typolos
Hallo,

ich möchte gerne in einem Verzeichniss alle PDF's in txt-files umwandeln. dafür habe ich mir das Paket xpf installiert. Um nicht alle Files einzeln umzuwandeln,dazu habe ich mir ein kleines Script geschrieben.

Code: Select all


for a in /home/downloads/*.pdf
do
        pdftotext "$a" /home/downloads/test.txt
done
Sicherlich erkennt Ihr das Problem schon an dem Script. Ich bekomme als Output nur ein File namens test.txt mit dem letztn PDF File als Inhalt zurück. Das funktioniert auch erst einmal. Ich möchte aber das jedes Dokument das erzeugt wird so heist wie das PDF dokument nur mit der endung .txt.

Beispiel:
aus /home/downloads/Acrobat.pdf wird /home/downloads/Acrobat.txt

Hoffe ich war einigermassen verständlich. Danke für Hilfe.

Gruß
typolos :?:

Re: PDF's in txt Dateien umwandeln.

Posted: 2004-04-21 14:34
by captaincrunch

Code: Select all

#!/bin/sh
for a in `ls /home/downloads/*.pdf`
do
        pdftotext "$a" /home/downloads/test.txt
done 

Re: PDF's in txt Dateien umwandeln.

Posted: 2004-04-21 17:03
by typolos
Hallo,

irgendwie löst das nicht mein Problem. ich möchte lediglich den Variableninhalt $a ändern und in $b schreiben. Das Script muß´dann in etwa so aussehen:

Code: Select all

#!/bin/sh 
for a in `ls /home/downloads/*.pdf` 
do      
     b = irgendetwas mit $a machen damit in $b der neue dateiname steht 
     pdftotext "$a" "$b" 
done 

Re: PDF's in txt Dateien umwandeln.

Posted: 2004-04-21 17:15
by sascha
Bau doch noch rename ein (man rename).

Re: PDF's in txt Dateien umwandeln.

Posted: 2004-04-21 21:23
by captaincrunch
z.B. so:

Code: Select all

for a in /home/downloads/*.pdf
do
        `which pdftotext`  /home/downloads/"$a" /home/downloads/`echo $a | cut -d "." -f 1`.txt
done

Re: PDF's in txt Dateien umwandeln.

Posted: 2004-04-25 11:18
by tape
CaptainCrunch wrote:z.B. so:

Code: Select all

for a in /home/downloads/*.pdf
do
        `which pdftotext`  /home/downloads/"$a" /home/downloads/`echo $a | cut -d "." -f 1`.txt
done
basename --help

basename liefert als Eert den Namen abzüglich dem suffix. Ein 'basename $a .pdf' also den blanken Namen ohne .pdf als Extension. Jetzt nur noch das .pdf drangeklebt und et voila.. Theoretisch fertig.

Zum Bleistift....

#!/bin/bash
for a in ./*.gz
do
echo `basename $a .gz`.ExTension
done


But as usual, es gibt immer mehr als einen Weg etwas zu erledigen. Denke ich, denke ich!

hth
Anton

Re: PDF's in txt Dateien umwandeln.

Posted: 2004-04-25 11:26
by captaincrunch
Stimmt, basename hatte ich komplett vergessen. ;)

Re: PDF's in txt Dateien umwandeln.

Posted: 2004-04-25 11:34
by tape
fällt mir auch immer erst ein wenn ich es zuerst anders versucht habe, und wenn ich es bei anderen sehe. Kommt davon wenn es mehr als einen Weg gibt, da geh ich oft gern zuerst den längeren. ;)