PDF's in txt Dateien umwandeln.

Bash, Shell, PHP, Python, Perl, CGI
Post Reply
typolos
Posts: 57
Joined: 2003-03-26 18:44
 

PDF's in txt Dateien umwandeln.

Post by typolos »

Hallo,

ich möchte gerne in einem Verzeichniss alle PDF's in txt-files umwandeln. dafür habe ich mir das Paket xpf installiert. Um nicht alle Files einzeln umzuwandeln,dazu habe ich mir ein kleines Script geschrieben.

Code: Select all


for a in /home/downloads/*.pdf
do
        pdftotext "$a" /home/downloads/test.txt
done
Sicherlich erkennt Ihr das Problem schon an dem Script. Ich bekomme als Output nur ein File namens test.txt mit dem letztn PDF File als Inhalt zurück. Das funktioniert auch erst einmal. Ich möchte aber das jedes Dokument das erzeugt wird so heist wie das PDF dokument nur mit der endung .txt.

Beispiel:
aus /home/downloads/Acrobat.pdf wird /home/downloads/Acrobat.txt

Hoffe ich war einigermassen verständlich. Danke für Hilfe.

Gruß
typolos :?:
captaincrunch
Userprojekt
Userprojekt
Posts: 7066
Joined: 2002-10-09 14:30
Location: Dorsten
Contact:
 

Re: PDF's in txt Dateien umwandeln.

Post by captaincrunch »

Code: Select all

#!/bin/sh
for a in `ls /home/downloads/*.pdf`
do
        pdftotext "$a" /home/downloads/test.txt
done 
DebianHowTo
echo "[q]sa[ln0=aln256%Pln256/snlbx]sb729901041524823122snlbxq"|dc
typolos
Posts: 57
Joined: 2003-03-26 18:44
 

Re: PDF's in txt Dateien umwandeln.

Post by typolos »

Hallo,

irgendwie löst das nicht mein Problem. ich möchte lediglich den Variableninhalt $a ändern und in $b schreiben. Das Script muß´dann in etwa so aussehen:

Code: Select all

#!/bin/sh 
for a in `ls /home/downloads/*.pdf` 
do      
     b = irgendetwas mit $a machen damit in $b der neue dateiname steht 
     pdftotext "$a" "$b" 
done 
sascha
Posts: 1325
Joined: 2002-04-22 23:08
 

Re: PDF's in txt Dateien umwandeln.

Post by sascha »

Bau doch noch rename ein (man rename).
captaincrunch
Userprojekt
Userprojekt
Posts: 7066
Joined: 2002-10-09 14:30
Location: Dorsten
Contact:
 

Re: PDF's in txt Dateien umwandeln.

Post by captaincrunch »

z.B. so:

Code: Select all

for a in /home/downloads/*.pdf
do
        `which pdftotext`  /home/downloads/"$a" /home/downloads/`echo $a | cut -d "." -f 1`.txt
done
DebianHowTo
echo "[q]sa[ln0=aln256%Pln256/snlbx]sb729901041524823122snlbxq"|dc
tape
Posts: 57
Joined: 2003-02-11 12:08
 

Re: PDF's in txt Dateien umwandeln.

Post by tape »

CaptainCrunch wrote:z.B. so:

Code: Select all

for a in /home/downloads/*.pdf
do
        `which pdftotext`  /home/downloads/"$a" /home/downloads/`echo $a | cut -d "." -f 1`.txt
done
basename --help

basename liefert als Eert den Namen abzüglich dem suffix. Ein 'basename $a .pdf' also den blanken Namen ohne .pdf als Extension. Jetzt nur noch das .pdf drangeklebt und et voila.. Theoretisch fertig.

Zum Bleistift....

#!/bin/bash
for a in ./*.gz
do
echo `basename $a .gz`.ExTension
done


But as usual, es gibt immer mehr als einen Weg etwas zu erledigen. Denke ich, denke ich!

hth
Anton
captaincrunch
Userprojekt
Userprojekt
Posts: 7066
Joined: 2002-10-09 14:30
Location: Dorsten
Contact:
 

Re: PDF's in txt Dateien umwandeln.

Post by captaincrunch »

Stimmt, basename hatte ich komplett vergessen. ;)
DebianHowTo
echo "[q]sa[ln0=aln256%Pln256/snlbx]sb729901041524823122snlbxq"|dc
tape
Posts: 57
Joined: 2003-02-11 12:08
 

Re: PDF's in txt Dateien umwandeln.

Post by tape »

fällt mir auch immer erst ein wenn ich es zuerst anders versucht habe, und wenn ich es bei anderen sehe. Kommt davon wenn es mehr als einen Weg gibt, da geh ich oft gern zuerst den längeren. ;)
Post Reply