dateinamen aus html-Datei auslesen

Bash, Shell, PHP, Python, Perl, CGI
maku
Posts: 58
Joined: 2003-03-26 15:14
Location: Köln

dateinamen aus html-Datei auslesen

Post by maku »

Hallo,

ich bin auf der Suche nach der Lösung von folgendem Problem:

einer meiner Kunden legt jeden Tag eine bestimmte neue Datei an, die immer unterschiedlich benannt wird. Ich muss diese Datei nun jeden Tag sichern. Und zwar nur diese Datei. Da ich nicht weiss, wie die Datei zum Sicherungszeitpunkt benannt wurde, muss ich manuell nachsehen, wie sie heisst und dann die Datei auf einen anderen Server speichern.
Der Kunde lässt diesen Dateinamen jedoch zeitgleich mit der Erstellung auf seinen Webseiten veröffentlichen. Dadurch wäre ich in der Lage, den aktuellen Dateinamen aus dem HTML-code zu entnehmen. Ein 'grep' nach einem 'wget' bringt mir allerdings die gesamte Zeile des HTML-codes und nicht nur den Dateinamen, den ich benötige. Bei dem Dateinamen ist immer der erste Teil (name des Kunden) und der letzte Teil (tar.gz) identisch.
Hat zufällig jemand eine Idee, wie ich aus der erhaltenen Zeile den Dateinamen in eine Variable kopieren könnte, um dann ein automatisiertes backup-skript schreiben zu können?!

Vielen Dank im voraus,

Mark
captaincrunch
Userprojekt
Userprojekt
Posts: 7066
Joined: 2002-10-09 14:30
Location: Dorsten

Re: dateinamen aus html-Datei auslesen

Post by captaincrunch »

Auf der Shell tät ich das wie folgt machen :

Code: Select all

grep NAME.*tar.gz FILE.html | sed 's/.*(NAME.*tar.gz).*/1/g'
Btw. : Ist eher was für's Scripting, daher verschiebe ich es mal dorthin.
DebianHowTo
echo "[q]sa[ln0=aln256%Pln256/snlbx]sb729901041524823122snlbxq"|dc