Page 1 of 1

dateinamen aus html-Datei auslesen

Posted: 2003-08-19 16:27
by maku
Hallo,

ich bin auf der Suche nach der Lösung von folgendem Problem:

einer meiner Kunden legt jeden Tag eine bestimmte neue Datei an, die immer unterschiedlich benannt wird. Ich muss diese Datei nun jeden Tag sichern. Und zwar nur diese Datei. Da ich nicht weiss, wie die Datei zum Sicherungszeitpunkt benannt wurde, muss ich manuell nachsehen, wie sie heisst und dann die Datei auf einen anderen Server speichern.
Der Kunde lässt diesen Dateinamen jedoch zeitgleich mit der Erstellung auf seinen Webseiten veröffentlichen. Dadurch wäre ich in der Lage, den aktuellen Dateinamen aus dem HTML-code zu entnehmen. Ein 'grep' nach einem 'wget' bringt mir allerdings die gesamte Zeile des HTML-codes und nicht nur den Dateinamen, den ich benötige. Bei dem Dateinamen ist immer der erste Teil (name des Kunden) und der letzte Teil (tar.gz) identisch.
Hat zufällig jemand eine Idee, wie ich aus der erhaltenen Zeile den Dateinamen in eine Variable kopieren könnte, um dann ein automatisiertes backup-skript schreiben zu können?!

Vielen Dank im voraus,

Mark

Re: dateinamen aus html-Datei auslesen

Posted: 2003-08-19 16:40
by captaincrunch
Auf der Shell tät ich das wie folgt machen :

Code: Select all

grep NAME.*tar.gz FILE.html | sed 's/.*(NAME.*tar.gz).*/1/g'
Btw. : Ist eher was für's Scripting, daher verschiebe ich es mal dorthin.