UTF-8: Probleme beim Übtragen einer Dateistruktur von Windows auf Linux

FreeBSD, Gentoo, openSUSE, CentOS, Ubuntu, Debian
simcen
RSAC
Posts: 338
Joined: 2003-02-12 14:35
Location: Bern, Schweiz

UTF-8: Probleme beim Übtragen einer Dateistruktur von Windows auf Linux

Post by simcen » 2007-10-19 20:14

Hallo Zusammen

Ich habe leider eine Situation, welche sich momentan nicht ändern lässt, und zwar folgende:
Auf einem Windows 2003 Server werden mittelns einem Job bestimmte Verzeichnisse und Dateien generiert, welche zum Teil Sonderzeichen und Umlaute enthalten.
Diese werden mittels PSCP auf die RedHat Maschine gestellt, worauf die Systemsprache LANG=en_US.UTF-8 eingestellt ist. Auf die Server kopierten Daten werden anschliessend von einer Server-Software eingelesen, wobei alle Verzeichnisse und Dateien, welche einen Umlaut (Leerzeichen und einige Sonderzeichen funktionieren) enthalten, kriegt die Software nicht angezeigt.
Der Server ist ein WebSphere Application Server V6.1, tut aber eigentlich nichts zur Sache, könnte auch ein Tomcat o.ä. sein.

Schaue ich mir die Dateien mit dem Default-Locale an:

Code: Select all

$ echo $LANG
en_US.UTF-8
$ ll
total 16
4 drwxr-xr-x  3 asrun asrun 4096 Oct 19 19:54 .
4 drwxrwx---  9 asrun asrun 4096 Oct 19 19:53 ..
4 -rw-r--r--  1 asrun asrun  701 Oct 15 17:03 20070825 - 20070826.csv
4 drwxr-xr-x  2 asrun asrun 4096 Oct 15 17:03 Firma XYZ - Debi - 91128660 - franz?sisch


Stelle ich die Locales um, werden die Verzeichnisse korrekt dargestellt:

Code: Select all

$ echo $LANG
en_US
$ ll
total 16
4 drwxr-xr-x  3 asrun asrun 4096 Oct 19 19:54 .
4 drwxrwx---  9 asrun asrun 4096 Oct 19 19:53 ..
4 -rw-r--r--  1 asrun asrun  701 Oct 15 17:03 20070825 - 20070826.csv
4 drwxr-xr-x  2 asrun asrun 4096 Oct 15 17:03 Firma XYZ - Debi - 91128660 - französisch


Ich vermute, dass mit einer Änderung der Locales im Application-Server-Environment wäre. Dies ist aber für mich einen zu grossen Eingriff in die Umgebung und hätte eine massive Umstellung zur Folge.

Gibt es einen Ausweg? Ev. bereits bei der Übertragung? Kann ich irgendwie ein Script bauen, was mir die Verzeichnisse und Dateien UTF8-fähig macht?

Besten Dank für eure Unterstützung und Gruss
Simon

User avatar
Joe User
Project Manager
Project Manager
Posts: 11583
Joined: 2003-02-27 01:00
Location: Hamburg

Re: UTF-8: Probleme beim Übtragen einer Dateistruktur von Windows auf Linux

Post by Joe User » 2007-10-19 20:24


simcen
RSAC
Posts: 338
Joined: 2003-02-12 14:35
Location: Bern, Schweiz

Re: UTF-8: Probleme beim Übtragen einer Dateistruktur von Windows auf Linux

Post by simcen » 2007-10-19 20:39

Ach Mensch, und ich hab einen halben Roman geschrieben :roll:

Darauf gibt es nur eine Antwort: PERFEKT, vielen Dank!

Bis bald (mit doofen Fragen ;) )
Simon