Debian: locale, Umlaute, UTF-8 & Co.
Posted: 2007-12-06 22:05
Es geht um ein relativ frisch installiertes Debian Etch (kein Upgrade von Sarge).
Kopier ich mit WinSCP die Datei "täst.txt" auf das System wird der Umlaut korrekt dargestellt (in WinSCP)! In der Konsole sieht die Datei jedoch so aus: "t?st.txt".
Wird die Datei "täst.txt" via Samba (unix charset: utf-8, dos charset: cp1250, display charset: locale) abgelegt erscheint sie in der Konsole so: "t??st.txt" (2 Fragezeichen). Unter WinSCP erscheint sie so: "täst.txt" - also wieder anders. Der Windowsrechner sieht nach wie das korrekte "täst.txt".
Putty und WinSCP sind auf UTF-8 eingestellt.
Ich blicke bei diesem Durcheinander absolut nicht mehr durch.... :(
Müsste nachdem ich mit
die gängigen Codepages generiert und de_DE.UTF-8 als default ausgewählt habe
nicht anders aussehen? Ich erwartete da jetzt eigentlich was von de_DE.UTF-8 zu sehen... Und warum ist LANG leer?
Was ich sonst noch gefunden habe:
Hab ich hier ein Verständnisproblem? Muss ich zwischen der echten Konsole und einer SSH-Verbindung unterscheiden?
Grundsätzlich möchte ich einfach alles auf UTF-8 haben bzw. belassen - und soweit ich es nachvollziehen kann habe ich das auch alles so eingestellt (z.B. mit locales und in Samba) - trotzdem werden die Umlaute aber nicht dargestellt bzw. sie gehen verloren wenn ich die Dateien der Samba Share z.B. unter Linux packe und später wieder unter Windows entpacke.
Hab ich eigentlich bei der Kernelkonfiguration einen Einfluss darauf bzw. könnte ich hier irgendwas falsch gemacht haben?
CONFIG_NLS_DEFAULT habe ich auf "utf8" gesetzt.
CONFIG_NLS_UTF8 ist (u.a.) fest eingebaut.
Kopier ich mit WinSCP die Datei "täst.txt" auf das System wird der Umlaut korrekt dargestellt (in WinSCP)! In der Konsole sieht die Datei jedoch so aus: "t?st.txt".
Wird die Datei "täst.txt" via Samba (unix charset: utf-8, dos charset: cp1250, display charset: locale) abgelegt erscheint sie in der Konsole so: "t??st.txt" (2 Fragezeichen). Unter WinSCP erscheint sie so: "täst.txt" - also wieder anders. Der Windowsrechner sieht nach wie das korrekte "täst.txt".
Putty und WinSCP sind auf UTF-8 eingestellt.
Ich blicke bei diesem Durcheinander absolut nicht mehr durch.... :(
Müsste nachdem ich mit
Code: Select all
dpkg-reconfigure locales
Code: Select all
www:~# locale
LANG=
LC_CTYPE="POSIX"
LC_NUMERIC="POSIX"
LC_TIME="POSIX"
LC_COLLATE="POSIX"
LC_MONETARY="POSIX"
LC_MESSAGES="POSIX"
LC_PAPER="POSIX"
LC_NAME="POSIX"
LC_ADDRESS="POSIX"
LC_TELEPHONE="POSIX"
LC_MEASUREMENT="POSIX"
LC_IDENTIFICATION="POSIX"
LC_ALL=
Was ich sonst noch gefunden habe:
Code: Select all
www:~# cat /etc/environment
LANG="de_DE.UTF-8"
www:~# cat /etc/default/locale
LANG=de_DE.UTF-8
Grundsätzlich möchte ich einfach alles auf UTF-8 haben bzw. belassen - und soweit ich es nachvollziehen kann habe ich das auch alles so eingestellt (z.B. mit locales und in Samba) - trotzdem werden die Umlaute aber nicht dargestellt bzw. sie gehen verloren wenn ich die Dateien der Samba Share z.B. unter Linux packe und später wieder unter Windows entpacke.
Hab ich eigentlich bei der Kernelkonfiguration einen Einfluss darauf bzw. könnte ich hier irgendwas falsch gemacht haben?
CONFIG_NLS_DEFAULT habe ich auf "utf8" gesetzt.
CONFIG_NLS_UTF8 ist (u.a.) fest eingebaut.