Debian: locale, Umlaute, UTF-8 & Co.

neo2001
Posts: 40
Joined: 2002-09-12 19:04
Location: Bad Herrenalb

Debian: locale, Umlaute, UTF-8 & Co.

Post by neo2001 »

Es geht um ein relativ frisch installiertes Debian Etch (kein Upgrade von Sarge).

Kopier ich mit WinSCP die Datei "täst.txt" auf das System wird der Umlaut korrekt dargestellt (in WinSCP)! In der Konsole sieht die Datei jedoch so aus: "t?st.txt".

Wird die Datei "täst.txt" via Samba (unix charset: utf-8, dos charset: cp1250, display charset: locale) abgelegt erscheint sie in der Konsole so: "t??st.txt" (2 Fragezeichen). Unter WinSCP erscheint sie so: "täst.txt" - also wieder anders. Der Windowsrechner sieht nach wie das korrekte "täst.txt".

Putty und WinSCP sind auf UTF-8 eingestellt.

Ich blicke bei diesem Durcheinander absolut nicht mehr durch.... :(

Müsste nachdem ich mit

Code: Select all

dpkg-reconfigure locales

die gängigen Codepages generiert und de_DE.UTF-8 als default ausgewählt habe

Code: Select all

www:~# locale
LANG=
LC_CTYPE="POSIX"
LC_NUMERIC="POSIX"
LC_TIME="POSIX"
LC_COLLATE="POSIX"
LC_MONETARY="POSIX"
LC_MESSAGES="POSIX"
LC_PAPER="POSIX"
LC_NAME="POSIX"
LC_ADDRESS="POSIX"
LC_TELEPHONE="POSIX"
LC_MEASUREMENT="POSIX"
LC_IDENTIFICATION="POSIX"
LC_ALL=

nicht anders aussehen? Ich erwartete da jetzt eigentlich was von de_DE.UTF-8 zu sehen... Und warum ist LANG leer?

Was ich sonst noch gefunden habe:

Code: Select all

www:~# cat /etc/environment
LANG="de_DE.UTF-8"
www:~# cat /etc/default/locale
LANG=de_DE.UTF-8


Hab ich hier ein Verständnisproblem? Muss ich zwischen der echten Konsole und einer SSH-Verbindung unterscheiden?
Grundsätzlich möchte ich einfach alles auf UTF-8 haben bzw. belassen - und soweit ich es nachvollziehen kann habe ich das auch alles so eingestellt (z.B. mit locales und in Samba) - trotzdem werden die Umlaute aber nicht dargestellt bzw. sie gehen verloren wenn ich die Dateien der Samba Share z.B. unter Linux packe und später wieder unter Windows entpacke.

Hab ich eigentlich bei der Kernelkonfiguration einen Einfluss darauf bzw. könnte ich hier irgendwas falsch gemacht haben?
CONFIG_NLS_DEFAULT habe ich auf "utf8" gesetzt.
CONFIG_NLS_UTF8 ist (u.a.) fest eingebaut.
Top

User avatar
Joe User
Project Manager
Project Manager
Posts: 11462
Joined: 2003-02-27 01:00
Location: Hamburg

Re: Debian: locale, Umlaute, UTF-8 & Co.

Post by Joe User »

Sind die glibc-locales installiert beziehungsweise generiert? Spuckt env die richtigen LANG/LC_* aus? `man convmv`?
Top

neo2001
Posts: 40
Joined: 2002-09-12 19:04
Location: Bad Herrenalb

Re: Debian: locale, Umlaute, UTF-8 & Co.

Post by neo2001 »

Joe User wrote:Sind die glibc-locales installiert beziehungsweise generiert? Spuckt env die richtigen LANG/LC_* aus? `man convmv`?


Wenn die glibc-locales das gleich sind wie das was ich meine, dann ja:

Code: Select all

www:~# locale-gen
Generating locales (this might take a while)...
  de_DE.UTF-8... done
  de_DE.ISO-8859-1... done
  de_DE.ISO-8859-15@euro... done
  en_US.ISO-8859-1... done
  en_US.UTF-8... done
Generation complete.



So wie ich das deute steht hier gar nichts bzgl. dem was ich gern hätte:

Code: Select all

www:~# env
TERM=xterm
SHELL=/bin/bash
SSH_CLIENT=10.0.0.10 2077 17075
SSH_TTY=/dev/pts/0
USER=root
LS_COLORS=no=00:...[*schnipp*]...35:
MAIL=/var/mail/root
PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin
PWD=/root
PS1=h:w$
SHLVL=1
HOME=/root
LS_OPTIONS=--color=auto
LOGNAME=root
SSH_CONNECTION=10.0.0.10 2077 192.168.0.100 17075
_=/usr/bin/env


convmv hatte ich kürzlich verwendet um die schon vorhandenen files in den shares in UTF-8 umzuwandeln (nur dort). Werde das nochmal prüfen.

EDIT:
Interessant ist Folgendes:
Betrachte ich mit ls den Inhalt der Verz. sehe ich die Umlaute mit "??"
In der Eingabeaufforderung kann ich den korrekten Dateinamen aber dennoch durch die Tabtasten-Vervollständigung bekommen.

Code: Select all

-rw-r--r--  1 root root    433152 Dec  6 23:21 Kosten??bernahme.xls
www:~# cat Kostenübernahme.xls
Top

Who is online

Users browsing this forum: No registered users and 2028 guests