Unsere täglich Umlaut-Frage gib uns heute

Unsere täglich Umlaut-Frage gib uns heute

am 02.03.2006 20:05:04 von Matthias Fischer

Hallo

Keine Frage, ein wirklich unschönes Thema, nervig oben drein, aber ich
hab den Dreh noch nicht raus, und da Anfänger, bitte ich um Rücksicht.

Ich möchte Daten mittels LOAD DATA LOCAL INFILE in eine Datenbank
einfügen, aber es werden Umlaute und Akzente versaubeutelt.
Hier einige Auszüge:

H├ñndel Händel
Var├¿se Varèse
C├®sar César
Jan├ícek Janácek
Gy├Ârgy György
G├│recki Górecki
Tak├ícs Jen├ Takács Jenö
Nicol├▓ Nicolò

und ein kleinwenig vom System

WinXP SP2
ISS
--------------
mysql Ver 14.12 Distrib 5.0.18, for Win32 (ia32)

Connection id: 1
Current database: klassik ##InnoDB
Current user: mfischer@localhost
SSL: Not in use
Using delimiter: ;
Server version: 5.0.18-nt-max
Protocol version: 10
Connection: localhost via TCP/IP
Server characterset: latin1
Db characterset: latin1
Client characterset: latin1
Conn. characterset: latin1
TCP port: 3306
Uptime: 21 min 57 sec

Threads: 1 Questions: 7 Slow queries: 0 Opens: 0 Flush tables: 1
Open tables: 6 Queries per second avg: 0.005
--------------

Ich habe diese Newsgroup bis Sep 2005 zurückverfolgt, die angesprochenen
Umlautthemen gelesen und enthaltene Hinweise versucht, zu beachten,
entsprechende Kapitel im MySQL-Manual gelesen.
Außerdem wurde versucht, die Textdateien in unterschiedlichen
Kodierungen zu speichern - bisher ohne Erfolg.
Die Eingabe über die mysql-Kommandozeile verläuft natürlich vorbildlich.

An welchen Schrauben kann ich noch drehen?

Dank im voraus
Matthias

Re: Unsere täglich Umlaut-Frage gib uns heute

am 02.03.2006 21:44:19 von Christian Kirsch

Matthias Fischer wrote:
> Hallo
>
> Keine Frage, ein wirklich unschönes Thema, nervig oben drein, aber ich
> hab den Dreh noch nicht raus, und da Anfänger, bitte ich um Rücksicht.
>
> Ich möchte Daten mittels LOAD DATA LOCAL INFILE in eine Datenbank
> einfügen, aber es werden Umlaute und Akzente versaubeutelt.
> Hier einige Auszüge:

Auszüge von *was*? Was ist die linke, was die rechte Spalte?

Links stehen vermutlich UTF-8-kodierte Strings, rechts Latin-1. Aber
*warum*? Ist das Rechte die ursprüngliche Textdatei? Das Linke die
Ausgabe von mysql? Umgekehrt? Warum müssen wir das raten?

Und was hast Du gegen UTF-8-kodierte Strings? Du könntest sie doch in
das konvertieren, was Du gerne hättest (allerdings bezweifle ich, dass
Du wirklich Latin 1 haben willst - damit kannst Du den Kollegen Eötvös
leider nicht darstellen, der hat lange Umlaute IIRC. Ganz zu schweigen
von Schostakowitsch, Tchaikowsky etc. pp. ).

> H├ñndel Händel
> Var├¿se Varèse
> C├®sar César
> Jan├ícek Janácek
> Gy├Ârgy György
> G├│recki Górecki
> Tak├ícs Jen├ Takács Jenö
> Nicol├▓ Nicolò
>

Nein, stimmt ja gar nicht - RECHTS ist UTF-8 und links ist als UTF-8
kodiertes UTF-8. Aber warum?
--------------
>
> Ich habe diese Newsgroup bis Sep 2005 zurückverfolgt, die angesprochenen
> Umlautthemen gelesen und enthaltene Hinweise versucht, zu beachten,
> entsprechende Kapitel im MySQL-Manual gelesen.
> Außerdem wurde versucht, die Textdateien in unterschiedlichen
> Kodierungen zu speichern - bisher ohne Erfolg.
> Die Eingabe über die mysql-Kommandozeile verläuft natürlich vorbildlich.
>
> An welchen Schrauben kann ich noch drehen?

Du könntest wenigstens mal erklären, was Du tust, was Du getan hast, wie
diese beiden von Dir oben wiedergegebenen Spalten zustandegekommen sind,
was Du erreichen möchtest und so weiter und so weiter.