F: Spreadsheat::ParseExcel und Unicode

F: Spreadsheat::ParseExcel und Unicode

am 24.04.2006 14:23:51 von Holger von Rauch

Hallo!

Ich lese mit o.g. Modul die Daten aus mehrsprachigen Excel-Dateien aus,
um sie zur Kontrolle via CGI im Browser anzuzeigen und dann in eine
utf-8-kodierte PostgreSQL-DB zu übertragen.

Sonderzeichen aus nicht-westlichen Datensätzen gehen dabei verloren (und
zwar eben bei der Extraktion aus Excel; mehrsprachige Daten direkt aus
der Webanwendung gelangen problemlos auf den Bildschirm und in die DB).

Usenetpostings zu dieser Problematik habe ich unter groups.google wohl
gefunden, allerdings scheint mir die richtige Lösung nicht dabei zu
sein. Sowohl die meisten Postings als auch das ParseExcel-Modul sind
schon ziemlich angejahrt und allerorten wird auf die künftig
volkommenere Unicode-Unterstützung von Perl verwiesen. (Ich verwende
v5.8.6 built for MSWin32-x86-multi-thread.)

Hat jemand den Schlüssel?

Vielen Dank im Voraus sendet und grüßt
Holger

--
Bitte nur in Newsgroup antworten. Danke.
Please reply only to Newsgroup. Thanks.

Re: F: Spreadsheat::ParseExcel und Unicode

am 24.04.2006 16:10:09 von Helmut Wollmersdorfer

Holger von Rauch wrote:

> Usenetpostings zu dieser Problematik habe ich unter groups.google wohl
> gefunden, allerdings scheint mir die richtige Lösung nicht dabei zu
> sein. Sowohl die meisten Postings als auch das ParseExcel-Modul sind
> schon ziemlich angejahrt und allerorten wird auf die künftig
> volkommenere Unicode-Unterstützung von Perl verwiesen. (Ich verwende
> v5.8.6 built for MSWin32-x86-multi-thread.)

> Hat jemand den Schlüssel?

Perl v5.8.6 sollte Unicode/UTF8 perfekt unterstützen.

Ich vermute den Fehler eher bei Excel selber bzw. im Modul
Spreadsheat::ParseExcel.

Nachdem die Excel-Funktionen 'char' und 'code' nur 8 Bit unterstützen,
nehme ich mal an, dass die Speicherung in Excel intern auch mit 8 Bit +
Font gelöst ist. Indizien dafür gibt es mehrere.

Helmut Wollmersdorfer

Re: F: Spreadsheat::ParseExcel und Unicode

am 24.04.2006 22:36:11 von Slaven Rezic

Holger von Rauch writes:

> Hallo!
>
> Ich lese mit o.g. Modul die Daten aus mehrsprachigen Excel-Dateien
> aus, um sie zur Kontrolle via CGI im Browser anzuzeigen und dann in
> eine utf-8-kodierte PostgreSQL-DB zu übertragen.
>
> Sonderzeichen aus nicht-westlichen Datensätzen gehen dabei verloren
> (und zwar eben bei der Extraktion aus Excel; mehrsprachige Daten
> direkt aus der Webanwendung gelangen problemlos auf den Bildschirm und
> in die DB).
>
> Usenetpostings zu dieser Problematik habe ich unter groups.google wohl
> gefunden, allerdings scheint mir die richtige Lösung nicht dabei zu
> sein. Sowohl die meisten Postings als auch das ParseExcel-Modul sind
> schon ziemlich angejahrt und allerorten wird auf die künftig
> volkommenere Unicode-Unterstützung von Perl verwiesen. (Ich verwende
> v5.8.6 built for MSWin32-x86-multi-thread.)
>
> Hat jemand den Schlüssel?
>

http://rt.cpan.org/Public/Bug/Display.html?id=11500

--
Slaven Rezic - slaven rezic de

Visualize XML files in a Tk text widget:
http://search.cpan.org/search?mode=module&query=Tk::XMLViewe r