INFO 23-02-18 // ZEICHENSATZ
Immer wieder erreichen uns Fragen bzgl. der Konvertierung von verschiedenen Zeichensätzen. Nun - wer den ganzen Beitrag aufmerksam verfolgt hat, wird unter anderem auch das hier gelesen haben:
http://www.waldbauer.com/vb/showpost...8&postcount=36
OA4DB konvertiert die Daten grundsätzlich in der Eingangscodepage des Nutzers (in unseren Breitengraden daher vorzugsweise in CP850, in den USA zb. in CP437). Wer nun weiter in der Wikipedia über CP850 liest, wird auf diesen Artikel stossen:
https://de.wikipedia.org/wiki/Codepage_850
Wer also erfolgreich seine Daten von OA in ein gewünschtes anderes Format bringen will, muß sich leider - wohl oder übel - mit ICONV und/oder SED auseinandersetzen, da wir auch in zukünftigen Releases keine Mappings dafür im Konverter einbauen werden sondern die Daten immer unverändert konvertieren.
Bzgl. SED sei nocheinmal anzumerken: Wer sich die CP850 in der Wiki genau ansieht wird hier insbesondere auf Doppelbelegungen stoßen, die bei der normalen Konvertierung via ICONV zb. von CP850 nach CP437 plötzlich fehlerhaft sind. Wenn ich also zb. im OA4 via ALT+F4 ein § (ASCII 245) Zeichen in die Datenbank schreibe, wird an dieser Stelle HEX 15 verwendet welches dummerweise eben doppelt belegt ist und zb. in MYSQL als Steuerzeichen interpretiert wird....
In diesem Fall ist also vor einer Weiterverarbeitung zusätzlich noch zB. folgendes zu machen:
Code:
sed -i "s/\x15/\xF5/g" output.csv ( = CSV Ausgabe von OA4DB)