とある日の妄想モバイル - 機種依存文字を考える

0.戻る

2007年04月11日(木)

PHPでシステムを作る場合、機種依存文字の問題は避けて通れない。
特に文字コードを変換して利用しようとしたとき、その問題は顕著だ。
対応コードが無いため、?になってしまい、「文字化け」クレームの元になる。

Webコミュニティでは、丸付き文字を代表とする機種依存文字は
利用すること自体を避けねばならないものだとされるが、
顧客にそれを理解してもらうのは容易ではない。

既存のデータ資産にこれらの機種依存文字が含まれている場合も多く、
使えません、では通らないことも多いのだ。

いまのところ経験的に、UTF-8Nでシステムを構築すると、
この問題に比較的対処しやすいように感じている。
ユニコードには、丸付き文字などが定義として存在しているからだ。

CSVを取り込むときは、sjis-winを取り込み元エンコードとして指定する。
CSV書き出しも同じだ。
これで機種依存文字のSJIS読み込み・書き出しができる。
もちろんWindows環境で処理するという前提だ。

EXCELはSJISしか認識できないためUTF-8は使えない。
最新バージョンはどうなのか不明だが。

一般公開されているページでは、機種依存文字がOSによって
文字化けしてしまうのは避けられないように思う。
MacOSXでは丸付き文字とうは表示できるようになっている。
しかし、ローマ数字等は相変わらずWindowsとちがった表示になる。

完全な解決は、やはり難しいよな。
0.戻る

©2001-2009 konkon All Rights Reserved.