● Jul 1, 2001 (Sun) 1:22 - PerlでUnicode 今,社内で Unicode の話題が熱いです.以下,全てPerlでの話です. 今までうちの会社では,EUCベースで全てをやっていました. 入力されたコードは,EUCに変換して内部で処理したり,DBにいれて, 出力時にSJISという流れです. で,現在社内で使ってるライブラリを新しく書き直したついでに, Unicodeベースへ移行しようと(わたしが)しているのですが, mysql のターミナルで Unicode->EUC 変換が出来ない等の理由で 反対意見が出たりして. 一応,内部でUTF-8に変換し,全ての処理を追えてからSJIS(または UTF-8)にして出力するものがすでに出来ています. (っていうか,ToDoとかこの日記はそのライブラリ上で動いてます) Unicodeのメリットとして, ・文字列のマッチ・置換が正しく行える ・今後の標準コードセットであることがほぼ間違いない. ・Unicodeを採用しないと,将来のperlで動かなくなる可能性がある. (manに"use utf8" still needed to enable a few features って書いてあるので‥‥‥.use utf8 が要らないと言うことは, EUCなどをUTF8とデフォで理解しようとしてエラーが‥‥‥) ・広大な私用領域が使用できる. 私用領域に,imode,J-SKY等の絵文字を割り当てると,絵文字を 通常の文字と同列に扱える. ・perl5.8やperl6等,将来のバージョンでネイティブにサポートされる. ・国際化対応. とかがあると思うのです. デメリットしては, ・通常より大きな領域を使用する(場合によっては処理速度が低下する.) ・MySQLが現在対応していないため,ターミナルからmysqlコマンドを 使用して,DBの中身を確認できない. といったところでしょうか. ってかんじで議論になってるんですが,どう思います? 技術屋の反応希望(笑) |
|