Jul 1, 2001 (Sun) 1:22 - PerlでUnicode

今,社内で Unicode の話題が熱いです.以下,全てPerlでの話です.

今までうちの会社では,EUCベースで全てをやっていました.
入力されたコードは,EUCに変換して内部で処理したり,DBにいれて,
出力時にSJISという流れです.

で,現在社内で使ってるライブラリを新しく書き直したついでに,
Unicodeベースへ移行しようと(わたしが)しているのですが,
mysql のターミナルで Unicode->EUC 変換が出来ない等の理由で
反対意見が出たりして.

一応,内部でUTF-8に変換し,全ての処理を追えてからSJIS(または
UTF-8)にして出力するものがすでに出来ています.
(っていうか,ToDoとかこの日記はそのライブラリ上で動いてます)

Unicodeのメリットとして,

・文字列のマッチ・置換が正しく行える
・今後の標準コードセットであることがほぼ間違いない.
・Unicodeを採用しないと,将来のperlで動かなくなる可能性がある.
 (manに"use utf8" still needed to enable a few features
  って書いてあるので‥‥‥.use utf8 が要らないと言うことは,
  EUCなどをUTF8とデフォで理解しようとしてエラーが‥‥‥)
・広大な私用領域が使用できる.
 私用領域に,imode,J-SKY等の絵文字を割り当てると,絵文字を
 通常の文字と同列に扱える.
・perl5.8やperl6等,将来のバージョンでネイティブにサポートされる.
・国際化対応.

とかがあると思うのです.

デメリットしては,

・通常より大きな領域を使用する(場合によっては処理速度が低下する.)
・MySQLが現在対応していないため,ターミナルからmysqlコマンドを
 使用して,DBの中身を確認できない.

といったところでしょうか.

ってかんじで議論になってるんですが,どう思います?
技術屋の反応希望(笑)



2024年10月
29
0
30
0
01
0
02
0
03
0
04
0
05
0
06
0
07
0
08
0
09
0
10
0
11
0
12
0
13
0
14
0
15
0
16
0
17
0
18
0
19
0
20
0
21
0
22
0
23
0
24
0
25
0
26
0
27
0
28
0
29
0
30
0
31
0
01
0
02
0

TmmDiary / Copyright 2001 Ymirlink,Inc. & Mikage Sawatari
このアドレスにはメールを送らないで下さい.
Don't send mail to this address.
hina@mikage.to