Sep 19, 2001 (Wed) 0:58 - CPAN Testers

http://testers.cpan.org/search?request=dist&dist=Unicode-Japanese

なんかテストされてる〜.
って,ついさっき追加されたようですが(^^;

これって手動で make test して結果見てるのかな?



Sep 19, 2001 (Wed) 9:17 - SSP Unicode

#~~~~
# 「GET Sentence」, 「Charset」といったエントリ名や改行コードなどの
# 1 byte コードまで 3 byte の UTF-8 コードに変換しているにもかかわらず,
# 栞側にはエントリ名や改行コードまで encode されたヘッダを解析する
# 能力が無い事が原因であると判明しました.

SSP Unicode はまだ試してないんですが,UTF-8 なら,8bit目が 0 の
文字は,ASCII と完全に同じになるはずです.
UTF-8 指定なのに,改行コードやASCII文字が 3bytes になるなら
それは UTF-8 とは言えないような...(^^;;

わたしも後で試してみます.
SSTP しか試験出来ないと思いますが(^^;



Sep 19, 2001 (Wed) 11:23 - Unicode

#~~~~
# んー,しかし台湾向けとかになるとUCS2だと表示できない文字が多そうだ(^^;
# ほんとは内部でもUTF8のままにしたほうが良いんだろうけど,

台湾の文字なら UCS2 でも表示できると思いますが(^^;
UCS2 の範囲外(UTF-16 でサロゲートしないとダメ)な文字って
最近 Unicode3.1 で追加されたものだけなので,
特に問題ないかと思います.

http://www.unicode.org/Public/UNIDATA/Blocks.txt

これの 0x10000 以降が UCS2 で表現できないものですが,

20000..2A6D6; CJK Unified Ideographs Extension B
2F800..2FA1F; CJK Compatibility Ideographs Supplement

ここらへんって,たぶんフォントが無いので対応しても
意味がなさそうです(爆)
上の領域が追加されたのが,2001 Mar ですし.(^^;

ただ,可能なら今のうちにサロゲート対応しておくと良いかも(^^;



Sep 19, 2001 (Wed) 12:06 - たいわん

#~~~~
## 台湾の文字なら UCS2 でも表示できると思いますが(^^;
# いや,なんか,
# 子供が生まれるたびに新しい字が増えてるとかそういう話を聞いたもんで(^^;
# たぶん,似た字に置き換えられるのかな.

子供が生まれるたびに増えた字を登録していったらキリがないような(^^;
漢字でも,人名だと表示できない場合ありますし,古文はぼろぼろですし.
似た字でおきかえるとかしているのでは(^^;

Unicode が目指すのは全部の文字の網羅ではないですからねぇ.
そういうのは,文字鏡(商品版)とかで.

あ,超漢字のが文字数多い模様.



Sep 19, 2001 (Wed) 17:23 - うぃるす

http://www.symantec.com/region/jp/sarcj/data/w/w32.nimda.a@mm.html

結構強力みたいですね.
身近な会社が感染してたし(爆)



2001年09月
26
9
27
5
28
1
29
3
30
2
31
1
01
3
02
7
03
3
04
2
05
5
06
7
07
0
08
7
09
3
10
1
11
4
12
2
13
1
14
6
15
1
16
7
17
2
18
7
19
5
20
2
21
0
22
4
23
1
24
3
25
1
26
0
27
1
28
12
29
7
30
6
01
4
02
1
03
4
04
3
05
5
06
3

TmmDiary / Copyright 2001 Ymirlink,Inc. & Mikage Sawatari
このアドレスにはメールを送らないで下さい.
Don't send mail to this address.
hina@mikage.to