KL WIKI


UTF8


UTF-8

1 0xxx xxxx
2 110x xxxx  10xx xxxx
3 1110 xxxx  10xx xxxx  10xx xxxx
4 1111 0xxx  10xx xxxx  10xx xxxx  10xx xxxx
5 1111 10xx  10xx xxxx  10xx xxxx  10xx xxxx  10xx xxxx
6 1111 110x  10xx xxxx  10xx xxxx  10xx xxxx  10xx xxxx  10xx xxxx

最短ではない符号

0x7fの表現
1 0111 1111
2 1100 0001  1011 1111
3 1110 0000  1000 0001  1011 1111
4 1111 0000  1000 0000  1000 0001  1011 1111
5 1111 1000  1000 0000  1000 0000  1000 0001  1011 1111
6 1111 1100  1000 0000  1000 0000  1000 0000  1000 0001  1011 1111
1 0x7f
2 c1 bf
3 e0 81 bf
4 f0 80 81 bf
5 f8 80 80 81 bf
6 fc 80 80 80 81 bf
最も短いバイト数による表現以外は不正なUTF-8シーケンス

2バイト表現

 1バイト目はC0-DFではなく C2-DFとなる

3バイト表現

 2バイト目は80-BFではなく A0-BFとなる

4バイト表現

 2バイト目は80-BFではなく 90-BFとなる

5バイト表現

 2バイト目は80-BFではなく 88-BFとなる

6バイト表現

 2バイト目は80-BFではなく 84-BFとなる
MENU

1.0.0-0.0.7

doc
doc/format

(C) Copyright Masao Kondo , 2009 - 2017 All rights reserved

KL WIKI Ver 1.0.0-0.0.7