引用:
Originally posted by Lucas
我記得4 byte編碼已經考慮到2byte unicode 編碼,
正因為不常用,或因應特殊領域,所以4 byte編碼有其必要,卻又難以普及,
我想UTF-8之類的應用是折衷的好辦法吧,雖然相對的會浪費一點空間。
|
4byte編碼的ISO10646是有包含進unicode的,這也是他的妥協
因為原本的ISO2022,是採用跟unicode不一樣的規則,會造成麻煩
所以ISO10646,就是採用unicode方式,並將他納入的
其實4byte字元集原本並沒有什麼不好,除了網路上會比較在意這個容量的浪費
UTF-8跟UTF-16轉碼,也就是unicode補足字元不足的方法