中文編碼處理方式

2013-09-09

ActionScript 3:

var a:String = “超越梦想#”;

trace(escape(a)); //%u8D85%u8D8A%u68A6%u60F3%23

trace(encodeURI(a)); //%E8%B6%85%E8%B6%8A%E6%A2%A6%E6%83%B3#

trace(encodeURIComponent(a)); //%E8%B6%85%E8%B6%8A%E6%A2%A6%E6%83%B3%23

JavaScript:

var a = “超越梦想#”;

alert(escape(a)); //%u8D85%u8D8A%u68A6%u60F3%23 

alert(encodeURI(a)); //%E8%B6%85%E8%B6%8A%E6%A2%A6%E6%83%B3# 

alert(encodeURIComponent(a)); //%E8%B6%85%E8%B6%8A%E6%A2%A6%E6%83%B3%23

 

 

Unicode UTF-32 編碼方式

將 Unicode 字元表示成 32 位元整數序列。應用程式可以使用 UTF32Encoding 類別,將字元轉換成 UTF-32 編碼或是從其轉換回來。

當編碼空間對作業系統十分重要,而應用程式需要在作業系統上避免 UTF-16 的 Surrogate 字碼指標行為,可以使用 UTF-32。請注意,在畫面上呈現的單個「圖像」(Glyph) 仍可以使用一個以上的 UTF-32 字元編碼。目前會受到此行為影響的補充字元目前要比 Unicode BMP 字元少許多。

Unicode UTF-16 編碼方式

將 Unicode 字元表示成 16 位元整數序列。您的應用程式可以使用 UnicodeEncoding 類別,將字元轉換成 UTF-16 編碼或是從其轉換回來。

UTF-16 通常會以原生形式使用,如在 Microsoft.Net char 型別、Windows WCHAR 型別和其他常用型別。大多數常用 Unicode 字碼指標只能接受一個 UTF-16 字碼指標 (2 個位元組)。U+10000 及以上的 Unicode 補充字元仍需要兩個 UTF-16 Surrogate 字碼指標。

Unicode UTF-8 編碼方式

將 Unicode 字元表示成 8 位元的位元組序列。您的應用程式可以使用 UTF8Encoding 類別,將字元轉換成 UTF-8 或是從其轉換回來。

UTF-8 可使用 8 位元的資料大小編碼,而且適用於許多現有的作業系統。對於 ASCII 字元範圍,UTF-8 與 ASCII 編碼完全相同,而且允許範圍更廣的字元集。不過,對於 CJK 指令碼,UTF-8 則是每個字元需要三個位元組,資料大小可能比 UTF-16 還大。請注意,ASCII 資料量 (如 HTML 標記) 有時可能是 CJK 範圍大小增加的原因。

Unicode UTF-7 編碼方式

將 Unicode 字元表示成 7 位元 ASCII 字元序列。您的應用程式可以使用 UTF7Encoding 類別,將字元轉換成 UTF-7 或是從其轉換回來。非 ASCII 的 Unicode 字元則以 ASCII 字元的逸出序列 (Escape Sequence) 表示。

UTF-7 支援需要這種編碼的特定通訊協定,這些多半是電子郵件和新聞群組通訊協定。然而,UTF-7 並沒有特別安全或穩固。在某些情況下,變更一個位元便可能會徹底改變整個 UTF-7 字串的解譯。在其他情況下,不同的 UTF-7 字串可能會編碼成相同的文字。對於包含非 ASCII 字元的序列而言,UTF-7 的有效空間 (Space-Efficient) 效率比 UTF-8 低很多,而且編碼/解碼的速度比較慢。因此,您的應用程式通常應優先選擇 UTF-8 而非 UTF-7。

ASCII 編碼方式

將拉丁字母編碼成單一的 7 位元 ASCII 字元。由於這個編碼方式僅支援 U+0000 到 U+007F 之間的字元值,因此大部分的情況下,這並不適用於國際化的應用程式。您的應用程式可以使用 ASCIIEncoding 類別,將字元轉換成 ASCII 編碼或是從其轉換回來。如需在程式碼中使用這個類別的範例,請參閱將基底型別編碼

ANSI/ISO 編碼方式

用於非 Unicode 編碼方式。Encoding 類別支援各式各樣的 ANSI/ISO 編碼方式。

Contact

Github

Codepen

歡迎參觀我的賣場
© 2013 Copyright Digishot Web | Design Tools
Visitors【640736】
digishot webdesign studio