在項目開發(fā)中不少朋友都會遇到字符串編碼、解碼或者編碼轉(zhuǎn)換的問題。
為了方便初學者朋友,我就在這里拋磚引玉地講解一下吧。
在C#中我們一般使用System.Text.Encoding來處理字符串編碼的問題。
1、字符串解碼
string code = "00430023662f4e0095e85f884f1896c576848bed8a00";
有這么一段代碼,我們?nèi)绾伟阉D(zhuǎn)換成可識別的中文呢?
有經(jīng)驗或?qū)Ω鞣N編碼比較熟悉的朋友可能直接就可以看出來,但是我們在不知道編碼的情況下如何快速把該編碼轉(zhuǎn)換為漢字呢?
string text = Encoding.UTF8.GetString(byte[] bytes);
在知道這是UTF8編碼的情況下我們可以通過GetString來進行解碼。
不知道編碼其實我們可以通過遍歷的方式來窮舉一下就可以了:
- string sources = "C#是一門很優(yōu)雅的語言";
- string code = "00430023662f4e0095e85f884f1896c576848bed8a00";
- foreach (var encoding in Encoding.GetEncodings())
- {
- string temp_code = string.Concat(encoding.GetEncoding().GetBytes(sources).Select(item => item.ToString("x").PadLeft(2, '0')));
- if (temp_code == code)
- {
- Console.WriteLine(temp_code);
- Console.WriteLine(encoding.Name);
- }
- }
如果沒有sources字符串,只有code編碼的時候也可以遍歷所有encoding,看看什么encoding可以輸出正常的中文即可。
或者在直接知道編碼的情況下:
- string code = "00430023662f4e0095e85f884f1896c576848bed8a00";
- byte[] buffer = Regex.Matches(code, "[0-9a-fA-F]{2}").Cast<Match>().Select(item => Convert.ToByte(item.Value, 16)).ToArray();
- Console.WriteLine(Encoding.BigEndianUnicode.GetString(buffer));
2、字符串編碼
編碼就相對比較簡單了。
- string temp_code = string.Concat(encoding.GetEncoding().GetBytes(sources).Select(item => item.ToString("x").PadLeft(2, '0')));
我們上面的解碼過程中就是把字符串用各種編碼方式進行編碼然后和已有的編碼比較。
3、編碼轉(zhuǎn)換
- byte[] buffer = Encoding.UTF8.GetBytes(sources);//可能是從其他地方獲取過來的參數(shù)
- buffer = Encoding.Convert(Encoding.UTF8/*原始編碼*/, Encoding.ASCII/*目標編碼*/, buffer);
PS:
在web開發(fā)中可能經(jīng)常遇到的是url編碼、解碼的問題,或者url參數(shù)亂碼等等。。。
Server.UrlEncode(""); Server.UrlDecode(""); System.Web.HttpUtility.UrlEncode(""); System.Web.HttpUtility.UrlDecode(""); System.Uri.EscapeDataString(""); System.Uri.UnescapeDataString("");
通??梢允褂眠@些工具類來編碼、解碼。亂碼一般都是因為發(fā)送方和接收放使用的編碼不一致造成的,在解碼過程中加上正確的編碼即可。
|