鍍金池/ 問答/HTML/ 一道Nodejs編碼解碼問題

一道Nodejs編碼解碼問題

var s = '\u5C0F\u5B9D\u8D1Dsyy';
console.log(decodeURIComponent(s))

var userNick = decodeURIComponent('%5Cu5C0F%5Cu5B9D%5Cu8D1Dsyy');
console.log(decodeURIComponent( userNick ))

decodeURIComponent('%5Cu5C0F%5Cu5B9D%5Cu8D1Dsyy') 解碼之后就是變量\u5C0F\u5B9D\u8D1Dsyy,但是在node中執(zhí)行,卻輸出不一致,我期望的是能轉(zhuǎn)換成中文,但是下面只是轉(zhuǎn)換成unicode,這是為什么?

回答
編輯回答
汐顏

encodeURIComponent 僅僅能對特殊字符和中文進(jìn)行轉(zhuǎn)碼,且中文的編碼的方式是使用utf-8方式,對于字符串'\u5C0F\u5B9D\u8D1Dsyy'來說\是特殊字符,所以就被轉(zhuǎn)義成%5C了。
encodeURIComponent('u5C0Fu5B9Du8D1Dsyy') 就會得到 '%5Cu5C0F%5Cu5B9D%5Cu8D1Dsyy',調(diào)用decodeURIComponent就回得到原始字符串,重復(fù)調(diào)用decodeURIComponent是沒有用的,因為第一次decode之后得到的字符串中已經(jīng)沒有特殊字符了。

2017年2月1日 11:25
編輯回答
紓惘

問題出在轉(zhuǎn)義字符。注意字符串變量你輸入的代碼與回顯值的區(qū)別,比如如果你在控制臺打印變量str打印出來是\,那么它其實應(yīng)該是var str="\\"。同樣如果你var str='\\u';console.log(str),你看到的是'''u'''。

你解碼的那個字符串本來就是錯的,你的代碼里沒說明'%5Cu5C0F%5Cu5B9D%5Cu8D1Dsyy'是怎么得到的,其實你可以驗證下'%5Cu5C0F%5Cu5B9D%5Cu8D1Dsyy'===encodeURIComponent('\\u5C0F\\u5B9D\\u8D1Dsyy')為true。而實際上你需要的是字符串encodeURIComponent('\u5C0F\u5B9D\u8D1Dsyy'),或者說你直接encodeURIComponent('小寶貝ssy')就行了,因為\u只是個轉(zhuǎn)義字符,會把\u{X} ... \u{XXXXXX}解析成對齊的unicode字符,本質(zhì)上'\u5C0F\u5B9D\u8D1Dsyy'==='小寶貝ssy'

如果你這串字符串就是別人傳給你的話,那么可以

var userNick = decodeURIComponent('%5Cu5C0F%5Cu5B9D%5Cu8D1Dsyy');
console.log(eval('"'+decodeURIComponent( userNick )+'"'))

這樣就打印出來小寶貝syy

ps:
這其實是URI編碼解碼的問題。URI需要編碼解碼的原因一個是由于歧義,因為查詢字符串部分形式?foo=1&bar=2,默認(rèn)會用'&'和'='來查分URI,而你可能要傳的變量值包含&或者=,這就產(chǎn)生了URI編碼解碼的需求。 一般說的字符串編解碼是對同一段Buffer用不同的字符集來編碼。
我個人是這樣區(qū)分的:

  • URI編碼 為了消除歧義,同時URI傳輸時只允許ASCII(好像是)。JS中的escape、encodeURI、encodeURIComponent都是這個系列的。
  • 字符串內(nèi)容的編碼解碼 處理數(shù)據(jù)流。比如來自網(wǎng)絡(luò)的數(shù)據(jù)流,或者讀取本地文件等。打開這段js,發(fā)現(xiàn)中文部分是亂碼,因為傳來的數(shù)據(jù)流被瀏覽器當(dāng)作gbk編碼來解析了,要改成utf8才能看到(chrome不支持改編碼設(shè)置了,我用的插件Set Charset Encoding。這在node里是用Buffer來解決。
2017年2月7日 03:55