鍍金池/ 問答/Java  HTML/ request庫,url有中文時(shí)報(bào)錯(cuò)The header content con

request庫,url有中文時(shí)報(bào)錯(cuò)The header content contains invalid characters

代碼

let request = require('request');
let url = "https://www.baidu.com/s?wd=我是個(gè)大天賜,啦啦啦啦啦啦";

request(url, function (error, response, body) {
    if (!error && response.statusCode == 200) {
        console.log(body);
    } else {
        console.log(error);
    }
});

node version v8.9.0

報(bào)錯(cuò)

TypeError: The header content contains invalid characters
    at validateHeader (_http_outgoing.js:497:11)
    at ClientRequest.setHeader (_http_outgoing.js:501:3)
    at new ClientRequest (_http_client.js:173:14)
    at Object.request (https.js:240:10)
    at Request.start (D:\node_root\socket\node_modules\request\request.js:740:32)
    at Request.end (D:\node_root\socket\node_modules\request\request.js:1398:10)
    at end (D:\node_root\socket\node_modules\request\request.js:567:14)
    at Immediate.<anonymous> (D:\node_root\socket\node_modules\request\request.js:581:7)
    at runCallback (timers.js:789:20)
    at tryOnImmediate (timers.js:751:5)
回答
編輯回答
不將就

URL有中文,可以換個(gè)寫法:

let request = require('request');
// let url = "https://www.baidu.com/s?wd=我是個(gè)大天賜好建華大街的,啦啦啦啦啦啦";
var options = { 
  method: 'GET',
  url: 'https://www.baidu.com/s',
  qs: { wd: '我是個(gè)大天賜好建華大街的,啦啦啦啦啦啦' },
  headers: { 
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.89 Safari/537.36' 
  }
};
request(options, function (error, response, body) {
    if (!error && response.statusCode == 200) {
        console.log(body);
    } else {
        console.log(error);
    }
});
2017年7月27日 00:57
編輯回答
巫婆

不用 Request 庫的代碼如下,可能對你有幫助:

var http = require('https');
const { URL } = require('url');

var addr = new URL('https://www.baidu.com/s?wd=我是個(gè)大天賜好建華大街的,啦啦啦啦啦啦');

http.get(addr, function(res) {
  var result = '';

  res.on('data', function(data) {   result += data.toString('utf8');  });
  res.on('end', function() {    console.log(result);  });
});

請求不到數(shù)據(jù)的原因,分析如下:

  1. 把地址直接貼到 chrome 瀏覽器的地址欄,在開發(fā)者工具觀察 HTTP 請求;
  2. 發(fā)現(xiàn)有文檔的請求,有圖片的請求,還有腳本的請求;
  3. 懷疑搜索是通過一個(gè) all_async_search.js 腳本發(fā)起的,請見下面的截圖;

用 node.js 程序,只請求了一部分?jǐn)?shù)據(jù),請求來頁面,沒有獲得頁面上外鏈的 js 腳本。即使請求得到腳本,也沒有能力執(zhí)行 js 腳本程序,所以沒有最終請求到搜索結(jié)果。如果想請求到搜索結(jié)果,需要對方提供 HTTP API 接口(現(xiàn)在比較常用的是 RESTful API)。換句話說,這個(gè)頁面或者 URL 地址是給瀏覽器訪問的,不是用來給程序訪問的。

王頂,node.js, 408542507@qq.com

2018年8月3日 13:24
編輯回答
尤禮

最終的結(jié)果呢是把中文encodeURI+設(shè)置一下UA就好了

let request = require('request');
let url = "https://www.baidu.com/s?wd=%E6%95%B4%E5%A4%A9%E5%B0%B1%E6%98%AF%E8%83%8C%E8%83%8C%E8%83%8C%E8%AE%B0%E8%AE%B0%E8%AE%B0%EF%BC%8C%E6%88%96%E8%80%85%E6%9C%89%E4%BA%9B%E6%AD%A3%EF%BC%8C%E6%97%B6%E9%97%B4%E5%B0%B1%E8%BF%99%E4%B9%88%E6%B5%AA%E8%B4%B9%E4%BA%86";

let options = {
    url: url,
    method: 'GET',
    headers: {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36',
    }
}

request(options, function (error, response, body) {
    if (!error && response.statusCode == 200) {
        console.log(body);
    } else {
        console.log(error);
    }
});
2018年1月19日 10:08