舊代碼的問題是res.on('end',...)是異步的,與可能titleHref都還是空的。現(xiàn)在我更新了代碼,解決了這個問題,但是怎么打印出結果的ans數(shù)組呢,打印是同步的,老是打印出空數(shù)據(jù)。
新代碼:
const cheerio = require('cheerio');
const http = require('http');
const iconv = require('iconv-lite');
let baseUrl = "http://www.ygdy8.net/html/gndy/dyzz/list_23_";
let Host = "http://www.ygdy8.net/";
const totalPage = 2; //指定爬多少頁數(shù)據(jù)
let ans = [];
//獲取頁面電影數(shù)據(jù)
function getTitleHref(url,page) {
let startUrl = url+page+".html";
http.get(startUrl,function(res) {
const { statusCode } = res;
let chunks = [];
res.on('data',function(chunk){
chunks.push(chunk);
});
res.on('end',function(){
let title = [];
let html = iconv.decode(Buffer.concat(chunks),'gb2312');
let $ = cheerio.load(html, {decodeEntities: false});
// console.log($);
$('.co_content8 .ulink').each(function(i,d) {
let $d = $(d);
let titleHref = [];
titleHref.push({
href: $d.attr('href')
});
getLink(titleHref)
});
// console.log(ans);
});
});
}
// /*
//獲取種子鏈接
function getLink(titleHref) {
console.log('進入getLink');
console.log(titleHref);
if(titleHref) {
titleHref.forEach(function(v,k) {
console.log('~~~~~~~~~~~~~~~~~~~~');
let infoUrl = Host + v.href;
// console.log(infoUrl);
http.get(infoUrl,function(res) {
const { statusCode } = res;
const contentType = res.headers['content-type'];
let error;
if (statusCode !== 200) {
error = new Error('請求失敗。\n' +
`狀態(tài)碼: ${statusCode}`);
}
if (error) {
console.error(error.message);
// 消耗響應數(shù)據(jù)以釋放內存
res.resume();
return;
}
console.log('進入getlink http');
let chunks = [];
res.on('data',function(chunk) {
chunks.push(chunk);
});
res.on('end', function(){
try {
let html = iconv.decode(Buffer.concat(chunks),'gb2312');
let $ = cheerio.load(html, {decodeEntities: false});
let bt = '';
bt = $('#Zoom td').children('a').attr('href');
// console.log(bt);
// console.log(typeof bt)
ans.push(bt);
}catch (e) {
console.error('bt',e.message);
}
})
}).on('error', (e) => {
console.error(`錯誤: ${e.message}`);
});
});
}
};
// */
for(let i = 1; i <= totalPage; i++) {
getTitleHref(baseUrl,i);
};
--------------------------------------------------------分割線-------
const cheerio = require('cheerio');
const http = require('http');
const iconv = require('iconv-lite');
let baseUrl = "http://www.ygdy8.net/html/gndy/dyzz/list_23_";
let Host = "http://www.ygdy8.net/";
let titleHref = [];
const totalPage = 1; //指定爬多少頁數(shù)據(jù)
let res = [];
//獲取頁面電影數(shù)據(jù)
function getTitleHref(url,page) {
let startUrl = url+page+".html";
http.get(startUrl,function(res) {
let chunks = [];
res.on('data',function(chunk){
chunks.push(chunk);
});
res.on('end',function(){
let title = [];
let html = iconv.decode(Buffer.concat(chunks),'gb2312');
let $ = cheerio.load(html, {decodeEntities: false});
// console.log($);
$('.co_content8 .ulink').each(function(i,d) {
let $d = $(d);
titleHref.push({
href: $d.attr('href')
});
});
console.log(titleHref);
});
if(page <= totalPage) {
getTitleHref(url,++page);
}else {
console.log(page);
getLink(titleHref);
}
});
}
//獲取種子鏈接
function getLink(titleHref) {
console.log('進入getLink');
titleHref.forEach(function(v,k) {
console.log('~~~~~~~~~~~~~~~~~~~~');
let infoUrl = Host + v.href;
console.log(infoUrl);
// try {
http.get(infoUrl,function(res) {
console.log('進入getlink http');
let chunks = [];
res.on('data',function(chunk) {
chunks.push(chunk);
});
res.on('end', function(){
let html = iconv.decode(Buffer.concat(chunks),'gb2312');
let $ = cheerio.load(html, {decodeEntities: false});
let reg = /.*譯 名/;
let info = '';
let bt = '';
let textInfo = $('.co_content8 #Zoom p').eq(0).text();
info = textInfo.match(reg)[0];
bt = $('#Zoom td').children('a').attr('href');
res.push({
Info:info,
Bt:bt
});
console.log(res);
})
//怎么捕獲錯誤?。?!
//res.on('error',function(){
// console.log('error');
//})
})
// }catch(e) {
// console.log(e);
// }
});
};
getTitleHref(baseUrl,1)
如上面代碼,異步太多,不知道是哪里的問題,求node大神指教,getLink()函數(shù)里的titleHref.forEach都沒進去到,node線程就崩了?console.log('進入getlink http')也是沒有打印的
北大青鳥APTECH成立于1999年。依托北京大學優(yōu)質雄厚的教育資源和背景,秉承“教育改變生活”的發(fā)展理念,致力于培養(yǎng)中國IT技能型緊缺人才,是大數(shù)據(jù)專業(yè)的國家
北大青鳥中博軟件學院創(chuàng)立于2003年,作為華東區(qū)著名互聯(lián)網(wǎng)學院和江蘇省首批服務外包人才培訓基地,中博成功培育了近30000名軟件工程師走向高薪崗位,合作企業(yè)超4
中公教育集團創(chuàng)建于1999年,經(jīng)過二十年潛心發(fā)展,已由一家北大畢業(yè)生自主創(chuàng)業(yè)的信息技術與教育服務機構,發(fā)展為教育服務業(yè)的綜合性企業(yè)集團,成為集合面授教學培訓、網(wǎng)
達內教育集團成立于2002年,是一家由留學海歸創(chuàng)辦的高端職業(yè)教育培訓機構,是中國一站式人才培養(yǎng)平臺、一站式人才輸送平臺。2014年4月3日在美國成功上市,融資1
曾工作于聯(lián)想擔任系統(tǒng)開發(fā)工程師,曾在博彥科技股份有限公司擔任項目經(jīng)理從事移動互聯(lián)網(wǎng)管理及研發(fā)工作,曾創(chuàng)辦藍懿科技有限責任公司從事總經(jīng)理職務負責iOS教學及管理工作。
浪潮集團項目經(jīng)理。精通Java與.NET 技術, 熟練的跨平臺面向對象開發(fā)經(jīng)驗,技術功底深厚。 授課風格 授課風格清新自然、條理清晰、主次分明、重點難點突出、引人入勝。
精通HTML5和CSS3;Javascript及主流js庫,具有快速界面開發(fā)的能力,對瀏覽器兼容性、前端性能優(yōu)化等有深入理解。精通網(wǎng)頁制作和網(wǎng)頁游戲開發(fā)。
具有10 年的Java 企業(yè)應用開發(fā)經(jīng)驗。曾經(jīng)歷任德國Software AG 技術顧問,美國Dachieve 系統(tǒng)架構師,美國AngelEngineers Inc. 系統(tǒng)架構師。