鍍金池/ 問答/HTML/ nodejs如何獲取文章內(nèi)第一張圖片的鏈接?

nodejs如何獲取文章內(nèi)第一張圖片的鏈接?

基本上是文章里有插入圖片,而這個圖片的鏈接是外鏈圖片,因為不懂NODEJS,所以不知道該如何獲取文章內(nèi)的第一個圖片的鏈接。希望知道的人可以幫忙解答,非常感謝!~

備注:因為只可以使用NODEJS所以無法使用javascript和jquery,用了就報錯。

回答
編輯回答
陌南塵

node端沒有瀏覽器環(huán)境,所有沒有document,window這些瀏覽器對象,只有js可以用,你是怎么獲取網(wǎng)頁的 ? http或者fs模塊都可以。
讀取網(wǎng)頁后用正則判斷第一個img標(biāo)簽,拿到里面的src就可以

2017年5月29日 16:59
編輯回答
巴扎嘿

你用了cheerio之后 $('img')可能會選擇所有的img標(biāo)簽 你把選擇器 選對試試

2017年8月27日 14:33
編輯回答
做不到

思路是

  • 可選操作 將注釋剔除掉 <!--....-->
  • 截取 <body></body> 元素里的內(nèi)容 記 content
  • 從 content 里截取 文章內(nèi)容塊 <article></article> 里的內(nèi)容 記 article
  • 從 article 截取第一個 <img .../> 標(biāo)簽定義 記 coverPicTag
  • 從 coverPicTag 里 截取 src 屬性 src="...." 引號里的值 記 coverPicUrl

這個截取的方式 可以很多實現(xiàn)辦法,比如你 jquery('html').find(...) 或用其他 DOM的解析器,這個性能太大, 或者 用正則來模式匹配下,如果覺得寫正則寫不太好,那就 直接用字符串查找 特征性字符段查找

2017年7月6日 18:36
編輯回答
野橘

用正則,或者用cherrio https://cnodejs.org/topic/520...

另外,nodejs的代碼就是javascript,jquery.js在node中也是可以使用的,其實cherrio就是jquery.js的簡版。

2018年3月9日 20:28
編輯回答
忘了我

那么這個適合你
鏈接描述

2018年6月14日 17:24