鍍金池/ 問答/人工智能  Python  網(wǎng)絡(luò)安全/ xpath能去掉js代碼么?

xpath能去掉js代碼么?

一段讓人討厭的html代碼,在div里面寫入了js。是個(gè)鍵盤翻頁的代碼
圖片描述

我的xpath是這樣寫的
圖片描述
圖片描述

發(fā)現(xiàn)<p>里面的有標(biāo)簽的內(nèi)容沒了,像這樣
<p>我是中國人</p> 得到的是:我是人。中國沒有了
然后有人說我這xpath('.//p/text()')這個(gè)text前多加一個(gè)/,寫成
xpath('.//p//text()'),這樣是變成“我是中國人”了,但這js又跑進(jìn)來了,痛苦。
請(qǐng)教一下,我只要text,不要什么標(biāo)簽,不要js代碼,怎么寫這個(gè)xpath呢?
補(bǔ)充一個(gè)
data.xpath('string(.)').extract()[0]這種方法不行,js的標(biāo)簽是去掉了,但代碼還在那。

回答
編輯回答
涼薄

操,聲望為-1,估計(jì)也沒人來了,希望這網(wǎng)站快點(diǎn)倒閉吧

2018年7月6日 13:35