鍍金池/ 問答/Java  Python  數(shù)據(jù)庫/ 如何用正則表達(dá)式提取網(wǎng)頁中的ip 端口?

如何用正則表達(dá)式提取網(wǎng)頁中的ip 端口?

問題描述

關(guān)于正則表達(dá)式
做代理池時找到的一個代理網(wǎng)站 提取ip和端口出現(xiàn)的問題

相關(guān)代碼

// 請把代碼文本粘貼到下方(請勿用圖片代替代碼)
<tr>
<td>1</td>
<td>115.159.100.19</td>
<td>8998</td>
<td>上海</td>
<td>上海</td>
<td>電信</td>
<td>high</td>
<td>7.05 毫秒</td>
<!-- td></td -->
<td>
7分鐘前

</td>
<td>復(fù)制</td>
</tr>
<tr>
<td>2</td>
<td>221.229.166.55</td>
<td>8080</td>
<td>江蘇</td>
<td>徐州</td>
<td>電信</td>
<td>anonymous</td>
<td>21.26 毫秒</td>
<!-- td></td -->
<td>
7分鐘前

我寫的正則表達(dá)式re.findall('<td>.?<td>(.).*?(d+)</td>',html,re.S)
不知道為什么一直出不了結(jié)果 希望大佬們指點一下

你期待的結(jié)果是什么?

回答
編輯回答
小眼睛

使用正則 ((\d+\.){3}\d+)[^\d]+?<td>(\d+) 匹配到每個match中 group1為ip,group3為端口

2017年3月28日 20:07