鍍金池/ 教程/ Python/ 提取電子郵件地址
文本翻譯
提取URL地址
處理PDF
塊分類
搜索和匹配
大寫轉(zhuǎn)換
提取電子郵件地址
字符串的不變性
文本處理狀態(tài)機(jī)
雙字母組
閱讀RSS提要
單詞替換
WordNet接口
重新格式化段落
標(biāo)記單詞
向后讀取文件
塊和裂口
美化打印數(shù)字
拼寫檢查
將二進(jìn)制轉(zhuǎn)換為ASCII
文本分類
文字換行
頻率分布
字符串作為文件
約束搜索
詞干算法
符號化
同義詞和反義詞
過濾重復(fù)的字詞
刪除停用詞
Python文本處理教程
文字摘要
段落計數(shù)令牌
語料訪問
文字改寫
文本處理簡介
處理Word文檔
Python文本處理開發(fā)環(huán)境
排序行

提取電子郵件地址

要從文本中提取電子郵件,我們可以使用正則表達(dá)式。 在下面的示例中,借助正則表達(dá)式包來定義電子郵件ID的模式,然后使用findall()函數(shù)來檢索與此模式匹配的文本。

import re
text = "Please contact us at contact@qq.com for further information."+\
        " You can also give feedbacl at feedback@yiibai.com"


emails = re.findall(r"[a-z0-9\.\-+_]+@[a-z0-9\.\-+_]+\.[a-z]+", text)
print emails

執(zhí)行上面示例代碼,得到以下結(jié)果 -

['contact@qq.com', 'feedback@tp.com']

上一篇:文字換行下一篇:刪除停用詞