鍍金池/ 教程/ Python/ WordNet接口
文本翻譯
提取URL地址
處理PDF
塊分類
搜索和匹配
大寫轉(zhuǎn)換
提取電子郵件地址
字符串的不變性
文本處理狀態(tài)機
雙字母組
閱讀RSS提要
單詞替換
WordNet接口
重新格式化段落
標(biāo)記單詞
向后讀取文件
塊和裂口
美化打印數(shù)字
拼寫檢查
將二進(jìn)制轉(zhuǎn)換為ASCII
文本分類
文字換行
頻率分布
字符串作為文件
約束搜索
詞干算法
符號化
同義詞和反義詞
過濾重復(fù)的字詞
刪除停用詞
Python文本處理教程
文字摘要
段落計數(shù)令牌
語料訪問
文字改寫
文本處理簡介
處理Word文檔
Python文本處理開發(fā)環(huán)境
排序行

WordNet接口

WordNet是一個英語詞典,類似于傳統(tǒng)的詞庫,NLTK包括英語版本的WordNet。 我們可以使用它作為獲取單詞,用法示例和定義含義的參考。 類似單詞的集合稱為lemmas。 WordNet中的單詞是有組織的,節(jié)點和邊是節(jié)點表示單詞文本,邊表示單詞之間的關(guān)系。 下面我們將來學(xué)習(xí)如何使用WordNet模塊。

所有Lemmas

from nltk.corpus import wordnet as wn
res=wn.synset('locomotive.n.01').lemma_names()
print res

當(dāng)運行上面的程序時,我們得到以下輸出 -

[u'locomotive', u'engine', u'locomotive_engine', u'railway_locomotive']

詞的定義
可以通過使用定義函數(shù)來獲得單詞的字典定義。 它描述了可以在普通字典中找到的單詞的含義。參考以下代碼 -

from nltk.corpus import wordnet as wn
resdef = wn.synset('ocean.n.01').definition()
print resdef

當(dāng)運行上面的程序時,得到以下輸出 -

a large body of water constituting a principal part of the hydrosphere

用法示例
可以使用exmaples()函數(shù)獲得顯示單詞的一些用法示例的示例句子。

from nltk.corpus import wordnet as wn
res_exm = wn.synset('good.n.01').examples()
print res_exm

執(zhí)行上面示例代碼,得到以下結(jié)果 -

['for your own good', "what's the good of worrying?"]

反義詞

使用反義詞功能獲取所有相反的單詞。

from nltk.corpus import wordnet as wn
# get all the antonyms
res_a = wn.lemma('horizontal.a.01.horizontal').antonyms()
print res_a

當(dāng)運行上面的程序時,得到以下輸出 -

[Lemma('inclined.a.02.inclined'), Lemma('vertical.a.01.vertical')]