檢查拼寫是任何文本處理或分析的基本要求。 python中的pyspellchecker
包提供了這個(gè)功能,可以找到可能錯(cuò)誤拼寫的單詞,并建議可能的更正。
首先,我們需要在python環(huán)境中使用以下命令安裝所需的包。
pip install pyspellchecker
現(xiàn)在在下面看到如何使用包來指出錯(cuò)誤拼寫的單詞以及對可能的正確單詞提出一些建議。
from spellchecker import SpellChecker
spell = SpellChecker()
# find those words that may be misspelled
misspelled = spell.unknown(['let', 'us', 'wlak','on','the','groun'])
for word in misspelled:
# Get the one `most likely` answer
print(spell.correction(word))
# Get a list of `likely` options
print(spell.candidates(word))
當(dāng)運(yùn)行上面的程序時(shí),我們得到以下輸出 -
group
{'group', 'ground', 'groan', 'grout', 'grown', 'groin'}
walk
{'flak', 'weak', 'walk'}
區(qū)分大小寫
如果使用Let
代替let
,那么這將成為單詞與字典中最接近的匹配單詞的區(qū)分大小寫的比較,結(jié)果現(xiàn)在看起來不同。
from spellchecker import SpellChecker
spell = SpellChecker()
# find those words that may be misspelled
misspelled = spell.unknown(['Let', 'us', 'wlak','on','the','groun'])
for word in misspelled:
# Get the one `most likely` answer
print(spell.correction(word))
# Get a list of `likely` options
print(spell.candidates(word))
當(dāng)運(yùn)行上面的程序時(shí),我們得到以下輸出 -
group
{'groin', 'ground', 'groan', 'group', 'grown', 'grout'}
walk
{'walk', 'flak', 'weak'}
get
{'aet', 'ret', 'get', 'cet', 'bet', 'vet', 'pet', 'wet', 'let', 'yet', 'det', 'het', 'set', 'et', 'jet', 'tet', 'met', 'fet', 'net'}