Py之SnowNLP:SnowNLP中文處理包的簡(jiǎn)介、安裝、使用方法、代碼實(shí)現(xiàn)之詳細(xì)攻略 SnowNLP的簡(jiǎn)介? ? ? ? ?snowNLP是國(guó)人開發(fā)的python類庫(kù),可以方便的處理中文文本內(nèi)容,是受到了TextBlob的啟發(fā)而寫的。 snownlp主要可以進(jìn)行中文分詞(算法是Character-Based Generative Model)、詞性標(biāo)注、情感分析、文本分類(原理是樸素貝葉斯)、轉(zhuǎn)換拼音、繁體轉(zhuǎn)簡(jiǎn)體、提取文本關(guān)鍵詞(原理TextRank)、提取摘要(原理TextRank)、分割句子、文本相似(原理BM25)。官網(wǎng)還有更多關(guān)于該庫(kù)的介紹。
github:SnowNLP: Simplified Chinese Text Processing SnowNLP的安裝pip install snownlp ?SnowNLP的使用方法文章推薦 NLP之TEA:基于SnowNLP實(shí)現(xiàn)自然語言處理之對(duì)輸入文本進(jìn)行情感分析(分詞→詞性標(biāo)注→情感分析→測(cè)試) 關(guān)于訓(xùn)練現(xiàn)在提供訓(xùn)練的包括分詞,詞性標(biāo)注,情感分析,而且都提供了我用來訓(xùn)練的原始文件 以分詞為例 分詞在
|
|