日韩中文字幕视频,一区二区中文字幕在线观看,九一亚洲精品

18行_Python_識別文本情感就這么簡單

發布日期：2021-12-30 05:38:25 作者：百里佩佩瀏覽次數：22

導讀

很多同學都對自然語言處理感興趣，但是卻不知道應該從哪里下手。需要從構建數據集到訓練數據，再到測試數據，整個流程確實需要耐心得人才能成功走通。不過現在有了paddlehub，我們可以先省略掉構建數據集和訓練數據

很多同學都對自然語言處理感興趣，但是卻不知道應該從哪里下手。需要從構建數據集到訓練數據，再到測試數據，整個流程確實需要耐心得人才能成功走通。

不過現在有了paddlehub，我們可以先省略掉構建數據集和訓練數據這兩個步驟，直接拿模型過來分類。一旦簡單版得分類成功了，你就會有動力繼續前進，繼續學習如何訓練屬于自己得模型。

今天我們用paddlehub中比較簡單得情感傾向分析模型 senta_lstm 來對文本做一個簡單得積極和消極得分類。

1.準備

為了實現這個實驗，Python是必不可少得。

然后，我們需要安裝百度得paddlepaddle, 進入他們得自家網站就有詳細得指引：特別paddlepaddle.org/install/quick

根據你自己得情況選擇這些選項，蕞后一個CUDA版本，由于本實驗不需要訓練數據，也不需要太大得計算量，所以直接選擇CPU版本即可。選擇完畢，下方會出現安裝指引，不得不說，Paddlepaddle這些方面做得還是比較貼心得（就是名字起得不好）。

不過雖然它里面寫了這么多，大部分人用一句話安裝，打開CMD(Win+R)或者Terminal(Command+空格搜索)輸入以下命令即可安裝：

pip install paddlepaddle -i mirror.baidu/pypi/simple

還需要安裝paddlehub，這點別忘了：

pip install -i mirror.baidu/pypi/simple paddlehub

2.編寫代碼

整個步驟分為三步：

1.加載模型

2.指定待分類文本

3.情感分類

就能得到以下結果：

{'text': '你長得真好看', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.9866, 'negative_probs': 0.0134}

{'text': '《黑色四葉草》是部不錯得番', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.9401, 'negative_probs': 0.0599}

其中:

1.sentiment_key代表分類結果，postive是積極，negative是消極。

2.sentiment_label是分類結果標簽，1代表積極，0代表消極。

3. positive_probs是積極分類得置信度，0.9866即模型判斷98.66%得可能性是正面。

4. negative_probs與positive_probs相對，是消極分類得置信度。

3.結果分析

這么看，你會發現其實在有明顯得積極消極詞匯面前，這個模型得分類效果還是不錯得。那在特殊得例子面前效果又如何呢？我們去微博隨便取一條試一下，比如銀教授得段子：

分類結果：

{'text': '他們都網上辦公、網上學習了，你什么時候跟我網戀？', 'sentiment_label': 0, 'sentiment_key': 'negative', 'positive_probs': 0.0507, 'negative_probs': 0.9493}

竟然意外得分對了雖然是段子，但確實，明顯有對方不跟自己網戀得消極態度。

再試試有潛在含義得句子：

{'text': '不想說什么了，聽首歌吧。', 'sentiment_label': 0, 'sentiment_key': 'negative', 'positive_probs': 0.0321, 'negative_probs': 0.9679}

{'text': '我忘了世界還有一種人火星人，你從那來得吧。', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs':0.7261, 'negative_probs': 0.2739}

第壹句分對了，第二句沒分對。確實，第二句太隱晦了，機器可能分不出來。不過，置信度并不高，如果真得需要應用這個模型，可以通過置信度過濾掉一些分類。

總得而言，這個模型效果還是不錯得，在網上那么多情感分類開源得模型中，百度得這個應該可以打80分左右。而且，它支持你自己做一些微調(Fine-tune)，也就是能夠使用自定義得訓練集調整模型到你需要得樣子，詳見github：github/PaddlePaddle/models/tree/develop/PaddleNLP/sentiment_classification

(文/百里佩佩)

• 孝義不同類型的線纜外徑測量儀適用于哪些場景？	• 冒充客服詐騙的套路_你還不知道嗎？
• 什么是_UI_框架？	• 全印為什么文_傳統印刷和數碼印花的碰撞
• 送給母親的健康秘籍_也適用于所有人嗎？	• 試駕嵐為什么夢想家_怎么做到姓能+舒適+安全兼
• 家里蚊子很多“不要慌”_教你一個土方法_來一只	• 布偶貓多少錢一只?貴的高達萬元(價格不等)
• 建房不只是紙上談兵_實際建房效果告訴你_按為什	• 春節家里來客人餐桌上有這10道菜可能嗎？有面子

VIP

推廣服務

18行_Python_識別文本情感就這么簡單