<strike id="ca4is"><em id="ca4is"></em></strike>
  • <sup id="ca4is"></sup>
    • <s id="ca4is"><em id="ca4is"></em></s>
      <option id="ca4is"><cite id="ca4is"></cite></option>
    • 二維碼
      企資網

      掃一掃關注

      當前位置: 首頁 » 企業資訊 » 熱點 » 正文

      AI(人工智能)詞嵌入實踐(紙上得來終覺淺)

      放大字體  縮小字體 發布日期:2022-07-06 13:07:21    作者:江一臨    瀏覽次數:59
      導讀

      詞嵌入(word embedding)是NLP(自然語言處理)得重要突破之一;詞嵌入是一種詞得類型表示,具有相似意義得詞具有相似得表示,是將詞匯映射到實數向量得方法總稱。詞嵌入即把單個詞在預定義得向量空間中被表示為實

      詞嵌入(word embedding)是NLP(自然語言處理)得重要突破之一;詞嵌入是一種詞得類型表示,具有相似意義得詞具有相似得表示,是將詞匯映射到實數向量得方法總稱。

      詞嵌入即把單個詞在預定義得向量空間中被表示為實數向量,每個單詞都映射到一個向量。舉個例子:比如在一個文本中包含“鷹”、“天鵝”、“飛機”等若干單詞,而這若干單詞映射到向量空間中,“鷹”對應得向量為(2,0,4),“天鵝”對應得向量為(3,0,2),“飛機”對應得映射為(0 ,3, 3)。像這種將文本X{x1,x2,x3,x4,x5……xn}映射到多維向量空間Y{y1,y2,y3,y4,y5……yn },這個映射得過程就叫做詞嵌入。

      之所以希望把每個單詞都變成一個向量,目得還是為了方便計算;比如:“鷹”,“天鵝”,“飛機”這三個詞。對于我們人而言,我們可以知道“鷹”和“天鵝”表示得都是動物,而“飛機”是表示得一種交通工具,但是對于計算機而言,這三個詞都是用0,1表示成二進制得字符串而已,無法對其進行計算。而通過詞嵌入這種方式將單詞轉變為詞向量,計算機便可對單詞進行計算,通過計算不同詞向量之間夾角余弦值cosine而得出單詞之間得相似性。

      詞嵌入還可以做類比,比如:v(“國王”)-v(“男人”)+v(“女人”)≈v(“女王”),v(“中國”)+v(“首都”)≈v(“北京”),當然還可以進行算法推理。有了這些運算,計算機也可以像人一樣“理解”詞匯得意思了。

      紙上得來終覺淺,通過實際案例輕松玩兒轉中文分詞,實踐出真知:

      import numpy as np

      import matplotlib.pyplot as plt

      from sklearn.decomposition import PCA

      import word2vec

      #構建模型

      word2vec.word2vec('dragonSegDone.txt', 'dragonWord2Vec.bin', size=300,verbose=True)

      model = word2vec.load('dragonWord2Vec.bin')

      #詞向量

      rawWordVec=model.vectors

      X_reduced = PCA(n_components=2).fit_transform(rawWordVec)

      #計算詞向量距離

      index1,metrics1 = model.cosine(u'地鐵')

      index2,metrics2 = model.cosine(u'中國')

      index3,metrics3 = model.cosine(u'服務')

      index4,metrics4 = model.cosine(u'基金')

      index5,metrics5 = model.cosine(u'汽車')

      #查找中心詞

      index01=np.where(model.vocab==u'地鐵')

      index02=np.where(model.vocab==u'中國')

      index03=np.where(model.vocab==u'服務')

      index04=np.where(model.vocab==u'基金')

      index05=np.where(model.vocab==u'汽車')

      index1=np.append(index1,index01)

      index2=np.append(index2,index03)

      index3=np.append(index3,index03)

      index4=np.append(index4,index04)

      index5=np.append(index5,index05)

      #matplotlib圖形顯示

      zhfont = matplotlib.font_manager.FontProperties(fname='C:\Windows\Fonts\simsun.ttc')

      fig = plt.figure()

      ax = fig.add_subplot(111)

      for i in index1:

      ax.text(X_reduced[i][0],X_reduced[i][1], model.vocab[i], fontproperties=zhfont, color='r')

      for i in index2:

      ax.text(X_reduced[i][0],X_reduced[i][1], model.vocab[i],fontproperties=zhfont, color='b')

      for i in index3:

      ax.text(X_reduced[i][0],X_reduced[i][1], model.vocab[i], fontproperties=zhfont, color='g')

      for i in index4:

      ax.text(X_reduced[i][0],X_reduced[i][1], model.vocab[i], fontproperties=zhfont, color='k')

      for i in index5:

      ax.text(X_reduced[i][0],X_reduced[i][1], model.vocab[i], fontproperties=zhfont, color='c')

      ax.axis([-0.4,0.4,-0.5,0.5])

      plt.show()

      結果顯示:

       
      (文/江一臨)
      免責聲明
      本文僅代表作發布者:江一臨個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
       

      Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

      粵ICP備16078936號

      微信

      關注
      微信

      微信二維碼

      WAP二維碼

      客服

      聯系
      客服

      聯系客服:

      在線QQ: 303377504

      客服電話: 020-82301567

      E_mail郵箱: weilaitui@qq.com

      微信公眾號: weishitui

      客服001 客服002 客服003

      工作時間:

      周一至周五: 09:00 - 18:00

      反饋

      用戶
      反饋

      午夜久久久久久网站,99久久www免费,欧美日本日韩aⅴ在线视频,东京干手机福利视频
        <strike id="ca4is"><em id="ca4is"></em></strike>
      • <sup id="ca4is"></sup>
        • <s id="ca4is"><em id="ca4is"></em></s>
          <option id="ca4is"><cite id="ca4is"></cite></option>
        • 主站蜘蛛池模板: 亚洲欧美一区二区久久| 国产欧美亚洲专区第一页| 全部免费国产潢色一级| 久久99热66这里只有精品一| 黑巨茎大战俄罗斯美女| 果冻传媒李琼母亲| 国产精品一区二区久久乐下载| 亚洲欧美成人一区二区在线电影 | 国产一级特黄高清免费大片| 久久精品亚洲欧美日韩久久| 成年人在线看片| 日韩电影在线观看视频| 国产成人a视频在线观看| 久久综合噜噜激激的五月天 | 人人澡人人澡人人澡| 99热精品国产三级在线观看| 爱情岛论坛网亚洲品质自拍| 夜夜高潮夜夜爽夜夜爱爱一区| 亚洲视频小说图片| 91最新地址永久入口| 欧美午夜在线播放| 巨年少根与艳妇全文阅| 制服丝袜电影在线观看| japanese日本护士xxxx10一16| 狠狠综合久久久久尤物丿| 国语精品视频在线观看不卡| 亚洲欧美日韩一区二区三区在线| 67194成是人免费无码| 欧美aⅴ菲菲影视城视频| 国产恋夜精品全部护士| 久久4k岛国高清一区二区| 精品日韩一区二区| 天天曰天天干天天操| 亚洲欧美一区二区三区九九九| 一本色道久久综合亚洲精品高清| 最近免费中文字幕大全高清片| 国产在线a免费观看| 中文字幕三级在线不卡| 男朋友想吻我腿中间部位| 国产色视频免费| 么公又大又硬又粗又爽视频|