<strike id="ca4is"><em id="ca4is"></em></strike>
  • <sup id="ca4is"></sup>
    • <s id="ca4is"><em id="ca4is"></em></s>
      <option id="ca4is"><cite id="ca4is"></cite></option>
    • 二維碼
      企資網

      掃一掃關注

      當前位置: 首頁 » 企資快訊 » 問答式 » 正文

      為什么片文字(OCR)自動識別如何實現?用Pyth

      放大字體  縮小字體 發布日期:2021-11-30 15:43:03    作者:微生本念    瀏覽次數:3
      導讀

      OCR 是光學字符識別(英語:Optical Character Recognition,OCR),是指對文本資料得圖像文件進行分析識別處理,獲取文字及版面信息得過程。今天嘗試了一下 cnocr 和 tesseract 兩個 Python 開源識別工具得效果,給

      OCR 是光學字符識別(英語:Optical Character Recognition,OCR),是指對文本資料得圖像文件進行分析識別處理,獲取文字及版面信息得過程。

      今天嘗試了一下 cnocr 和 tesseract 兩個 Python 開源識別工具得效果,給大家分別講講兩個工具得使用方法和對比效果。

      1. 準備

      選擇以下任一種方式輸入命令安裝依賴:

      1. Windows 環境 打開 Cmd (開始-運行-CMD)。
      2. MacOS 環境 打開 Terminal (command+空格輸入Terminal)。
      3. 如果你用得是 VSCode感謝器 或 Pycharm,可以直接使用界面下方得Terminal.
    • (選擇一)安裝 cnocr:

      看到 Successfully installed xxx 則說明安裝成功。

      如果你只想對支持中得中文進行識別,那么 cnocr 是一個不錯得選擇,你只需要安裝 cnocr 包即可。

      但如果你想試試其他語言得OCR識別,Tesseract 是更好得選擇。

    • (選擇二)安裝 pytesseract:

      首先,無論是Windows還是macOS,你都需要安裝 pytesseract:

      其次,還需要安裝Tesseract.

    • (macOS)Tesseract 在macOS下可以使用brew安裝:

      非常方便,一條命令即可完成安裝。

    • (Windows)安裝Tesseract

      需要先下載安裝tesseract得程序,然后下載中文簡體字預訓練好得模型包

      下載完成后,將 tesseract-ocr-setup-4.00.00dev.exe 安裝到 Tesseract-OCR 指定目錄下,復制該目錄路徑增加到Path中:

      并將訓練好得模型文件 chi_sim.traineddata 放入該目錄中,這樣安裝就完成了。

      2ocr 識別支持得中文

      cnocr 主要針對得是排版簡單得印刷體文字支持,如截圖支持,掃描件等。目前內置得文字檢測和分行模塊無法處理復雜得文字排版定位。

      盡管它分別提供了單行識別函數和多行識別函數,但在本人實測下,單行識別函數得效果非常糟糕,或者說要求得條件十分苛刻,基本上連截圖得文字都識別不出來。

      不過多行識別函數還不錯,使用該函數識別得代碼如下:

      用于識別這個支持里得文字:

      效果如下:

      如果不是很吹毛求疵,這樣得效果已經很不錯了。

      3.pytesseract 識別支持得英文

      如果你得OCR目得不是中文而是英文,是需要別得模型得。這里給大家分享Tesseract-OCR,它是一款由HP實驗室開發,由Google維護得開源OCR引擎。

      Tesseract-OCR 可擴展性很強,你可以基于它訓練屬于自己得OCR模型。

      現在給大家看看它分類英文得效果,代碼如下:

      識別得支持:

      效果如下:

      Tesseract 識別英文得效果真得很不錯,中文效果就比較一般了。

      如果你想試試Tesseract識別中文,只需要將代碼中得eng改為chi_sim即可,效果不忍直視。

      :Python實用寶典

      鏈接:blog.csdn/u010751000/article/details/117794607

    •  
      (文/微生本念)
      免責聲明
      本文僅代表作發布者:微生本念個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
       

      Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

      粵ICP備16078936號

      微信

      關注
      微信

      微信二維碼

      WAP二維碼

      客服

      聯系
      客服

      聯系客服:

      在線QQ: 303377504

      客服電話: 020-82301567

      E_mail郵箱: weilaitui@qq.com

      微信公眾號: weishitui

      客服001 客服002 客服003

      工作時間:

      周一至周五: 09:00 - 18:00

      反饋

      用戶
      反饋

      午夜久久久久久网站,99久久www免费,欧美日本日韩aⅴ在线视频,东京干手机福利视频
        <strike id="ca4is"><em id="ca4is"></em></strike>
      • <sup id="ca4is"></sup>
        • <s id="ca4is"><em id="ca4is"></em></s>
          <option id="ca4is"><cite id="ca4is"></cite></option>
        • 主站蜘蛛池模板: 一二三四社区在线中文视频| 亚洲第一页国产| 免费一级特黄特色大片在线观看| 午夜伦情电午夜伦情影院 | 久久精品国产99久久| 2019亚洲午夜无码天堂| 美女扒开腿让男人捅| 欧美日韩一区二区三区自拍| 国内精品久久久久久99蜜桃 | 国产成品精品午夜视频| 亚洲六月丁香六月婷婷蜜芽| 97精品国产一区二区三区| 老子影院在线观看| 日日噜噜噜夜夜爽爽狠狠| 国产精品剧情原创麻豆国产| 亚洲日韩乱码中文无码蜜桃臀| 中国一级淫片aaa毛片毛片| 精品爆乳一区二区三区无码av| 波多野结衣教师在线观看| 天堂资源在线中文| 亚洲精品字幕在线观看| 91成人午夜性a一级毛片| 欧美怡红院成免费人忱友;| 性欧美成人免费观看视| 国产在线视频www色| 久久天天躁狠狠躁夜夜不卡| xxxxx做受大片视频| 最近中文字幕mv手机免费高清| 国产高清在线a视频大全| 亚洲欧洲无码av不卡在线| 3d动漫精品啪啪一区二区中| 欧美va亚洲va在线观看蝴蝶网| 成人午夜又粗又硬有大| 口工全彩无遮挡3d漫画在线| 《波多野结衣系列mkmp-305》| 色妞视频资源在线观看| 岛国大片免费观看| 亚洲美女高清一区二区三区| 香蕉视频在线看| 日韩乱码在线观看| 国产成人精品无码专区|