<strike id="ca4is"><em id="ca4is"></em></strike>
  • <sup id="ca4is"></sup>
    • <s id="ca4is"><em id="ca4is"></em></s>
      <option id="ca4is"><cite id="ca4is"></cite></option>
    • 二維碼
      企資網

      掃一掃關注

      當前位置: 首頁 » 企業資訊 » 經驗 » 正文

      如何正確使用COCO數據集

      放大字體  縮小字體 發布日期:2021-08-31 10:48:52    作者:高雨凡    瀏覽次數:42
      導讀

      簡介COCO數據集,意為“Common Objects In Context”,是一組具有挑戰性的、高質量的計算機視覺數據集,是最先進的神經網絡,此名稱還用于命名這些數據集使用的格式。COCO 是一個大規模的對象檢測、分割和字幕數據集

      簡介

      COCO數據集,意為“Common Objects In Context”,是一組具有挑戰性的、高質量的計算機視覺數據集,是最先進的神經網絡,此名稱還用于命名這些數據集使用的格式。

      COCO 是一個大規模的對象檢測、分割和字幕數據集。COCO有幾個特點_

      - 對象分割

      - 在上下文中識別

      - 超像素素材分割

      - 330K 圖像(> 200K 標記)

      - 150 萬個對象實例

      - 80 個對象類別

      該數據集的格式可以被高級神經網絡庫自動理解,例如Facebook的Detectron2,甚至還有專門為處理 COCO 格式的數據集而構建的工具,例如COCO- annotator和COCOapi。了解此數據集的表示方式將有助于使用和修改現有數據集以及創建自定義數據集。具體來說,我們對注釋文件感興趣,是因為完整的數據集由圖像目錄和注釋文件組成,提供機器學習算法使用的元數據。

      可以用COCO做什么?

      實際上有多個 COCO 數據集,每個數據集都是為特定的機器學習任務創建的,并帶有附加數據。3個最受歡迎的任務是_

    • 對象檢測_模型應該獲取對象的邊界框,即返回對象類列表和她們周圍矩形的坐標;物體(也稱為“事物”)是離散的、獨立的物體,通常帶有零件,如人和汽車。

    • 對象分割_模型不僅應該得到對象(實例/“事物”)的邊界框,還應該得到分割掩碼,即圍繞對象的多邊形坐標。

    • 實例分割_模型應該做對象分割,但不是在單獨的對象(“事物”)上,而是在背景連續模式上,比如草或天空。

      在計算機視覺中,這些任務有著巨大的用途,例如用于自動駕駛車輛(檢測人和其他車輛)、基于人工智能的安全性(人體檢測和/或分割)和對象重新識別(對象分割或實例分割去除背景有助于檢查對象身份)。

      COCO數據格式

      基本結構和常見元素_COCO 注釋使用的文件格式是 JSON,她有字典(大括號內的鍵值對{…})作為頂部值,她還可以有列表(括號內的有序項目集合,[…])或嵌套在其中的字典。

      {  "info": {…},  "licenses": […],  "images": […],  "categories": […],  "annotations": […]}

      讓我們仔細看看基本結構中的每一個部分。

      “info”部分_

      該字典包含有關數據集的元數據,對于官方的 COCO 數據集,如下_

      {  "description": "COCO 2017 Dataset",  "url": "cocodataset.org",  "version": "1.0",  "year": 2017,  "contributor": "COCO Consortium",  "date_created": "2017/09/01"}

      如我們所見,她僅包含基本信息,"url"值指向數據集官方網站(例如 UCI 存儲庫頁面或在單獨域中),這是機器學習數據集中常見的事情,指向他們的網站以獲取更多信息,例如獲取數據的方式和時間。

      “licenses”部分_

      以下是數據集中圖像許可的鏈接,例如知識共享許可,具有以下結構_

      [  {    "url": "creativecommons.org/licenses/by-nc-sa/2.0/",     "id": 1,     "name": "Attribution-NonCommercial-ShareAlike License"  },  {    "url": "creativecommons.org/licenses/by-nc/2.0/",     "id": 2,     "name": "Attribution-NonCommercial License"  },  …]

      這里要注意的重要一點是"id"字段_"images"字典中的每個圖像都應該指定其許可證的“id”。

      在使用圖像時,請確保沒有違反其許可_可以在 URL 下找到全文。

      如果我們決定創建自己的數據集,請為每個圖像分配適當的許可_如果我們不確定,最好不要使用該圖像。

      “image”部分_

      可以說是第二重要的,這本字典包含有關圖像的元數據_

      {  "license": 3,  "file_name": "000000391895.jpg",  "coco_url": "images.cocodataset.org/train2017/000000391895.jpg",  "height": 360,  "width": 640,  "date_captured": "2013–11–14 11:18:45",  "flickr_url": "farm9.staticflickr/8186/8119368305_4e622c8349_z.jpg",  "id": 391895}

      接下來我們看一下這些字段_

    • "license"_來自該"licenses" 部分的圖像許可證的 ID
    • "file_name": 圖像目錄中的文件名
    • "coco_url", "flickr_url": 在線托管圖像副本的 URL
    • "height", "width": 圖像的大小,在像 C 這樣的低級語言中非常方便,在這種語言中獲取矩陣的大小是非常困難的
    • "date_captured": 拍照的時候

      "id"領域是最重要的領域,這是用于"annotations"識別圖像的編號,因此如果我們想識別給定圖像文件的注釋,則必須在"圖像"中檢查相應圖像文檔的“id”,然后在“注釋”中交叉引用她。

      在官方COCO數據集中"id"與"file_name"相同。需要注意的是,自定義 COCO數據集可能不一定是這種情況!這不是強制的規則,例如由私人照片制成的數據集可能具有與沒有共同之處的原始照片名稱"id"。

      "categories"部分_

      本部分對于對象檢測和分割任務以及對于實例分割任務有點不同。

      對象檢測/對象分割_

      [  {"supercategory": "person", "id": 1, "name": "person"},  {"supercategory": "vehicle", "id": 2, "name": "bicycle"},  {"supercategory": "vehicle", "id": 3, "name": "car"},  …  {"supercategory": "indoor", "id": 90, "name": "toothbrush"}]

      這些是可以在圖像上檢測到的對象類別("categories"在 COCO 中是類別的另一個名稱,我們可以從監督機器學習中了解到)。

      每個類別都有一個唯一的"id",她們應該在 [1,number of categories] 范圍內。類別也分為“超類別”,我們可以在程序中使用她們,例如,當我們不關心是自行車、汽車還是卡車時,一般檢測車輛。

      實例分割_

      [  {"supercategory": "textile", "id": 92, "name": "banner"},  {"supercategory": "textile", "id": 93, "name": "blanket"},  …  {"supercategory": "other", "id": 183, "name": "other"}]

      類別數從高開始以避免與對象分割沖突,因為有時這些任務可以一起執行。從 92 到 182 的 ID 是實際的背景素材,而 ID 183 代表所有其他沒有單獨類的背景紋理。

      “annotations”部分_

      這是數據集最重要的部分,其中包含對特定 COCO 數據集的每個任務至關重要的信息。

      {  "segmentation":  [[    239.97,    260.24,    222.04,    …  ]],  "area": 2765.1486500000005,  "iscrowd": 0,  "image_id": 558840,  "bbox":  [    199.84,    200.46,    77.71,    70.88  ],  "category_id": 58,  "id": 156}
    • "segmentation"_分割掩碼像素列表;這是一個扁平的對列表,因此我們應該采用第一個和第二個值(圖片中的 x 和 y),然后是第三個和第四個值,以獲取坐標;需要注意的是,這些不是圖像索引,因為她們是浮點數_她們是由 COCO-annotator 等工具從原始像素坐標創建和壓縮的
    • "area"_分割掩碼內的像素數
    • "iscrowd"_注釋是針對單個對象(值為 0),還是針對彼此靠近的多個對象(值為 1);對于實例分割,此字段始終為 0 并被忽略
    • "image_id": 'images' 字典中的 'id' 字段;警告_這個值應該用于將圖像與其他字典交叉引用,而不是"id"字段!
    • "bbox"_邊界框,即對象周圍矩形的坐標(左上x,左上y,寬,高);從圖像中提取單個對象非常有用,因為在像 Python 這樣的許多語言中,她可以通過訪問圖像數組來完成,例如cropped_object _ image[bbox[0]:bbox[0] + bbox[2], bbox[1]:bbox[1] + bbox[3]]
    • "category_id"_對象的類,對應"類別"中的"id"字段
    • "id": 注釋的唯一標識符;警告_這只是注釋ID,這并不指向其他詞典中的特定圖像!

      在處理人群圖像 ( "iscrowd": 1) 時,該"segmentation"部分可能會有所不同_

      "segmentation":{  "counts": [179,27,392,41,…,55,20],  "size": [426,640]}

      這是因為對于許多像素,明確列出所有像素創建分割掩碼將占用大量空間,相反,COCO使用自定義的運行長度編碼(RLE)壓縮,這是非常有效的,因為分段掩碼是二進制的,僅0和1的RLE可能會將大小減小很多倍。

      總結

      我們探討了用于最流行任務的COCO數據集格式_對象檢測、對象分割和實例分割。COCO官方數據集質量高、規模大,適合初學者項目、生產環境和最新研究。我希望本文能夠幫助小伙伴理解如何解釋這種格式,并將其用于小伙伴的ML應用程序。

    •  
      (文/高雨凡)
      免責聲明
      本文僅代表作發布者:高雨凡個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
       

      Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

      粵ICP備16078936號

      微信

      關注
      微信

      微信二維碼

      WAP二維碼

      客服

      聯系
      客服

      聯系客服:

      在線QQ: 303377504

      客服電話: 020-82301567

      E_mail郵箱: weilaitui@qq.com

      微信公眾號: weishitui

      客服001 客服002 客服003

      工作時間:

      周一至周五: 09:00 - 18:00

      反饋

      用戶
      反饋

      午夜久久久久久网站,99久久www免费,欧美日本日韩aⅴ在线视频,东京干手机福利视频
        <strike id="ca4is"><em id="ca4is"></em></strike>
      • <sup id="ca4is"></sup>
        • <s id="ca4is"><em id="ca4is"></em></s>
          <option id="ca4is"><cite id="ca4is"></cite></option>
        • 主站蜘蛛池模板: 老司机免费福利午夜入口ae58| 国产人妖ts视频在线观看| 国产三级在线观看视频| 久久亚洲国产精品五月天| 一区二区三区在线观看视频 | 兽皇videos极品另类| 丁香六月色婷婷| 精品国产污污免费网站| 性xxxxfreexxxxx国产| 午夜神器成在线人成在线人免费| 中文字幕38页| 精品不卡一区二区| 天天爽夜夜爽人人爽一区二区 | 哒哒哒免费视频观看在线www| 中文乱码字字幕在线第5页| 欧美爽爽爽爽爽爽视频| 国产精品无码专区在线观看| 亚洲国产成人无码av在线影院| 做受视频60秒试看| 欧洲美女与动zooz| 国产人澡人澡澡澡人碰视频| 99精品国产在热久久无码| 欧美日韩在线一区二区三区| 国产精品久久国产三级国不卡顿 | 美女18毛片免费视频| 女人18毛片a级毛片免费| 人人狠狠综合久久亚洲| 3d区在线观看| 日韩无套内射视频6| 国产hs免费高清在线观看| 一级做a毛片免费视频| 欧美综合区自拍亚洲综合天堂| 国产一区二区三区久久精品| 2022国产精品视频| 宅男噜噜噜66网站| 亚洲成a人片在线观看中文!!! | 骚包在线精品国产美女| 性中国videossex古装片| 乱码一乱码二乱码三新区| 老色鬼久久亚洲av综合| 在线视频一区二区三区在线播放|