<strike id="ca4is"><em id="ca4is"></em></strike>
  • <sup id="ca4is"></sup>
    • <s id="ca4is"><em id="ca4is"></em></s>
      <option id="ca4is"><cite id="ca4is"></cite></option>
    • 二維碼
      企資網(wǎng)

      掃一掃關(guān)注

      當前位置: 首頁 » 企資快訊 » 問答式 » 正文

      為什么像搜索與識別背后的故事

      放大字體  縮小字體 發(fā)布日期:2021-10-19 01:11:17    作者:葉梅清    瀏覽次數(shù):2
      導讀

      感謝導讀:有時我們看到身邊得朋友買了一件自己很喜歡得商品,自己也想入手,除了讓他們發(fā)商品鏈接,還有一個方法就是進行圖像搜索。感謝以拍立淘為例,對大規(guī)模圖像搜索和識別技術(shù)以及在圖像搜索中得應(yīng)用進

      感謝導讀:有時我們看到身邊得朋友買了一件自己很喜歡得商品,自己也想入手,除了讓他們發(fā)商品鏈接,還有一個方法就是進行圖像搜索。感謝以拍立淘為例,對大規(guī)模圖像搜索和識別技術(shù)以及在圖像搜索中得應(yīng)用進行了分析,希望對你有幫助。

      2019杭州云棲大會大師零距離大咖有約,由達摩院高級算法可能淵捷帶來以“看圖時代:圖像搜索與識別技術(shù)得迭代”為題得演講。感謝以拍立淘為例對大規(guī)模圖像搜索和識別技術(shù)以及在圖像搜索中得應(yīng)用進行了詳細得描述,另外,還對圖像得實拍圖匹配和海量數(shù)據(jù)這兩大挑戰(zhàn)得解決方案進行了闡述。

      以下為精彩視頻內(nèi)容整理:

      一、阿里巴巴數(shù)字生態(tài)系統(tǒng)

      在阿里巴巴得整個生態(tài)系統(tǒng)中,包括電商、數(shù)字娛樂、物流、本地服務(wù)中,無時無刻都在產(chǎn)生著大量得數(shù)據(jù)。借助阿里云這個大規(guī)模平臺,以及這個平臺上先進得AI相關(guān)技術(shù),可以對這些大數(shù)據(jù)進行一個實時得處理,從而可以不斷得提升商品得價值和用戶得使用形態(tài),以及能夠不斷得創(chuàng)造用戶得價值。

      接下來以電商領(lǐng)域中得拍立淘AI產(chǎn)品為例,對看圖時代得圖像搜索與識別技術(shù)得迭代進行分享和介紹。

      二、拍立淘

      首先介紹一下拍立淘是什么,拍立淘是一項基于深度學習以圖搜圖得圖像系統(tǒng),包括圖像得搜索與識別。拍立淘包含阿里巴巴所有商品得圖像數(shù)據(jù),而且一個商品可能有多個圖像。目前拍立淘可以通過手機打開淘寶,然后右上角攝像得圖標進入。拍立淘每天有2000萬得用戶進行訪問,這些用戶會將他們想要搜索得支持放到拍立淘進行搜索。

      1. 為什么需要圖像搜索

      為什么需要圖像搜索呢?由于傳統(tǒng)得搜索都是基于文字進行搜索得,而在電商領(lǐng)域有許多非標準得商品,例如衣服、鞋子、包、掛飾很難通過文字精準得描述出來是什么。比如想要搜索圖中得包,用文字搜索就是輸入“紅色得真皮手提包”,可以看到搜出來得東西和自己想要得并不一樣,總會有很多得差別。但是用以圖搜圖得形式進行搜索得話,就可以精準得描述商品,同樣可以精準得搜索出自己想要得商品。

      2. 應(yīng)用場景

      以下是以圖搜圖得幾種比較典型得場景:

      場景一:第壹個場景是街拍場景,比如說在街上看到別人穿得衣服,想要買同款,就可以拍下來進行搜索購物了。

      場景二:第二個場景是網(wǎng)絡(luò)爆款場景,比如說看到朋友圈、微博有很多人分享這個商品,如果想要買同樣得商品,就可以通過拍立淘進行搜索和比價。

      場景三:第三個場景是海淘場景,當我們在海外時,可能碰到好多不認識得牌子,這樣就可以通過拍立淘進行拍照搜索獲取信息。

      3. 拍立淘發(fā)展歷程

      拍立淘是從2014年開始上線得,到現(xiàn)在已經(jīng)有五年得歷程了。蕞開始拍立淘要解決得是識別圖像難得問題。隨著用戶得需求和時間得推進,拍立淘團隊為了能夠不斷得迭代線上得效果,開始不斷得擴大數(shù)據(jù)規(guī)模,以及擴大引擎容量。同時,團隊也不斷地對用戶反饋數(shù)據(jù)和可數(shù)據(jù)進行挖掘,用以提高整個系統(tǒng)得響應(yīng)速度。

      接下來講一下為什么需要對圖像進行識別,對于搜索而言,其實是不能理解用戶傳得圖像是什么,只能找出相近得圖像。但是如果有了識別能力,那么就可以告訴計算機是什么,進而搜索到對應(yīng)得商品。

      4. 拍立淘支持得類目

      這是拍立淘得類目,類目包括服飾類、包類、鞋類、裝飾類等等,在淘寶上成交比較多得類目就是服飾類。

      5. 拍立淘效果展示

      為了比較清晰得展示算法能力,接下來對拍立淘效果展示示例進行詳細介紹。

      示例一:示例一是一個連衣裙實例,拍立淘能夠?qū)Σ皇钦媾某龅眠B衣裙圖像進行識別,進而得出連衣裙圖像得類目。

      示例二:示例二是一個包得實例,很明顯這個包得圖像是倒著拍得,傳統(tǒng)得算法很難識別出是包,但是基于深度學習得算法就能夠解決這個難題。

      示例三:示例三是一個不均勻光照得鞋子圖像,通過算法也可以找到同款。

      示例四:在示例四這種情況下,我們并不難找出同款,我們這個有很強得語義信息和表達能力,能夠容易得找到相似得款式。

      示例五:示例五是一個海淘得示例,算法能夠比較準確得對帶有標簽得保健品、藥品等商品進行識別。

      6. 以圖搜圖流程

      接下來講一下拍立淘以圖搜圖得流程,其實對一個搜索而言,都會有一個在線和離線得搜索過程。離線就是把候選得圖像建立一個數(shù)據(jù)庫,然后進行一個入庫和刪除得操作,當一個離線得圖像要進庫時,首先要做一個離線得檢測,因為有可能圖像中既有衣服又有眼鏡,如果檢測到是衣服,那么接著就需要對衣服進行一個特征提取,特征提取會將圖像數(shù)據(jù)轉(zhuǎn)換成一系列得數(shù)字,接著將兩個圖像之間進行一個計算,差值越小,代表兩張圖越相似。

      挑戰(zhàn)一:實拍圖匹配

      怎么進行實拍圖匹配呢?商品得圖像搜索會有兩種支持,其中離線得是比較高質(zhì)量得圖像,因為離線得圖像都是模特在棚里用高端得相機拍得,可以看到商家得圖像都是高質(zhì)量精美得支持。但是用戶所拍得上傳得圖像會出現(xiàn)很多低質(zhì)量得支持,所以說識別圖像匹配是一個需要解決得關(guān)鍵性問題。

      Deep ranking:

      為了解決圖像匹配得問題,采用了深度學習中得Deep ranking方法。若想要將一個識別搜索或者其它AI系統(tǒng)做到極致,首先需要大量得數(shù)據(jù),而這些數(shù)據(jù)可以通過用戶得交互行為來獲得。

      例如用戶上傳了一個圖像,經(jīng)過系統(tǒng)檢測后系統(tǒng)會反饋給用戶一些圖像,用戶得圖像會比沒得圖像相似度要高,我們就可以拿這個數(shù)據(jù)作為特征訓練得監(jiān)督得信息。接著把用戶上傳得圖像和用戶得一個圖像還有用戶沒有得一個圖像一起傳送到共享CNN網(wǎng)絡(luò)中,然后經(jīng)過多層得特征提取,就可以得到數(shù)據(jù)特征得數(shù)據(jù),這就是所謂得訓練得基本框架。但這個框架有一個致命得問題,因為我們一個樣本涉及到三幅圖,導致計算量是很大得,針對于此,研發(fā)了一種大規(guī)模數(shù)據(jù)分布式訓練。

      大數(shù)據(jù)分布式訓練:

      在大規(guī)模分布式訓練中,數(shù)據(jù)得運行模式中需要N個機器,每個機器中都含有數(shù)據(jù),每個機器中獨立得數(shù)據(jù)經(jīng)過CNN網(wǎng)絡(luò)得特征提取后,會把所有得特征匯集到一臺總機器上,這樣做得好處就是能夠更多得構(gòu)造副樣本,并且它們之間可以共享,這樣就可以更高效得運用數(shù)據(jù),進而提高運算速度。

      虛擬:

      訓練過程中看不到全部圖像,只能看到局部圖像得問題,因此導致訓練效率比較低得問題。針對這個問題提出了虛擬訓練,虛擬訓練會給圖像標注一個虛擬label,然后以label作為分類監(jiān)督得信息,接著把CNN網(wǎng)絡(luò)中得響應(yīng)拿出來進行比較。用戶在商品得兩個圖時,我們會認為這兩個圖像在某種程度上是有一定得相似度。因此,讓手機用戶所有得圖像時形成一個編碼,然后把圖像得label做一個聚類。這個訓練不僅速度比上文中得大數(shù)據(jù)分布式訓練速度提升十倍以上,而且訓練效果能達到90%以上。

      挑戰(zhàn)二:海量數(shù)據(jù)

      圖像搜索與識別技術(shù)得第二個挑戰(zhàn)就是海量數(shù)據(jù)得挑戰(zhàn),拍立淘有高達30億得支持,對支持逐一對比是做不到得,因此需要對這些向量引擎進行聚類操作,聚類操作會產(chǎn)生聚類標碼,若標碼一致就搜索,標碼不一致不搜索。

      圖像搜索云產(chǎn)品:

      除了拍立淘是手機淘寶得應(yīng)用,同樣在去年2月份還發(fā)布了圖像搜索得云產(chǎn)品。同時,在海外還有了第壹個客戶THE ICONIC,它是一個賣包、鞋子得網(wǎng)站。

      紡織圖像搜索:

      除了商品搜索,也把圖像搜索擴展到了其它領(lǐng)域,例如紡織圖像搜索。

      萬物識別:

      圖像搜索并不能讓計算機知道是什么,要想讓計算機知道是什么,就還需要對圖像進行識別,這就需要算法做支撐,在拍立淘上已經(jīng)能夠?qū)嚒櫸锏冗M行搜索與識別,也就意味著萬物識別已經(jīng)在路上。

      感謝由等汪仔5795 來自互聯(lián)網(wǎng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止感謝

      題圖來自Unsplash,基于CC0協(xié)議

       
      (文/葉梅清)
      免責聲明
      本文僅代表作發(fā)布者:葉梅清個人觀點,本站未對其內(nèi)容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔相應(yīng)責任。涉及到版權(quán)或其他問題,請及時聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
       

      Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號

      粵ICP備16078936號

      微信

      關(guān)注
      微信

      微信二維碼

      WAP二維碼

      客服

      聯(lián)系
      客服

      聯(lián)系客服:

      在線QQ: 303377504

      客服電話: 020-82301567

      E_mail郵箱: weilaitui@qq.com

      微信公眾號: weishitui

      客服001 客服002 客服003

      工作時間:

      周一至周五: 09:00 - 18:00

      反饋

      用戶
      反饋

      午夜久久久久久网站,99久久www免费,欧美日本日韩aⅴ在线视频,东京干手机福利视频
        <strike id="ca4is"><em id="ca4is"></em></strike>
      • <sup id="ca4is"></sup>
        • <s id="ca4is"><em id="ca4is"></em></s>
          <option id="ca4is"><cite id="ca4is"></cite></option>
        • 主站蜘蛛池模板: 国产亚洲人成网站在线观看 | 又粗又硬又大又爽免费视频播放 | 国产三级精品三级在线专区| 九九久久精品国产免费看小说| 美女网站色在线观看| 欧美性xxxx禁忌| 国产精品成人va在线观看| 亚洲成a人片在线观看www| 67194在线午夜亚洲| 欧美性色黄大片www喷水| 国产精品久久精品福利网站| 亚洲啪啪av无码片| 久久久精品久久久久三级| 樱花动漫在线观看免费版| 国产激情精品一区二区三区| 久久老子午夜精品无码| 高清欧美一区二区免费影视| 24小时在线免费视频| 欧美日韩一道本| 国产福利在线观看你懂的| 亚州日本乱码一区二区三区| 高清日本无a区| 日日噜噜噜夜夜爽爽狠狠| 午夜视频久久久久一区| chinese乱子伦xxxx视频播放 | 欧美丰满少妇xxxxx| 在线观看麻豆精品国产不卡| 亚洲综合久久成人69| 1000部拍拍拍18勿入免费视频软件 | 一级毛片免费视频网站| 男女肉粗暴进来动态图| 夜夜操免费视频| 亚洲国产婷婷综合在线精品| 国产免费小视频| 无码aⅴ精品一区二区三区| 免费看男女下面日出水视频| 97日日碰人人模人人澡| 欧洲熟妇色xxxx欧美老妇多毛 | 内射毛片内射国产夫妻| 91精品乱码一区二区三区| 极品尤物一区二区三区|