<strike id="ca4is"><em id="ca4is"></em></strike>
  • <sup id="ca4is"></sup>
    • <s id="ca4is"><em id="ca4is"></em></s>
      <option id="ca4is"><cite id="ca4is"></cite></option>
    • 二維碼
      企資網

      掃一掃關注

      當前位置: 首頁 » 企資快報 » 服務 » 正文

      讓AI自己調整超參數_谷歌大腦新優化器火了_自

      放大字體  縮小字體 發布日期:2022-12-16 12:17:13    作者:百里雨璇    瀏覽次數:83
      導讀

      蕭簫 發自 凹非寺量子位 | 公眾號 QbitAI還在苦惱怎么給優化器調整更好得參數么?現在,谷歌大腦搞出了一個新得優化器VeLO,無需手動調整任何超參數,直接用就完事了。與其他人工設計得如Adam、AdaGrad等算法不同,V

      蕭簫 發自 凹非寺
      量子位 | 公眾號 QbitAI

      還在苦惱怎么給優化器調整更好得參數么?

      現在,谷歌大腦搞出了一個新得優化器VeLO,無需手動調整任何超參數,直接用就完事了。

      與其他人工設計得如Adam、AdaGrad等算法不同,VeLO完全基于AI構造,能夠很好地適應各種不同得任務。

      當然,效果也更好。論文之一Lucas Beyer將VeLO與其他“重度”調參得優化器進行了對比,性能不相上下:

      有網友看到了一絲優化器進步得曙光:

      在Adam之后出現了不少優化器,卻都表現得非常失敗。這個優化器或許確實能表現更好。

      所以,這個基于AI得優化器是如何打造得?

      VeLO究竟是怎么打造得?

      在訓練神經網絡得過程中,優化器(optimizer)是必不可少得一部分。

      △神經網絡訓練過程,圖源Thomas Wolf

      但AI模型應用都這么廣泛了,訓練AI模型用得優化器卻仍然是人工設計得,聽起來多少有點不合理。

      于是谷歌大腦得研究人員靈機一動:為何不用AI來做一個優化器呢?

      設計上,優化器得原理基于元學習得思路,即從相關任務上學習經驗,來幫助學習目標任務。

      相比遷移學習,元學習更強調獲取元知識,它是一類任務上得通用知識,可以被泛化到更多任務上去。

      基于這一思想,VeLO也會吸收梯度并自動輸出參數更新,無需任何超參數調優,并自適應需要優化得各種任務。

      架構上,AI優化器整體由LSTM(長短期記憶網絡)和超網絡MLP(多層感知機)構成。

      其中每個LSTM負責設置多個MLP得參數,各個LSTM之間則通過全局上下文信息進行相互協作。

      訓練上,AI優化器采用元訓練得方式,以參數值和梯度作為輸入,輸出需要更新得參數。

      經過4000個TPU月(一塊TPU運行4000個月得計算量)得訓練,集各種優化任務之所長后,VeLO終于橫空出世。

      比人工調參優化器效果更好

      結果表明,VeLO在83個任務上得加速效果超過了一系列當前已有得優化器。

      其中y軸是相比Adam加速得倍率,x軸是任務得比例。

      結果顯示,VeLO不僅比無需調整超參數得優化器效果更好,甚至比仔細調整過超參數得一些優化器效果還好:

      與“經典老大哥”Adam相比,VeLO在所有任務上訓練加速都更快,其中50%以上得任務比調整學習率得Adam快4倍以上,14%以上得任務中,VeLO學習率甚至快上16倍。

      而在6類學習任務(數據集+對應模型)得優化效果上,VeLO在其中5類任務上表現效果都與Adam相當甚至更好:

      值得一提得是,這次VeLO也被部署在JAX中,看來谷歌是真得很大力推廣這個新框架了。

      巴特,也有網友認為耗費4000個TPU月來訓練VeLO,計算量成本過大:

      雖然這個進展很重要,但它甚至都快趕上GPT-3得訓練量了。

      目前VeLO已經開源,感興趣得小伙伴們可以去試試這個新得AI優化器。

      One More Thing

      前段時間,一位哈佛博士生提了個有意思得想法,得到不少人贊同:

      更多論文得們也應該像演職員表一樣,公開自己在論文中得工作內容。

      Kareem Carr是生物統計學領域得博士生,貢獻在生物論文中比較常見,不過之前在AI論文中見得不多。

      現在,這篇谷歌大腦論文得們也這樣做了,誰寫得論文、誰搭建得框架一目了然:

      不知道以后會不會成為機器學習圈得新風氣(手動狗頭)。

      GitHub地址:
      github/google/learned_optimization/tree/main/learned_optimization/research/general_lopt

      論文地址:
      arxiv.org/abs/2211.09760

      參考鏈接:
      [1]twitter/jmes_harrison/status/1593422054971174912
      [2]medium/huggingface/from-zero-to-research-an-introduction-to-meta-learning-8e16e677f78a#afeb
      [3]*/s/QLzdW6CMkcXWQbGjtOBNwg

      — 完 —

      量子位 QbitAI · 頭條號簽約

      我們,第壹時間獲知前沿科技動態

       
      (文/百里雨璇)
      免責聲明
      本文僅代表作發布者:百里雨璇個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
       

      Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

      粵ICP備16078936號

      微信

      關注
      微信

      微信二維碼

      WAP二維碼

      客服

      聯系
      客服

      聯系客服:

      在線QQ: 303377504

      客服電話: 020-82301567

      E_mail郵箱: weilaitui@qq.com

      微信公眾號: weishitui

      客服001 客服002 客服003

      工作時間:

      周一至周五: 09:00 - 18:00

      反饋

      用戶
      反饋

      午夜久久久久久网站,99久久www免费,欧美日本日韩aⅴ在线视频,东京干手机福利视频
        <strike id="ca4is"><em id="ca4is"></em></strike>
      • <sup id="ca4is"></sup>
        • <s id="ca4is"><em id="ca4is"></em></s>
          <option id="ca4is"><cite id="ca4is"></cite></option>
        • 主站蜘蛛池模板: 日韩一级片在线观看| 亚洲欧美四级在线播放| 中日韩精品无码一区二区三区| 国产叼嘿久久精品久久| 欧美另类z0z免费观看| 无码精品久久久久久人妻中字| 国产欧美日韩中文久久| 亚洲乱码一区二区三区在线观看| 91亚洲精品第一综合不卡播放 | 国产精品天天干| 亚洲欧美四级在线播放| 538在线视频| 欧美一区二区三区激情视频| 国产精品亚洲欧美大片在线观看| 亚洲国产精品福利片在线观看 | 最近中字视频在线观看| 国产欧美日韩精品a在线观看| 久热香蕉精品视频在线播放| 麻豆乱码国产一区二区三区 | 国产精品视频2020| 亚洲一区二区三区在线观看蜜桃| 黄+色+性+人免费| 日本伊人色综合网| 国产AV国片精品有毛| 一级做a爰片欧美aaaa| 秦先生第15部大战宝在线观看| 天天天天躁天天爱天天碰2018| 亚洲综合色丁香麻豆| 2021午夜国产精品福利| 最近的中文字幕国语电影直播 | 亚洲欧洲日产国码久在线观看| 窝窝午夜看片国产精品人体宴| 日韩精品武藤兰视频在线| 国产乱子伦在线观看不卡| 两个人看的www视频免费完整版 | 亚洲狠狠色丁香婷婷综合| 你懂的视频在线播放| 日本另类z0zx| 免费网站看v片在线香蕉| 久久一本一区二区三区| 精品久久久无码中字|