• <ins id='8hev'></ins>

      <i id='8hev'><div id='8hev'><ins id='8hev'></ins></div></i>

      <acronym id='8hev'><em id='8hev'></em><td id='8hev'><div id='8hev'></div></td></acronym><address id='8hev'><big id='8hev'><big id='8hev'></big><legend id='8hev'></legend></big></address>

      <code id='8hev'><strong id='8hev'></strong></code>
        <span id='8hev'></span>
        <dl id='8hev'></dl>
      1. <tr id='8hev'><strong id='8hev'></strong><small id='8hev'></small><button id='8hev'></button><li id='8hev'><noscript id='8hev'><big id='8hev'></big><dt id='8hev'></dt></noscript></li></tr><ol id='8hev'><table id='8hev'><blockquote id='8hev'><tbody id='8hev'></tbody></blockquote></table></ol><u id='8hev'></u><kbd id='8hev'><kbd id='8hev'></kbd></kbd>
          <fieldset id='8hev'></fieldset>
            <i id='8hev'></i>

            警惕!AMD又打7nm新顯卡的歪腦筋:BF16是深度學習還是礦車升級?

            • 时间:
            • 浏览:8
            • 来源:台湾成人论坛_台湾三级_台湾三级片

            Navi潔身自好之日不久矣?

            自2018年大礦災之後,即便經歷瞭2019年夏天這一波短暫回升,區塊鏈代幣行業依然處於低迷時期。2016~2018年通過Polaris系列顯卡大挖特挖的AMD礦卡傢族,在2019年已經逐漸銷聲匿跡,新發佈的Navi系列7nm顯卡也罕有涉及挖礦的新聞曝出。

            挖礦算力未得到革命性升級的RDNA架構,總算是免過挖礦之難

            然而,GitHub(著名開源組織社區)在對AMD ROCm開發庫進行調查後獲悉:

            AMD GPU將加入BFloat16(BF16)浮點指令的支持。此指令將比當前的FP16浮點性能獲得巨大(革命性)提升。

            而這一提升的幅度會是多少?ARM架構方面的測算提升幅度約為1.6~4倍,藍廠10代CPU架構方面在NPU、AI綜合增益約為2.5倍。因此,得益於大量CU(運算單元)的結構又是,GPU架構的BF16綜合增益,在高級制程下Sp數量擴張之後,將有可能達到4~10倍以上(無責推)。

            打算用BF16革瞭FP16的命,劍指何方?

            AI、深度學習是已確認的CPU(包括ARM類產品)下一階段重點發展方向,Jim Keller在換庒之後的基本操作也是將特斯拉任職期間主刀的AI、深度學習、神經網絡等“手術”實驗,植入第10代開始的Intel CPU上。

            除此之外,主流ARM芯片企業,在今年春末紛紛確認BFloat16指令集的研發、標準策略等工作進度。看來這場又AI為主導的神經網絡大升級已是待發之箭瞭。

            AMD RX5700XT的FP16性能:19.51TFLOPS(圖源AMD官網)

            而AMD被曝將在“未來”的GPU上(筆者預計最快將在明年發佈的RDAN2架構上)支持BF16指令集,則傳達出更多隱含深意的訊息。

            挖礦運算,更像窮舉法的重復運算過程,運算單元越多越劃算

            眾所周知,典型的區塊鏈加密運算難度並不高,且運算模式重復率高。因此在多年來的經驗中表明,CPU強大的復雜運算能力應對“挖礦”運算並不占優,反而是具備少則2048、多則4096(sp)的多單元GPU運算架構,對於區塊鏈挖礦運算更勝一籌。簡而言之就是,讓8個數學教授去做一萬道小學計算題的速度,絕對比不過2048個高中生的速度快。

            而這種“低難度”的運算操作,其實就涉及到‘單精度浮點性能’,恰好,傳統顯卡的單精度浮點性能和FP16(峰值半精度性能)息息相關。講到這裡,讀者們應該已經大概明白,數碼君想表達什麼瞭。

            總結 &amp; 預測(無責推)

            AMD的顯卡份額基本上就是靠2016~2018年的礦卡狂潮完成翻盤的,在區塊鏈代幣行業遭遇瓶頸期、傳統顯卡挖礦模式趨於衰退的環境下,如何保持2016~2018年長達30個月的GPU快速增長勢頭?光靠遊戲卡或者零售、OEM大單是根本不可能的。

            各GPU區塊鏈運算相關參數一覽(圖例時間2018年7月)

            因此,假設BFloat16獲得數倍於傳統FP16的性能增益,結合7nm+、大核心RDNA2架構、高達8192sp的旗艦卡皇,外加500W左右的TDP(Navi10結構推算),這張AMD顯卡的算力會怎麼樣?

            我不敢猜,我更怕的是:

            獲得BF16指令集增強的大批100瓦左右、2048sp的RDNA2顯卡,再次重回礦場。

            往事不堪回首,本文僅供解悶,咱也不懂,咱也是瞎猜~


            淘數碼關註數碼配件優惠特價資訊,關註+轉發+私信:【20196688】自動獲取更多優惠信息