第1329章 deepseek:ai大模型訓練成本革命與英偉達面臨的挑戰(第1/2 頁)
每一次技術革新都可能引發市場的巨震。近日,deepseek-r1基準測試在國外大模型排名arena上的卓越表現,無疑為ai領域帶來了一場地震。1月24日,deepseek-r1在arena上攀升至全類別大模型第三,更在風格控制類模型(stylectrl)分類中與openai的o1並列第一。這一成績不僅彰顯了deepseek的技術實力,更引發了全球對其背後ai訓練成本革命的關注。
deepseek-v3的突破在於其以極低的成本實現了高效的大模型訓練。據悉,該模型僅使用2048塊h800 gpu,便完成了6710億引數模型的訓練,成本僅為5576萬美元。這一數字遠低於其他頂級模型的訓練成本,如gpt-4高達10億美元的訓練費用。deepseek的低成本訓練模式,無疑為ai領域帶來了一股清流,也引發了市場對於英偉達等傳統ai硬體巨頭地位的擔憂。
英偉達作為ai硬體領域的領頭羊,其主導地位一直備受矚目。然而,deepseek的崛起,似乎正在悄然改變這一格局。在deepseek的影響下,美股市場人工智慧(ai)的狂歡開始顫動,投資者們開始重新審視ai領域的競爭格局。deepseek的低成本訓練模式,不僅降低了ai大模型的門檻,更可能顛覆英偉達等硬體商在ai領域的傳統優勢。
值得注意的是,英偉達的“老對手”ad也迅速為deepseek“站臺”,宣佈全新的deepseek-v3模型已整合至ad stct gpu上。這一合作不僅進一步鞏固了ad與deepseek的長期合作關係,更可能使ad gpu成為比英偉達更具有成本效益的替代品。在deepseek的推動下,ad的市場地位有望得到顯著提升。
deepseek的崛起,無疑給英偉達等傳統ai硬體商帶來了巨大的壓力。一方面,deepseek的低成本訓練模式降低了ai大模型的門檻,使得更多的企業和研究機構能夠參與到ai領域中來;另一方面,deepseek的技術突破也引發了市場對於ai硬體需求的重新評估。未來,隨著ai技術的不斷發展,對於推理算力的需求將成為主要驅動力。而英偉達等傳統硬體商的傳統優勢更多集中在訓練側,這可能會對其市場地位和戰略佈局產生影響。
在deepseek的影響下,美股市場對於ai領域的投資也開始出現分化。一些投資者開始將目光投向那些具有低成本訓練能力的ai企業,而英偉達等傳統硬體商則面臨著股價下跌的壓力。例如,在deepseek釋出成績後的第二天,英偉達股價大跌312,創下公司在年初ces展產品不及預期表現後的最大跌幅。這一跌幅不僅反映了市場對於英偉達未來業績的擔憂,更凸顯了deepseek對於ai領域競爭格局的影響。
海外媒體和知名市場評論員也對deepseek的崛起表示了高度關注。vital knowled、德國世界報知名市場評論員holr zschaepitz等紛紛將deepseek稱之為“美國股市最大的威脅”。他們認為,deepseek的低成本訓練模式正在對美國此前宣佈的5000億美元ai基建計劃形成巨大的打擊。而美股大v“the short bear”則在社交媒體上表示,deepseek創造了一個ai巨頭們的痛苦時刻,投資者必須對此敲響警鐘。
面對deepseek的崛起,英偉達等傳統ai硬體商顯然不能坐以待斃。他們需要透過技術創新和戰略佈局來應對這一挑戰。一方面,他們需要不斷提升自身的硬體效能和技術水平,以滿足ai大模型對於算力的需求;另一方面,他們也需要積極尋求與ai企業的合作機會,