【杜蘭說AI】AI平權 or 給對手送武器？ 3分鐘帶你完全理解 DeepSeek五天開源周

2025年3月17日上午10:15

DeepSeek真的就這麽放心讓對手抄作業？全部開源是不是也在給對手送武器？自此DeepSeek出來之後，這樣的問題就一直不少，尤其是剛剛結束的DeepSeek開源周，我真的是看著全球的開發者從一開始眼巴巴等著今天又會開源什麽王炸技術，到最後忍不住表示：要不然DeepSeek你還是給自己留個後手吧？首先我覺得很重要的一點，雖然這次DeepSeek 是完全面向開發者進行開源的，但我還是覺得每個人都應該或多或少地了解一點，現在最前沿的AI，到底走到了一個什麽階段。簡單給大家用大白話解釋一下哈， DeepSeek的開源一共持續了五天，第一天的高性能計算庫FlashMLA，大家可以理解成一個GPU的性能榨幹器。它能讓一塊國內閹割版的H800，幹出2.4塊旗艦機顯卡A100的活兒。第二天，開源通信庫DeepEP，相當於給以前合作只能靠吼的專家模型們拉了個群，大幅度降低了溝通成本，讓模型訓練的時間必傳統方案縮短了40%。第三天的DeepGEMM 本質上是一個AI計算的加速器，但傳統加速方法可能要上萬行代碼才能實現，它只用了300行代碼，對於中小型團隊來說，又是一次遊戲規則的改寫。第四天， DeepSeek直接把自家的底子拿出來了，公開了V3和R1模型的工業級部署方案，解決了AI並行計算中有人忙得要死，有人又在摸魚的情況，通過計算-通信的重疊，讓AI模型學會了邊算邊聊，最終提升了30%的硬件利用率。第五天，壓軸的是DeepSeek全系列模型的核心裝備， 3FS文件系統和Smallpond數據框架，它們主要負責存儲與數據處理，喝一杯咖啡， 5分鐘左右的時間，就能處理完人類文明史上所有的書籍。了解了DeepSeek這五天到底都開源了什麽，我再來回答開頭的那個問題， DeepSeek這狂踩牙膏的開源，到底是不是在給對手送武器？我覺得這件事，大家要站在一個更高的維度去看。在現在的經濟態勢下，是像Meta、xAI這些不差錢的大廠多，還是缺錢的中小型團隊多？肯定是後者，除了這些中小型團隊，還有很多根本就沒錢的個人開發者，所以這五天的開源，影響的是全世界的科研團隊。開源，不僅僅是這次的DeepSeek，還有開源這個概念誕生之初，為的就是通過共享來集中大家的智慧，也就是我們常說的那句老話： “人多力量大”

更多精彩內容，請登陸
財華香港網 (//m.iteamtexas.com/)
現代電視 (http://www.fintv.com)