DeepSeek真的就這麽放心讓對手抄作業? 全部開源 是不是也在給對手送武器? 自此DeepSeek出來之後, 這樣的問題就一直不少, 尤其是剛剛結束的DeepSeek開源周, 我真的是看著全球的開發者從一開始 眼巴巴等著今天又會開源什麽王炸技術, 到最後忍不住表示: 要不然DeepSeek你還是給自己留個後手吧? 首先我覺得很重要的一點, 雖然這次DeepSeek 是完全面向開發者進行開源的, 但我還是覺得每個人都應該或多或少地了解一點, 現在最前沿的AI, 到底走到了一個什麽階段。 簡單給大家用大白話解釋一下哈, DeepSeek的開源一共持續了五天, 第一天的高性能計算庫FlashMLA, 大家可以理解成一個GPU的性能榨幹器。 它能讓一塊國內閹割版的H800, 幹出2.4塊旗艦機顯卡A100的活兒。 第二天,開源通信庫DeepEP, 相當於給以前合作只能靠吼的專家模型們拉了個群, 大幅度降低了溝通成本, 讓模型訓練的時間必傳統方案縮短了40%。 第三天的DeepGEMM 本質上是一個AI計算的加速器, 但傳統加速方法可能要上萬行代碼才能實現, 它只用了300行代碼, 對於中小型團隊來說, 又是一次遊戲規則的改寫。 第四天, DeepSeek直接把自家的底子拿出來了, 公開了V3和R1模型的工業級部署方案, 解決了AI並行計算中有人忙得要死, 有人又在摸魚的情況, 通過計算-通信的重疊, 讓AI模型學會了邊算邊聊, 最終提升了30%的硬件利用率。 第五天, 壓軸的是DeepSeek全系列模型的核心裝備, 3FS文件系統和Smallpond數據框架, 它們主要負責存儲與數據處理, 喝一杯咖啡, 5分鐘左右的時間, 就能處理完人類文明史上所有的書籍。 了解了DeepSeek這五天到底都開源了什麽, 我再來回答開頭的那個問題, DeepSeek這狂踩牙膏的開源, 到底是不是在給對手送武器? 我覺得這件事, 大家要站在一個更高的維度去看。 在現在的經濟態勢下, 是像Meta、xAI這些不差錢的大廠多, 還是缺錢的中小型團隊多? 肯定是後者, 除了這些中小型團隊, 還有很多根本就沒錢的個人開發者, 所以這五天的開源, 影響的是全世界的科研團隊。 開源, 不僅僅是這次的DeepSeek, 還有開源這個概念誕生之初, 為的就是通過共享來集中大家的智慧, 也就是我們常說的那句老話: “人多力量大”
更多精彩內容,請登陸
財華香港網 (//m.iteamtexas.com/)
現代電視 (http://www.fintv.com)