請輸入關鍵字：

熱門搜尋：

華光新材德恩精工久日新材香港樓宇蜂助手美元

FinTV 現代電視

【杜蘭說AI】大模型的“大”到底是啥？

2025年5月9日上午10:10

大模型的“大”到底是啥？
一共四個維度，
第一，
參數規模，
就像是你吃火鍋時鍋的大小，
也是一切的基礎，
ChatGPT就是一口1750億參數的巨型火鍋，
因為夠大，
所以能涮的食材也多。

這又涉及到了咱們的第二個維度，
訓練數據的規模，
就是咱們涮火鍋的食材種類，
食材越多越豐富，
涮鍋的味道就越香，
這也就是為啥說
“訓練數據決定了模型的知識廣度和深度”。

第三是計算量，
也叫訓練模型的能源消耗，
計算量大不大，
就是在問你這鍋的火力大不大？
一般肯定是火力越強熟得越快，
但也有像DeepSeek這樣，
著名的550萬美元能耗的火鍋，
主打一個“智能控溫”，
能耗小，
湯也能熟。

最後一個叫上下文窗口，
它決定的是模型能同時處理的信息量，
這回咱得支個桌了，
上下文窗口越大，
就相當於你放火鍋的餐桌越大，
那能放的菜品肯定也越多，
模型一次能處理的信息也就越多。

總結起來就是，
大模型就是一鍋容量大、食材多、火力強、桌面寬的火鍋。
好了，
吃個火鍋獎勵一下自己吧。

更多精彩內容
請登陸
財華香港網 (//m.iteamtexas.com/)或
現代電視 (https://www.fintv.hk)

相關視頻

蓋茨擬於20年內捐出2000億美元　助消除疾病及減少貧困

美英宣布達成貿易協議　但具體細節尚待敲定

科大成立馮諾依曼研究院陳茂波出席並致辭

總商會：中東、香港與大灣區可做到三方合作

本港學者料新任教宗教普雷沃斯沿過去路線處理中梵關係　邁向建交

大廈食水缸滿佈鐵鏽漬 5年無洗積5吋泥易播菌致腹瀉

AI 機械人洗頭店廣州冒起只需19元、13 分鐘完成吸引上班族

【杜蘭說AI】大模型的“大”到底是啥？

【杜蘭說AI】你被 “內卷” 收割了嗎？

400萬樓印花稅減至100元　許正宇：旨在平衡市民負擔和財政穩健

內地餐廳綠茶集團今起招股入場費2905元引入8名基石投資者

丘應樺：正全力營造有利環境為6G時代做好準備

快訊

更多

17:39: 綠地香港(00337.HK)首四個月合約銷售約8.8億元
17:32: 時代中國控股(01233.HK)4月合同銷售金額5.6億元
17:28: 高視醫療(02407.HK)：人工晶狀體植入系統獲中國醫療器械註冊證
17:23: 先瑞達醫療-B(06669.HK)智能抽吸感應連接管的註冊申請獲批
17:19: 合景泰富集團(01813.HK)4月預售額同比減少47.5%
17:16: 建業地產(00832.HK)4月物業合同銷售額同比減少20.2%
17:09: 世茂集團(00813.HK)4月合約銷售額20.01億元
17:03: 蘿蔔快跑：自動駕駛測試區域再擴大在港安全行駛里程超14000公里
16:39: 【大行報告】景順：美英達成貿易協議市場反應冷熱不均未來關稅走向仍待觀察
16:30: 香港金管局舉辦2025綠色金融科技比賽

專欄

有連雲

國内領先的智能金融信息引擎

PANews

PANews是區塊鏈和Web3.0領域領先的智庫型信息平台，為行業用戶提供具有國際視野的前沿資訊與報...

: 余豐慧
: 邱震海
: 賈康
: 梁海明
海南大學「一帶一路」研究院院長 ,香港經濟學家、絲路智谷研究院院長。
: 楊德龍
: 傅健慈
中國人民大學法學博士 ,全國港澳研究會理事 ,英國皇家特許法律行政人員學院院士.
: 汪揚
BS ,MS ,PhD ,香港科技大學副校長（大學拓展） ,hth登录入口网页100強研究中心顧問
: 梅新育
商務部國際貿易經濟合作研究院研究員
: 許照中
六福金融主席兼行政總裁
: 施永青
中原集團主席兼總裁