GPT-4.5剛發布的時候, 我就覺得得讓子彈再飛一會兒, 結果就過了一個周末, 各種聲音全都出來了。 我個人差不多就三個感覺哈。 第一, 知道你openai貴, 但也不能這麽離譜啊? 輸入價格75刀, 輸出價格150刀, 比DeepSeek貴了快300倍。 如此恐怖的成本提升下, GPT-4.5的性能怎麽樣呢? 這就是我的第二個感受, 確實變強了,但只有一點點。 官方給出的基準測試里, GPT-4.5是碾壓GPT-4o的, 在最新的一項編碼測試里, 也超越了DeepSeek-R1、o1、GPT-4o等模型, 但在一些比較困難的學術基準測試上, 就不太夠看了, 在某些偏實用的評估基準上, 甚至是全班墊底。 不過OpenAI官方這次也特意強調, 說GPT-4.5的真正厲害之處, 在於它能夠更好地理解人類的意思, 並以更細致入微的“情商”來解讀微妙的暗示或隱含的期望。 用奧特曼的話來說, 就是你會感覺在和一個“有思想的人”說話。 因為GPT-4.5現在只向Pro用戶開放, 我沒買它的會員, 所以只看了一些用戶PO到網上的圖。 對此我的第三個感覺是, 看起來確實有人情味兒了些, 會先安慰你, 給你情緒價值, 而不是直接給一堆解決方案。 但這就能證明它比別家更強嗎? 很難說。 更何況它收費還那麽貴, 頗有一種要算法有情商、 要推理有情商、 要應用還是只有情商的感覺。 最後再給大家展開一下啊, 這次的GPT-4.5還有一個意義, 它很有可能是OpenAI的最後一代非推理模型。 什麽意思呢? 現在業界大模型架構是“重推理”的, 也就是基於傳統的語言模型, 通過思維鏈、自我驗證等多步中間推理生成答案, 擅長編程、學術寫作以及分析覆雜問題, 典型代表就是DeepSeek-R1和GPT-o1。 與之相對的就是非推理大模型, 主要依賴預訓練階段的高質量參數進行學習, 邏輯推理能力稍弱, 更側重於流暢的語言生成和上下文理解, 代表是GPT-o3-mini。 這幾天推理模型陣營的DeepSeek 剛剛把自己壓箱底的寶貝都拿了出來, 搞得全球的開發者都一片沸騰, 這邊非推理模型GPT-4.5的風評, 大家又都有目共睹, 所以我估計, 以後大部分AI的方向, 可能都將會徹底轉向推理。
更多精彩內容,請登陸
財華香港網 (//m.iteamtexas.com/)
現代電視 (http://www.fintv.com)