請輸入關鍵字:

熱門搜尋:

首個AI高考全卷評測結果發佈:最高分303 數學全不及格

日期:2024年6月19日 下午4:19

6月19日,據《科創板日報》訊,上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考「語數外」全卷能力測試。OpenCompass發佈了首個大模型高考全卷評測結果。語數外三科加起來的滿分為420分,此次高考測試結果顯示,阿里通義千問2-72B排名第一,為303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能實驗室的書生·浦語2.0排名第三,三個大模型的得分率均超過70%。來自法國大模型初創公司的Mistral排名末尾。從結果來看,大模型的語文、英語考試水平普遍不錯,但數學都不及格,最高分也只有75分。

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至content@finet.com.hk,獲得書面確認及授權後,方可轉載。

更多精彩內容,請登陸
財華香港網 (//m.iteamtexas.com/)
財華智庫網(https://www.finet.com.cn)

現代電視 (https://www.fintv.hk)

相關文章

6月18日
霧凇資本在香港設立地區總部
6月14日
中汽協:5月新能源汽車銷量95.5萬輛 同比增長33.3%
6月14日
中汽協:5月汽車銷量241.7萬輛 同比增長1.5%
6月11日
中汽協:4月汽車零部件類產品出口金額87.6億美元
6月7日
台積電5月營收約2296.2億元新台幣 同比增加30.1%
6月6日
中國保險行業協會發佈《保險汽車風險測試規程》系列標準
6月5日
國產商用飛機完成首次加注可持續航空燃料(SAF)演示飛行
6月3日
AMD蘇姿豐:銳龍9000系列桌面處理器將於7月上市
5月31日
OpenCSG創大模型編程世界紀錄
5月30日
百度何俊傑:大模型不應該只向内卷算力、卷參數 更應該向外卷場景、卷問題

視頻

快訊

16:03
雲天勵飛:公司推理芯片和加速卡支持適配雲天書、通義千問、百川智能、Meta等30+開源大模型
15:58
百度與寧德時代簽署戰略合作協議 圍繞無人駕駛與數智化兩大核心領域展開合作
15:50
雲天勵飛:公司暫未和宇樹機器人合作
15:47
東鵬飲料:目前正在進行DS大模型的本地及雲端部署
15:32
鄂爾多斯:公司購買的上海物業目前已投入運營
15:28
常山藥業:公司研發的創新藥艾本那肽上市許可申請被國家藥監局受理
15:19
賽昉科技:獲港投公司戰略投資 著力推動RISC-V芯片開發
15:06
松芝股份:公司是江淮尊界高端車型汽車熱管理產品的主要供應商
14:46
陳茂波:強化財政管理 穩步有序回復收支平衡
14:40
國家能源局印發《2025年能源工作指導意見》
Baidu
map