馬斯克突然發布Grok 1.5!上下文長度飆昇16倍和GPT-4齊平

掃碼閱讀手機版

來源: 快科技 2024-03-29 15:00:48

  就在剛剛,埃隆·馬斯克旗下的人工智能初創公司xAI宣布正式推出Grok-1.5,官方推送啥也沒說,直接甩鏈接,主打一個“字少事大”。

  Grok-1.5有哪些昇級呢,主要是兩個方面:

  1、長上下文理解

  對於上下文窗口,Grok-1.5直接提昇到了之前的16倍,從8192增長到128k,和GPT-4齊平。

  這也就意味著Grok-1.5可以處理更長和更復雜的提示,同時保持其遵循指令的能力。

  在大海撈針(NIAH)評估中,Grok-1.5展示了強大的檢索功能,可以在長度達128K的上下文中檢索嵌入的文本,獲得完美的檢索結果。

  2、能力和推理

  Grok-1.5最大的改進之一是處理編程和數學相關任務的能力大幅提昇,全面超越Grok-1、Mistral Large、Claude 2。

  數學方面,Grok-1.5在MATH基准測試上得分50.6%,超越中杯Claude 3 Sonnet;GSM8K上得分90%。

  編程方面,Grok-1.5在HumanEval基准測試上得分74.1%,超越中杯Claude 3 Sonnet、Gemini Pro1.5、GPT-4,僅次於大杯Claude 3 Opus。

下載津雲客戶端關注更多精彩

推薦新聞

我來說兩句

關於北方網 | 廣告服務 | 誠聘英纔 | 聯系我們 | 網站律師 | 設為首頁 | 關於小狼 | 違法和不良信息舉報電話:022-23602087 | 舉報郵箱:jubao@staff.enorth.cn | 舉報平臺

Copyright (C) 2000-2024 Enorth.com.cn, Tianjin ENORTH NETNEWS Co.,LTD.All rights reserved
本網站由天津北方網版權所有
增值電信業務經營許可證編號:津B2-20000001  信息網絡傳播視聽節目許可證號:0205099  互聯網新聞信息服務許可證編號:12120170001津公網安備 12010002000001號
增值電信業務經營許可證編號:津B2-20000001  信息網絡傳播視聽節目許可證號:0205099  互聯網新聞信息服務許可證編號:12120170001津公網安備 12010002000001號