就在剛剛,埃隆·馬斯克旗下的人工智能初創公司xAI宣布正式推出Grok-1.5,官方推送啥也沒說,直接甩鏈接,主打一個“字少事大”。
Grok-1.5有哪些昇級呢,主要是兩個方面:
1、長上下文理解
對於上下文窗口,Grok-1.5直接提昇到了之前的16倍,從8192增長到128k,和GPT-4齊平。
這也就意味著Grok-1.5可以處理更長和更復雜的提示,同時保持其遵循指令的能力。
在大海撈針(NIAH)評估中,Grok-1.5展示了強大的檢索功能,可以在長度達128K的上下文中檢索嵌入的文本,獲得完美的檢索結果。
2、能力和推理
Grok-1.5最大的改進之一是處理編程和數學相關任務的能力大幅提昇,全面超越Grok-1、Mistral Large、Claude 2。
數學方面,Grok-1.5在MATH基准測試上得分50.6%,超越中杯Claude 3 Sonnet;GSM8K上得分90%。
編程方面,Grok-1.5在HumanEval基准測試上得分74.1%,超越中杯Claude 3 Sonnet、Gemini Pro1.5、GPT-4,僅次於大杯Claude 3 Opus。