AI模型评测

  • SWE-Lancer:OpenAI开源的大模型代码能力测试基准
  • AGI-Eval:AI大模型评测社区
error: