AI模型评测

  • TransBench:阿里国际等推出的多语言翻译评测体系
  • SWE-Lancer:OpenAI开源的大模型代码能力测试基准
  • AGI-Eval:AI大模型评测社区
error: