ai导航
      • 未登录
        登录后即可体验更多功能
      未登录
      登录后即可体验更多功能

      AI模型评测

      共 16 篇网址
      排序
      发布更新浏览点赞
      SuperCLUE

      SuperCLUE

      SuperCLUE是什么 SuperCLUE 是针对中文大模...
      040
      AI模型评测# AI模型评测
      H2O EvalGPT

      H2O EvalGPT

      H2O EvalGPT 是 H2O.ai 用于评估和比较 L...
      040
      AI模型评测# AI模型评测
      AGI-Eval

      AGI-Eval

      AGI-Eval是什么 AGI-Eval是上海交通大学、同济...
      040
      AI模型评测# AI模型评测
      PubMedQA

      PubMedQA

      PubMedQA是什么 PubMedQA是专门用在生物医学研...
      040
      AI模型评测# AI模型评测
      OpenCompass

      OpenCompass

      OpenCompass是什么 OpenCompass是上海人...
      040
      AI模型评测# AI模型评测
      CMMLU

      CMMLU

      CMMLU是什么 CMMLU是综合性的中文评估基准,专门用在...
      040
      AI模型评测# AI模型评测
      MMBench

      MMBench

      MMBench是什么 MMBench是多模态基准测试,由上海...
      040
      AI模型评测# AI模型评测
      C-Eval

      C-Eval

      C-Eval是什么 C-Eval是适用于大语言模型的多层次多...
      040
      AI模型评测# AI模型评测
      HELM

      HELM

      HELM是什么 HELM全称Holistic Evaluat...
      040
      AI模型评测# AI模型评测
      FlagEval

      FlagEval

      FlagEval是什么 FlagEval(天秤)是北京智源人...
      040
      AI模型评测# AI模型评测
      LMArena

      LMArena

      LMArena是什么 LMArena是加州大学伯克利分校推出...
      040
      AI模型评测# AI模型评测
      AI Ping

      AI Ping

      AI Ping是什么 AI Ping是专注AI大模型服务性能...
      040
      AI模型评测# AI模型评测
      LLMEval3

      LLMEval3

      LLMEval是由复旦大学NLP实验室推出的大模型评测基准...
      040
      AI模型评测# AI模型评测
      MagicArena

      MagicArena

      MagicArena是什么 MagicArena 是字节跳动...
      030
      AI模型评测# AI模型评测
      MMLU

      MMLU

      MMLU 全称 Massive Multitask Lang...
      040
      AI模型评测# AI模型评测
      加载更多
      ai导航
      OneNav 一为导航主题,集网址、资源、资讯于一体的 WordPress 导航主题,简约优雅的设计风格,全面的前端用户功能,简单的模块化配置,欢迎您的体验

      友链申请 免责声明 广告合作 关于我们

      扫码加微信ai导航
      扫码加微信
      Copyright © 2026 ai导航 
      反馈
      让我们一起共建文明社区!您的反馈至关重要!
      网址
      网址文章软件书籍