天一导航 天一导航 天一导航 天一导航
  • 常用AI推荐
  • AI对话聊天
  • AI写作工具
  • 常用AI图像工具
  • AI图片插画生成
  • AI视频工具
  • AI设计工具
  • AI搜索引擎
  • AI音频工具
  • AI编程工具
  • AI开发平台
  • AI提示指令
  • AI学习网站
  • AI内容检测
  • AI模型评测
  • AI法律助手
  • 网盘云储
  • 友情链接
  • 收录投稿
天一导航 天一导航
  • 天一商贸
  • 关于
  • 收录投稿
  • 黑洞
  • 导航主题
  • 图标

    AI模型评测

    PubMedQA
    PubMedQA

    生物医学研究问答数据集和模型得分排行榜

    H2O EvalGPT
    H2O EvalGPT

    H2O.ai推出的基于Elo评级方法的大模型评估系统

    LLMEval3
    LLMEval3

    由复旦大学NLP实验室推出的大模型评测基准

    Chatbot Arena
    Chatbot Arena

    以众包方式进行匿名随机对战的LLM基准平台

    HELM
    HELM

    斯坦福大学推出的大模型评测体系

    MMBench
    MMBench

    全方位的多模态大模型能力评测体系

    CMMLU
    CMMLU

    一个综合性的大模型中文评估基准

    OpenCompass
    OpenCompass

    上海人工智能实验室推出的大模型开放评测体系

    AGI-Eval
    AGI-Eval

    AI大模型评测社区

    SuperCLUE
    SuperCLUE

    中文通用大模型综合性测评基准

    FlagEval
    FlagEval

    智源研究院推出的FlagEval(天秤)大模型评测平台

    C-Eval
    C-Eval

    一个全面的中文基础模型评估套件

    Open LLM Leaderboard
    Open LLM Leaderboard

    Hugging Face推出的开源大模型排行榜单

    MMLU
    MMLU

    大规模多任务语言理解基准

    天一导航 天一导航
    天一AI导航全面的前端用户功能,简单的模块化配置,欢迎您的体验

    友链申请 免责声明 广告合作 关于我们

    吉ICP备2025026974号-1