次级导航
blog
关于
收录投稿
二级菜单样式
排行榜
收录投稿
blog
关于
收录投稿
二级菜单样式
排行榜
收录投稿
iowen
帅气的我简直无法用语言描述!
文章
11
网址
313
书籍
1
软件
0
评论
0
已发布
313
MMBench
全方位的多模态大模型能力评测体系
0
44
0
AI模型评测
# MMBench
HELM
斯坦福大学推出的大模型评测体系
0
41
0
AI模型评测
# HELM
OpenCompass
上海人工智能实验室推出的大模型开放评测体系
0
39
0
AI模型评测
# OpenCompass
C-Eval
一个全面的中文基础模型评估套件
0
46
0
AI模型评测
# C-Eval
LLMEval3
由复旦大学NLP实验室推出的大模型评测基准
0
45
0
AI模型评测
# LLMEval3
FlagEval
智源研究院推出的FlagEval(天秤)大模型评测平台
0
41
0
AI模型评测
# FlagEval
PubMedQA
生物医学研究问答数据集和模型得分排行榜
0
41
0
AI模型评测
# PubMedQA
H2O EvalGPT
H2O.ai推出的基于Elo评级方法的大模型评估系统
0
43
0
AI模型评测
# H2O EvalGPT
SuperCLUE
中文通用大模型综合性测评基准
0
44
0
AI模型评测
# SuperCLUE
Evidently AI
开源的机器学习模型监测和测试工具
0
74
0
AI训练模型
# Evidently AI
Gen-2
Runway最新推出的AI视频生成模型
0
66
0
AI训练模型
# Gen-2
Imagen
Google AI文字到图像生成模型
0
70
0
AI训练模型
# Imagen
加载更多
网址
网址
文章
软件
书籍