evaluation-framework - 主题项目

追踪 GitHub 趋势，把握技术发展脉搏

探索趋势了解更多

evaluation-framework - 主题项目

追踪 GitHub 趋势，把握技术发展脉搏

探索趋势了解更多

成就解锁

❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序，在微信中搜索 TrendForge Pro 即可使用小程序，如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

evaluation-framework

话题找到数量

promptfoo/promptfoo

测试您的提示词、智能体和检索增强生成系统。针对大语言模型的红队测试、渗透测试与漏洞扫描。对比GPT、Claude、Gemini、Llama等模型的性能表现。支持命令行与CI/CD集成的简易声明式配置。

ci ci-cd cicd

promptfoo

promptfoo 开发者

22k

2k

555

+8.2k

排名 #18

6月17日

confident-ai/deepeval

大语言模型评估框架

evaluation-framework evaluation-metrics llm-evaluation

confident-ai

confident-ai 开发者

15k

1.4k

564

+109

排名 #12

5月16日

EleutherAI/lm-evaluation-harness

用于语言模型少样本评估的框架。

evaluation-framework language-model transformer

EleutherAI

EleutherAI 开发者

12k

3.3k

460

+22

排名 #6

5月13日

zeno-ml/zeno

AI数据管理与评估平台

ai data-science evaluation

zeno-ml

zeno-ml 开发者

214

11

132

排名 #14

6月29日

首页上一页

1

1

下一页末页

助手