2026-03
🏷️

#llm-evaluation 每月趋势报告

📅 2026-03
📊 4 个项目

🔥 #llm-evaluation 每月热门项目

promptfoo/promptfoo

测试您的提示词、智能体和检索增强生成系统。针对大语言模型的红队测试、渗透测试与漏洞扫描。对比GPT、Claude、Gemini、Llama等模型的性能表现。支持命令行与CI/CD集成的简易声明式配置。

18k
1.6k
253
+8.2k
排名 #3
3月31日
查看详情

promptfoo/promptfoo

测试您的提示词、智能体和检索增强生成系统。针对大语言模型的红队测试、渗透测试与漏洞扫描。对比GPT、Claude、Gemini、Llama等模型的性能表现。支持命令行与CI/CD集成的简易声明式配置。

18k
1.6k
253
+8.2k
排名 #18
3月31日
查看详情

Arize-ai/phoenix

AI可观测性与评估体系。

9.1k
784
218
+443
排名 #11
3月31日
查看详情

NVIDIA/garak

大语言模型漏洞扫描器

7.4k
849
195
+348
排名 #9
3月31日
查看详情

📊 数据统计

4 个热门项目
2026-03 数据日期

🔥 TrendForge - 追踪开源项目热度,发现技术趋势

助手