灵感菇

AI 技能的自然生态,你的一句话,蔓延出无限连接。

返回搜索

AI / LLM / Agent skills

智能体评估

agent-eval

安装量 2,677GitHub Stars 0更新时间 2026年5月11日

描述

在自定义任务上对编程智能体(Claude Code、Aider、Codex 等)进行正面对比,涵盖通过率、成本、耗时与一致性指标

uiperformancedockerapillmpromptagentagentsworkflowgithubevalhead