灵感菇

AI 技能的自然生态,你的一句话,蔓延出无限连接。

返回搜索

AI 应用 / Agent skills

eval

eval

安装量 1,042GitHub Stars 14,998更新时间 2026年5月16日

描述

Evaluate and rank agent results by metric or LLM judge for an AgentHub session.

安全审计

使用前的风险提示

未审计

规则审计

未审计
更新 1年1月1日

智能审计

未审计
更新 1年1月1日
llmagentevalevaluateandrankresultsmetricjudgeforagenthubsession