AI 应用 / Agent skills

eval

安装量 1,042GitHub Stars 14,998更新时间 2026年5月16日

描述

Evaluate and rank agent results by metric or LLM judge for an AgentHub session.

安全审计

使用前的风险提示

未审计

未审计

更新 1年1月1日

未审计

更新 1年1月1日

llmagentevalevaluateandrankresultsmetricjudgeforagenthubsession