搜索结果
evals
找到 2 个相关结果
AI / LLM / Agent skills
google-agents-cli-eval
google-agents-cli-eval
当用户希望“运行评估”、“评估我的 ADK agent”、“编写 evalset”、“调试 eval scores”、“比较 eval results”,或需要有关 ADK (Agent Development Kit) 评估方法论及 eval-fix 循环的指导时,应使用此技能。涵盖 eval metrics、evalset schema、LLM-as-judge、tool trajectory scoring 以及常见失败原因。属于 Google ADK (Agent Development Kit) 技能套件的一部分。请勿用于 API 代码模式(请使用 google-agents-cli-adk-code)、部署(请使用 google-agents-cli-deploy)或项目脚手架(请使用 google-agents-cli-scaffold)。
Stars 0
uitestingdeploymentapi
AI / LLM / Agent skills
持续代理循环
continuous-agent-loop
包含质量门禁、评估机制和恢复控制的持续自主智能体循环模式。
Stars 0
uiauditagentworkflow