描述
运行任何 ADK 评估前必读。ADK 评估方法论 —— 评估指标、evalset 模式、LLM-as-judge、工具轨迹评分及常见失败原因。在评估 agent 质量、运行 adk eval 或调试评估结果时使用。请勿用于 API 代码模式(使用 adk-cheatsheet)、部署(使用 adk-deploy-guide)或项目脚手架(使用 adk-scaffold)。
AI 应用 / Agent skills
adk-eval-guide
描述
运行任何 ADK 评估前必读。ADK 评估方法论 —— 评估指标、evalset 模式、LLM-as-judge、工具轨迹评分及常见失败原因。在评估 agent 质量、运行 adk eval 或调试评估结果时使用。请勿用于 API 代码模式(使用 adk-cheatsheet)、部署(使用 adk-deploy-guide)或项目脚手架(使用 adk-scaffold)。
安全审计