搜索结果
evaluate
找到 9 个相关结果
AI / LLM / Agent skills
微软铸造厂
microsoft-foundry
端到端部署、评估和管理 Foundry 代理:Docker 构建、ACR 推送、托管/提示代理创建、容器启动、批量评估、持续评估……
Frontend / UI
代码审查
critique
从用户体验视角评估设计,审视视觉层次、信息架构、情感共鸣、认知负荷及整体质量,通过……
Frontend / UI
免费工具策略
free-tool-strategy
当用户希望出于营销目的(如潜在客户挖掘、SEO 价值或品牌知名度)规划、评估或构建免费工具时。此外,当用户……时也可使用。
Security / Review
Firestore 安全规则审计工具
firestore-security-rules-auditor
一项用于评估 Firestore 安全规则安全性的技能。当 Firestore 安全规则更新时,可使用此技能来确保生成的规则……
Security / Review
Firebase 安全规则审计工具
firebase-security-rules-auditor
用于评估 Firestore 安全规则安全性的技能。当 Firestore 安全规则更新时,请使用此技能以确保生成的规则……
AI / LLM / Agent skills
google-agents-cli-workflow
google-agents-cli-workflow
当用户希望“开发智能体”、“使用 ADK 构建智能体”、“在本地运行智能体”、“调试智能体代码”、“测试智能体”、“部署智能体”、“发布智能体”、“监控智能体”,或需要 ADK (Agent Development Kit) 开发生命周期与编码规范时,应使用此技能。它是构建 ADK 智能体的入口。始终处于激活状态——提供完整的工作流(脚手架、构建、评估、部署、发布、监控)、代码保留规则、模型选择指南,以及针对 ADK 或任何智能体开发的故障排除步骤。
AI / LLM / Agent skills
google-agents-cli-eval
google-agents-cli-eval
当用户希望“运行评估”、“评估我的 ADK agent”、“编写 evalset”、“调试 eval scores”、“比较 eval results”,或需要有关 ADK (Agent Development Kit) 评估方法论及 eval-fix 循环的指导时,应使用此技能。涵盖 eval metrics、evalset schema、LLM-as-judge、tool trajectory scoring 以及常见失败原因。属于 Google ADK (Agent Development Kit) 技能套件的一部分。请勿用于 API 代码模式(请使用 google-agents-cli-adk-code)、部署(请使用 google-agents-cli-deploy)或项目脚手架(请使用 google-agents-cli-scaffold)。
Security / Review
Laravel 插件发现
laravel-plugin-discovery
通过 LaraPlugins.io MCP 发现并评估 Laravel 扩展包。当用户需要查找插件、检查包健康状况或评估 Laravel/PHP……时使用。
Frontend / UI
创业构思
startup-ideation
帮助用户生成和评估创业点子。当有人在进行商业头脑风暴、寻找创业概念、评估某个点子是否可行时使用……