harness

找到 6 个相关结果

AI / LLM / Agent skills

eval-harness

为实施评估驱动开发（EDD）原则的 Claude Code 会话提供正式评估框架

Frontend / UI

agent-harness-construction

设计与优化 AI 智能体的动作空间、工具定义和观测格式，以提升任务完成率。

DevOps / Deployment

healthcare-eval-harness

面向医疗应用部署的患者安全评估工具。用于 CDSS 准确性、PHI 泄露、临床工作流完整性等场景的自动化测试套件，……

AI / LLM / Agent skills

autonomous-agent-harness

将 Claude Code 转化为具备持久记忆、定时任务、计算机使用和任务队列的完全自主智能体系统。替代独立……

Frontend / UI

gan-style-harness

受 GAN 启发的生成器-评估器智能体框架，用于自主构建高质量应用。基于 Anthropic 2026 年 3 月发布的框架设计论文。

AI / LLM / Agent skills

workspace-surface-audit

审计活跃仓库、MCP 服务器、插件、连接器、环境接口和测试套件配置，随后推荐最高价值的 ECC 原生技能、钩子、智能体……