搜索结果
harness
找到 6 个相关结果
AI / LLM / Agent skills
评估工具套件
eval-harness
为实施评估驱动开发(EDD)原则的 Claude Code 会话提供正式评估框架
Stars 0
uiperformancesecurityauth
Frontend / UI
Agent Harness 构建
agent-harness-construction
设计与优化 AI 智能体的动作空间、工具定义和观测格式,以提升任务完成率。
Stars 0
reactdesignuiprompt
DevOps / Deployment
医疗评估工具套件
healthcare-eval-harness
面向医疗应用部署的患者安全评估工具。用于 CDSS 准确性、PHI 泄露、临床工作流完整性等场景的自动化测试套件,……
Stars 0
uijestdeploymentsecurity
AI / LLM / Agent skills
自主智能体框架
autonomous-agent-harness
将 Claude Code 转化为具备持久记忆、定时任务、计算机使用和任务队列的完全自主智能体系统。替代独立……
Stars 0
designuitestingsecurity
Frontend / UI
gan风格线束
gan-style-harness
受 GAN 启发的生成器-评估器智能体框架,用于自主构建高质量应用。基于 Anthropic 2026 年 3 月发布的框架设计论文。
Stars 0
reactfrontenddesignui
AI / LLM / Agent skills
工作区表面审计
workspace-surface-audit
审计活跃仓库、MCP 服务器、插件、连接器、环境接口和测试套件配置,随后推荐最高价值的 ECC 原生技能、钩子、智能体……
Stars 0
designuideploymentaudit