endpoint

找到 6 个相关结果 / Agent skills

AI / LLM / Agent skills

图像转视频

image-to-video

在 RunComfy 上让任何静态图像动起来——此技能是一个智能路由器，能将用户意图匹配到 RunComfy 目录中合适的 i2v 模型。常规动画选取 HappyHorse 1.0 I2V（Arena #1、原生音频、保持身份特征），带 `audio_url` 的自定义配音口型同步选取 Wan 2.7，基于“图像 + 参考视频 + 参考音频”的多模态动画选取 Seedance 2.0 Pro。内置各模型的文档化提示词模式，让调用者获得更精准的输出，避免在错误的模型上浪费迭代次数。通过本地 RunComfy CLI 调用 `runcomfy run <vendor>/<model>/image-to-video`（或其端点变体）。触发词包括“image to video”、“image-to-video”、“i2v”、“animate image”、“make this move”，或任何将静态图像转换为视频的明确请求。

Stars 0

uisecurityapirag

AI / LLM / Agent skills

视频编辑

video-edit

44.1K

在 RunComfy 上编辑现有视频 — 此技能是一个智能路由器，可将用户意图匹配到 RunComfy 目录中合适的编辑模型。支持选择 Wan 2.7 Edit-Video（通用风格重绘 / 背景替换 / 包装替换，保留身份特征与运动轨迹）、Kling 2.6 Pro Motion Control（将参考视频中的精确动作迁移至目标角色），或 Lucy Edit Restyle（轻量级且身份特征稳定的风格重绘 / 服装替换）。内置各模型文档化的提示词模式，使该技能能获得更精准的编辑效果，避免在错误的模型上浪费迭代次数。通过本地 RunComfy CLI 调用 `runcomfy run <vendor>/<model>/<endpoint>`。触发词包括：“video edit”、“edit video”、“restyle video”、“swap video background”、“motion control”、“outfit swap video”，或任何明确要求转换视频的指令。

Stars 0

designuisecurityapi

AI / LLM / Agent skills

gpt-image-edit

43.9K

在 RunComfy 上使用 OpenAI GPT Image 2（ChatGPT Images 2.0 的 `/edit` 端点）编辑图像——内置该模型的文档化提示词模式，使该技能比针对同一模型的朴素提示词获得更精准的输出。记录了 GPT Image Edit 的优势（保留语言、多语言图像内文本编辑、最多支持 10 张图像的多重参考、布局/排版精度）、数据架构，以及何时应路由至 Nano Banana Edit / Flux Kontext / GPT Image 2 t2i。通过本地 RunComfy CLI 调用 `runcomfy run openai/gpt-image-2/edit`。在触发词为“gpt image edit”、“gpt-image-edit”、“chatgpt image edit”、“edit with gpt image 2”，或任何明确要求使用此模型进行编辑时触发。

Stars 0

uiuxsecurityapi

AI / LLM / Agent skills

nano-banana-edit

43.9K

在 RunComfy 上使用 Google Nano Banana 2（图生图编辑端点）编辑图像。文档说明了 Nano Banana Edit 的优势（保留主体特征、替换背景、使用空间语言进行局部编辑、支持多达 20 张输入的多图批量编辑）、数据结构，以及何时应转而使用 GPT Image 2 edit、Flux Kontext 或 Nano Banana 2 t2i。通过本地 RunComfy CLI 调用 `runcomfy run google/nano-banana-2/edit`。在触发“nano banana edit”、“edit with nano banana”、“image edit nano banana”或任何明确要求使用此模型进行编辑的指令时激活。

Stars 0

uiuxtestingsecurity

AI / LLM / Agent skills

Notion API

notion-api

24.3K

此技能提供了通过 REST 调用与 Notion API 交互的全面指南。每当用户要求与 Notion 交互时，均应使用此技能，包括读取、创建、更新或删除页面、数据库、块、注释或任何其他 Notion 内容。该技能涵盖了身份验证、所有可用端点、分页、错误处理和最佳实践。

Stars 0

uiperformanceauthapi

AI / LLM / Agent skills

kling-3-0

20.4K

在 RunComfy 上使用 Kling 3.0 生成视频。Kling 3.0（亦称 Kling V3.0）是快手科技推出的第三代多镜头视频模型，具备原生同步音频功能，且能在多镜头间保持角色一致性。本技能涵盖全部六个 Kling 3.0 端点，横跨三个渲染级别（Standard、Pro、4K）与两种模式（text-to-video、image-to-video）。通过本地 RunComfy CLI 执行命令 runcomfy run kling/kling-3.0/<tier>/<mode>。当出现“kling”、“kling 3.0”、“kling v3”、“kling pro”、“kling 4k”、“kling text to video”、“kling image to video”，或任何明确要求使用 Kling 3.0 进行生成或制作动画的指令时触发。

Stars 0

uitestingsecurityapi