在 Claude Code 中使用 GPT Image 2 (ChatGPT Images 2.0) 生成图像，利用现有的 ChatGPT Plus 或 Pro 订阅——无需单独的 OpenAI 访问权限，无按图计费。支持通过本地 Codex CLI 进行文生图、图像编辑、风格迁移和多参考图组合。当触发“gpt image 2”、“gpt-image-2”、“ChatGPT Images 2.0”、“image 2”，或任何明确要求通过用户的 ChatGPT 套餐生成或编辑图像的请求时激活。

Stars 0

uiuxauthapi

AI / LLM / Agent skills

图像转视频

image-to-video

44.3K

在 RunComfy 上让任何静态图像动起来——此技能是一个智能路由器，能将用户意图匹配到 RunComfy 目录中合适的 i2v 模型。常规动画选取 HappyHorse 1.0 I2V（Arena #1、原生音频、保持身份特征），带 `audio_url` 的自定义配音口型同步选取 Wan 2.7，基于“图像 + 参考视频 + 参考音频”的多模态动画选取 Seedance 2.0 Pro。内置各模型的文档化提示词模式，让调用者获得更精准的输出，避免在错误的模型上浪费迭代次数。通过本地 RunComfy CLI 调用 `runcomfy run <vendor>/<model>/image-to-video`（或其端点变体）。触发词包括“image to video”、“image-to-video”、“i2v”、“animate image”、“make this move”，或任何将静态图像转换为视频的明确请求。

Stars 0

uisecurityapirag

AI / LLM / Agent skills

seedance-v2

44.3K

在 RunComfy 上使用 ByteDance Seedance 2.0 Pro 生成电影级短视频。文档说明了 Seedance 2.0 Pro 的优势（多模态参考——最多支持 9 张图像、3 个视频和 3 个音频——同步内嵌音频与自然唇形同步、电影级动作优化）、4-15 秒的时长规范，以及何时应转用 HappyHorse 1.0 / Wan 2.7 / Kling。通过本地 RunComfy CLI 调用 `runcomfy run bytedance/seedance-v2/pro`。在触发“seedance”、“seedance 2”、“seedance v2”、“seedance pro”、“bytedance video”或明确要求使用此模型生成视频时激活。

Stars 0

uitestingsecurityapi

AI / LLM / Agent skills

flux-kontext

43.9K

在 RunComfy 上使用 Flux 1 Kontext Pro（Black Forest Labs 的精准局部图像编辑模型）编辑图像——内置该模型官方文档中的提示词模式，使该技能能获得比直接调用同一模型更出色的输出效果。文档说明了 Flux Kontext 的优势（单参考图精准局部编辑、强大的提示词控制能力、稳定的高保真输出）、其输入模式（单张图像 + 提示词），以及何时应转而使用 Nano Banana Edit / GPT Image 2 edit / Flux 2 Klein。通过本地 RunComfy CLI 调用 `runcomfy run blackforestlabs/flux-1-kontext/pro/edit`。当触发词为 "flux kontext"、"flux-kontext"、"flux 1 kontext"、"kontext"、"BFL kontext"，或任何明确要求使用此模型进行编辑的指令时激活。

Stars 0

designuiuxsecurity

AI / LLM / Agent skills

gpt-image-edit

43.9K

在 RunComfy 上使用 OpenAI GPT Image 2（ChatGPT Images 2.0 的 `/edit` 端点）编辑图像——内置该模型的文档化提示词模式，使该技能比针对同一模型的朴素提示词获得更精准的输出。记录了 GPT Image Edit 的优势（保留语言、多语言图像内文本编辑、最多支持 10 张图像的多重参考、布局/排版精度）、数据架构，以及何时应路由至 Nano Banana Edit / Flux Kontext / GPT Image 2 t2i。通过本地 RunComfy CLI 调用 `runcomfy run openai/gpt-image-2/edit`。在触发词为“gpt image edit”、“gpt-image-edit”、“chatgpt image edit”、“edit with gpt image 2”，或任何明确要求使用此模型进行编辑时触发。

Stars 0

uiuxsecurityapi

AI / LLM / Agent skills

nano-banana-edit

43.9K

在 RunComfy 上使用 Google Nano Banana 2（图生图编辑端点）编辑图像。文档说明了 Nano Banana Edit 的优势（保留主体特征、替换背景、使用空间语言进行局部编辑、支持多达 20 张输入的多图批量编辑）、数据结构，以及何时应转而使用 GPT Image 2 edit、Flux Kontext 或 Nano Banana 2 t2i。通过本地 RunComfy CLI 调用 `runcomfy run google/nano-banana-2/edit`。在触发“nano banana edit”、“edit with nano banana”、“image edit nano banana”或任何明确要求使用此模型进行编辑的指令时激活。

Stars 0

uiuxtestingsecurity

AI / LLM / Agent skills

图像编辑

image-edit

43.9K

在 RunComfy 上编辑图像——此技能是一个智能路由器，可将用户意图匹配至 RunComfy 目录中最合适的编辑模型。支持选择 Nano Banana Edit（批量处理最多 20 张，默认保持身份特征）、OpenAI GPT Image 2 Edit（多语言图像内文本重写、多参考组合、精准布局）、Flux Kontext Pro（单参考高保真局部编辑）或 Z-Image Turbo Inpaint（基于遮罩的精准区域编辑）。内置各模型官方文档的提示词模式，使该技能能获得更精准的编辑效果，避免在错误的模型上浪费迭代次数。通过本地 RunComfy CLI 调用 `runcomfy run <vendor>/<model>/edit`。触发词包括“image edit”、“edit image”、“image-to-image”、“i2i”、“swap background”、“remove object”、“rewrite headline”，或任何明确要求编辑单张或批量图像的指令。

Stars 0

uiuxsecurityapi

AI / LLM / Agent skills

flux-2-klein

43.7K

在 RunComfy 上使用 Flux 2 Klein（Black Forest Labs 推出的 Flux 2 蒸馏快速变体）生成图像——内置该模型官方文档的提示词模式，使该技能能获得比直接调用同一模型更精准的输出。详细说明了 Flux 2 Klein 的优势（亚秒级延迟、多参考品牌风格、声明式主体优先提示词）、步数策略（4-8 步用于快速迭代，约 25 步用于精修）、9B 与 4B 变体的权衡，以及何时应转用 Flux 2 Pro / Seedream 5 / GPT Image 2。通过本地 RunComfy CLI 调用 `runcomfy run blackforestlabs/flux-2-klein/9b/text-to-image`（或 `/4b/`）。在触发词为 "flux 2 klein"、"flux-2-klein"、"flux klein"、"BFL flux 2"，或任何明确要求使用此模型生成时触发。

Stars 0

uiuxsecurityapi

AI / LLM / Agent skills

nano-banana-2

43.7K

在 RunComfy 上使用 Google Nano Banana 2（Gemini 系列的 flash 级文本生成图像模型）生成图像——内置该模型官方文档中的提示词模式，使该技能能获得比直接调用同一模型更出色的输出效果。文档详细说明了 Nano Banana 2 的优势（快速迭代、图像内文字排版渲染、可预测的画面构图、可选的联网背景信息）、分辨率级别的定价、安全容忍度调节机制，以及何时应转而使用 Nano Banana Pro / GPT Image 2 / Flux 2 / Seedream。通过本地 RunComfy CLI 调用 `runcomfy run google/nano-banana-2/text-to-image`。当触发词为“nano banana”、“nano-banana-2”、“nano banana 2”、“google image gen”、“gemini image”，或明确要求使用此模型生成图像时触发。

Stars 0

uiuxtestingsecurity

AI / LLM / Agent skills

baoyu-发布到微信

baoyu-post-to-wechat

23.2K

通过 API 或 Chrome CDP 发布内容至微信公众号。支持以 HTML、Markdown 或纯文本输入发布文章（文章），以及图文…

Stars 0

uiuxsecurityauth

Cloud / Azure / Infra

baoyu-image-gen

20.6K

[已弃用：请使用 baoyu-imagine] 使用 OpenAI、Azure OpenAI、Google、OpenRouter、DashScope、Z.AI GLM-Image、MiniMax、即梦、Seedream 等进行 AI 图像生成…

Stars 0

uideploymentauthapi

AI / LLM / Agent skills

kling-3-0

20.4K

在 RunComfy 上使用 Kling 3.0 生成视频。Kling 3.0（亦称 Kling V3.0）是快手科技推出的第三代多镜头视频模型，具备原生同步音频功能，且能在多镜头间保持角色一致性。本技能涵盖全部六个 Kling 3.0 端点，横跨三个渲染级别（Standard、Pro、4K）与两种模式（text-to-video、image-to-video）。通过本地 RunComfy CLI 执行命令 runcomfy run kling/kling-3.0/<tier>/<mode>。当出现“kling”、“kling 3.0”、“kling v3”、“kling pro”、“kling 4k”、“kling text to video”、“kling image to video”，或任何明确要求使用 Kling 3.0 进行生成或制作动画的指令时触发。

Stars 0

uitestingsecurityapi

AI / LLM / Agent skills