灵感菇

AI 技能的自然生态,你的一句话,蔓延出无限连接。

搜索结果

ing

找到 91 个相关结果 / 后端与 API

内容创作 / 生成

图像转视频

image-to-video

78.9K

在 RunComfy 上让任何静态图像动起来——此技能是一个智能路由器,能将用户意图匹配到 RunComfy 目录中合适的 i2v 模型。常规动画选取 HappyHorse 1.0 I2V(Arena #1、原生音频、保持身份特征),带 `audio_url` 的自定义配音口型同步选取 Wan 2.7,基于“图像 + 参考视频 + 参考音频”的多模态动画选取 Seedance 2.0 Pro。内置各模型的文档化提示词模式,让调用者获得更精准的输出,避免在错误的模型上浪费迭代次数。通过本地 RunComfy CLI 调用 `runcomfy run <vendor>/<model>/image-to-video`(或其端点变体)。触发词包括“image to video”、“image-to-video”、“i2v”、“animate image”、“make this move”,或任何将静态图像转换为视频的明确请求。

Stars 3
promptagentagentsgithub

内容创作 / 生成

seedance-v2

seedance-v2

78.6K

在 RunComfy 上使用 ByteDance Seedance 2.0 Pro 生成电影级短视频。文档说明了 Seedance 2.0 Pro 的优势(多模态参考——最多支持 9 张图像、3 个视频和 3 个音频——同步内嵌音频与自然唇形同步、电影级动作优化)、4-15 秒的时长规范,以及何时应转用 HappyHorse 1.0 / Wan 2.7 / Kling。通过本地 RunComfy CLI 调用 `runcomfy run bytedance/seedance-v2/pro`。在触发“seedance”、“seedance 2”、“seedance v2”、“seedance pro”、“bytedance video”或明确要求使用此模型生成视频时激活。

Stars 3
apiagentagentsgithub

内容创作 / 生成

kling-3-0

kling-3-0

55.4K

在 RunComfy 上使用 Kling 3.0 生成视频。Kling 3.0(亦称 Kling V3.0)是快手科技推出的第三代多镜头视频模型,具备原生同步音频功能,且能在多镜头间保持角色一致性。本技能涵盖全部六个 Kling 3.0 端点,横跨三个渲染级别(Standard、Pro、4K)与两种模式(text-to-video、image-to-video)。通过本地 RunComfy CLI 执行命令 runcomfy run kling/kling-3.0/<tier>/<mode>。当出现“kling”、“kling 3.0”、“kling v3”、“kling pro”、“kling 4k”、“kling text to video”、“kling image to video”,或任何明确要求使用 Kling 3.0 进行生成或制作动画的指令时触发。

Stars 3
promptagentagentsgithub

内容创作 / 生成

baoyu-发布到微信

baoyu-post-to-wechat

24.2K

通过 API 或 Chrome CDP 发布内容至微信公众号。支持以 HTML、Markdown 或纯文本输入发布文章(文章),以及图文…

Stars 18,427
uiauthapiprompt

内容创作 / 生成

runcomfy-cli

runcomfy-cli

23.1K

通过命令行在 RunComfy 上运行任意模型。`runcomfy` CLI 是一个二进制文件、一次认证、数百个模型端点 —— 图像生成、图像编辑、视频生成、图生视频、唇形同步、换脸、视频编辑、局部重绘、外扩、扩展、ControlNet、重新打光、超分辨率、LoRA 训练等。提交请求、轮询状态、下载输出。本技能教授智能体如何安装、认证、发现模型 schema、调用模型、流式/轮询/无等待模式、JSON 输出模式脚本编写以及错误处理。触发词包括 "runcomfy cli"、"install runcomfy"、"runcomfy login"、"runcomfy run"、"runcomfy whoami"、"runcomfy api",或任何明确要求从脚本或终端调用 RunComfy 模型的请求。同级技能(ai-image-generation、ai-video-generation、image-edit、video-edit、face-swap、lipsync、image-to-video、image-inpainting、image-outpainting、video-extend、controlnet-pose、relight)均通过此 CLI 进行调度。

Stars 3
uiauthapiagent

内容创作 / 生成

AI视频生成

ai-video-generation

22.0K

ai-video-generation — 一个可安装的 AI 智能体技能,由 agentspace-so/runcomfy-agent-skills 发布。

Stars 3
promptagentagentsvideo

内容创作 / 生成

baoyu-cover-image

baoyu-cover-image

21.2K

结合 11 种调色板和 7 种渲染风格,通过 5 个维度(类型、调色板、渲染、文本、氛围)生成文章封面图。支持电影级……

Stars 18,427
backenduipromptagent

内容创作 / 生成

lipsync

lipsync

20.6K

Lip-sync a face to a specific audio track on RunComfy via the `runcomfy` CLI. Routes across ByteDance OmniHuman (audio-driven full-body avatar from a portrait + audio), Sync Labs sync v2 / Pro (state-of-the-art mouth sync onto a video), Kling lipsync (audio-to- video and text-to-video with synced speech), and Creatify lipsync. The skill picks the right endpoint for the user's actual intent — portrait still + audio (avatar-style), source video + audio (mouth- swap on existing footage), or generate-and-sync from a script. Triggers on "lip sync", "lipsync", "make this video speak", "match audio to mouth", "dub video", "sync lips to voice", "Sync Labs", "voiceover sync", or any explicit ask to drive a face's mouth from an audio track.

Stars 3
promptagentagentslipsync

内容创作 / 生成

controlnet-pose

controlnet-pose

19.9K

Pose-conditioned generation on RunComfy via the `runcomfy` CLI. Routes across Kling 2-6 Motion Control Pro / Standard (transfer the motion / blocking of a reference video onto a target character), community Wan 2-2 Animate (audio-driven character animation with pose conditioning), and Z-Image Turbo ControlNet LoRA (pose-conditioned image generation from an OpenPose / DWPose / canny / depth control image). Picks the right route based on video vs still and stylized vs photoreal. Triggers on "controlnet", "control net", "pose control", "openpose", "DWPose", "transfer pose", "motion control", "pose driven", "character pose", "depth control", "canny edge", "use this pose", or any explicit ask to condition generation on a pose / skeleton / motion / depth / canny reference.

Stars 3
uiapiagentagents

内容创作 / 生成

image-outpainting

image-outpainting

19.3K

Image outpainting on RunComfy via the `runcomfy` CLI — extend a still beyond its original canvas, fill in what the camera didn't capture, change aspect ratio (square → 16:9, portrait → landscape) while preserving the original content. Routes across Nano Banana 2 Edit (default, spatial-language driven), GPT Image 2 Edit (multi-ref with reference-style matching), FLUX Kontext Pro (single-shot maximum-preservation), and the brand edit endpoints (Seedream / Dreamina / Qwen / FLUX 2). Picks the right route based on whether the outpaint is prose-driven, reference-driven, or brand-locked. Triggers on "outpaint", "outpainting", "extend image canvas", "expand the image", "fill in around the photo", "uncrop", "change aspect ratio", "extend frame", "wide-screen from square", or any explicit ask to add canvas around an existing still.

Stars 3
uxagentagentsimage

内容创作 / 生成

hyperframes-media

hyperframes-media

18.4K

HyperFrames 合成的资产预处理——文本转语音旁白(Kokoro)、音视频转录(Whisper)以及背景移除,用于……

Stars 18,469
apihyperframesmediaasset

内容创作 / 生成

higgsfield-产品拍摄

higgsfield-product-photoshoot

16.1K

通过 Higgsfield 的 product-photoshop 提示词增强功能,在 GPT Image 2 / gpt_image_2 上生成品牌级产品图像。专业品牌/产品视觉的入口。适用场景:“产品照片”、“影棚照”、“生活方式图”、“Pinterest Pin”、“主图/Banner”、“轮播图”、“广告创意”、“Meta 广告”、“虚拟试穿”、“模特展示”、“人物手持产品”、“手部特写”、“悬浮/漂浮/水花飞溅产品”、“CGI/超现实产品”、“风格重绘”、“季节/美学变体”,或任何产品、品牌及付费社交媒体创意。模式:product_shot、lifestyle_scene、closeup_product_with_person、moodboard_pin、hero_banner、social_carousel、ad_creative_pack、virtual_model_tryout、conceptual_product、restyle。后端会组装最终提示词;切勿手动自由编写。不适用于:无产品的文本生成图像(请使用 higgsfield-generate)、品牌化身视频(请使用 higgsfield-generate Marketing Studio)、电商商品列表卡片(请使用 higgsfield-marketplace-cards)、Soul Character 训练(请使用 higgsfield-soul-id)。

Stars 268
backenduxauthprompt

内容创作 / 生成

meme-factory

meme-factory

3.6K

Generate memes using the memegen.link API. Use when users request memes, want to add humor to content, or need visual aids for social media. Supports 100+…

Stars 1,815
uiapiagentmeme

内容创作 / 生成

技术文档工程师

technical-writer

2.9K

为开发者和用户编写清晰的文档、API 参考、指南和技术内容。适用场景:撰写文档、创建 README 文件、记录 API、编写教程、制作用户指南,或当用户提及文档、技术写作,以及需要清晰解释技术概念时。

Stars 110,515
designuiapillm

内容创作 / 生成

fal AI 媒体

fal-ai-media

2.8K

通过 fal.ai MCP 统一生成媒体——图像、视频和音频。涵盖文生图(Nano Banana)、文/图生视频(Seedance、Kling、Veo 3),…

Stars 0
uiapipromptworkflow

内容创作 / 生成

hot-topics

hot-topics

1.4K

获取微博、知乎、百度、抖音、今日头条、B站等主流中文平台的实时热搜榜单和热门话题。Use when users want to know trending topics, hot searches, or popular content on Chinese social media platforms.

Stars 34
agentagentsmonitoringhot

内容创作 / 生成

Twitter 阅读器

twitter-reader

1.3K

获取 Twitter/X 帖子内容,包括长篇文章、完整图像和元数据。当 Claude 需要检索推文/文章内容、作者信息……时使用。

Stars 0
uiauthapiworkflow

内容创作 / 生成

代理现金

agentcash

1.1K

按次付费 x402/MPP API(支持 Base 链 USDC、Solana、Tempo)。无需 API 密钥——钱包按请求扣费。如果任务与下方列出的 SERVICES 来源匹配,请跳过搜索,直接执行 discover → fetch。仅在没有列出的来源匹配时才进行搜索。SERVICES:stableenrich(人员/公司、网页搜索、抓取、地图、LinkedIn、邮箱验证、新闻)、stablesocial(TikTok、Instagram、Facebook、Reddit、LinkedIn)、stablestudio(AI 图像/视频)、stableupload(文件/网站托管)、stableemail(电子邮件、收件箱、子域名)、stablephone(AI 通话、电话号码)、stablejobs(工作)、stabletravel(旅行)、stablebrowser(浏览器自动化)。TRIGGERS:研究、信息丰富、抓取、搜索网页、生成图像、视频、社交媒体、发送电子邮件、打电话、旅行、工作、查找联系人、查找 API、x402、mpp、agentcash

Stars 0
uiauthapiagent

内容创作 / 生成

Naver 博客研究

naver-blog-research

1.1K

仅使用 python3 标准库搜索 Naver 博客、读取完整文章内容并下载图片——无需 API 密钥。

Stars 0
uiauthapiworkflow

内容创作 / 生成

opencli-rs

opencli-rs

1.0K

Use opencli-rs CLI to interact with social/content websites (HackerNews, DevTo, Lobsters, StackOverflow, Steam, Linux-do, Arxiv, Wikipedia, Apple-Podcasts, Xiaoyuzhou, BBC, Hugging Face, SinaFinance, Google, V2EX, Bloomberg, Twitter/X, Bilibili, Reddit, Zhihu, Xiaohongshu, Xueqiu, Weibo, Douban, WeRead, YouTube, Medium, Substack, SinaBlog, BOSS直聘, Jike, Facebook, Instagram, TikTok, Yollomi, Yahoo-Finance, Barchart, LinkedIn, Reuters, SMZDM, Ctrip, Coupang, Grok, Jimeng, Chaoxing, Weixin, Doubao, Cursor, Codex, ChatWise, ChatGPT, Doubao-App, Notion, Discord, Antigravity etc.) via the user's Chrome login session. ALWAYS prefer opencli-rs over playwright/browser automation for these supported sites. Triggers: user asks to browse, search, or fetch hot/trending content from internet, post, or read messages on any web site;

Stars 830
uxplaywrightgithubopencli

1 / 5

上一页下一页