搜索结果
generation
找到 13 个相关结果 / Agent skills
AI / LLM / Agent skills
AI图像生成
ai-image-generation
通过 inference.sh CLI 使用 GPT-Image-2、FLUX、Gemini、Grok、Seedream、Reve 及 50 多种模型生成 AI 图像。模型包括:GPT-Image-2、FLUX Dev LoRA、FLUX.2 Klein…
AI / LLM / Agent skills
AI视频生成
ai-video-generation
ai-video-generation — 一项面向 AI 智能体的可安装技能,由 inference-sh-skills/skills 发布。
AI / LLM / Agent skills
完整输出强制
full-output-enforcement
覆盖默认的 LLM 截断行为。强制生成完整代码,禁止占位符模式,并妥善处理 Token 限制下的代码分割。适用于任何…
AI / LLM / Agent skills
引流诱饵
lead-magnets
当用户想要创建、规划或优化用于收集邮箱或潜在客户开发的引流诱饵时使用。当用户提及“lead magnet”、“gated…
AI / LLM / Agent skills
kling-3-0
kling-3-0
在 RunComfy 上使用 Kling 3.0 生成视频。Kling 3.0(亦称 Kling V3.0)是快手科技推出的第三代多镜头视频模型,具备原生同步音频功能,且能在多镜头间保持角色一致性。本技能涵盖全部六个 Kling 3.0 端点,横跨三个渲染级别(Standard、Pro、4K)与两种模式(text-to-video、image-to-video)。通过本地 RunComfy CLI 执行命令 runcomfy run kling/kling-3.0/<tier>/<mode>。当出现“kling”、“kling 3.0”、“kling v3”、“kling pro”、“kling 4k”、“kling text to video”、“kling image to video”,或任何明确要求使用 Kling 3.0 进行生成或制作动画的指令时触发。
AI / LLM / Agent skills
baoyu-danger-gemini-web
baoyu-danger-gemini-web
通过逆向工程的 Gemini Web API 生成图像和文本。支持文本生成、基于提示词的图像生成、用于视觉输入的参考图像等……
AI / LLM / Agent skills
品牌套件
brandkit
用于创建高端品牌规范板、标志系统、标识演示文稿和视觉世界展示的高级品牌套件图像生成技能。经过训练……
AI / LLM / Agent skills
higgsfield-soul-id
higgsfield-soul-id
训练一个 Soul Character —— 基于人脸的个性化模型,Higgsfield 使用该模型进行身份保真的图像和视频生成。适用场景:“create my Soul”、“train my face”、“make my digital twin”、“build me an avatar”、“learn my appearance”、“create a character of me”、“set up identity for video”、“I want my face in generated images”。调用链:训练 Soul(一次性操作,返回 reference_id) → 在 higgsfield-generate 中通过 `--soul-id <id>` 配合 `text2image_soul_v2` 或 `soul_cinema_studio` 等模型使用。不适用于:单次人脸替换(请使用带 --image 参数的 higgsfield-generate)、具名角色/非写实头像(请使用带 prompt 参数的 higgsfield-generate)。
AI / LLM / Agent skills
higgsfield-marketplace-cards
higgsfield-marketplace-cards
通过 Higgsfield 生成电商商品主图卡片:合规主图、商品副图以及 A+ 页面内容模块。当用户要求生成电商上架图片、商品详情卡片、商品副图、产品信息图、场景展示图、A+ 页面内容、电商图片集或可直接销售的产品视觉图时使用此技能。后端维护电商合规参考与提示词模板;此技能仅将用户意图路由至 CLI。不适用于无电商/上架上下文的常规品牌产品摄影(请使用 higgsfield-product-photoshoot)、视频生成或 UGC 广告(请使用 higgsfield-generate),以及 Soul 角色训练(请使用 higgsfield-soul-id)。
AI / LLM / Agent skills
深度研究
deep-research
当用户需要包含引用追踪、证据持久化和结构化报告生成的多源研究时使用。在触发“deep research”、…时激活。
AI / LLM / Agent skills
Gemini-interactions-api
gemini-interactions-api
在编写调用 Gemini API 以实现文本生成、多轮对话、多模态理解、图像生成、流式传输等功能的代码时,请使用此技能。
AI / LLM / Agent skills
设备端基础模型
foundation-models-on-device
Apple FoundationModels 框架,用于设备端 LLM — 在 iOS 26+ 中支持文本生成、使用 @Generable 的引导式生成、工具调用以及快照流式传输。
AI / LLM / Agent skills
fal AI 媒体
fal-ai-media
通过 fal.ai MCP 统一生成媒体——图像、视频和音频。涵盖文生图(Nano Banana)、文/图生视频(Seedance、Kling、Veo 3),…