搜索结果
text
找到 50 个相关结果 / AI / LLM
AI / LLM / Agent skills
baoyu-danger-gemini-web
baoyu-danger-gemini-web
通过逆向工程的 Gemini Web API 生成图像和文本。支持文本生成、基于提示词的图像生成、用于视觉输入的参考图像等……
AI / LLM / Agent skills
中文拟人化工具
humanizer-zh
去除文本中的 AI 生成痕迹。适用于编辑或审阅文本,使其听起来更自然、更像人类书写。基于维基百科的“AI 写作特征”综合指南。检测并修复以下模式:夸大的象征意义、宣传性语言、以 -ing 结尾的肤浅分析、模糊的归因、破折号过度使用、三段式法则、AI 词汇、否定式排比、过多的连接性短语。
AI / LLM / Agent skills
baoyu-format-markdown
baoyu-format-markdown
格式化纯文本或 Markdown 文件,支持 frontmatter、标题、摘要、章节标题、粗体、列表和代码块。当用户要求“格式化 Markdown”时使用,……
AI / LLM / Agent skills
cavecrew
cavecrew
委派给原始风格子代理的决策指南。指导主线程何时生成 `cavecrew-investigator`(定位代码)、`cavecrew-builder`(1-2 个文件编辑)或 `cavecrew-reviewer`(差异审查),而不是在主线程内联执行工作或使用原生的 `Explore`。子代理的输出经过原始压缩,因此注入回主上下文的工具结果体积缩小了约 60%——在长会话中主上下文能维持更久。触发词:"delegate to subagent"、"use cavecrew"、"spawn investigator/builder/reviewer"、"save context"、"compressed agent output"。
AI / LLM / Agent skills
安全需求提取
security-requirement-extraction
从威胁模型和业务上下文中推导安全需求。在将威胁转化为可执行的需求、创建安全用户……时使用。
AI / LLM / Agent skills
gemini-api-dev
gemini-api-dev
在使用 Gemini API 托管的模型(包括 Gemini 和 Gemma 4)构建应用程序,以及处理多模态内容(文本、图像、音频等)时,请使用此技能……
AI / LLM / Agent skills
higgsfield-产品拍摄
higgsfield-product-photoshoot
通过 Higgsfield 的 product-photoshop 提示词增强功能,在 GPT Image 2 / gpt_image_2 上生成品牌级产品图像。专业品牌/产品视觉的入口。适用场景:“产品照片”、“影棚照”、“生活方式图”、“Pinterest Pin”、“主图/Banner”、“轮播图”、“广告创意”、“Meta 广告”、“虚拟试穿”、“模特展示”、“人物手持产品”、“手部特写”、“悬浮/漂浮/水花飞溅产品”、“CGI/超现实产品”、“风格重绘”、“季节/美学变体”,或任何产品、品牌及付费社交媒体创意。模式:product_shot、lifestyle_scene、closeup_product_with_person、moodboard_pin、hero_banner、social_carousel、ad_creative_pack、virtual_model_tryout、conceptual_product、restyle。后端会组装最终提示词;切勿手动自由编写。不适用于:无产品的文本生成图像(请使用 higgsfield-generate)、品牌化身视频(请使用 higgsfield-generate Marketing Studio)、电商商品列表卡片(请使用 higgsfield-marketplace-cards)、Soul Character 训练(请使用 higgsfield-soul-id)。
AI / LLM / Agent skills
higgsfield-soul-id
higgsfield-soul-id
训练一个 Soul Character —— 基于人脸的个性化模型,Higgsfield 使用该模型进行身份保真的图像和视频生成。适用场景:“create my Soul”、“train my face”、“make my digital twin”、“build me an avatar”、“learn my appearance”、“create a character of me”、“set up identity for video”、“I want my face in generated images”。调用链:训练 Soul(一次性操作,返回 reference_id) → 在 higgsfield-generate 中通过 `--soul-id <id>` 配合 `text2image_soul_v2` 或 `soul_cinema_studio` 等模型使用。不适用于:单次人脸替换(请使用带 --image 参数的 higgsfield-generate)、具名角色/非写实头像(请使用带 prompt 参数的 higgsfield-generate)。
AI / LLM / Agent skills
higgsfield-marketplace-cards
higgsfield-marketplace-cards
通过 Higgsfield 生成电商商品主图卡片:合规主图、商品副图以及 A+ 页面内容模块。当用户要求生成电商上架图片、商品详情卡片、商品副图、产品信息图、场景展示图、A+ 页面内容、电商图片集或可直接销售的产品视觉图时使用此技能。后端维护电商合规参考与提示词模板;此技能仅将用户意图路由至 CLI。不适用于无电商/上架上下文的常规品牌产品摄影(请使用 higgsfield-product-photoshoot)、视频生成或 UGC 广告(请使用 higgsfield-generate),以及 Soul 角色训练(请使用 higgsfield-soul-id)。
AI / LLM / Agent skills
firecrawl-解析
firecrawl-parse
高效提取并转换任何本地文件(如 PDF、DOCX、DOC、ODT、RTF、XLSX、XLS 或 HTML)的内容,将其保存为格式整洁的 Markdown 文件并写入磁盘。当用户请求解析、读取或提取其计算机上文件的信息时,请使用此技能,包括“解析此 PDF”、“转换此文档”、“读取此文件”、“从中提取文本”等表述,或者在提供了本地文件路径(非 URL)的情况下。此技能提供高级选项,例如生成 AI 驱动的摘要以及基于文件内容回答问题。在处理本地文件时,优先使用此工具而非 `scrape`,以便为下游任务提供精确且结构化的输出。
AI / LLM / Agent skills
此时此地
here-now
here.now 让智能体能够发布网站并在云盘中存储私有文件。使用 Sites 将 HTML、文档、图像、PDF、视频和静态文件发布至 {slug}.here.now 或自定义域名的在线 URL。使用 Drives 作为私有云文件夹,智能体可在其中存储文件(文档、上下文、记忆、计划、资产、媒体、研究、代码等),与其他智能体共享文件,并能在跨会话和工具间保持连续性。当遇到要求“发布这个”、“托管这个”、“部署这个”、“在网络上分享这个”、“制作一个网站”、“把这个放到网上”、“创建一个网页”、“生成一个 URL”、“构建一个聊天机器人”、“把这个保存到我的 Drive”、“存储这个以备后用”、“把这个写入云存储”、“与另一个智能体共享文件夹”或“使用我的 here.now Drive”时,请使用此工具。
AI / LLM / Agent skills
gpt-image-2
gpt-image-2
在 RunComfy 上使用 OpenAI GPT Image 2 (ChatGPT Images 2.0) 生成和编辑图像。文档涵盖了 GPT Image 2 的优势(文本嵌入、Logo、多语言排版、指令精准度)、其 3 种固定尺寸、保留内容的编辑语言,以及何时应转交同级模型(Flux 2 / Nano Banana Pro / Seedream)处理。通过本地 RunComfy CLI 调用 `runcomfy run openai/gpt-image-2/text-to-image` 或 `/edit`。触发词为“gpt image 2”、“gpt-image-2”、“ChatGPT Images 2”、“image 2”,或任何明确要求使用此模型进行生成或编辑的指令。
AI / LLM / Agent skills
迭代检索
iterative-retrieval
用于逐步优化上下文检索以解决子代理上下文问题的模式
AI / LLM / Agent skills
正则表达式与LLM处理结构化文本
regex-vs-llm-structured-text
解析结构化文本时在正则表达式与 LLM 之间进行选择的决策框架——优先使用正则表达式,仅在处理低置信度的边缘情况时引入 LLM。
AI / LLM / Agent skills
Gemini-interactions-api
gemini-interactions-api
在编写调用 Gemini API 以实现文本生成、多轮对话、多模态理解、图像生成、流式传输等功能的代码时,请使用此技能。
AI / LLM / Agent skills
设备端基础模型
foundation-models-on-device
Apple FoundationModels 框架,用于设备端 LLM — 在 iOS 26+ 中支持文本生成、使用 @Generable 的引导式生成、工具调用以及快照流式传输。
AI / LLM / Agent skills
蓝图
blueprint
将单行目标转化为多会话、多智能体工程项目的分步构建计划。每个步骤均包含独立的上下文摘要,以便全新智能体能够直接从零开始执行。包含对抗性审查关卡、依赖关系图、并行步骤检测、反模式目录以及计划变更协议。触发条件:用户为复杂的多PR任务请求计划、蓝图或路线图,或描述需要多个会话才能完成的工作。不触发条件:任务可在单个PR或不足3次工具调用内完成,或用户表示“直接做”。
AI / LLM / Agent skills
fal AI 媒体
fal-ai-media
通过 fal.ai MCP 统一生成媒体——图像、视频和音频。涵盖文生图(Nano Banana)、文/图生视频(Seedance、Kling、Veo 3),…
AI / LLM / Agent skills
上下文预算
context-budget
审计 Claude Code 在代理、技能、MCP 服务器和规则中的上下文窗口消耗情况。识别冗余膨胀与冗余组件,并生成优先级排序的……
AI / LLM / Agent skills
文档与架构决策记录 (ADR)
documentation-and-adrs
记录决策与文档。适用于做出架构决策、更改公共 API、发布功能,或需要记录相关上下文……