名称: image-cog
描述: 由 CellCog 驱动的 AI 图像生成。创建图像、编辑照片、生成一致的角色、产品摄影、基于参考的图像、图像集、风格迁移。使用 AI 进行专业图像创作。
元数据:
openclaw:
emoji: "🎨"
作者: CellCog
dependencies: [cellcog]
使用 AI 创建专业图像——从单张图像到一致的角色集,再到产品摄影。
此技能需要 cellcog 技能来完成 SDK 设置和 API 调用。
clawhub install cellcog
请先阅读 cellcog 技能以完成 SDK 设置。本技能将向您展示可实现的功能。
快速使用模式 (v1.0+):
# 即发即弃 - 立即返回
result = client.create_chat(
prompt="[您的图像请求]",
notify_session_key="agent:main:main",
task_label="image-task",
chat_mode="agent" # 简单图像使用 "agent",复杂任务使用 "agent team"
)
# 守护进程完成后会通知您 - 请勿轮询
根据文本描述生成任意图像:
- 场景:"清晨阳光透过窗户洒入的舒适咖啡馆室内"
- 肖像:"身着商务装、充满自信女性的专业头像"
- 产品:"大理石表面上白色运动鞋的极简主义产品特写"
- 抽象:"海军蓝与金色的几何抽象艺术"
- 自然:"日出时分,薄雾笼罩的山景中有一位孤独的徒步者"
对现有图像进行转换:
- 风格迁移:"将这张照片转换成水彩画风格"
- 背景移除:"移除背景并置于干净的白色背景上"
- 增强:"增强色彩并添加戏剧性灯光"
- 修改:"将人物的服装换成红色连衣裙"
创建同一角色在不同场景下的多张图像:
- 角色系列:"创建一个科技创业者角色,然后展示他们:1) 在办公桌前编程,2) 向投资者演示,3) 庆祝产品发布"
- 吉祥物变体:"设计一个友好的机器人吉祥物,然后为以下场景创建版本:欢迎页、错误页、成功消息、加载屏幕"
- 故事序列:"创建一个主角,然后描绘他们旅程中的 5 个场景"
此功能适用于:
- 漫画和故事板
- 具有一致角色的营销活动
- 视频帧生成
- 跨场景的品牌吉祥物
专业的视觉产品展示:
- 主视觉图:"渐变背景上智能手表的产品主视觉图"
- 生活场景图:"现代客厅中,一个人正在使用智能手机"
- 平铺图:"带有植物元素的护肤品平铺图"
- 360 度视图:"皮革手提包的多角度图——正面、侧面、背面、细节"
为活动或系列创建多张风格统一的图像:
- 社交媒体集:"健身品牌的 5 张 Instagram 帖子图片——风格一致,内容多样"
- 网站主图:"SaaS 落地页的 3 张主图——专业、现代、聚焦科技"
- 广告变体:"具有不同背景和氛围的 4 个产品广告版本"
- 博客插图:"关于生产力技巧的博客文章的 6 张插图集"
使用现有图像作为风格、角色或构图的参考:
- 风格匹配:"以这张参考图的艺术风格创建一张新图像"
- 角色一致性:"以此人物为参考,创建一个他们徒步的新场景"
- 品牌对齐:"创建与此品牌视觉风格匹配的产品图像"
- 构图参考:"创建构图相似但主题不同的图像"
| 方面 | 选项 |
|---|---|
| 宽高比 | 1:1 (正方形), 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 21:9 |
| 尺寸 | 1K (~1024px), 2K (~2048px), 4K (~4096px) |
| 风格 | 照片级真实感、插画、水彩、油画、动漫、数字艺术、矢量 |
| 格式 | PNG (默认) |
尺寸建议:
- 1K:快速迭代、缩略图、社交媒体帖子、草稿
- 2K:标准网页内容、演示文稿、营销材料
- 4K:主视觉图、印刷材料、细节至关重要的最终交付物
对于图像生成,以下情况建议使用 chat_mode="agent team":
- 需要多个元素的复杂场景
- 一致的角色系列
- 需要分析的基于参考的生成
- 相关图像集
对于简单的单张图像,chat_mode="agent" 可能更快。
专业头像:
"创建一位 30 多岁、友好的亚洲女性的专业头像,身着海军蓝西装外套,柔和影棚灯光,中性灰色背景,自信且平易近人的表情。1:1 正方形,2K 质量,照片级真实感。"
产品摄影:
"高级无线耳机充电盒的产品特写,哑光黑色表面,置于带有微妙蓝色氛围光的反光深色表面上。极简主义、高端科技美学。4:3 横向,4K 用于主视觉图。"
一致的角色集:
"创建一个角色:年轻的非裔男性软件开发人员,休闲风格戴眼镜,友好亲切。然后创建 4 张图像:
1. 在站立式办公桌前工作,有多台显示器
2. 在视频会议中,正在解释某事
3. 在咖啡馆用笔记本电脑,思考中
4. 与团队庆祝,击掌
确保所有图像中的角色完全一致。"
社交媒体集:
"为一家植物性膳食配送服务创建 5 张 Instagram 帖子:
1. 俯视的彩色佛陀碗
2. 开心的人正在拆开配送包裹
3. 整齐排列的餐盒
4. 新鲜食材的特写
5. 从食材到成品的制作前后对比
风格:明亮、清新、开胃、一致的暖色调调色。1:1 正方形格式。"
风格迁移:
"将这张上传的城市街道照片转换成吉卜力工作室风格的动漫插画。保持构图和元素,但应用吉卜力特有的温暖感、柔和的云朵和奇思妙想的细节。"