名称: vgl
描述: 对 AI 图像生成实现最大程度的控制——编写结构化的 VGL(视觉生成语言)JSON,明确控制每个视觉属性。将精确的对象摆放、光照方向、相机角度、镜头焦距、构图、配色方案和艺术风格定义为确定性的 JSON,而非模糊的自然语言。当您需要可复现的图像生成、对场景构图的精确控制,或将自然语言图像请求转换为 Bria FIBO 模型的结构化 JSON 模式时,请使用此技能。触发条件:请求结构化提示词、可控生成、VGL JSON、确定性图像描述或 Bria/FIBO 的 structured_prompt 格式。
许可证: MIT
元数据:
author: Bria AI
version: "1.2.1"
将每个视觉属性定义为结构化 JSON,而非寄希望于自然语言能准确传达。VGL(视觉生成语言)为您提供对 Bria FIBO 模型的对象、光照、相机设置、构图和风格的明确、确定性控制。
相关技能:使用 bria-ai 通过 Bria API 执行这些 VGL 提示词。VGL 定义了结构化控制格式;bria-ai 则负责生成、编辑和背景移除。
VGL 用确定性的 JSON 取代模糊的自然语言提示词,明确声明每个视觉属性:对象、光照、相机设置、构图和风格。这确保了图像生成的可复现性和可控性。
| 模式 | 输入 | 输出 | 使用场景 |
|---|---|---|---|
| 生成 | 文本提示词 | VGL JSON | 根据描述创建新图像 |
| 编辑 | 图像 + 指令 | VGL JSON | 修改参考图像 |
| 带遮罩编辑 | 带遮罩的图像 + 指令 | VGL JSON | 填充灰色遮罩区域 |
| 描述 | 仅图像 | VGL JSON | 描述现有图像 |
| 优化 | 现有 JSON + 编辑指令 | 更新后的 VGL JSON | 修改现有提示词 |
输出一个包含以下必需键的单一有效 JSON 对象:
short_description (字符串)图像内容的简洁摘要,最多 200 词。包含关键主体、动作、场景和氛围。
objects (数组,最多 5 项)每个对象需要:
{
"description": "详细描述,最多 100 词",
"location": "中心 | 左上 | 右下前景 | 等",
"relative_size": "小 | 中 | 大 (在画面内)",
"shape_and_color": "基本形状和主色调",
"texture": "光滑 | 粗糙 | 金属 | 毛茸茸 | 织物 | 等",
"appearance_details": "显著的视觉细节",
"relationship": "与其他对象的关系",
"orientation": "直立 | 倾斜 45 度 | 面向左 | 水平 | 等"
}
人物主体 需额外添加:
{
"pose": "身体姿态描述",
"expression": "眨眼 | 喜悦 | 严肃 | 惊讶 | 平静",
"clothing": "着装描述",
"action": "人物正在做什么",
"gender": "性别描述",
"skin_tone_and_texture": "皮肤外观"
}
对象群组 需额外添加:
{
"number_of_objects": 3
}
尺寸指引:如果人物是主体,使用 "中等至大" 或 "大 (在画面内)"。
background_setting (字符串)整体环境、场景以及未包含在 objects 中的背景元素。
lighting (对象){
"conditions": "明亮的日光 | 昏暗的室内 | 影棚灯光 | 黄金时刻 | 蓝色时刻 | 阴天",
"direction": "正面光 | 逆光 | 左侧光 | 顶光",
"shadows": "长而柔和的阴影 | 锐利清晰的阴影 | 极少的阴影"
}
aesthetics (对象){
"composition": "三分法 | 对称 | 居中 | 引导线 | 中景 | 特写",
"color_scheme": "单色蓝 | 暖色互补 | 高对比度 | 柔和色",
"mood_atmosphere": "宁静 | 充满活力 | 神秘 | 欢乐 | 戏剧性 | 平和"
}
对于人物作为主体的情况,在构图中指定镜头类型:"中景"、"特写"、"人像构图"。
photographic_characteristics (对象){
"depth_of_field": "浅景深 | 深景深 | 背景虚化",
"focus": "主体清晰对焦 | 柔焦 | 运动模糊",
"camera_angle": "平视 | 低角度 | 高角度 | 荷兰角 | 鸟瞰",
"lens_focal_length": "广角 | 50mm 标准 | 85mm 人像 | 长焦 | 微距"
}
对于人物:优先使用 "标准镜头 (35mm-50mm)" 或 "人像镜头 (50mm-85mm)"。除非特别指定,否则避免使用广角。
style_medium (字符串)"照片" | "油画" | "水彩画" | "3D 渲染" | "数字插画" | "铅笔素描"
除非明确要求,否则默认为 "照片"。
artistic_style (字符串)如果不是照片,用最多 3 个词描述特征:"印象派,鲜艳,有纹理"
对于照片,使用 "写实" 或类似描述。
context (字符串)描述图像类型/用途:
- "用于杂志跨页的高级时尚编辑照片"
- "奇幻视频游戏的概念艺术"
- "用于电子商务的商业产品摄影"
text_render (数组)默认:空数组 []
仅在用户明确提供确切文本内容时填充:
{
"text": "来自用户的精确文本(切勿使用占位符)",
"location": "中心 | 左上 | 底部",
"size": "小 | 中 | 大",
"color": "白色 | 红色 | 蓝色",
"font": "衬线字体 | 无衬线字体 | 手写体 | 粗体 Impact",
"appearance_details": "金属质感 | 3D 效果 | 等"
}
例外:与对象融为一体的通用文本(例如,停止标志上的“STOP”)。
edit_instruction (字符串)描述编辑/生成的单个祈使句命令。
以动作动词开头,描述变更,切勿提及“原图”:
| 类别 | 重写后的指令 |
|---|---|
| 风格变更 | 将图像转换为卡通风格。 |
| 对象属性 | 将狗的颜色改为黑白。 |
| 添加元素 | 给主体添加一顶宽边毡帽。 |
| 移除对象 | 移除主体手中的书。 |
| 替换对象 | 将玫瑰换成明亮的黄色向日葵。 |
| 光照 | 将光照从黑暗、忧郁改为明亮、充满活力。 |
| 构图 | 将视角改为更广的镜头。 |
| 文本变更 | 将文本“Happy Anniversary”改为“Hello”。 |
| 质量 | 优化图像以获得更高的清晰度和锐度。 |
将“遮罩区域”或“遮罩部分”作为目标:
| 意图 | 重写后的指令 |
|---|---|
| 对象生成 | 在遮罩区域生成一朵中心为蓝色的白玫瑰。 |
| 扩展 | 将图像扩展到遮罩区域,创建一个包含...的场景。 |
| 背景填充 | 在遮罩区域创建以下背景:延伸至地平线的广阔海洋。 |
| 氛围填充 | 用清澈、明亮的蓝天和缕缕云彩填充背景遮罩区域。 |
| 主体修复 | 在遮罩区域修复一位年轻女性。 |
| 环境填充 | 在遮罩区域内创建:一个玻璃天花板下有成排植物的温室。 |
除非指令明确要求更改,否则保留所有视觉属性:
- 主体身份、姿态、外观
- 对象存在、位置、大小、方向
- 构图、相机角度、镜头特性
- 风格/媒介
仅更改编辑严格要求的属性。
{
"short_description": "一位身着海军蓝西装外套的专业商务女性自信地站在现代化的玻璃办公室中,手持平板电脑。自然日光透过落地窗照射进来,营造出温暖、高效的工作氛围。",
"objects": [
{
"description": "一位30多岁、自信的商务女性,深色及肩发,身着剪裁合体的海军蓝西装外套,内搭白色衬衫。她左手拿着平板电脑,右手自然地做着手势。",
"location": "中心偏右",
"relative_size": "大 (在画面内)",
"shape_and_color": "人物轮廓,海军蓝和白色着装",
"texture": "光滑面料,职业装",
"appearance_details": "简约首饰,整洁专业的形象",
"relationship": "主体,与平板电脑互动",
"orientation": "略微面向左,四分之三视图",
"pose": "直立站立,放松的职业姿态",
"expression": "自信,亲切的微笑",
"clothing": "剪裁合体的海军蓝西装外套,白色丝绸衬衫,深色长裤",
"action": "在平板电脑上展示或查看信息",
"gender": "女性",
"skin_tone_and_texture": "中等暖色调皮肤,健康光滑的肤色"
},
{
"description": "一个现代平板设备,明亮的屏幕上显示着图表和图形",
"location": "中心,由主体手持",
"relative_size": "小",
"shape_and_color": "矩形,银色边框,屏幕亮起",
"texture": "光滑的玻璃和金属",
"appearance_details": "轻薄外形,屏幕上可见商业应用界面",
"relationship": "由商务女性手持,是她注意力的焦点",
"orientation": "垂直,屏幕以轻微角度面向观看者",
"pose": null,
"expression": null,
"clothing": null,
"action": null,
"gender": null,
"skin_tone_and_texture": null,
"number_of_objects": null
}
],
"background_setting": "现代化的企业办公室内部,落地窗外是城市天际线。中性色调的极简主义家具,盆栽植物点缀着绿色。",
"lighting": {
"conditions": "明亮的自然日光",
"direction": "左侧光(从窗户射入)",
"shadows": "柔和、自然的阴影"
},
"aesthetics": {
"composition": "三分法,中景",
"color_scheme": "专业的蓝色和中性白色,带有暖色点缀",
"mood_atmosphere": "自信、专业、亲切"
},
"photographic_characteristics": {
"depth_of_field": "浅景深,背景略微模糊",
"focus": "主体面部和上半身清晰对焦",
"camera_angle": "平视",
"lens_focal_length": "人像镜头 (85mm)"
},
"style_medium": "照片",
"artistic_style": "写实",
"context": "用于公司网站或 LinkedIn 专业档案的企业肖像摄影。",
"text_render": [],
"edit_instruction": "生成一位在现代化办公室环境中手持平板电脑的专业商务女性。"
}
text_render 为空edit_instruction 格式nullcurl -X POST "https://engine.prod.bria-api.com/v2/image/generate" \
-H "api_token: $BRIA_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"structured_prompt": "{\"short_description\": \"...\", ...}",
"prompt": "生成此场景",
"aspect_ratio": "16:9"
}'