图像生成之结构化指令

结构化指令：范式

画质词>>
一般比较固定：大师作品，杰作，最佳画质，丰富细节(Highly detailed)，官方艺术，丁达尔效应，细腻的CG画质，8K，超大壁纸等。一般起手输入masterpiece, best quality, 为了提升画质会加入HDR,UHD等。

艺术风格和介质>>
例如彩绘、铅笔画或艺术摄影，或强调艺术家风格。某些个性模型有固定的"触发指令"。
摄影修饰词（Polaroid 拍立德，Tilt-shift 移轴，Portrait 肖像）
风格修饰词（Product Shot 产品拍摄，Color-Splash 色彩拼接，Monochrome 单色）
镜头修饰词（Telephoto 长焦，Fish-eye 鱼眼，CCTV 监视器画面，800mm,Gopro）
艺术修饰词（Pencil Drawing 铅笔画，Graffiti 涂鸦，Water Colors 水彩，Oil Painting 油画）

图片的主题>>
构图的主体，复杂构图中，存在主体存在于某个介质或环境下，例如：挂在墙上的画框中的老人照片，我们要确认唯一主体进行细化，或分布生成。

--描述主体造型>>
注意整体和细节都是从上到下描述，这里以描述人物为例：
发型（呆毛，耳后有头发，盖住眼睛的刘海，低双马尾，大波浪卷发），
发色（顶发金色，末端挑染彩色），
衣服（长裙，旗袍，半长袖，过膝袜，室内鞋），
头部（猫耳,红色眼睛），
颈部（项链），
手臂（露肩），
腹部（可看到肚脐），
腿部（长腿），
脚步（裸足）

--描述主体细节
例如对人物进行表述表情，支持使用emoji，其表现力相当出色。可通过添加emoji或颜文字来达到表现效果，例如使用😍来形容表情，或使用🖐来修正手部绘画。:-) 微笑 :-( 不悦 ;-) 使眼色 :-D 开心 :-P 吐舌头 :-C 很悲伤 :-O 惊讶张大口 :-/ 怀疑

描述主体的构图
以人物为例，主要是动作：
基础动作（站，坐，跑，走，蹲，趴，跪），
头动作（歪头，仰头，低头），
手动作（手在拢头发，放在胸前，举手），
腰动作（弯腰，跨坐，鸭子坐，鞠躬），
腿动作（交叉站，二郎腿，M形开腿，盘腿，跪坐），
复合动作（战斗姿态，JOJO立，背对背站，侧翻）

--主体的大背景
室内，室外，树林，沙滩，星空下，太阳下，天气如何

--杂项>>
比如眼睛描绘详细

结构化指令：例子

(masterpiece:1.331), best quality,

illustration,

(1girl),

(deep pink hair:1.331), (wavy hair:1.21),(disheveled hair:1.331), messy hair, long bangs, hairs between eyes,(white hair:1.331), multicolored hair,(white bloomers:1.46),(open clothes),

beautiful detailed eyes,purple|red eyes),

expressionless,

sitting,

dark background, moonlight, ,flower_petals,city,full_moon,

结构化指令：简化

•主体：East African canyons, mountains, deserts, weeds, an antelope

•修饰词：Best Picture Quality

•风格：Studio Ghibli style

MJV6

Midjourney V6 Alpha 测试已经启动。要启用 Midjourney V6，它不会根据默认设置自动更新。因此，你需要向 Midjourney Discord 服务器或机器人发送信息，输入 /settings 命令，并从下拉菜单中选择 V6。另外，你也可以在提示语的末尾输入 --v 6 来激活该功能。

Midjourney 的创始人 David Holz 提出了一种新的提示方法。V6 对提示的敏感度大大提高。建议避免使用“获奖、超现实、4k、8k”等表述，而应确保请求明确。如果你希望得到更直接、更中立且更现实的输出结果，最好将 --style raw 设置为默认。（原文中直言不讳地将 4k、8k 等描述称为“无用”提示。"V6 对你的提示非常敏感。避免使用‘无用’的表述，如‘获奖、超现实、4k、8k’"）

要素	描述	示例
风格	图像的风格。	Photo of
主题	描述图像的主题或对象。	An astronaut in a white space suit, helmet visor reflecting stars.
背景	指出图像的背景设置，即地点或环境。	Standing on a moon with Earth visible in the starry sky.
构图	阐释图像内元素的排列方式。	Astronaut centered, Earth in the background.
灯光	描述图像中的照明或光线反射。	Bright sunlight with soft moonlight reflections.
额外信息	提供图像中包含的其他细节或信息。	Moon rocks and small craters nearby.

反过来，遵循上述提示结构可以获得最优结果。此外，该系统最显著的特点包括能够精确呈现文本而不模糊，并且能够细腻地调整纹理和光线。

MIDJOURNEY 的新提示结构

Midjourney v6 即将推出，它对提示有了更深刻的理解。这意味着不再使用随机的短语和词汇。我们需要采用一种全新的提示创建方式。

我个人计划测试这个简单结构，它反映了典型的语言框架：

风格：
- 目的：为图像提供特定的审美或艺术风格。
- 需要包括的细节：偏好的风格或时代。

主题：
- 目的：明确图像的核心焦点。
- 需要包括的细节：中心主题的特点（如人物、物体、动物），包括外观、颜色和特别之处。

背景：
- 目的：设置主题所处的环境或背景。
- 需要包括的细节：地点（室内、室外、虚构），环境元素（自然、城市），一天中的时间，以及天气状况。

构图：
- 目的：决定主题及其元素如何在画面中呈现。
- 需要包括的细节：视角（特写、广角、俯瞰），角度，以及具体的构图偏好。

灯光：
- 目的：设定图像的情绪和视觉基调。
- 需要包括的细节：照明类型（明亮、昏暗、自然），情绪（愉悦、神秘），以及大气效果。

额外信息：
- 目的：为图像增添更多层次和深度。
- 需要包括的细节：次要物体、人物、动物，以及它们与主题的相互关系和位置。

我期待不久后测试这一结构，并与大家分享结果。