大家好,我是风雨无阻。
上一篇文章详细介绍了sd文生图的功能及使用注意事项,感兴趣的朋友可以前往查看:AI 绘画Stable Diffusion 研究(四)sd文生图功能详解(上) 。
那今天这篇文章,我们接着介绍 sd文生图功能,主要是 sd 提示词prompt 。
大家都知道,提示词是整个Stable Diffusion ai 绘画的灵魂,那么我们应该怎么来写提示词呢?什么样的提示词是优秀的提示词呢?
这篇文章给大家介绍的提示词,很有可能是以前没有听过的,只要大家跟着我的脚步,认认真真的看完这篇文章,你一定不会为写提示词而烦恼!也一定会让你的提示词更简洁有效!
这篇文章的干货非常多,那现在就正式开始吧~
提示词的内容主要包含2个部分:prompt 的格式、 修饰词。
相信大家在网上也看过其他博主有关提示词的知识介绍,一般主要讲解的是提示词的格式,如怎么提高权重、减少权重,以及少量的怎么让画面变得清晰这块。但是修饰词这块很少讲解,那这里就把这块内容进行补齐。
一、提示词 prompt 详解
1、从了解自己的需求开始理解提示词的要素
在写提示词之前,我们脑海里面就要过一下以下问题。
为了便于理解,这里做了中英文的对比,英文部分是直接可以使用的提示词。
(1)、 我想要一张照片(photo)还是一幅画(painting)?
尝试回答 ==》 照片(photo)
(2)、图片的主题是什么? 是人(Person)? 是动物(An animal)还是风景(landscape)?
尝试回答 ==》 一个女孩 (a girl)
(3)、我想添加哪些细节?
尝试回答 ==》 穿泳衣(Dress swimming)
我需要哪种特殊照明(Special Lighting)?自然光(naturalight)、柔光(Soft)、环境光(ambient)、环形光(ring light)、霓虹灯(neon)?
尝试回答 ==》 自然光(naturalight)
我需要在什么环境(Environment)下?室内(lndoor)、室外(outdoor)、水下(underwater)、太空(in space)?
尝试回答 ==》 水下(underwater)
我需要哪种配色方案(Color Scheme)?颜色鲜艳(with bright colors)、充满活力(Vibrant)、黑暗(dark)、柔和(pastel)?
尝试回答 ==》 柔和(pastel)
我需要哪种视角(Point of view)?正面(Front)、头顶(Overhead)、侧面(Side)?
尝试回答 ==》 正面(Front)
(4)、我需要哪种特定的艺术风格? 3D渲染(3D render),吉卜力工作室studio ghibli),电影海报(movie poster)?
尝试回答 ==》 电影海报(movie poster)
(5)、我需要哪种特定的照片类型? 微距(Macro)、长焦(telephoto)
尝试回答 ==》 微距(Macro)
根据以上问题,我们将其串联起来,就可以清晰的看见提示词涉及的元素。
如下:
photo,a girl,Dress swimming,Special Lighting naturalight,Environment underwater,with bright colors pastel,Front, 3D render movie poster,Macro
2、关于提示词权重增减
(1)、单词的顺序很重要
句子中的词,越早出现,权重越高,单词从做往右,从上往下,权重逐渐降低。
因此,我们写提示词的时候,要尽量将重要的核心的内容写在前面,次要的内容写在后面。
(2)、强制增减权重
在上一篇也有简单说明 ,这里再总结一下,感兴趣的朋友可以回头看看
AI 绘画Stable Diffusion 研究(四)sd文生图功能详解(上)-21、Tag 加权、减权用法简单说明
A、套英文半角()
每套一层,权重就乘以 1.1倍
例如:
(((a very beautiful girl )))
表示 1.1x1.1x1.1=1.331倍(增强)
B、英文半角()+数字
a very beautiful girl:1.5
表示权重变为原来的1.5倍
a very beautiful girl:0.8
表示权重变为原来的0.8倍
c、套大括号{}
每套一层,权重就乘以1.05倍
{{{a very beautiful girl}}}
表示 1.05x1.05x1.05 =1.157625倍(增强)
d、套方括号[]
每套一层,权重就乘以0.9倍
[[[a very beautiful girl]]]
表示 0.9x0.9x0.9 =0.729倍(减弱)
二、修饰词详解
修饰词可以改变图像风格、格式、视角的单词。
事实证明,某些单词或短语,有神奇的效果,可以提高图片的质量,下面我们来详细介绍不同类型的修饰词。
下表总结了常用的几类修饰词,在实际书写提示词时,可以搭配使用。
镜头类型 shot type | 风格 style | Subject 主体 | 灯光 Lighting | 环境Environment | 镜头 Lens |
---|---|---|---|---|---|
Long shot | Polaroid | Woman | Soft | Indoor | Wide-angle |
Close-up | Monochrome | Old man | Ambient | Outdoor | Telephoto |
Medium shot | Long exposure | Grey cat | Ring | At night | 24mm |
PoV | Color splash | Bunny | Sun | In the park | EF 70mm |
Extreme Close-up | Tilt-shift | Ferrari | Cinematic | Studio | Bokeh |
(1)、镜头类型 (shot type)
-
Long shot (远景): Long shot 是一种较远距离拍摄的镜头类型,用于展示被拍摄对象相对较远的位置和环境。远景镜头广泛用于展示整个场景、人物在广阔环境中的位置或活动,或者用于突出环境对故事的重要性。
-
Close-up(特写): Close-up 指的是对被拍摄对象进行近距离拍摄,使其填满画面或占据大部分画面。这种镜头类型用于强调被拍摄对象的细节、表情或情感。它通常用于人物特写或突出物体的细节。
-
Medium shot (中景): Medium shot 是介于远景和特写之间的一种镜头类型。它将被拍摄对象从腰部或膝盖处裁剪,并展示人物或物体的整体外貌和姿态。中景镜头适用于展示人物的动作、表情和环境背景。
-
POV(第一人称视角): POV 是“Point of View”(视角)的缩写,表示通过模拟角色或观察者的视觉角度来呈现场景或情节。POV 镜头旨在让观众体验到与角色或观察者更加身临其境的感觉,使其感受到与角色共享的视觉体验。
-
Extreme Close-up(极特写): Extreme Close-up 指的是对被拍摄对象的极度近距离拍摄。它将焦点限制在非常小的区域上,以突出显示物体的微小细节或部分。极特写常用于表达强烈的情感、揭示重要的细节或营造紧张的氛围。
(2)、风格(style)
-
Polaroid: Polaroid 指的是一种特殊的即时成像摄影技术。它使用一种叫做 Polaroid 的相机拍摄,照片在拍摄后几)钟内即可显影完成,无需进一步的冲洗或处理过程。Polaroid 照片通常具有独特的外观和色彩效果,给人一种复古怀旧的感觉。
still photo of a child sittine in the middle of a wide empty city street, his back to the camera, symmetrical, polaroid photography, highly detailed, crisp qualit
- Monochrome: Monochrome 指的是黑白摄影。这种摄影风格仅使用黑、白、灰三种色调,去除了彩色的元素,将照片呈现为单色调的画面。黑白摄影通常具有独特的表现力和艺术感,可以突出形式、纹理和光影效果。
Photo of staircase in abandoned building, symmetrical, monochrome
photography, highly detailed, crisp quality and light reflections, 100mm lens
- Long exposure: Long exposure 指的是长时间曝光。在摄影中,当相机的快门打开并保持打开的时间较长时,允许更多的光线进入相机,从而在照片中捕捉到移动的物体或在场景中产生模糊效果。长时间曝光常用于拍摄流水、星轨、夜景等场景,创造出动态、流动或梦幻的效果。
An aerial view of a gty at night, long exposure, instagram contest
- Color splash: Color splash 指的是色彩喷溅效果。这种效果通过将照片中的大部分部分转换为黑白或灰度,并突出显示其中的某些颜色,以产生强烈的色彩对比。通常,选择的颜色会在照片中显眼突出,而其他部分则变为单色或无彩色,营造出一种引人注目的效果。
color splash wide photo of red phone booth in the middle of empty street
detailed, mist soft vignette
-
Tilt shift: Tit shiit 是一种特殊的镜头和后期处理效果。通过使用特定的倾斜移轴镜头或后期处理软件,可以使照片中的实际场景看起来像是微型模型或玩具场景。这种效果主要是通过调整焦平面和透视效果,使实际场景看起来像是缩小的模型世界。
photo of construction site, workers, tilt shift effect, bokeh, Nikon
- Product Shot: Product Shot (产品拍摄) 是摄影风格中的一种,主要用于展示商品或产品的照片。在商业摄影中产品拍摄被广泛应用于广告、商品目录、电子商务网站等领域。产品拍摄旨在突出和展示产品的特点、细节和外观。它通常包括专业的照明、背景设置和摄影技术,以确保产品呈现出最佳的形象。产品拍摄的目标是通过高质量的照片吸引消费者的注意,展示产品的功能、材质、颜色和设计。
product shot of nike shoes, with soft vibrant colors, 3d blender render, modular constnuctivism, blue background, physically based rendering, centered
- Portrait: Portrat指的是一种摄影风格,专注于拍摄人物的照片。肖像摄影旨在捕捉人物的面部表情、特征、个性和情感,以展示人物的特质和美感。肖像摄影通常强调人物的眼神、姿态、表情和肢体语言。它可以是个人肖像,捕捉一个人的形象和特征,也可以是群体肖像,拍摄一组人的集体形象。肖像摄影在不同场景和背景下进行,可以是室内或户外、专业设置或日常环境。肖像摄影的目标是通过照片展现人物的独特性、情感、故事或风格。它可以表达人物的自我表达、个性特点、职业角色、情感状态等。肖像摄影广泛应用于人物肖像摄影、家庭摄影、婚纱摄影、时尚摄影等领域。
Portrait photo of a storm trooper with his beautiful wife on his wedding day
Satelite: Satellite(卫星)是指地球轨道上的人造卫星,用于从空间中拍摄地球的照片和图像。卫星可以携带各种传感器和摄像设备,用于获取高分辨率的地球图像和数据。
Google earth satellite image, of New York City, detailed buildings and streets
3、主体(Subject)
- Woman: 指的是成年女性。在这个上下文中,它表示一个女性个体。
- old man: 意思是年迈的男性。这个短语用来描述一个年龄较大的男人。
- Grey cat: 表示一只灰色的猫。这里描述的是猫咪的颜色。
- Bunny: 是指免子,一种小型哺乳动物,通常以其长耳朵和柔软的皮毛而闻名。
- Ferrari: 是一家意大利的豪华汽车制造商,同时也是该品牌的名称。这个词用来指代法拉利汽车,一种高性能、豪华的跑车品牌。
这里的主体,只是列举了几个示例,并不是只有这几个主体。
4、灯光 (Lighting)
-
Soft:在这个上下文中,"Soft”指的是柔和的光线效果。柔和光线通过扩散、减少阴影和提供均匀的照明来创建柔和的氛围。这种光线常常用于人像摄影、拍摄产品或场景时希望减少硬阴影的情况。
-
Ambient:"Ambient”指的是环境光,也称为自然光或整体光。它是来自周围环境的整体照明,没有明确的光源,通常用于创造自然或舒适的照明效果。
-
Ring:"Ring”指的是环形灯,一种特殊的灯具或闪光灯,具有圆环状的光源。环形灯的设计可产生均匀、柔和的照明效果,并在拍摄人像或拍摄需要特定光环效果的情况下常被使用。
-
Sun:"Sun”指的是太阳。在摄影和照明上,"Sun"用来表示自然光源,即来自太阳的光线。太阳光可以在户外拍摄中提供强烈的明亮光线,产生明显的阴影和高对比度的效果。
Fallout concept art school interior render grim, sun rays coming through window, unreal engine 5
-
Cinematic:“Cinematic”表示电影般的照明效果。这种效果通常使用特定的灯光设置和技术来创造出电影般的视觉效果,以营造戏剧性、情绪化和引人入胜的氛围。
-
Nostalgic:"Nostalgic”(怀旧的) 是指一种营造怀旧情感或回忆往昔的灯光效果或氛围
Fallout concept art school interior render grim, nostalgic lighting, unreal engine 5
- Purple Neon:"Purple Neon”(紫色虹灯)是指使用紫色光源或紫色灯光来照明场景的一种灯光效果.
Fallout concept art school interior render grim, realistic purple neon lighting unreal engine 5
5、环境(environment)
-
**Indoor:**指的是室内环境。这个词描述了在室内进行的活动、场景或拍摄。室内环境通常具有不同的照明、背景和氛围,需要相应的拍摄技巧和照明设置。
-
Outdoor:意为户外环境。这个词用来描述在户外进行的活动、场景或拍摄。户外环境具有自然光线、广阔的背景和与室内不同的氛围,可能需要特殊的照明和拍摄技巧。
-
At night: 表示在夜晚进行的活动、场景或拍摄。夜晚的环境通常具有特殊的照明需求,例如利用城市灯光、月光或人工照明来创造所需的效果。
-
In the park: 指在公园进行的活动、场景或拍摄。公园环境通常具有自然的景观、开放的空间和特定的氛围,可以提供丰富的背景和拍摄机会。
-
Studio: 指的是摄影工作室,一个专门用于摄影和拍摄的室内场地。摄影工作室提供了受控的照明、背景和拍摄环境,可以实现更精确和艺术化的照片和影像创作。
6、镜头(Lens)
- Wide-angle (广角)
广角镜头指的是具有较短焦距的镜头。它提供更广阔的视角和较大的景深,可以捕捉到更多的场景和环境细节。广角镜头适用于拍摄大景、建筑物、风景以及需要更多环境呈现的场景。 - Telephoto (长焦)
长焦镜头是具有较长焦距的镜头。它提供较窄的视角和较小的景深,可以放大远处的对象,并提供更为聚焦的效果。
长焦镜头适用于拍摄远距离的主体、体育活动、野生动物以及需要把焦点放在被摄对象上的场景。
Alligator emerging from water, telephoto lens
-
24mm
指的是一个具体的焦距。24mm 是一种广角镜头,常用于拍摄广阔的场景,提供较宽的视角和透视效果。
-
EF 70mm
EF 70mm 是指使用佳能(Canon) F镜头接口的镜头,并具有 70mm 的焦距。70mm 焦距的镜头通常被归类为中焦镜头,可用于人像摄影、风景摄影以及许多其他拍摄情景。
-
Fish-eye
Fish-eye(鱼眼)是一种特殊类型的广角镜头,具有非常短的焦距和极大的视角。它得名于其像鱼眼一样弯曲和凸起的透镜形状。
Night club, people dancing, Fish-eye lens
- 800mm
800mm焦距的镜头被归类为超长焦镜头,它提供了非常高的放大倍率和远距离的拍摄能力。这种镜头适用于需要捕捉远距离对象的场景,例如野生动物摄影、体育摄影或其他需要将远处主体细节捕捉到的场景。800mm 焦距的镜头通常被视为专业镜头,因为它提供了极高的放大能力和图像清晰度。使用这样的镜头需要稳定的支架或三脚架,以确保摄影师能够稳定地拍摄远距离的主体,并避免图像模糊或抖动。
Photo of hummingbird,800mm lens
-
Macro
"Macro”(微距)是一种特殊类型的镜头,专门设计用于拍摄极为近距离的主体,以捕捉微小的细节和放大的图像Macro镜头具有较短的最短对焦距离和高放大倍率,使摄影师能够接近被摄对象并拍摄非常接近的图像。它通常用于拍摄小型物体、昆虫、花朵、珠宝、纹身等需要呈现微小细节的主题。Maro镜头的特点是能够提供极高的解析度和清晰度,捕捉微小的细节、纹理和结构。它通常具有浅景深,使被摄对象突出于模糊的背景之中,从而产生出独特的视觉效果。使用 Macro 镜头,摄影师可以探索微观世界,揭示日常生活中被忽视的细节和美丽。这种镜头在室内和室外的摄影、产品摄影、生态摄影、医学摄影等领域都有广泛的应用。
Photo of a ladybug bee hybrid standing on a tulip, macro lens
三、如何写自己的提示词
(1)、提示词书写公式
根据以上所学知识,这里我总结了一套提示词书写公式:
提示词 = 人物及主体特征+ 场景特征 + 环境光照 + 画幅视角 + 画质提示词 + 画风提示词
(1)、人物及主体特征
-
服饰穿搭 (white dress)
-
发型发色 (blonde hair, long hair)
-
五官特点 (small eyes, big mouth)
-
面部表情 (smiling)
-
肢体动作 (stretching arms)
(2)、场景特征
-
室内、室外 (indoor / outdoor)
-
大场景 (forest, city, street)
-
小细节 (tree, bush, white filower)
(3)、环境光照
-
日天黑夜 (day / night)
-
特定时段 (moming,sunset)
-
光环境 (sunlight, bright, dark)
-
天空 (blue sky, starry sky)
(4)、画幅视角
-
距离 (cose-up, distant)
-
人物例 (full body, upper body)
-
观察视角 (from above, view of back)
-
镜头类型 (wide angle, Sony A7)
(5)、画质提示词
通用高画质
best quality, ultra detailed, masterpiece, hires, 8k
(6)、画风提示词
-
插画风 (illustration, painting, paintbrush)
-
二次元 (anime, comic, game CG)
-
写实系 (photorealistic, reallistic, photograph)
2、提示词实践
根据以上提示词书写公式 ,我们再结合前一篇的知识点,加上正向画质改善提示词,以及通用反向提示词,配合面部修复、高分辨率修复参数设置即可生成一张漂亮的图片。
关于通用的改善画质提示词和通用的反向提示词,忘记的朋友,建议再回头看看 AI 绘画Stable Diffusion 研究(四)sd文生图功能详解(上)。
例如,我想画一张这样的图片:
早上,一个漂亮的小女孩身穿西服背着小书包,长发披肩,一双水灵灵的大眼睛,樱桃小嘴,鹅蛋脸,她微笑着站在一座桥上,下面是一条宁静流淌的河流,远处是连绵起伏的山峦和晴空万里,使用 24mm 镜头拍摄。
对应的正向提示词:
Morning, a beautiful little girl in a suit, carrying a small backpack, with long hair draped over her shoulders, Her eyes are large and sparkling, with cherry lips and an oval face, On her way to school, she stands smiling on a bridge,Below is a tranquil flowing river, Outdoor,with rolling mountains and clear skies in the distance,Captured with a 24mm lens,(masterpiece:1.2), best quality, masterpiece, highres, original, extremely detailed wallpaper.oerfect lighting,(extremely detailed CG:1.2), drawing, paintbrush
对应的反向提示词:
NSFW, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality,(monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (ugly:1.331),duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:l.331), mutated hands, (poorly drawnands:1.5), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331),missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051),unclear eyes:1.331), lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers.((extra arms and legs)))
按照以下8个步骤,生成:
生成效果如下:
3、关于写提示词的建议:
(1)、提示词不要一次性写的太多,图像效果是一个不断调整的过程。有时候只需要添加几个主题关键词,效果就可以非常好。因此我们要从简单的提示词开始,只包含主题内容,一次性最少生成4张图,先看看会得到什么样的图。
(2)、大多数的提示词并不是100%有效,因此,如果一个提示词没有生效,不要沮丧,可以尝试调整它的位置,或者增加权重,再或者是更换为近义词。
(3)、能不使用强制增减权重,就不要使用,因为这会增加后期调整的难度。
(4)、修饰词和魔法词很重要,有时候往往增加一个修饰词或魔法词,就可以给图像带来巨大的改变,一定要熟练掌握。