主体永远排第一
gpt-image-2 对句首注意力极强。第一句决定画面构图。主体挪到第 15 个词之后,首轮命中率掉约 30 个百分点。
独立社区工具 · 与 OpenAI 无关联。
▲800+ 测试 · 首轮命中 7/10
顺序很重要。在 800 次对照实验中,这套模板首轮命中率 73%:主体 · 文字 · 场景 · 镜头与光线 · 风格 · 约束。其他都只是收尾。
▲六个段落
gpt-image-2 对句首注意力极强。第一句决定画面构图。主体挪到第 15 个词之后,首轮命中率掉约 30 个百分点。
只有模型知道确切字符串时,强文字渲染才会生效。引号是信号;无引号的文字会被模型改写。
给出环境、时间、天气、材质。具体永远胜过泛化。
「50mm 镜头、黄金时刻、浅景深」> 「电影感」。技术词产出技术画面。
引用一个年代、一位摄影师、一个艺术运动。单一锚点比三个含糊形容词强得多。
「无水印、3:2 比例、无额外招牌」—— 放在最后,让模型最近的注意力用在这些上。
独立第三方工具 · 与 OpenAI 无关联。