Whisk AI 常见问题解答
Whisk AI 是一个免费的 Google Labs 图像生成器,它使用 Gemini 和 Imagen 3 AI 模型通过融合主题、场景和风格输入来创建视觉效果。
Whisk AI 的常见问题解答
Whisk AI 通过其视觉输入工作流程提供了哪些图像生成能力?
Whisk AI 借助三个视觉输入(主体、场景和风格)并使用 Gemini 和 Imagen 3 模型进行融合,支持图像生成。这种视觉优先的方法让用户无需复杂的提示词工程或详细的文本描述即可创建新图像。
Whisk AI 提供了哪些风格预设以定制输出美学?
Whisk AI 提供六种独特的风格预设,包括贴纸、毛绒玩具、胶囊玩具、徽章、巧克力盒和卡片。每种预设都会应用特定的视觉效果、灯光和构图规则,使输出符合特定的艺术意图或商业用途。
Whisk AI 如何自动优化用户提示以提升图像质量?
Whisk AI 会分析基础的文本描述,并自动整合艺术风格、灯光、构图和技术细节,以生成优化的提示词。此过程帮助用户以最少的提示词工程知识或经验即可生成更高质量的图像。
如何使用 Whisk AI
- 首先,通过官方的 Google Labs 网站或直接访问工具网址来使用 Whisk AI。
- 导入三张图片,分别代表你希望生成的主体、场景和风格。
- Whisk AI 会自动使用 Google 的 Gemini 和 Imagen 3 模型分析并融合这些视觉输入。
- 查看生成的图像,该图像结合了你所选的主体、场景和风格元素。
- 如有需要,可以调整图片或尝试不同的组合,以获得理想的创意结果。
