火爆全网的AI造像，逼开发者祭出“火眼金睛”：让AI“完美”图片瞬间现原形，不料却秒翻车？

138 0 0

最近，在 Stable Diffusion 和 Midjourney 长期占据霸主地位的图像生成领域中，有一个新的巨头正在崛起：Flux。

这款由 Black Forest Labs（即 Stable Diffusion 的原始团队）开发的文本到图像模型，以其庞大的规模和卓越的表现力，正逐步成为文生图模型领域的领军者——前几天被疯狂刷屏的这张极其逼真的“TED 演讲者”图片，就是基于 Flux 训练的 LoRA 模型所生成的。

自 8 月初发布以来，Flux 已在开发者和创意工作者之间引起了巨大轰动。许多人在尝试过 Flux 之后，相继发出“根本分不清到底是真人和 AI”的惊叹。

然而 AI 的魔法，看来还是要用 AI 来打败：昨日，前谷歌搜索创始人之一 Deedy Das 在 X 上宣布，他全程用 Claude 编写了一个辨别图片是否由 AI 生成的工具，其关键在于“提高饱和度”。

01 完全由 Claude 编写的 AI 鉴别神器？

以最近很火的这张“TED 演讲者”图片为例，Deedy Das 将其上传至这个工具后，原本看似极其逼真的 AI 人像瞬间就暴露了其“真容”：相当诡异的牙齿部分，麦克风和胸牌上的色块也不太正常。

火爆全网的AI造像，逼开发者祭出“火眼金睛”：让AI“完美”图片瞬间现原形，不料却秒翻车？

Deedy Das 指出，与下面的真实人像图片相比，显然后者的牙齿部分很正常，提高饱和度后的整体色块也更为均匀且一致。

火爆全网的AI造像，逼开发者祭出“火眼金睛”：让AI“完美”图片瞬间现原形，不料却秒翻车？

Deedy Das 还强调，工具代码完全由 AI 模型 Claude 编写，尤其它还是在原始图像数据上编写饱和度代码的，都不用使用外部库。目前，该工具处于公开可用状态（https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46），感兴趣的人可以去试试。除此之外，Deedy Das 还附上了工具源代码：https://t.co/v6nmtLrezW。

接下来，我们试两张网友用 Flux 生成的 AI 图像，来看看这个工具的具体效果如何：

火爆全网的AI造像，逼开发者祭出“火眼金睛”：让AI“完美”图片瞬间现原形，不料却秒翻车？

从结果来看，如果辨别图片是否由 AI 生成的标准是奇怪的牙齿和不和谐的色块，那么这个工具确实将这两张 AI 图片识别出来了。

正当许多人以为，终于出现了个“神器”能准确辨别 AI 图片、不用担心再被 AI 欺骗的时候，有位用户突发奇想，借用 Deedy Das 的 X 头像图片试了试，结果出现了突兀的色块——难道他的头像照片也是 AI 生成的？

火爆全网的AI造像，逼开发者祭出“火眼金睛”：让AI“完美”图片瞬间现原形，不料却秒翻车？

看到这个结果，Deedy Das 自己也哭笑不得，解释道：“这可能是图片压缩造成的。我刚用原始图片上试了试，并没有这些没有色块补丁。”

基于这个发现，后来 Deedy Das 在原帖下补充，理论上该工具可以检测 AI 图片，但它对 JPG 压缩后的真实图像会有误判，因此它可能不太适用于辨别社交媒体上的几乎所有图片，因为那些图片普遍都经过压缩：“经过 JPG 压缩的真实图片，整体色块的一致性会被破坏。”

对此 Deedy Das 表示，之后他会想办法构建一个针对最大饱和度图像的分类器，以此来分辨 JPG 压缩图像和 AI 图像。

02 AI 文生图模型的发展，实在太快

虽然 Deedy Das 承诺会想办法，但我们无法得知他具体会在何时实现——而且就目前来看，AI 文生图模型的发展，实在是太快了。

如开头所说，本月初 Stable Diffusion 背后的原始团队发布了全新的图像生成模型 Flux.1。据介绍，Flux.1 包含开发者版、快速版、专业版三种模型：

● Flux.1 [dev]：基础模型，以非商业许可方式开源，供社区在此基础上构建。

● Flux.1 [schnell]：基础模型的精简版，运行速度提高了 10 倍。Apache 2 授权。

● Flux.1 [pro]：仅通过 API 提供的封闭源代码版本。

根据 Flux 官网公布的数据显示，Flux.1 的 ELO 评分（一种在国际象棋等竞技游戏中广泛使用的评分方法，主要用于计算比赛对手实力等级）已超越 Midjourney-V6.0 和 Stable Diffusion3-Ultra 等主流模型，就算是较小规模的 Flux.1 [schnell] 在性能上也超越了 Midjourney-V6.0 和 Dall-E 3 HD 等更大的模型。

火爆全网的AI造像，逼开发者祭出“火眼金睛”：让AI“完美”图片瞬间现原形，不料却秒翻车？

基于以上数据，不少开发者都认为：或许，未来 Flux.1 将会是替代 MidJourney 和 Stable Diffusion 的终极 AI 图像生成工具。

若与 MidJourney 进行对比，Flux.1 在许多方面都具备优势。首先是开源，与 MidJourney 不同，Flux.1 的开源性质使得开发者可以轻松地对其进行修改和扩展，允许深度自定义、集成到各种应用程序中，还能根据需要修改模型。其次是卓越的图像质量，Flux.1 能提供既详细又逼真的高保真输出，图像质量在很多评分中都超过了 MidJourney。最后是可扩展性和性能，拥有 120 亿参数的 Flux.1 能够处理复杂且大规模的图像生成任务，适用于广泛的应用。

凭借着以上功能和优势，Flux.1 仅发布一周有余，就在网上引发了大规模的 AI 生图热潮，其逼真程度令人担忧：“AI 正在失控”。下面图片均由 Flux.1 生成，试问谁能一眼看出这些是 AI 生成的？

火爆全网的AI造像，逼开发者祭出“火眼金睛”：让AI“完美”图片瞬间现原形，不料却秒翻车？

不仅图片，甚至连视频都可以流畅生成——AI 创意制作人 Heather Cooper 就分享了一个用 Flux 制作化妆品广告的例子，甚至仅需 8 个步骤即可。