LOADING STUFF...

火爆全网的AI造像,逼开发者祭出“火眼金睛”:让AI“完美”图片瞬间现原形,不料却秒翻车?

news2个月前发布 曾哥的AI世界
20 0

最近,在 Stable Diffusion 和 Midjourney 长期占据霸主地位的图像生成领域中,有一个新的巨头正在崛起:Flux。

这款由 Black Forest Labs(即 Stable Diffusion 的原始团队)开发的文本到图像模型,以其庞大的规模和卓越的表现力,正逐步成为文生图模型领域的领军者——前几天被疯狂刷屏的这张极其逼真的“TED 演讲者”图片,就是基于 Flux 训练的 LoRA 模型所生成的。

火爆全网的AI造像,逼开发者祭出“火眼金睛”:让AI“完美”图片瞬间现原形,不料却秒翻车?

自 8 月初发布以来,Flux 已在开发者和创意工作者之间引起了巨大轰动。许多人在尝试过 Flux 之后,相继发出“根本分不清到底是真人和 AI”的惊叹。

然而 AI 的魔法,看来还是要用 AI 来打败:昨日,前谷歌搜索创始人之一 Deedy Das 在 X 上宣布,他全程用 Claude 编写了一个辨别图片是否由 AI 生成的工具,其关键在于“提高饱和度”。

01 完全由 Claude 编写的 AI 鉴别神器?

以最近很火的这张“TED 演讲者”图片为例,Deedy Das 将其上传至这个工具后,原本看似极其逼真的 AI 人像瞬间就暴露了其“真容”:相当诡异的牙齿部分,麦克风和胸牌上的色块也不太正常。

火爆全网的AI造像,逼开发者祭出“火眼金睛”:让AI“完美”图片瞬间现原形,不料却秒翻车?

Deedy Das 指出,与下面的真实人像图片相比,显然后者的牙齿部分很正常,提高饱和度后的整体色块也更为均匀且一致。

火爆全网的AI造像,逼开发者祭出“火眼金睛”:让AI“完美”图片瞬间现原形,不料却秒翻车?

Deedy Das 还强调,工具代码完全由 AI 模型 Claude 编写,尤其它还是在原始图像数据上编写饱和度代码的,都不用使用外部库。目前,该工具处于公开可用状态(https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46),感兴趣的人可以去试试。除此之外,Deedy Das 还附上了工具源代码:https://t.co/v6nmtLrezW。

接下来,我们试两张网友用 Flux 生成的 AI 图像,来看看这个工具的具体效果如何:

火爆全网的AI造像,逼开发者祭出“火眼金睛”:让AI“完美”图片瞬间现原形,不料却秒翻车?

火爆全网的AI造像,逼开发者祭出“火眼金睛”:让AI“完美”图片瞬间现原形,不料却秒翻车?

从结果来看,如果辨别图片是否由 AI 生成的标准是奇怪的牙齿和不和谐的色块,那么这个工具确实将这两张 AI 图片识别出来了。

正当许多人以为,终于出现了个“神器”能准确辨别 AI 图片、不用担心再被 AI 欺骗的时候,有位用户突发奇想,借用 Deedy Das 的 X 头像图片试了试,结果出现了突兀的色块——难道他的头像照片也是 AI 生成的?

火爆全网的AI造像,逼开发者祭出“火眼金睛”:让AI“完美”图片瞬间现原形,不料却秒翻车?

火爆全网的AI造像,逼开发者祭出“火眼金睛”:让AI“完美”图片瞬间现原形,不料却秒翻车?

看到这个结果,Deedy Das 自己也哭笑不得,解释道:“这可能是图片压缩造成的。我刚用原始图片上试了试,并没有这些没有色块补丁。”

基于这个发现,后来 Deedy Das 在原帖下补充,理论上该工具可以检测 AI 图片,但它对 JPG 压缩后的真实图像会有误判,因此它可能不太适用于辨别社交媒体上的几乎所有图片,因为那些图片普遍都经过压缩:“经过 JPG 压缩的真实图片,整体色块的一致性会被破坏。”

对此 Deedy Das 表示,之后他会想办法构建一个针对最大饱和度图像的分类器,以此来分辨 JPG 压缩图像和 AI 图像。

02 AI 文生图模型的发展,实在太快

虽然 Deedy Das 承诺会想办法,但我们无法得知他具体会在何时实现——而且就目前来看,AI 文生图模型的发展,实在是太快了。

如开头所说,本月初 Stable Diffusion 背后的原始团队发布了全新的图像生成模型 Flux.1。据介绍,Flux.1 包含开发者版、快速版、专业版三种模型:

● Flux.1 [dev]:基础模型,以非商业许可方式开源,供社区在此基础上构建。

● Flux.1 [schnell]:基础模型的精简版,运行速度提高了 10 倍。Apache 2 授权。

● Flux.1 [pro]:仅通过 API 提供的封闭源代码版本。

根据 Flux 官网公布的数据显示,Flux.1 的 ELO 评分(一种在国际象棋等竞技游戏中广泛使用的评分方法,主要用于计算比赛对手实力等级)已超越 Midjourney-V6.0 和 Stable Diffusion3-Ultra 等主流模型,就算是较小规模的 Flux.1 [schnell] 在性能上也超越了 Midjourney-V6.0 和 Dall-E 3 HD 等更大的模型。

火爆全网的AI造像,逼开发者祭出“火眼金睛”:让AI“完美”图片瞬间现原形,不料却秒翻车?

基于以上数据,不少开发者都认为:或许,未来 Flux.1 将会是替代 MidJourney 和 Stable Diffusion 的终极 AI 图像生成工具。

若与 MidJourney 进行对比,Flux.1 在许多方面都具备优势。首先是开源,与 MidJourney 不同,Flux.1 的开源性质使得开发者可以轻松地对其进行修改和扩展,允许深度自定义、集成到各种应用程序中,还能根据需要修改模型。其次是卓越的图像质量,Flux.1 能提供既详细又逼真的高保真输出,图像质量在很多评分中都超过了 MidJourney。最后是可扩展性和性能,拥有 120 亿参数的 Flux.1 能够处理复杂且大规模的图像生成任务,适用于广泛的应用。

凭借着以上功能和优势,Flux.1 仅发布一周有余,就在网上引发了大规模的 AI 生图热潮,其逼真程度令人担忧:“AI 正在失控”。下面图片均由 Flux.1 生成,试问谁能一眼看出这些是 AI 生成的?

火爆全网的AI造像,逼开发者祭出“火眼金睛”:让AI“完美”图片瞬间现原形,不料却秒翻车?

火爆全网的AI造像,逼开发者祭出“火眼金睛”:让AI“完美”图片瞬间现原形,不料却秒翻车?

火爆全网的AI造像,逼开发者祭出“火眼金睛”:让AI“完美”图片瞬间现原形,不料却秒翻车?

不仅图片,甚至连视频都可以流畅生成——AI 创意制作人 Heather Cooper 就分享了一个用 Flux 制作化妆品广告的例子,甚至仅需 8 个步骤即可。

03 检测 AI 的方法,很可能也会很快失效

面对这些难以区分的 AI 图片,不少人十分担忧其可能带来的隐患,由此开始讨论到底该如何区分这些真真假假的图片。

有网友发现,如果让 AI 生成“普通人”的图片,通常都是不会笑的人,但如果是要求生成“漂亮的人”则多数都面带微笑。如下,提示词为“相貌平平的人”所生成的图片:

火爆全网的AI造像,逼开发者祭出“火眼金睛”:让AI“完美”图片瞬间现原形,不料却秒翻车?

对此有人分析称,这是因为模型根据当下的社会现象,认为“普通人”就该是正常的、平淡无奇的,“漂亮的人”的人则应该开朗明媚。某种程度上来说,这也是一种训练偏差。

还有人指出,AI 生成的图像往往略显模糊,因此放在大屏幕上比在手机上更容易分辨。除此之外,AI 生成的人的脸颊和额头,通常会有反光,且反光程度比真实照片要夸张一些——尽管如此,根据这两年的 AI 发展状况,这些检测 AI 的方法很可能也会很快失效。

基于以上,越来越多人对 AI 发展的未来前景感到担忧:

● “我在网上看到过一些帖子,帖子里有几张 AI 照片,然后作者会说其中一张是真的。现在真的越来越难一眼分辨了。很多人也不会花时间仔细检查他们在社交媒体上看到的每张照片。”

● “这东西很可怕,因为如果我把它给我父母看,他们根本不会分辨出这是真的还是假的。”

那么,你是否也有被 AI 图片混淆过,又是否有辨别 AI 图片的方法可以分享吗?

参考链接:

https://x.com/deedydas/status/1822665923775611374

https://x.com/AngryTomtweets/status/1822203767728591350

https://www.reddit.com/r/artificial/comments/1epjlbl/average_looking_people/

本文来自微信公众号“CSDN”,整理:郑丽媛 ,36氪经授权发布。

© 版权声明

相关文章

暂无评论

暂无评论...