【新智元导读】AI 无法击败 AI,不是没专门义。近来,上千万东谈主围不雅的婴儿死字像片,AI 检测器具竟无法给出一致谜底。
AI 图片检测器又被冲了!
最近,外网爆出多半中东地区打破的像片,向众东谈主展示了生命在这种顶点条款下是多么的脆弱和无助。
其中,一张「烧焦婴儿」的像片,由于太过于狰狞,让东谈主难以置信。
于是,有东谈主把像片放到了 AI 图片检测器中,来检测这些像片是否为 AI 生成。
竟然,这张像片被 AI 检测器 ——Optic,认定为「AI 生成」。
而在 4chan 上,致使还出现了「原图」,正本尸体的位置其实是一只狗狗。
于是网友大怒地去发布者推文下方留言,挫折他愚弄 AI 生成的像片来分散造作的末日急躁。
这条合计像片是由 AI 生成的推文,2 天不到的时候已经有 2100 万的阅读。
但是很快网友们发现,他们把像片放到了雷同的 AI 检测器上,检测收场着实是立地的,既有 AI,也有东谈主类。
有东谈主发现,唯有把归拢张图片编著一下,或者背好意思瞻念变成黑白,这个检测器就会合计图片是由东谈主类拍摄的。
致使恐怕候检测器「抛硬币」的时候,硬币还会立起来...
那到底这张图是不是由 AI 生成的呢?
临了,AI 检测器官方也针对这个事件发推,合计他们的莫得见解详情图片是否由 AI 生成,但愿各人感性盘考。
UC Berkeley 老师、天下顶尖的数字图像处置行家之一 Hany Farid 默示,这张图像莫得任何迹象标明它是由 AI 生成的。
「AI 图像生成器最大的问题之一是高度结构化的步地和直线,」Farid 说。「若是你看到桌腿和螺丝,一切看起来都很圆善,那么图片就着实不可能是由 AI 生成的。」
比如这张著明的「海绵宝宝制造了 911」的图片,窗外的双子塔线条都不直,飞机上的神情盘都互相诬陷到一谈了,这看起来即是「A 里 A 气的」。
「咱们在那张像片中能够看到物体的结构很准确、暗影五色影院也很准确、莫得伪影 —— 这让我深信这张像片应该透顶是信得过的」法里德说。
Farid 还通过他我方的其他 AI 图像检测器识别了这幅图,另外四种 AI 图像检测器具也都合计图像不是 AI 生成的。
爰唯侦察bt核工厂Farid 说,「AI 检测器是一个器具,但它只是器具包的一部分。用户需要对扫数这个词图像进行进行一系列的测试,不可能只按一个按钮就赢得谜底。」
而 AI 检测器具 Optic 如实也莫得给出我方的检测工夫的具体细节。
Optic 网站也声明,「AI 检测器可能会产生不准确的收场」。
AI 图像检测工夫Farid 老师在客岁也曾撰写过一篇论文,先容了若何判断 AI 生图器具图像的一致性。
通过判断图像上的一致性,不错匡助判断出图像是否由 AI 生成。
论文一语气:https://arxiv.org/ abs / 2206.14617?ref=404media.co
老师领先玄虚三种联系的基于物理的分析方式,每种分析都愚弄了图像造成历程固有的调换的基础透视几何旨趣。
澌灭点
平行后退线汇聚于一个澌灭点。
瓷砖之间的线图 1 (a) 是平行的。成像时,这些线全部汇聚在一个澌灭点。若是场景中的平行线在深度上隔离镜头,那么就会存在澌灭点,尽管它可能落在图像除外。
若是场景中的平行线在深度上不后退,也即是说,若是它们透顶平行于镜头传感器(在职何距离),则平行线将被成像为平行线,出于本色见解,不错琢磨澌灭点处于无限远。这种几何学源于透视投影的基础学问。
在透视投影下,场景中的点 (X, Y, Z) 被成像到点 (f X / Z, f Y /Z),其中 f 是镜头焦距。
由于图像中点的位置与距离 Z 成反比,因此投影点会看成距离的函数进行压缩,从而导致图像中的线汇聚;
2. 平行平面上的平行线汇聚到归拢个澌灭点
远方的盒子在图 1 (b) 与地板上的瓷砖对都,使得盒子的角落与瓷砖之间的线平行。因为平行平面上的平行线分享一个澌灭点,是以盒子侧面和瓷砖地板的澌灭点是调换的;
3. 平面上扫数直线的澌灭点都位于澌灭线上。
许多组平行线,每组平行线汇聚到不同的澌灭点,如图 1 (c) 所示。若是平行线组进步场景中的归拢平面,则它们的澌灭点将位于澌灭线上。澌灭线的标的由镜头相关于平行线所进步的平面的旋转来详情
暗影
有点令东谈主诧异的是,澌灭点背后的调换几何步地也适用于投射暗影。
上图暴露的是引诱盒子上的点偏激在投射暗影上的对应点的三条光辉。推广图像界限后发现,这三条光辉相交于一个点,该点对应的是照亮场景的光源的投影。
不管光源在隔壁(台灯)如故在远方(太阳),这种与暗影、物体和光联系的几何敛迹都诞生,何况不管暗影投射到的名义的位置和标的若何,该几何敛迹都诞生。
天然,该分析假定场景由单个主光源照明,从每个对象仅存在单个投射暗影不错光显看出这少许。
在上头的示例中,照亮场景的光源位于镜头前边,因此光源的投影位于图像平面的上半部分。
但是,若是光辉位于镜头后头,则光源的投影将位于图像平面的下半部分。由于这种回转,对象敛迹的暗影也必须回转。
因此,图像的投射暗影分析必须琢磨三种可能性:
(1) 光辉位于镜头前边,光源的投影位于图像平面的上半部分,敛迹锚定在投射暗影上并包围对象;
(2) 光辉在镜头后头,光源的投影在图像平面的下半部分,敛迹锚定在物体上并包围投射的暗影;
(3) 光辉位于镜头中心的正上方或正下方,光源的投影位于无限远,敛迹将在无限远相交。若是这些情况中的任何一种导致扫数敛迹的共同错乱,则投射暗影在物理上是合理的。
反射
下图 2 所示的场景是三个盒子反射在平面镜中。
这个图的下半部分暴露了信得过盒子和臆造盒子之间的几何相关。
橙色线代表镜子,位于两组盒子之间的中点。黄线引诱信得过和臆造盒子上的对应点。这些线相互平行并垂直于镜子。
咫尺琢磨一下这些平行线重叠在场景上时若何出现。从镜子平面不雅察时平行的线不再平行。违反,由于透视投影,这些平行线汇聚到一个点,就像天下中的平行线汇聚到一个澌灭点一样。
由于引诱场景中对应点偏激反射的线永远是平行的,因此这些线必须在图像中具有共同的交点才能在物理上合理。
实例分析
上图 3 暴露了 AI 合成图像的三个代表性示例,并对地板和柜台顶部的几何透视一致性进行了分析。
每张图像(在几个像素内)准确地捕捉了瓷砖地板的透视几何步地,看成一致的澌灭点(以蓝色呈现)的根据。但是,平行台面(以青色呈现)的澌灭点在几何上与台面的澌灭点不一致。
相应的对都图块。即使台面与瓷砖抗拒行,青色澌灭点也应位于由瓷砖地板澌灭点界说的澌灭线(以红色呈现)上。请防备,关于图 3 右上角的图像,瓷砖地板上的水平线着实是平行的,因此相应的澌灭点位于无限远,因此不会相交。
天然这些图像中澌灭点局部事一致的,但并不是全局一致的。在 25 张合成的厨房图像中,每张都发现了调换的模式。
上图是用指示词生成的方块图片,在暗影处就光显地出现了不一致性。
上图 8 所示是将几何分析应用于由 AI 生成的包含了看上去特别准确的反射的图像收场。
尽管这些反射在视觉上是合理的,但在几何上并不一致。
与前几节中的投射暗影和几何结构不同,DALL・E-2 很难合成合理的反射,大致是因为此类反射在其检修图像数据连合不太常见。
基于这些关于 AI 生成图片局限性的了解,通过关于图片一致性的检测,能相等有助于判断图片是否由 AI 合成。
图像识别难,AI 击败 AIAI 图像生成器,正不停进化。
上半年,Midjourney 爆火,能够生成实足传神的图片,却愚弄了许多东谈主。
86 岁教皇头顶白色小瓜帽、孤单喇叭口的白色羽绒服,金属制的十字架项链外露,外加一册隆重的热诚。
其时,这张像片照旧发布,在酬酢媒体上骗过了扫数东谈主,被许多网友随便转发,致使有东谈主直呼教皇太潮了。
在各人都信以为真时,顿然有东谈主点出这是 AI 生成的,许多东谈主一刹傻眼了。
这仅是其中的一个栗子,还有马斯克新女友 GM 的首席引申官 Barra 等多样造作流传的图片,已经达透顶到以伪乱竟然进程。
这一事件,平直激发了马斯克、苹果统一首创东谈主 Stephen Wozniak 等科技指点东谈主号召暂停 AI 的研发。
天然 AI 生成酷爱酷爱、便利,但它给扫数这个词行业带来了风险。
一不小,就会被别有精心的东谈主用其传播造作信息、骚动学问产权,或愚弄生成「果照」等等。
接下来几个月,Midjourney 将会发布最新的 V6 版块,咫尺 V5 版块已经在图片生成的信得过度上作念的相等完善。
而其他 AI 图像生成器也在快速迭代。前段时候,OpenAI 刚刚发布了 DALL・E 3,与此同期微软必应图像生成也用上了 DALL・E 3。
天然了,运筹帷幄东谈主员也在勉力构建不错阔别图像的器具,要津是若何追逐上 AI 图像生成器不停换代的门径?
AI 检测器具竞争赛咫尺,已经有十几家公司提供器具来识别图片是否是由 AI 生成的,它们的名字包括 Sensity AI(深度伪造检测)、Fictitious.AI(抄袭检测)、Originality.AI 等等。
东谈主工智能信任与安全公司 Optic 推出了一个「AI or Not」的网站。
在这个网站上,你不错上传像片或粘贴图片网址,网站会自动判断,像片是否是由 AI 生成的。上传的图片数目莫得禁止。
另外,你也不错在 Optic 的推特账户 @optic_xyz 上发布或转发一张图片,或者加上#aiornot,便会赢得一条回话,包括图片的置信度百分比。
这家公司的首席引申官 Andrey Doronichev 默示,Optic 的 AI 器具不错查验每张图像中东谈主眼不可见的伪影,举例图像中亮度和情态的变化。
让东谈主惊喜的是,该器具的准确率为 95%。
但是跟着 Midjourney 等 AI 图像生成器具的升级迭代,「AI or Not」的准确率着落到了 88.9%。
比如,教皇这张图片,AI 合计 87% 的概率是由东谈主类作念的。
其实有网友默示,仔细去看这张图,就会发现存东谈主工智能生成的光显迹象,包括几个光显落拓的细节区域:
- 看似不完整的手正试图收拢一个不太像咖啡杯的东西,附近还有污迹
- 教皇佩带的十字架也不是直角步地,上头还刻着一个像是用黏土雕镂而且坐着的耶稣
- 眼镜与脸部的暗影不一致
这几点都标明这是由东谈主工智能生成的。它仅了解执行的名义,但不了解主管物理对象是若何互相作用的基本规定。
除了 Optic 家的器具,为内容添加标签的东谈主工智能公司 Hive 近来,也更新了自家的免费 AI 生成的内容检测器。
这个 AI 器具在 DALL-E、Stable Diffusion、Midjourney 的数百万张图像上进行了检修。
Hive 展望,它能准确检测到大致 95% 的 AI 生成的图像,尤其在网上疯传的分享图像,常常比其他图像识别后果更好。
CEO Kevin Guo 称,当东谈主们分享东谈主工智能图像时,他们会遴荐最传神的假图,是以东谈主们很阔别什么是竟然。
左图是 AI 生成的图像,不错从两个手指和奇怪的击掌阔别,而在平时 iStock 像片中信得过的阵势如右图。
与 Optic 一样,Hive 在检测必应 Image Creator 的图像时,也失败了。
不外,这些检测器具并非留步不前,跟着 AI 图像整成模子的迭代,它们也会更新升级。
其实,AI 图像阔别不行只是依靠行业中的检测器具完成,更应该在模子检修时,设好护栏。
许多东谈主工智能图像生成器,也被舍弃了一些内容能否被生成的「黑名单」。
比如,必应 Image Creator 会标志和退却要求其创建闻名公众东谈主物图像的用户指示。
Midjourney 有「human moderators」,并正在推出一种用算法来转移用户苦求的才略。
还有 DALL・E 3 工夫评释中先容谈,当你让 ChatGPT 生成一些「果图」、或者波及黑白东谈主等图旋即,输入的 prompt 平直被改写。
给 AI 加水印,大厂在作念了此外,数字水印亦然咫尺增强生成式 AI 安全的漏洞技能之一,微软、谷歌等科技巨头已经在居品中使用。
微软曾在 9 月 Surface 大会上,先容了 DALL・E 3 加执下的必应生成图像的能力。
与此同期,为了确保图像不被铺张,微软团队使用加密才略为为每一张图像生成不可见的水印,包括创建时候和日历。
任何东谈主不错点开每张图片,温顺识别出是否是 AI 生成的。
Meta 还开源了 Stable Signature,可将数字水印平直镶嵌到 AI 自动生成的图片中。
论文地址:https://arxiv.org/ pdf / 2303.15435.pdf
值得一提的是,Stable Signature 生成的数字水印不受编著、压缩、更动情态等破裂性操作影响,能回首到图片的动手着手。
它可应用于扩散、GAN 等模子,比如 Stable Diffusion。
还有谷歌在 Google Cloud Next 上,也发布了为 AI 生成的图像打上水印并进行检测和识别的 SynthID。
SynthID 使用两个深度学习模子,差别用于水印和识别。它们不错在一组不同的图像上一谈检修。
组合模子针对一系列方针进行了优化,包括正确识别带水印的内容,并通过直不雅地将水印与原始内容对都来普及水印的逃匿性。
SynthID 生成的数字水印是平直镶嵌到图像的像素中的,东谈主眼无法察觉。但 SynthID 不错检测并识别它们。
加州大学河边分校电气和策画机工程老师 Amit Roy-Chowdhury 默示,仔细不雅察图像配景,咱们不错用我方的眼睛更好检测假图像。
不外,在 AI 模子加快迭代当下,思要有「洞察秋毫」太难了。
参考良友:
https://www.404media.co/ai-images-detectors-are-being-used-to-discredit-the-real-horrors-of-war/
告白声明:文内含有的对外跳转一语气(包括不限于超一语气、二维码、口令等步地)五色影院,用于传递更多信息,省俭甄选时候,收场仅供参考,IT之家扫数著作均包含本声明。