全文共9112字,23图
预计阅读时间:23分钟
在情报调查中,我们知道照片里面包含着很多地理定位的重要细节,然而,除了照片表面上的视觉线索,其实,还有隐藏在图像文件中的其他重要信息,这些信息同样包含着关键线索,其中,最重要的就是 EXIF 数据。
对于,情报调查来说, EXIF 是一座信息金矿,因为它包含有关相机、设置,甚至位置数据的信息。虽然,通常大多数平台会从图像中删除 EXIF 数据,但是 EXIF 数据仍然是我们不能忽视的信息来源。
在这篇文章中,福韵君将带领大家一起去探索 JPEG 图像里深藏的情报密码。
情报分析工具
有一些工具可用于从 JPEG 图像文件中提取数据用以情报分析,在前期的推文中福韵君也向大家介绍过8类工具,可以点击下方链接了解。
2021-12-15
Forensically – 这是一个非常简单的基于 Web 的图像取证工具,可在浏览器中运行,只需使用“打开文件”加载图像即可开始分析。“元数据”“地理标签”和“字符串提取”选项卡对于访问我们需要的数据很有用。
Exiftool - 这是一个简单但非常强大的工具,用于从许多不同的文件类型中提取元数据,而不仅仅是图像。它可以在 Windows、Mac 和 Linux 上运行。它不像 Forensically 那样易于使用,但它对于查看恢复的元数据更有效。
Bless – Bless 是一个十六进制编辑器,可让以最原始的形式查看文件的结构。HxD也是一个很好的 Windows 基本十六进制查看器,但任何十六进制编辑器都可以用于此目的。使用十六进制阅读器是检查文件结构的最全面的方法,它将使我们能够非常精确地检查元数据。
JPEG 里的秘密
每种类型的文件都有自己的数字签名——这就是计算机如何区分.doc和.exe的方式。在 Windows 中,操作系统会查看文件末尾的扩展名(例如 .pdf、.xls)来决定使用什么程序来运行该文件。
更重要的是文件签名,每个文件都以十六进制文件签名开头,告诉操作系统它是什么类型的文件。.exe 文件以签名4D 5A开头,.docx 文件以签名50 4B 03 04开头,JPEG 图像文件以FF D8 开头,依此类推。
这意味着当计算机读取数据时,它会在文件的开头看到“ FF D8 ”并知道它是 JPEG。文件的结尾用相应的“ FF D9 ”标记。举个简单的例子,让我们看一下下面张图片,以下是计算机向你呈现图像的方式:
这是计算机看到相同图像的方式。通过使用十六进制查看器打开它,我们可以像计算机一样看到文件。请注意,它以文件签名FF D8开头,表明它是 JPEG:
并且文件以FF D9结尾,表示 JPEG 的结尾:
那么这与我们可能感兴趣的 EXIF 和其他文件数据有什么关系呢?
正如有特定的十六进制字符指示 JPEG 文件的开始和结束一样,文件中还有其他十六进制模式指示在何处可以找到特定类型的信息。这些都位于文件头中,这是文件的第一部分,位于与实际图像本身相关的主要数据之前。这里有所有有用的 JPEG 代码的完整列表,但我们感兴趣的只有几个:
FF E1 – 文件中任何 EXIF 数据的开始。
带有 EXIF 数据的照片
让我们首先保存它并将其上传到 Forensically,以下是元数据选项卡显示的内容:
里面有很多有用的细节。ImageDescription 字段也已填充,因此当我们将这张照片上传到博客时,它会自动填充标题字段。“字符串提取”选项卡中还有其他信息片段:
此 JPEG 标头中的大量数据使其成为使用十六进制编辑器检查文件的良好测试对象。以下是十六进制格式的文件:
请注意 EXIF 数据如何在右侧列中可见。我们知道 JPEG 的 EXIF 部分以FF E1开头,因此我们可以 Ctrl+F 找到文件的这一部分。它就在文件签名之后的开始处:
接下来我们可以通过搜索FF E2来检查 ICC 配置文件,但我们不会在这个特定的图像中找到它。但是FF ED字段(Photoshop 和 IPTC 数据)存在,因此我们知道该文件可能已由 Photoshop 处理:
文件的十六进制视图提供了最高级别的细节,但并不总是最容易阅读。Forensically 在提取和显示大部分数据方面做得很好,但在我看来,ExifTool 做得更好。以下是它如何呈现一些元数据的选择:
一些主要平台删除元数据的方式
有时我们可以看到平台是如何剥离数据的。例如,如果我们查看在 Ebay 上出售的这辆自行车,我们可以查看文件的十六进制视图,甚至可以告诉他们使用什么软件来执行此操作:
ExifTool Version Number : 10.80
File Name : 84068253_10111506635776461_6848249074852823040_o.jpg
Directory : .
File Size : 371 kB
File Permissions : rw-rw-r--
File Type : JPEG
File Type Extension : jpg
MIME Type : image/jpeg
Profile CMM Type :
Profile Version : 2.0.0
Profile Class : Display Device Profile
Color Space Data : RGB
Profile Connection Space : XYZ
Profile Date Time : 2009:03:27 21:36:31
Profile File Signature : acsp
Primary Platform : Unknown ()
CMM Flags : Not Embedded, Independent
Device Manufacturer :
Device Model :
Device Attributes : Reflective, Glossy, Positive, Color
Rendering Intent : Perceptual
Connection Space Illuminant : 0.9642 1 0.82491
Profile Creator :
Profile ID : 29f83ddeaff255ae7842fae4ca83390d
Profile Description : sRGB IEC61966-2-1 black scaled
Blue Matrix Column : 0.14307 0.06061 0.7141
Blue Tone Reproduction Curve : (Binary data 2060 bytes, use -b option to extract)
Device Model Desc : IEC 61966-2-1 Default RGB Colour Space - sRGB
Green Matrix Column : 0.38515 0.71687 0.09708
Green Tone Reproduction Curve : (Binary data 2060 bytes, use -b option to extract)
Luminance : 0 80 0
Measurement Observer : CIE 1931
Measurement Backing : 0 0 0
Measurement Geometry : Unknown
Measurement Flare : 0%
Measurement Illuminant : D65
Media Black Point : 0.01205 0.0125 0.01031
Red Matrix Column : 0.43607 0.22249 0.01392
Red Tone Reproduction Curve : (Binary data 2060 bytes, use -b option to extract)
Technology : Cathode Ray Tube Display
Viewing Cond Desc : Reference Viewing Condition in IEC 61966-2-1
Media White Point : 0.9642 1 0.82491
Profile Copyright : Copyright International Color Consortium, 2009
Chromatic Adaptation : 1.04791 0.02293 -0.0502 0.0296 0.99046 -0.01707 -0.00925 0.01506 0.75179
JFIF Version : 1.01
Resolution Unit : None
X Resolution : 1
Y Resolution : 1
Current IPTC Digest : 2aa1d117b0d20226dcefbb16249a023f
Original Transmission Reference : GggUWrgwZ9hSQFQXeGJa
Image Width : 1504
Image Height : 1505
Encoding Process : Progressive DCT, Huffman coding
Bits Per Sample : 8
Color Components : 3
Y Cb Cr Sub Sampling : YCbCr4:2:0 (2 2)
Image Size : 1504x1505
Megapixels : 2.3
File Type : JPEG
File Type Extension : jpg
MIME Type : image/jpeg
JFIF Version : 1.01
Resolution Unit : None
X Resolution : 1
Y Resolution : 1
Image Width : 1504
Image Height : 1505
Encoding Process : Baseline DCT, Huffman coding
Bits Per Sample : 8
Color Components : 3
Y Cb Cr Sub Sampling : YCbCr4:2:0 (2 2)
Image Size : 1504x1505
Megapixels : 2.3
因此,这不是一种非常有效的跟踪方式。
Twitter 也删除了元数据,但在从 Apple 设备上传文件时,它确实保留了 ICC 配置文件字段 ( FF E2 ) 和 Photoshop 元数据字段 ( FF ED )。这是Julia Bayer发布的一张 Quiztime 旧照片的示例:
在取证中打开图像并选择“字符串提取”从FF E2和FF ED字段中提取信息:
那里仍然有一些原始元数据尚未删除。Exiftool 使其更易于阅读:
ExifTool Version Number : 10.80
File Name : EP4i4PqUUA86HSg.jpeg
Directory : .
File Size : 284 kB
File Modification Date/Time : 2020:02:18 19:34:40+00:00
File Access Date/Time : 2020:02:18 19:34:40+00:00
File Inode Change Date/Time : 2020:02:18 19:34:40+00:00
File Permissions : rw-rw-r--
File Type : JPEG
File Type Extension : jpg
MIME Type : image/jpeg
JFIF Version : 1.01
Resolution Unit : None
X Resolution : 72
Y Resolution : 72
Profile CMM Type : Apple Computer Inc.
Profile Version : 4.0.0
Profile Class : Display Device Profile
Color Space Data : RGB
Profile Connection Space : XYZ
Profile Date Time : 2017:07:07 13:22:32
Profile File Signature : acsp
Primary Platform : Apple Computer Inc.
CMM Flags : Not Embedded, Independent
Device Manufacturer : Apple Computer Inc.
Device Model :
Device Attributes : Reflective, Glossy, Positive, Color
Rendering Intent : Perceptual
Connection Space Illuminant : 0.9642 1 0.82491
Profile Creator : Apple Computer Inc.
Profile ID : ca1a9582257f104d389913d5d1ea1582
Profile Description : Display P3
Profile Copyright : Copyright Apple Inc., 2017
Media White Point : 0.95045 1 1.08905
Red Matrix Column : 0.51512 0.2412 -0.00105
Green Matrix Column : 0.29198 0.69225 0.04189
Blue Matrix Column : 0.1571 0.06657 0.78407
Red Tone Reproduction Curve : (Binary data 32 bytes, use -b option to extract)
Chromatic Adaptation : 1.04788 0.02292 -0.0502 0.02959 0.99048 -0.01706 -0.00923 0.01508 0.75168
Blue Tone Reproduction Curve : (Binary data 32 bytes, use -b option to extract)
Green Tone Reproduction Curve : (Binary data 32 bytes, use -b option to extract)
IPTC Digest : d41d8cd98f00b204e9800998ecf8427e
Image Width : 1604
Image Height : 2048
Encoding Process : Progressive DCT, Huffman coding
Bits Per Sample : 8
Color Components : 3
Y Cb Cr Sub Sampling : YCbCr4:2:0 (2 2)
Image Size : 1604x2048
Megapixels : 3.3
该图像仍保留显示它是使用 Apple 设备创建的元数据:
Profile Creator : Apple Computer Inc.
Profile ID : ca1a9582257f104d389913d5d1ea1582
Profile Description : Display P3
Profile Copyright : Copyright Apple Inc., 2017
尽管 Twitter 删除了FF E1 (EXIF) 字段之后的大部分图像元数据,但它保留了其他元数据字段。这似乎只适用于 Apple 设备,但它只是一小部分信息,可能有助于证明或反驳图像归属,并且经常被忽视。
Reddit 还为来自 Apple 设备的照片保留了相同的元数据。这是头版的照片:
尽管所有其他数据都已被删除,但我们在这张图片中也看到了相同 Apple 起源的痕迹:
Profile CMM Type : Apple Computer Inc.
Profile Version : 4.0.0
Profile Class : Display Device Profile
Color Space Data : RGB
Profile Connection Space : XYZ
Profile Date Time : 2017:07:07 13:22:32
Profile File Signature : acsp
Primary Platform : Apple Computer Inc.
CMM Flags : Not Embedded, Independent
Device Manufacturer : Apple Computer Inc.
Device Model :
Device Attributes : Reflective, Glossy, Positive, Color
Rendering Intent : Perceptual
Connection Space Illuminant : 0.9642 1 0.82491
Profile Creator : Apple Computer Inc.
Profile ID : ca1a9582257f104d389913d5d1ea1582
Profile Description : Display P3
Profile Copyright : Copyright Apple Inc., 2017
人工智能生成的图像
在往期的推文中,福韵君也跟大家介绍过如何识别人工智能生成的图片,可点击下方链接阅读:
2021-11-26
在这张照片中存在许多标准元数据字段(都以“FF”开头),但它们都是空白的,实际上不包含任何数据。这当然是不寻常的,因为大多数真实的个人资料图像至少包含一些 JPEG 标题信息,而这个几乎完全是空白的。因此,根据此可以判断该照片是人工智能生成的,而非真实存在的照片。
好啦,今天的探秘到这里就结束啦,下次福韵君还会带领大家一起去了解更多有趣有价值的情报知识。
本篇文章为福韵原创内容,未经授权禁止转载
福韵原创IP形象设计,原创勿盗,侵权必究
封面来源:sebweo.com
原文始发于微信公众号(福韵 网络情报研究):【情报百科】探秘JPEG
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论