探究Java中XXE漏洞的深层原理

admin 2021年4月2日20:39:11评论49 views字数 1913阅读6分22秒阅读模式

前段时间微信支付JDK又出现了XXE漏洞,原因是对前一个XXE漏洞没有修复成功。细思深层原因,是因为对Java JDK提供的API函数理解不正确,导致误用函数进行防御。我不禁思考了以下问题:

1.Java中XXE漏洞的深层原理是什么?

2.以下代码为何无法防御XXE?

1
DocumentBuilderFactory.setExpandEntityReferences(false)

3.以下代码为何能够防御XXE?

1
DocumentBuilderFactory.setFeature("http://apache.org/xml/features/disallow-doctype-decl",true)

要弄清以上问题,我们必须深入到Java内置解析器中去一探究竟。于是我打算从JDK代码层面去跟踪解析器执行的每一步操作。接下来我会用三周的文章弄清这三个问题,本周先来弄清第一个。

0x01 测试代码

Java常用解析XML的方式有DOM,SAX,JDOM和DOM4j。我编写了4种方式的XXE漏洞测试代码,运行发现,漏洞触发点都是一样的。

说明这4种解析方式底层实现调用的API函数都是一样的。这里我选择DOM这种最常规的方式来举例。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import org.w3c.dom.Document;
import org.xml.sax.SAXException;
import javax.xml.parsers.*;
import java.io.ByteArrayInputStream;
import java.io.InputStream;

public class DOMXXETest {
public static void main(String[] args)throws ParserConfigurationException,SAXException,Exception{
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
String str = " n" +
"n" +
"]>&xxe;";
InputStream is = new ByteArrayInputStream(str.getBytes());
Document doc = db.parse(is);
}
}

可以在公众号回复”Java XXE漏洞测试代码”,获取所有测试代码下载地址。

0x02 漏洞分析

随着Java不断的成熟,它内置的解析器也越来越复杂,这里我们只挑和XXE漏洞相关的核心操作来说明。

由于所有解析方式都调用了XMLParser类来对XML文档进行解析。故我们从该对象的解析函数Parser开始跟踪。

XMLParser类会调用XML11Configuration类来解析XML文档的配置。而XML11Cofiguration类又会调用XMLDocumentFragmentScannerImpl类的scanDocument()对XML文档片段的结构和内容进行扫描。

scanDocument方法会先扫描XML的Document部分(START_DOCUMENT阶段),然后在扫描Document中的DTD(DTD阶段),当文档扫描器完成DTD的扫描后,进入START_ELEMENT阶段.

这时next()方法会对XML中的元素进行扫描。当扫描到文本中的&字符时(识别一般实体),将状态置为SCANNER_STATE_REFERENCE

在引用扫描状态下,解析器会调用scanEntityReference() 扫描实体引用。

其中将调用XMLEntityManager的startEntity()将应用程序定义的XML实体流插入解析流。

最后会调用setupCurrentEntity()创建连接并发起请求,以获取外部实体的内容,这时XXE漏洞将会触发!

最终调用链如下图所示

0x03 参考文章

文章来源于gv7.me:探究Java中XXE漏洞的深层原理

相关推荐: 永远的亚伦·斯沃茨

文章来源于gv7.me:永远的亚伦·斯沃茨相关推荐: 那些值得我们去研究的工具当下网络安全的工具层出不穷,质量参差不齐。大没必要到处收集。那些经得住时间考验的工具都是流传的经典。把它们用熟了,自然以一当百。它们当中的一些开源的,最好去阅读一下源码。那些设计,那…

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2021年4月2日20:39:11
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   探究Java中XXE漏洞的深层原理https://cn-sec.com/archives/318098.html

发表评论

匿名网友 填写信息