【论文速读】| LLM4FUZZ：利用大语言模型指导智能合约的模糊测试

admin

146004
文章

119
评论

2024年5月9日14:29:13评论66 views字数 2065阅读6分53秒阅读模式

本次分享论文：LLM4FUZZ: Guided Fuzzing of Smart Contracts with Large Language Models

基本信息

原文作者：Chaofan Shou, Jing Liu, Doudou Lu, Koushik Sen

作者单位：加州大学伯克利分校，加州大学欧文分校，Fuzzland公司

关键词：区块链，智能合约，Fuzzing，大语言模型

原文链接：

https://arxiv.org/pdf/2401.11108.pdf

开源代码：暂无

论文简介

随着区块链平台的迅速发展，智能合约在数字资产管理中的应用逐渐增多，同时也暴露出许多安全漏洞。本文介绍了一种名为“LLM4FUZZ”的创新方法，该方法利用大语言模型（LLMs）来智能地指导和优先处理模糊测试活动，从而优化智能合约的自动化安全分析。

传统的Fuzzing方法在探索庞大的状态空间时效率较低，但LLM4FUZZ通过使用LLM生成的指标来引导Fuzz工具，专注于那些更可能触发漏洞的代码区域和输入序列，从而显著提高测试的效率和覆盖率。

引言

随着区块链平台和去中心化应用的快速发展，管理数十亿美元数字资产的智能合约代码量急剧增加。不幸地，这些关键代码中的漏洞经常被黑客利用，导致了重大资产损失。因此，在部署前全面分析智能合约的安全性至关重要。

传统的人工审计大量的智能合约代码库容易出错，并且经常忽视边缘情况中的漏洞。为了克服这些限制，行业越来越倾向于使用自动化的方法，如测试、动态分析和形式验证。因此，开发能够有效指导Fuzz测试并提高其探索效率和安全性的新技术，对保障区块链生态系统的安全至关重要。

研究背景

区块链技术的快速进展使得智能合约成为管理大量数字资产的关键工具。尽管如此，智能合约中频繁出现的安全漏洞已导致巨大的资产损失。传统的安全审计方法主要依靠手动检查，而这种方法往往忽略了边缘案例中的漏洞。因此，业界已开始采用如动态分析和形式验证等自动化方法以提升审计效率。然而，目前的自动化Fuzz测试技术在理解代码的语义和状态依赖性方面表现不佳，难以高效地探索代码的复杂状态空间。因此，迫切需要开发更先进的解决方案以提高智能合约的安全测试效率。

相关工作

本论文综述了现有的智能合约Fuzzing技术，并指出它们主要依赖静态分析或动态执行跟踪来自动化地生成测试用例。然而，这些技术常局限于现有代码的API用法，难以探索新功能或深入挖掘潜在的复杂用例。

论文还讨论了大语言模型在程序代码生成中的应用，展示了这些模型为智能合约安全测试带来的新技术可能性。提出的LLM4FUZZ方法结合了大语言模型的分析能力与Fuzzing的动态测试优势，旨在显著提升智能合约测试的质量与效率。

实验设计

LLM4FUZZ首先把智能合约代码转换为抽象语法树（AST），进而执行深入的静态分析。接着，该系统利用大语言模型（LLMs）对代码进行分析，生成有关代码复杂度和潜在漏洞的度量指标。这些指标随后被用来指导Fuzz测试工具，优先针对那些更有可能触发漏洞的代码区域和输入序列进行测试。采用这种方法的LLM4FUZZ显著提升了测试的目标性和效率，有效减少了重复和无效的测试努力，加快了关键漏洞的发现和修复。这个流程的自动化和智能化显著增强了智能合约的安全验证过程。

实现方法

LLM4FUZZ实施了一个精细化的流程以优化智能合约的Fuzz测试。首先，该系统将智能合约代码转化为抽象语法树（AST），并执行静态分析来识别基本的代码特征。然后，通过大语言模型（LLMs）对这些特征进行详尽分析，产生关于代码区域的复杂性和潜在漏洞的度量指标。这些指标随后整合入Fuzzer的调度系统，以指导Fuzz测试工具优先针对那些潜在风险较高的区域。LLM4FUZZ通过这种方式显著提升了智能合约Fuzzing的效率和精确度，大幅减少了无目标探索的成本。

研究评估

LLM4FUZZ已在多个去中心化金融（DeFi）项目中进行实际评估，并与传统Fuzzing技术相比表现出显著的性能提升。该技术在提升测试覆盖率、减少漏洞发现时间以及增强漏洞检测能力方面显示出优异的成效。

此外，在测试过程中，LLM4FUZZ成功识别了多个之前审计未发现的严重漏洞，这些漏洞涉及的潜在财务损失超过24万美元。这一成绩证明了LLM4FUZZ通过大语言模型优化智能合约Fuzzing流程的有效性，并凸显了其在智能合约安全领域的巨大应用潜力。

论文结论

LLM4FUZZ通过结合大语言模型的深度语义分析功能，极大地提高了智能合约Fuzz测试的效率和成效。此方法智能地引导Fuzz测试工具专注于高风险的代码区域和输入序列，不仅提升了测试覆盖率，也在更短时间内识别出更多漏洞。随着区块链技术的广泛应用，LLM4FUZZ为智能合约的安全性验证提供了一种高效的新途径，有助于降低由漏洞引起的财务损失，并推动区块链生态系统的健康发展。

原作者：论文解读智能体

校对：小椰风

原文始发于微信公众号（安全极客）：【论文速读】| LLM4FUZZ：利用大语言模型指导智能合约的模糊测试

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

【论文速读】| LLM4FUZZ：利用大语言模型指导智能合约的模糊测试

专题·人工智能安全 | 大模型联网的风险分析与应对举措

从0到1大模型MCP自动化漏洞挖掘实践

网络安全分析人员的生成式AI辅助指南

优秀论文 | 生成式人工智能在侦查讯问中的应用——基础、尝试、风险及对策建议

悟空Agent实战：LLaMA-Factory高危0day漏洞挖掘与修复

图神经网络系列六：GCN优化之GAT与lightGCN

关于AI系统的访问控制，看看权威观点

中山大学｜FORGE：驱动大语言模型自动化构建大规模智能合约漏洞数据集

当ChatGPT接入MCP，你的数据是如何被泄露的？

【AI风险通告】LLaMA-Factory存在远程代码执行漏洞（CVE-2025-53002）

发表评论

在线咨询

微信