从开源项目和库的Issue和Bug报告中挖掘情报

2022年12月28日19:21:22评论65 views字数 1852阅读6分10秒阅读模式

原文标题：Mining Threat Intelligence about Open-Source Projects and Libraries from Code Repository Issues and Bug Report
原文作者：L Neil，S Mittal，A Joshi
原文链接：https://ieeexplore.ieee.org/document/8587375
发表会议：2018 IEEE International Conference on Intelligence and Security Informatics (ISI)
笔记作者：JSY2019@SecQuan
笔记小编：ourren@SecQuan

研究背景和研究介绍

在如今，开源项目和开源库在越来越多的软件中被使用。在这样的三方软件生态下，产生了新的攻击方法，即黑客通过利用项目所关联的其他安全性较低的其他项目来达到攻击目的。

作者提到了其先前的工作，即CyberTwitter[1]和Cyber-All-Intel[2]，这些工作都是从OSINT中获取内容。

在该论文中，作者提出了一个提示开发者关于在开发项目中链接某开源软件或某开源库时可能的威胁和漏洞的系统。并开发了一个可追踪客户机安装软件的程序。

研究问题与结果

提出的核心问题

威胁情报的获取：从基于web的版本控制服务平台中获取社区中提出的issues和bugs等威胁情报知识。这些平台包括GitHub、GitLab、bitbucket等。
安全知识图谱的构建：使用提取的威胁情报知识建立包含不同开源项目漏洞信息的知识图谱。

所采用的方法

总体的系统架构如下图：从开源项目和库的Issue和Bug报告中挖掘情报

威胁情报的获取

在本文中，主要的威胁情报来源于GitHub社区的bug和issue报告。

流程图大致如下。从开源项目和库的Issue和Bug报告中挖掘情报

文中利用GitHub REST API来获取并追踪项目仓库的issues和pull申请。对于issues，作者通过[1]中提出的SVCE工具来标记issues中内含多于两个安全名词的情报。

安全知识图谱的构建

作者基于UCO[3]构建本体图；并构建了软件依赖本体图来表达已安装的软件和其依赖。

软件依赖本体图：从开源项目和库的Issue和Bug报告中挖掘情报

在获取知识后，作者通过URI关联将知识变为结点，通过DBpedia链接现实概念和不同图谱节点，最后储存为RDF三元组。

警报系统的构建最终，作者通过建立一个SQARQL endpoint来收取查询，通过加入SWRL规则来生成警报。

结果

作者在安装了包括预装程序在内的81个程序的Ubuntu Linux上测试成果，

作者收集了2018年1月以后的、关于这81个程序的110800个GitHub issue，经过SVCE处理后，余下9194个。最后放入了知识图谱。

作者抽取了150个随机issue来人工检查系统的准确度。其中，98个正确，18个完全错误，余下34个部分正确。

其他想法

对于最后的准确度（65.3%完全正确，88%非完全错误率），作者提到了被丢弃的issues、拼写错误、无法分辨的字母、不正规的词语用法和非英文的词汇等。

社区情报的准确度正是因为这些情况的影响而无法很高。另一个问题是，仅是81个程序就存在着十万以上的issue，在处理后也余下近万个。对于互联网上存在着的巨量开源程序，其issues的量也是巨大的。对于知识图谱的储存、查询的要求会很大，所遗漏的漏洞也可能会变得很多。

参考文献

[1] Mittal S , Das P K , Mulwad V , et al. CyberTwitter: using Twitter to generate alerts for cybersecurity threats and vulnerabilities[C]// Advances in Social Networks Analysis and Mining. IEEE Computer Society, 2016.

[2] Mittal S , Joshi A , Finin T . Cyber-All-Intel: An AI for Security related Threat Intelligence[J]. 2019.

[3] Syed Z , Padia A , Finin T , et al. UCO: A Unified Cybersecurity Ontology[C]// AAAI Workshop on Artificial Intelligence for Cyber Security. 2016.

安全学术圈招募队友-ing
有兴趣加入学术圈的请联系 secdr#qq.com

原文始发于微信公众号（安全学术圈）：从开源项目和库的Issue和Bug报告中挖掘情报

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

从开源项目和库的Issue和Bug报告中挖掘情报

研究背景和研究介绍

研究问题与结果

提出的核心问题

所采用的方法

结果

其他想法

参考文献

G.O.S.S.I.P 阅读推荐 2025-07-08 Google视角下的Android设备指纹采集风险

哥本哈根大学 | TRAP：用于黑盒识别的定向随机对抗提示蜜罐

（CCS 2025）移动应用中的指纹识别行为——新研究揭示的挑战与解决方案

网络安全行业，每个从业者都是数字屋檐下的守夜人

Linux 命令实用清单指北

KDD2025｜Benchmarking Graph Foundation Models

ANTLR改进 — 像使用Tree-sitter一样使用ANTLR

巴西警方逮捕 IT 员工，涉超 1 亿美元网络盗窃案

114.114.114.114 与 8.8.8.8，国内外最火 DNS 谁更强？

如何面试 k8s 运维开发相关岗位

发表评论

在线咨询

微信