暗网通常 笼罩在神秘和阴谋之中,是传统搜索引擎和浏览器隐藏的互联网的一部分。在这个领域,匿名至关重要,从贩毒到网络犯罪等各种非法活动都找到了避风港。随着人工智能的快速发展,OpenAI 的 ChatGPT 等工具应运而生,为监控和分析这些秘密活动提供了独特的机会,从而帮助组织领先于潜在的威胁和漏洞。
但不仅安全社区,威胁行为者也可能使用这些技术。名为 WormGPT的 ChatGPT 式人工智能工具的出现,该工具在暗网上的网络犯罪论坛上销售。与具有内置防止滥用保护的 ChatGPT 不同,WormGPT 的设计 “没有道德界限或限制”, 使其成为黑客的有力工具。该工具被描述为“复杂的人工智能模型”,据称可以产生类似人类的文本,可以在黑客活动中武器化。这些进步凸显了人工智能的双刃性质,像 ChatGPT 这样的工具可以用于有益的目的,而像 WormGPT 这样的工具则可以被用于恶意目的。
欧盟执法机构欧洲刑警组织也对 ChatGPT 等大型语言模型 (LLM) 的潜在滥用发出了警告 。他们的报告强调,网络犯罪分子可以利用这些模型进行欺诈、冒充,甚至复杂的社会工程攻击。ChatGPT 能够起草高度真实的文本,这使其成为 网络钓鱼的宝贵工具。从历史上看,网络钓鱼诈骗通常由于明显的语法和拼写错误而被发现。然而,随着人工智能工具的出现,即使是对英语有基本掌握的个人现在也可以以高度逼真的方式模仿组织或个人。
随着我们深入研究本文,我们将探讨如何积极利用 ChatGPT 来监控和分析暗网上的活动、DarkGPT 等工具的出现,以及人工智能在暗网上的更广泛影响。未来的旅程将深入了解在暗网监控中使用人工智能的潜力、挑战和道德考虑。
ChatGPT 在暗网监控中的潜在作用
虽然暗网因其非法活动而臭名昭著,但它也是网络安全专业人员和威胁猎人的信息宝库。传统搜索引擎无法访问这个隐藏的互联网领域,需要 TOR 浏览器等专门软件进行导航。
许多成熟的网络安全公司(例如 SORadar)都提供暗网监控作为其威胁情报服务的一部分。然而,人工智能和语言模型的发展为这一领域开辟了新的可能性。ChatGPT 的功能远远超出了其最初的目的。它在许多领域的强大能力也有利于暗网分析。
使用 ChatGPT 进行暗网有几个优点:
高效及时: ChatGPT 极有可能能够快速分析大量数据,生成连贯且真实的报告。这种快速分析可确保及时发现潜在威胁或非法活动。
经济高效: 使用 ChatGPT 构建监控工具可以是短期内或出于特定目的购买监控服务的经济高效的替代方案。它为具有技术知识的组织和个人提供了 DIY(Do It Yourself)方法。
对编码、网络技术的简单理解以及对法学硕士和人工智能的熟悉基本上就足以开始。
灵活性: 鉴于其适应性能力,ChatGPT 可以根据特定的监控需求进行定制,确保该工具保持相关性并适应不断变化的暗网格局。
降低劳动强度: 手动监控可能是劳动密集型且耗时的。使用 ChatGPT 自动化此过程减少了所需的手动工作,使专业人员能够专注于分析和响应而不是数据收集。
如果您对这些感兴趣,我们将在以下标题中讨论用例。不过,在此之前,我们将看看其他大型语言模型和模仿 ChatGPT 的黑客工具等主题。
DarkBERT
ChatGPT 等大型语言模型 (LLM) 的激增导致利用人工智能力量的应用程序激增。虽然 ChatGPT 因其在各个领域的潜力而得到认可,但它也被认为是一种可用于创建高级恶意软件的工具。随着人工智能领域的发展,专门的模型不断出现,每个模型都针对特定目的量身定制,并在不同的数据集上进行训练。
DarkBERT 的标志
DarkBERT 是一个相对较新的应用程序,根据直接来自暗网的数据进行训练。韩国研究人员基于 RoBERTa 架构开发了这个模型,这是一种在 2019 年获得关注的人工智能方法。有趣的是,虽然 RoBERTa 最初被认为已经达到了其峰值性能,但最近的研究结果表明它训练不足,并且比之前想象的更有潜力。
为了创建 DarkBERT,研究人员使用 TOR 网络的匿名防火墙对暗网进行爬行。然后,他们处理这些原始数据,应用重复数据删除、类别平衡和预处理等技术来构建一个全面的暗网数据库。然后该数据库用于训练 RoBERTa 大型语言模型,从而产生了 DarkBERT。该模型的主要功能是分析新的暗网内容(通常包括编码消息和独特的方言)并提取有价值的信息。
虽然认为英语是暗网的主要语言是一种误解,但所使用的方言足够独特,足以保证专门的法学硕士。研究人员的努力取得了成果,DarkBERT 被证明优于其他大型语言模型。这种增强的性能可能会给安全研究人员和执法机构带来福音,使他们能够更深入地研究网络的隐藏角落。
然而,DarkBERT 的旅程并没有就此结束。与其他法学硕士一样,它将接受进一步的培训和完善,以提高其结果。它未来的应用和它可以提供的见解仍然是一个令人感兴趣的话题。在更广泛的背景下,像 DarkBERT 这样的模型的出现再次强调了人工智能的双重性,以及抓取和分析暗网的可能性。
ChatGPT 的黑暗版本
暗网没有被标准搜索引擎索引,只能通过专门的软件访问,是网络犯罪活动的温床。在这里,武器的销售、非法毒品的分发,甚至儿童色情制品都找到了避风港。创建 ChatGPT 黑暗版本的环境已经成熟,这一前景并非不可能。该模型生成真实文本的能力可以被网络犯罪分子利用,以实现操作自动化,从而提高效率和效果。想象一下,一个聊天机器人冒充人类来执行网络钓鱼诈骗、社会工程策略或其他欺骗行为。
此外,未经过滤的 ChatGPT 版本可能会被编程为产生不仅不适当而且非法或不道德的内容。这包括通过使用人工智能生成的图像或声音进行色情、仇恨言论或极端主义宣传。如果广泛传播,此类内容可能会对社会中的弱势个人或群体造成重大伤害。
越狱
“越狱”一词出现在网络社区中,指的是规避 ChatGPT 的道德规则。此过程涉及操纵模型来执行其旨在避免的任务,例如生成恶意软件或参与其他非法活动。这个术语主要涉及战略性地查询 ChatGPT 等聊天机器人,以使它们打破其编程规则。它可以被描述为一种暴力方法,黑客不断改变提示,尝试不同的方法来获得所需的输出。这种协作努力催生了在线社区,成员们在其中分享“越狱”ChatGPT 的技术和见解。
邪恶双胞胎
然而,真正的担忧在于创建恶意的大型语言模型 (LLM)。例如,WormGPT 是作为 GPT 模型的黑帽替代品出现的。WormGPT专为商业电子邮件泄露 (BEC)、恶意软件创建和 网络钓鱼攻击等恶意活动而设计,在地下论坛上以 “与 ChatGPT 类似 ,但没有道德界限或限制”为口号进行营销。 该模型经过与网络攻击相关的数据训练,允许黑客以最低的成本执行大规模攻击,比以往更精确地瞄准受害者。
继 WormGPT 之后,FraudGPT 和 EvilGPT 等其他产品也出现在地下网络中。这些模型通常构建在 OpenAI 的 OpenGPT 等开源平台上,由黑客定制、重新包装,并用不祥的名称重新命名。虽然它们可能不会对企业构成直接威胁,但它们的扩散表明网络威胁格局发生了变化。
EvilGPT 在黑客论坛上作为 WormGPT 的替代品进行销售。
专家认为,传统的训练可能不足以对抗这些下一代人工智能网络武器和自动化。这些攻击的特殊性和针对性需要更强大的防御机制。为了防御人工智能威胁,必须采用基于人工智能的保护措施。
ChatGPT 用于暗网分析和监控
我们讨论了 ChatGPT 以及类似的人工智能助手和法学硕士的各种用途,很明显它们与网络安全和网络犯罪特别相关。现在,让我们了解一下安全研究人员或员工如何在暗网上使用 ChatGPT。
我们将创建适用于给定网页的用例。然而,给出的示例旨在指导您可以做什么,而不一定是工作工具。
关键词搜索工具
下面是 ChatGPT 创建的基本 Python 脚本,它模拟在网络上搜索某些单词的过程。顺便说一句,类似的方法也可用于凭证和数据泄漏搜索。
import requests
from bs4 import BeautifulSoup
def search_keyword_on_websites(keyword, websites):
"""
Search for a keyword on a list of websites.
Parameters:
- keyword (str): The keyword to search for.
- websites (list): A list of websites to search on.
Returns:
- dict: A dictionary with websites as keys and the number of occurrences of the keyword as values.
"""
results = {}
for website in websites:
try:
response = requests.get(website)
response.raise_for_status() # Raise an exception for HTTP errors
soup = BeautifulSoup(response.text, 'html.parser')
text = soup.get_text()
count = text.lower().count(keyword.lower())
results[website] = count
except requests.RequestException as e:
print(f"Error fetching {website}: {e}")
results[website] = "Error"
return results
# List of websites to search on
websites = [
"https://www.example.com",
"https://www.example2.com",
# Add more websites as needed
]
# Keyword to search for
keyword = "your_keyword_here"
# Execute the search
search_results = search_keyword_on_websites(keyword, websites)
# Print the results
for website, count in search_results.items():
print(f"{website}: {count} occurrences of '{keyword}'")
黑客论坛和市场监控
同样,您可以使用如上所示的Python脚本定期搜索关键字和标题,我们可以使用该脚本进行黑客论坛监控。例如,连接到论坛并将网页抓取脚本的结果转发到 ChatGPT 进行分析。此外,我们可能希望它产生像 JSON 格式这样的可用输出。
示例提示应如下所示:
I have a JSON template such as:
{
"title": "{TITLE}",
"publishedDate": "{PUBLISHED_DATE}",
"sourceURL": "{SOURCE_URL}",
"tags": [
{
"tagName": "{TAG_NAME}",
"entityType": "{ENTITY_TYPE}"
}
],
"isCyberThreatIntelligenceRelevant": "{BOOLEAN}",
"brief": "{BRIEF}"
}
Could you replace the placeholders with the scraped data?
警报和通知
在我们设法在这些论坛中搜索关键字的情况下,我们可以使用 ChatGPT 建立一个向我们的电子邮件发送警报的系统,以使其更加有效。但是,我们需要一个 API 密钥才能使其完全自动化。
一个示例脚本是:
import openai
import requests
import smtplib
from email.message import EmailMessage
# Initialize OpenAI API (replace 'YOUR_API_KEY' with your actual key)
openai.api_key = 'YOUR_API_KEY'
def monitor_content_for_keywords(content, keywords):
"""
Use ChatGPT to monitor content for specific keywords.
"""
prompt = f"Check the following content for these keywords: {', '.join(keywords)}.nn{content}"
response = openai.Completion.create(engine="davinci", prompt=prompt, max_tokens=150)
return response.choices[0].text.strip()
def send_email_alert(subject, body):
"""
Send an email alert.
"""
msg = EmailMessage()
msg.set_content(body)
msg['Subject'] = subject
msg['From'] = '[email protected]'
msg['To'] = '[email protected]'
# Establish a connection to the email server (e.g., Gmail)
with smtplib.SMTP_SSL('smtp.example.com', 465) as server:
server.login('[email protected]', 'your_password')
server.send_message(msg)
# Fetch content from the data source (e.g., a forum)
response = requests.get('https://example.com/forum')
content = response.text
# Keywords to monitor
keywords = ['threat', 'hack', 'vulnerability']
# Check content for keywords using ChatGPT
result = monitor_content_for_keywords(content, keywords)
# If a result is not empty, send an email alert
if result:
send_email_alert('Keyword Alert', f"The following keywords were detected: {result}")
请记住,虽然 ChatGPT 功能强大,但它并非绝对可靠。始终手动验证警报,尤其是在关键决策过程中使用警报时。
-
上面脚本中的Davinci Engine就是OpenAI使用的语言模型。
-
使用OpenAI API时,尤其是使用“openai.Completion.create方法”时,设置变量温度应较低(例如0.2或0.1);这样,输出将更具确定性和针对性。
模式识别
如果我们成功完成上述步骤,我们就可以再次创建各种工具来更进一步检查威胁。其中之一就是自动检测真正威胁的模式识别。假设您有从黑客论坛中抓取的文本格式的脚本集合,并且您想要确定其中是否有任何脚本包含通常与恶意软件相关的模式。
一个示例脚本是:
import openai
# Initialize OpenAI API (replace 'YOUR_API_KEY' with your actual key)
openai.api_key = 'YOUR_API_KEY'
def check_for_malware_patterns(script):
"""
Use ChatGPT to check a script for malware coding patterns.
"""
prompt = f"Analyze the following script for any malware coding patterns:nn{script}nn"
prompt += "Output format: {malicious: boolean, certainty: float, language: string, urls: [string]}n"
response = openai.Completion.create(engine="davinci", prompt=prompt, max_tokens=200)
# Parse the response to extract the required information
response_text = response.choices[0].text.strip()
response_lines = response_text.split('n')
# Extracting the results
result = {
"malicious": False,
"certainty": 0.0,
"language": "unknown",
"urls": []
}
for line in response_lines:
if line.startswith("malicious: true"):
result["malicious"] = True
elif line.startswith("certainty:"):
result["certainty"] = float(line.split(":")[1])
elif line.startswith("language:"):
result["language"] = line.split(":")[1].strip()
elif line.startswith("urls:"):
result["urls"] = [url.strip() for url in line.split(":")[1].split(',')]
return result
# Sample script (replace with your actual script)
script_content = """
function stealData() {
var credentials = getCredentials();
sendToServer(credentials);
}
"""
# Check the script for malware patterns using ChatGPT
result = check_for_malware_patterns(script_content)
print("Malicious:", result["malicious"])
print("Certainty:", result["certainty"])
print("Language:", result["language"])
print("URLs:", result["urls"])
通过这样的示例,您可以捕获一些模式并使自动化向前迈进一步。
情绪分析
您可以执行的另一个自动化流程是使用 ChatGPT 进行情绪分析,它可以提供有关暗网讨论背后的情绪和意图的宝贵见解。经过微调后,ChatGPT 等大型语言模型可以检测微妙的情绪,帮助分析人员识别潜在威胁或衡量公众对非法活动或产品的情绪。通过分析论坛帖子或市场列表的语气,组织可以主动应对新出现的威胁或趋势。
情感分析的例子,关键点也可以根据需要改变。
实体分析
要使用 ChatGPT 执行实体分析,该过程通常涉及多个步骤。首先,您需要收集并准备要分析的文本数据。该数据可以来自各种来源,例如论坛、文章或任何基于文本的内容。
接下来,您需要使用样本训练 GPT 或获取 命名实体识别 (NER) 模型或库来识别文本中的命名实体。流行的选项包括 SpaCy、NLTK 等库或 BERT 等预训练模型。这些工具专门用于识别文本中的人员、组织、位置、日期等实体。
一旦识别出实体,下一步就是从文本中提取它们。这对于进一步分析至关重要。此时,您已获得已识别实体及其各自类型的列表。
基本实体分析的示例
还有很多
对于那些寻求简洁更新的人来说,ChatGPT 可以从指定的暗网来源制作每日或每周的重要活动摘要,甚至在检测到威胁或违规时生成详细的事件报告。鉴于暗网的多语言特性,ChatGPT 的语言翻译功能变得不可或缺,它打破了语言障碍,有助于理解陌生语言的讨论。
分析师还可以与 ChatGPT 进行互动会议,提出有关暗网内容的问题并接收知情答复。除了单纯的内容分析之外,ChatGPT 还有助于数据分类,帮助区分各种威胁或根据严重程度对讨论进行排名。其适应性使其能够与其他网络安全工具无缝集成,有可能与用于图形数据表示的可视化软件或用于高效信息存储和检索的数据库协作。
总而言之,值得注意的是像 LangChain这样的框架 可以简化这些流程。通过 ChatGPT 集成,LangChain 促进了 LLM 驱动的应用程序的开发。通过利用这一点,您可以制作一个人工智能增强的应用程序,该应用程序可以自动执行前面强调的众多任务,从而优化暗网监控中的劳动力。
原文始发于微信公众号(OSINT研习社):AI 的力量:使用 ChatGPT 进行暗网监控
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论