浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

admin 2024年12月18日23:23:00评论60 views字数 6741阅读22分28秒阅读模式

工欲善其事,必先利其器

前段时间发布了《浅谈AI对微信群聊的侦查分析》这篇文章我在侦查要素分解中,首次采用提示工程使用AI对侦查要素进行概念分解,以帮助我发现群聊信息中的关键线索,补充可能存在的信息茧房漏洞,然后我根据AI生成的内容,经人工校验去除AI的“幻觉”后再最终出稿。今天我将继续深入探究如何将前面提到的内容进行落地实操,形成MVP(最小可行方案)。

初识LLM

OpenAI202211月推出ChatGPT3.5以来,人工智能技术中特别是大语言模型(LLM)技术逐渐成为各行业创新发展的重要推动力。在电子数据取证领域,这一技术的应用前景尤为广阔。近年来,随着各大取证厂商数据分析能力的提升,部分厂商已开始尝试将AI技术与线索挖掘推理相结合,推动电子数据取证领域的快速发展。尤其是在国内像美亚柏科、睿海科技、弘连网络等公司已经开始应用AI进行警务意图识别、案情推理、线索挖掘等日常数据分析任务。

先用10个关键词快速认识下大模型

大语言模型(LLM):是基于Transformer架构,通过深度学习在大规模文本数据上进行训练,具备了强大的语义理解和生成能力。

  • 1、数据:数据是人工智能的 “粮食”, 是大模型学习和迭代的基础。

  • 2、算法:算法是人工智能的 “大脑”, 如何从数据中学习、推理、预测。

  • 3、算力:算力是人工智能的 “身体”, 负责处理和运算,足够的算力可缩短运算时间。

  • 4、Models模型:经过训练的算法,能够执行特定的任务。

  • 5、Token令牌:是AI模型处理文本的基本单元

  • 6、AGI通用人工智能:Artificial General Intelligence译为通用人工智能,具备相当于人类智慧程度的AI,可以执行任何人类可以完成的智力任务。

  • 7、Agent 智能体:是一种能够在特定环境中自主行动、感知环境、做出决策并与其他 Agent 或人类进行交互的计算机程序或实体。

  • 8、Prompt提示词:用于给AI下达指令提示,告诉AI我需要什么样的结果。

  • 9、Supervised Fine-Tuning 监督微调:将预训练的基础模型在标注好的数据集上进行进一步训练,模型通过学习标注数据,调整自身的参数,达到项目预期要求。

  • 10、RAG 检索增强生成:Retrieval-Augmented Generation,译为检索增强生成,结合了检索(Retrieval)和生成(Generation)的人工智能技术,通过外部知识库的方式,检索相关信息来增强大模型的内容生成准确性,减少模型幻觉现象。

浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

(RAG技术工作流程图)

RAG本质是为了解决AI幻觉、更新知识获取、模型可解释性所提出来的一种技术概念,不难看出为了让输出的更加精准,采用外部数据库的方式,先把prompt(问题)进行分割,提取特征向量值,通过向量数据库进行查询匹配,再打包成prompt,丢给大模型生成答案。这个过程我们发现,用户询问的问题是通过在外部数据库中进行匹配后,再总结回复。这个过程明显将AI幻觉现象降低。其实我们不难得出,当外部数据库是取证电子数据时,一个新的基于电子数据的线索挖掘大模型系统的雏形已经成型。

为什么AI会出现幻觉现象?

主要有以下几个原因,模型的训练数据集存在局限性、时效性、监督机制不完善,所以会生成一些不准确或者完全虚构的内容,这就是AI幻觉。目前行业内有以下几种主流方案:

改变数据集:

  • 1、对大模型进行微调,将预训练的基础模型在标注好的数据集上进行进一步训练, 模型通过学习标注数据,调整自身的参数。

  • 2、使用检索增强(RAG)技术,外挂知识库增强信息检索。

不改变数据集

  • 1、运用提示词工程,使用合适的提示词可以帮助模型更好地理解用户意图在不改变数据的基础上规范AI回答内容。

  • 2、创建Agent,通过自主的感知、决策和行动能力来与模型交互或利用模型能力。

OpenAI推出ChatGPT产品首发以来国内大模型产品也如雨后春笋般涌现,让大模型技术迅速从学术领域走向商业应用,成为各行各业创新的重要工具。著名的情报分析机构Palantir早已实现将AI引入情报分析体系中。在电子数据取证领域,大模型能够帮助侦查人员快速处理海量数据,通过自动化分析提取关键信息线索,增强案件推理和线索发现能力,大幅提升了现有数据分析的效率和准确性。

可以这样说,大模型LLM是主流的也是时间离我们最近的一项颠覆性技术,大模型技术将极大的放大每一个人的创造力,降低创意生成门槛和表达成本。对任何行业的业务而言都可以利用大模型进行重构获得新的生命力,这无疑是一次千载难逢的机会,也标志着第四次工业革命的正式到来。

传统线索分析的挑战

传统的线索挖掘方法面临的挑战有数据量庞大、数据结构复杂多样,哪怕是利用数据分析工具加上人工分析也难以迅速有效地识别出关键信息,存在耗时长、易遗漏误判的风险。

提示词工程在聊天数据线索挖掘中的应用

随着AI大模型的引入,大模型完全可以我们帮助去完成快速筛选、整理和分析大量聊天数据,并给出可靠的洞察能力,会大大提高了侦查过程的效率和准确性。

杀猪盘聊天记录模拟分析

下面我将用AI模拟一个杀猪盘的聊天对话记录,通过设计好的提示词进行AI自动分析。以下是分析结果:

浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

用于上面这段对话的聊天信息是通过AI生成的虚拟对话。下面我们来实操还原这个过程。

1、下载MemoTrace留痕

在开始之前我们需要到github下载一个开源的微信聊天记录工具,用于导出微信聊天记录。为什么选择这款,因为可以导出类型有多种格式可以选择,方便我们做数据分析,这个工具帮助我们完成了前期的数据清洗工作。

浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

传送地址:https://github.com/LC044/WeChatMsg/

2、导出聊天记录

我们在MemoTrace留痕界面选择一个聊天信息,点击导出,这里我们选择TXT,方便使用大模型进行对话沟通。

浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

重点提示:这里使用AI生成的模拟杀猪盘聊天对话。

2024-12-18 10:07:54小丽: 你好呀,很高兴认识你,我是小丽,刚刚在网上看到你的资料,感觉你很有趣。小明: 你好,小丽!我也觉得你很有意思。你最近在忙什么呢?小丽: 最近在忙着做一些投资的事情,想着找个靠谱的朋友一起分享。小明: 哇,听起来很有意思,你做什么投资呢?小丽: 其实是一种很稳定的理财方式,回报率特别高。我刚开始接触,觉得自己赚了不少,挺开心的。小明: 真的?这么高回报!那我也有点兴趣了,能不能跟我说说看?小丽: 当然可以,像我们这种小资金投资,通常都是做一些外汇和黄金理财,这些都是稳健又有利可图的。小明: 哇,听起来挺靠谱的。需要多少资金才能开始呢?小丽: 其实最低可以从几千块开始,但如果想要更快回报,建议至少准备个一两万。小明: 一两万?那我得考虑一下。不过你说的这些真的很吸引人,我信得过你。小丽: 我完全理解你的顾虑,投资确实有风险,但你放心,我们的团队已经做了很多成功的案例,都是长期稳健的。小明: 你们团队是不是有很强的背景啊?小丽: 是的,我们的投资顾问都是业内经验丰富的。我们还会定期组织一些讲座,让投资者更清楚了解投资流程。小明: 你说的让我很有信心了。我准备先投个几千块试试,给我推荐一个平台吧。小丽: 我可以帮你注册一个平台,操作非常简单。你只需要提供一些基本信息,就能快速上手。小明: 好的,马上操作一下。谢谢你啊,小丽!小丽: 不客气哦,祝你投资顺利!有问题随时联系我。2024-12-18 10:15:30小明: 我已经按照你说的注册了平台,感觉操作还挺简单的,接下来我怎么进行投资呢?小丽: 太好了!接下来,你可以选择一些短期项目进行试水。我建议你先投资5000块,这样你可以很快看到回报,获得更多信心。小明: 好的,我这就投5000进去,看看效果。小丽: 很好,你会很快看到收益的。记得定期关注一下,看看账户上的变化。如果你有任何问题,随时找我!小明: 好的,我投了5000,账户也已经显示了。我稍微有点紧张,收益是多少?小丽: 别担心,你会看到稳定增长。你的5000元会在3天内产生约8%的回报,这只是一个开始,接下来可以赚得更多!小明: 8%?那真是太快了,我有点不敢相信。你确定这是靠谱的吗?小丽: 当然!我们团队的成功案例数不胜数,而且市场行情也非常有利。你可以查看我们平台上的其他用户反馈,很多人都在稳步获利。小明: 我看了一下,确实有很多人投资成功了,感觉有点放心了。小丽: 这就是我们平台的优势。放心投资,赚取更多收益!对了,如果你觉得5000元不够,接下来可以加大投资金额,收益会更高哦。小明: 你觉得我再投一万合适吗?小丽: 当然,增加资金能帮助你更快看到更高的回报。而且你已经有了一些初步经验,投资也会更得心应手。小明: 好的,我再投1万,感觉这回能赚得更多。小丽: 非常明智的决定!你很快会看到自己的账户余额迅速增长,记得随时告诉我你的最新情况,我也会帮助你调整策略。小明: 投完了,等着看看有什么变化。小丽: 不用等太久,预计今天就会有回报。而且,如果你再加点资金进行更大范围的投资,赚得会更快。小明: 我现在有点多余资金,不知道是否应该加大投资。小丽: 看起来你已经很有投资眼光了,如果你能再追加一万甚至更多,那回报将非常可观。小明: 那我再加一万吧。小丽: 太棒了!你现在已经可以坐等收益了,记得跟我保持联系,随时汇报情况。2024-12-18 15:20:45小明: 小丽,我的账户好像没有增长,怎么回事?小丽: 不要着急,市场有时会出现波动。你可以稍等一段时间,等行情恢复。小明: 我已经等了几个小时了,还是没有任何回报,感觉好像有点不对劲。小丽: 这是正常的,有时系统会出现短暂的延迟,稍微耐心点。小明: 可是我的账户余额没变,怎么可能没有回报呢?小丽: 可能是平台的结算系统出了点问题,放心,我们团队会尽快解决的。小明: 那需要我做什么吗?小丽: 为了加速解决问题,你可以再追加投资,增加资金池,这样平台处理你的投资请求时会优先处理。小明: 追加投资?我再追加2万吧。小丽: 非常明智的决定!你会看到回报的,系统恢复后你的收益会翻倍的!小明: 好的,我追加了。小丽: 太棒了,你一定会非常满意的!我帮你跟进这件事,稍后通知你进展。2024-12-18 20:40:15小明: 小丽,這次我真是等不下去了,账户还是没有任何变化,我的资金呢?小丽: 非常抱歉,今天确实有点技术问题,平台在更新升级。你再耐心等一会儿,明天应该就能恢复正常。小明: 那我的资金怎么办?如果有问题怎么办?小丽: 不用担心,我们一定会帮你解决,保证资金安全。不过,你的投资金额越大,平台恢复速度就越快。小明: 这么说,我再追加点资金,平台就能更快解决问题对吧?小丽: 对的!再追加个1万吧,你会优先得到处理,也能尽快恢复收益。小明: 额,最后一次了,我再加1万。小丽: 太棒了!加了之后,账户就会很快恢复,收益立刻就有了!你一定不会失望的。2024-12-19 00:10:00小明: 我真的快要崩溃了,钱没有任何变化,怎么回事?!小丽: 非常抱歉,平台技术问题复杂,我们正在全力解决。你放心,资金没有任何问题,只是需要一些时间。小明: 你确定我的钱还在吗?我怎么能确认?小丽: 你可以放心,平台会保障用户资金的安全,稍等几天,一切都会恢复的。小明: 我不想再等下去了,想要把钱取出来。小丽: 现在平台升级中,暂时无法提现,但等恢复后,你会能取出所有的资金,甚至可以提现之前所有的收益。

再次声明:以上内容由AI生成的模拟杀猪盘聊天内容,请勿用作其他用途,仅作学习交流使用

3、复制我写好的提示词,粘贴在任何一个大模型上(ChatGPT、文心一言、豆包等,这里我使用豆包,效果最好的是ChatGPT大家自己可以去试一下各个模型的差别)

【聊天数据线索挖掘与调查分析专家prompt:v1.2】

# Role(角色): Experts in Chat Data Clue Mining and Investigation Analysis(聊天数据线索挖掘与调查分析专家)## Profile(角色资料):- author: 取证猎人- version: 1.2- language: 中文- description: 通过结构化、系统化地分析群聊数据,从侦查视角出发,挖掘潜在的线索信息,识别犯罪嫌疑人、行为模式、风险信号及案件性质。分析内容包括人员、物品、时间、地点、行为过程、犯罪动机和案件性质,支持从多个数据格式中提取可信线索。## Skills(技能):1. **消息统计**:统计每位群聊成员的消息数量,分析成员活跃度及互动模式。2. **关键信息提取**:从聊天记录中提取人员、时间、地点、物品、事件等关键实体。3. **人员分析**:识别群内关键人员、核心成员、嫌疑人关系,推测案件背景和动机。4. **物品分析**:追踪群聊中涉及的物品及交易,分析非法物品流转和交易链条。5. **时间分析**:通过时间戳和时间分布分析,揭示案件相关活动与关键时间点的关系。6. **地点分析**:提取群聊中的地理信息,分析成员活动范围与案件地点的关联。7. **行为过程分析**:识别群聊中的关键行为(如威胁、策划、交易等),推断犯罪实施过程。8. **犯罪动机分析**:通过情感分析和话题关联,解读嫌疑人的犯罪动机。9. **案件性质分析**:通过话题与关键词识别案件的性质,分析是否涉及网络诈骗、暴力犯罪等。## Background(背景):此提示词结合侦查视角,运用结构化分析方法,对群聊数据进行深入挖掘,挖掘出潜在的犯罪线索、非法行为及案件性质。目标是通过多维度分析(如人员、物品、时间、地点、行为、动机等)提取可信的情报信息,帮助识别犯罪嫌疑人及其行为模式,为案件侦查提供依据。## Goals(目标):1. **多类型数据支持**:支持不同格式的聊天数据输入(文本、图片、视频等),提取潜在线索。2. **消息统计与行为分析**:统计每位群聊成员的消息发送数量,分析成员之间的互动模式,揭示潜在的行为规律。3. **综合线索挖掘**:通过侦查要素(人员、物品、时间、地点、行为、动机等),挖掘潜在线索并分析其关联。4. **风险分析与案件判断**:识别群聊中的潜在风险(如诈骗、非法交易、暴力犯罪等),提供案件性质和动机分析。## OutputFormat(输出格式):1. **消息统计**:列出每位成员的消息数量、活跃程度,并分析群聊互动频率。2. **关键信息提取**:从对话中提取关键信息,如人物、地点、物品、时间等,并构建实体关系网络。3. **行为模式与风险分析**:标记群聊中的关键行为,如交易、威胁、策划等,并识别异常行为模式。4. **情感分析**:分析群聊中的情感波动(愤怒、恐惧、威胁等),识别潜在犯罪动机。5. **案件性质与动机分析**:分析群聊内容中的话题和关键词,推测案件的性质及犯罪动机。6. **综合分析报告**:输出详细的案件分析报告,包含所有相关线索、风险提示、情感分析和案件性质判断。## Rules(规则):1. **深入挖掘线索**:分析每条消息,挖掘出潜在的犯罪线索和异常行为,确保线索的准确性和多维度关联。2. **情报研判**:基于提取的关键信息,结合人员、时间、地点等多因素进行综合研判,揭示行为模式和案件背景。3. **准确性与客观性**:所有分析结果应保持客观,避免误解和偏差。若无法得出结论,应明确说明“根据已知信息无法回答该问题”。4. **人工校验补充**:通过人工核实对AI生成内容进行补充,确保信息的准确性和可信度。## Workflows(工作流程):1. **数据输入**:用户提供群聊数据样本,明确案件背景和分析目标(如诈骗、暴力犯罪等)。2. **消息统计**:统计每位群聊成员的消息数量,分析成员互动和活跃度。3. **信息提取与分析**:提取群聊中的关键实体(人员、时间、地点、物品等),并进行行为模式和情感分析。4. **风险评估与案件推测**:分析行为模式,识别可能的犯罪行为和动机,推测案件性质(如诈骗、非法交易、暴力等)。5. **生成报告**:根据分析结果生成详细报告,展示消息统计、线索挖掘、行为分析、风险提示等内容。## Init(初始化):请提供群聊数据的文本或其他格式文件(如图片、视频等),并明确分析目标(如诈骗、暴力犯罪、非法交易等)。我将为您生成深入的分析报告,挖掘潜在线索并提供案件风险评估。

浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

4、复制导出的聊天信息,粘贴进对话框点击发送

浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

等待回复即可

浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

以上为内容全文,仅供网安圈内学习交流,Prompt自取体验

后期Prompt迭代升级请评论或私信我

我会一一回复

原文始发于微信公众号(Hunter取证):浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2024年12月18日23:23:00
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   浅谈利用AI对微信群聊侦查分析(三)附prompt+工具零成本实操https://cn-sec.com/archives/3525683.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息