专题研讨|赵宪伟:海量电子数据审查的实现路径(三)

admin 2025年7月1日18:46:00评论5 views字数 4504阅读15分0秒阅读模式

三、精准运用电子数据空间巨大 

现实虽然并不乐观,但也不绝对悲观,特别是新型多发犯罪的网络化趋势越来越明显,电子数据的作用也得到空前的关注和重视。

    一方面立足融合协作,电子数据支撑办案有广度空间。虽然 当前案件中的电子数据运用呈快速增长,但从刑事案件总量上看,涉电子数据案件还有很大空间。应通过完善建立技术协作机 制,把电子数据取证纳入重大或疑难、复杂案件的提前介入及自行补充侦查,覆盖刑事案件办理的全部阶段。

    另一方面立足专业能力,电子数据支撑办案有深度空间。当前网络犯罪新型案件层出不穷,案件中无论是技术手段、原理或是事实情节都直接影响到案件定性及量刑。应通过研究新型或疑 难复杂案件的办案难点,在传统电子数据取证基础上,根据检察官在不同案件中的视角需求,形成针对海量电子数据聚类、搜索、归集、关联各类技战法,同时深入探索区块链、跨境云平台、特定对象数据取证(机动车、船舶等)等新型取证领域,进一步形成针对海量电子数据取证、分析专业技术能力。

跟大家分享若干案例。2020年杭州市江干区人民检察院在办理一起电信诈骗案中,侦查机关移送了142部被扣押的手机,初步查实共32名受害人,涉案金额32万余元。基层院的检察官与检察技术人员用了两周的时间,把能明确身份的受害人增加到202人,诈骗金额从32万增加到395万。这些突破对犯罪嫌疑人形成极大威慑力,最终整个团伙认罪认罚,不仅表示对数额认定没有异议,还主动要求退赃挽损。

    在另外一起案件中,技术人员协助检察官审查嫌疑人聊天记录时,推断其中一个嫌疑人应当用电脑记账,台账文件对涉案金额的确定至关重要,但侦查阶段并未扣押该嫌疑人电脑,退补期间,检察官现场引导侦查人员扣押了嫌疑人电脑,成功提取台账文件。通过对台账文件的分析,结合案涉其他相关证据,将涉案金额从300万提升至9700万,达到了罪责刑相适应的目的。

笔者多年辅助检察官解决涉案电子数据的专门性问题,对上述场景比较熟悉,更是对“电子数据中有天使,电子数据中也有魔鬼”的说法深有感触、深以为然。比如,2009年笔者通过分析电子数据证据,确定了被告人真实的年龄,使一起强奸案被告人得到应有的刑事处罚。2013年笔者通过分析涉案的数据库,还原了犯罪嫌疑人私放在押人员并修改后台数据库的过程。事实上,在大多案件中,我们尚未能够充分利用的电子数据价值。

    检察机关承担着指控和证明犯罪的主导责任,同时履行法律监督职能,也正由于以上的经历和分析,可以预见运用好电子数据的多元关联证明作用,将会开启前所未有的美好篇章。

四、实现路径和方法

坦白讲,前面提到的案例,办案过程都是非常艰辛的。因为大量的工作都是靠人工去完成。可问题的关键是,现阶段我们各地检察机关还不具备有足够优秀和数量的专业技术人员,无法在每一个案件中协助检察官去挖掘电子数据潜在的价值。试图把解决问题的希望寄托于侦查阶段也不现实。笔者看来,对海量电子数据进行审查,可以通过以下五个步骤推进。

1、引导培育办理案件运用电子数据的良好生态

从前述情况来看,整个检察系统的办案检察官,依旧沿袭对侦查机关结论性材料的依赖习惯——尤其针对电子数据,不愿怀疑、不会怀疑,进而不敢怀疑。导致这种情况的一个重要原因是,目前在行业内,还没有高度匹配检察审查应用场景的电子数据工具软件。这恐怕是很多设备和取证厂商,长期以来把更多的精力放在“取证”上所致。其实,在检察审查阶段,对电子数据的分析和应用是有一定规律的。在笔者看来,只要把握好以下几个方面,就能够充分挖掘电子数据的价值作用。在工具层面,需要完善对电子数据取证报告的浏览、过滤、搜索、统计、标记功能。显而易见,“浏览电子数据”始终是应用的第一步,并且是最重要的步骤,这里面可能还会涉及很多组合过滤的浏览需求。其次才是根据需要进行高效的搜索和查询。统计和标记的功能需要也是非常关键的,如在分析聊天记录时,当审查人员点击社交软件主账号时,好的审查工具应当清晰展示主账号的哪些群组更加活跃、跟哪些好友联系更加紧密、主账号在哪些群组的发言更加热络等。通过这些简单的统计,让审查人员能够对该主账号的状态有个整体性认识,也便于开展后续工作。同时,审查电子数据并非一日或者一次就能够完成,好的工具应当提供随时标记备注的功能,这也是研判案件事实的重要依据。

2、积累检察办案电子数据分析精准需求

在业务层面,应当围绕指控和证明的需求,而不是漫无边际的挖掘。笔者认为,应当从犯罪构成的角度入手,了解真正的检察审查需求是什么。下面试着梳理几方面问题供大家参考启发。

    一是哪些电子数据能够证明相关人员主体身份?可以从手机通讯簿信息、诸多第三方 APP 的注册用户基础信息、社交媒体记录中好友对其的称呼、交易对手信息、相关人员之间的备注信息等落地相关人员的主体身份。如下图所示。

专题研讨|赵宪伟:海量电子数据审查的实现路径(三)

专题研讨|赵宪伟:海量电子数据审查的实现路径(三)

二是哪些电子数据能够直接证明明知或者主观故意?电子数据不仅能够反映行为内容,也能够记录行为痕迹。因此,精准的电子数据取证不仅能够固定犯罪的客观行为,甚至也能够据此发现能行为人的主观故意、以及相关的犯罪预备行为。在某案件中,行为人与不满 14 周岁的受害人发生性关系,并辩称毫不知情受害者不满 14 周岁。但嫌疑人在与其好友的聊天交流中,曾经炫耀自己“X 了一个初二的女生”,依据这条聊天记录,完全可以推定行为人对受害者的年龄是具有明知故意的。

    三是哪些电子数据能表示犯罪行为的危害后果?在某黑客攻击案件中,行为人案发后为逃避刑事处罚,在跟好友的聊天记录中提到自己收了别人“几万元钱”,好友则劝其出去避避,这一组聊天记录不仅反映了犯罪行为的损害后果和情节,还侧面提供了好友的包庇行为。如下图所示。

专题研讨|赵宪伟:海量电子数据审查的实现路径(三)

哪些电子数据能够延伸证明潜在的受害者,受否存在上下游勾连或者团伙组织架构,哪些电子数据能够表明犯罪后的掩饰毁灭行为、销赃行为、请求帮助行为。以及哪些电子数据证明了侦查阶段取证行为不够规范或者违法取证等等。这些检察审查点比较分散,需要有丰富实际办案经验的检察官深度参与并提出,绝非工程技术人员能够解决得了的。 

3、设计科学合理的人工智能技术框架。

    依靠优秀的技术人员,只能解决个案。只有在更大的范围内做到整体性提升,才是解决问题的最好方法。怎么进行整体性提 升?笔者认为,唯有向科技要战斗力。具体到本文所探讨的问题,笔者甚至畅想,从海量电子数据中挖掘诉讼价值,极有可能是第一个在司法机关真正落地的人工智能应用场景。以海量聊天记录为例,我们可以建立这样一个模型:把电子数据所反映的行为拆分为最小原子操作,比如把每一条聊天记录当作一个处理的对象,运用算法识别每一条记录中的实体、行为类型等,通过积累 规则、对标犯罪案由库。这里有很多基础工作需要做,比如规则库怎么建、案由库怎么建,这些既可以通过集成司法系统的行业智慧,也可以辅助以机器学习5来付诸实现。

专题研讨|赵宪伟:海量电子数据审查的实现路径(三)

机器学习是对能通过经验自动改进的计算机算法的研究(Machine Learning is the study of computer algorithms that improve automatically through experience.)—Mitchell,《Machine Learning》 (1997

    该模型具体如何运行?以一份手机取证报告为例。将手机取证报告作为输入,对其中的每一条聊天记录进行分析,以人、物、地址、时间为基本属性,以行为识别、实体识别、情绪识别等为扩展属性。经过中间过程的匹配,初步输出我们检察办案所需要项目。比如是否有团伙、主观故意情况、表示危害后果的证据、潜在的受害对象等。这些具体的目标和指标,需要检察官的深度参与。同时,我们还可以在中间阶段加入取证规范性判断,通过智能化输出判断侦查取证行为是否必要、适当。

如何对模型进行验证?模型的智能化操作,最关键的是结果输出。最初未必准确,甚至完全不准确。这就需要动员高校、科研院所、各类公司企业参与进来。我们可以给所有的参与者提供真实案件中的电子数据包。各参与方充分挖掘自身智慧、创建自己的人工智能算法,支持和鼓励在各类算法之间进行竞争。由于依据的基础电子数据是已决案件,结果很容易得到验证。通过这种形式,推动不断地完善人工智能算法达到更好的效果。笔者认为这将是能够推动解决该问题的可行之道。

4、实现案件电子数据审查的必要功能

目前行业主流的电子数据取证和综合分析工具软件,通常具备过滤、关键词搜索(含正则表达式模糊搜索)以及简单的统计、标记等功能,但这距离高质量挖掘和利用电子数据的目标还相差甚远。如何在浏览、过滤、搜索、标记、统计等五个基础功能上,融合人工智能经典算法既是挑战,也着实令人期待。

    以海量聊天记录的搜索为例。按照常规的做法,我们会在深入了解案件的基础上,设定一组可能的关键词,并在社交媒体记录中进行精准检索(搜索中文无法使用正则表达式进行模糊匹配),然后在命中的文本中逐项浏览、标记和判断。但这种方法却始终无法处理下面的需求,如“检索聊天记录中出现的所有安徽省的地址”“检索聊天记录中‘闪电’组织的其他成员”“张 三与李四2020年10月3日下午去了哪里”“王五 2020 年 11 与 10 日的情绪怎么样”……

    上面这些“奇怪”的需求,已经突破了精准匹配和现有的模 式匹配概念,需要以当前比较成熟的自然语言处理、机器学习为基础,研究运用好人工智能经典算法,从一个小的需求切口出发,逐步积累形成成熟的战法。同时,还需要创造性的发明一种机制,把检察官的智慧模型化,并能够实现积累、验证和输出。

5、构建案件电子数据的科学表达

对海量电子数据进行可视化表达,既是运用电子数据的关键环节,也是充分实现庭审效果的有效手段。以某网络传销为例,一个拥有10余万用户的传销组织,其社会危害性、组织规模程度都不是冷冰冰的数字能够传递出来的。在庭审环节,公诉人出示了专门绘制的组织架构图(如下图所示),详细描绘了组织的 层级关系和总体规模,给参与庭审各方(法官、律师、被告人、群众等)以极大的震撼,取得良好的庭审效果。

    当然,数据可视化的方式和工具很多,广大电子数据技术工作者可以结合案件需要和实际情况灵活选择,并不推荐大家都追 求所谓的“高大上”,能够切实说明问题就可以了。

专题研讨|赵宪伟:海量电子数据审查的实现路径(三)

无论如何强调电子数据的作用都不为过,这是时代特点所决定的。以上是笔者从电子数据内容层面实现诉讼价值挖掘的一点思考。虽不成熟,但应坚信,只要有广泛的参与者,一定能最大 程度地利用好这些电子数据,履行好检察机关追诉犯罪和法律监督职能。

参考文献 

[1] 喻海松.刑事诉讼法修改与司法适用疑难解析书[M].北京:北京大学出版社,2021:174-194 

[2] 刘品新.电子证据法[M].北京:中国人民大学出版社,2020:335-345 [3] 陈慧芳.业务与技术碰撞提升检察办案质效[N].检察日报,202-4-10(3) 

[4] 寿思聪.基于自然语言处理的聊天内容分析系统[C].电 子数据取证与网络犯罪调查专刊,2018(1):209-215

原文始发于微信公众号(信息时代的犯罪侦查):专题研讨|赵宪伟:海量电子数据审查的实现路径(三)

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2025年7月1日18:46:00
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   专题研讨|赵宪伟:海量电子数据审查的实现路径(三)https://cn-sec.com/archives/903343.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息