语言模型 - 第 3 | CN-SEC 中文网

安全闲碎

【论文速读】| AutoRedTeamer：具有终身攻击集成功能的自主红队

基本信息原文标题：AutoRedTeamer: Autonomous Red Teaming with Lifelong Attack Integration原文作者：Andy Zhou, Kevin...

04月09日18 views评论

阅读全文

安全新闻

留神本地部署小模型的大风险

在AI安全这场长跑中，没有所谓的“免费午餐”。随着大语言模型在各行各业展现威力，如何让它们“瘦身”以降低部署成本，成为业界关注焦点。“模型蒸馏”正是在这样的背景下走红：通过让小模型学习大模型的行为，我...

04月09日17 views评论

阅读全文

人工智能安全

大语言模型权限泛滥：自主性失控带来的安全风险

要使AI代理能够"思考"并自主行动，必须赋予其自主权（agency），即允许其与其他系统集成、读取分析数据并执行命令。但随着这些系统获得对信息系统的深度访问权限，人们越来越担忧其权限过度扩张——当这些...

04月08日30 views评论

阅读全文

人工智能安全

面向可信大语言模型智能体的安全挑战与应对机制

论文引用格式：张熙, 李朝卓, 许诺, 等. 面向可信大语言模型智能体的安全挑战与应对机制[J]. 信息通信技术与政策, 2025, 51(1): 33-37.面向可信大语言模型智能体的安全挑战与应对...

04月07日11 views评论

阅读全文

人工智能安全

学术 | 大型语言模型通过图灵测试

大型语言模型通过图灵测试Large Language Models Pass the Turing Test本文摘要本研究通过两项随机化、对照且预先注册的图灵测试，在两个独立群体中对四类系统（ELIZ...

04月06日15 views评论

阅读全文

人工智能安全

本地部署小模型的大风险

随着大语言模型在各行各业展现威力，如何让它们“瘦身”以降低部署成本，成为业界关注焦点。“模型蒸馏”正是在这样的背景下走红：通过让小模型学习大模型的行为，我们可以得到“蒸馏量化”后的“小模型”，既保留大...

04月06日14 views评论

阅读全文

取证分析

大模型在公检法行业的最后一公里应用痛点分析

引言随着人工智能技术的快速发展，大型语言模型(LLM)在各行业的应用逐渐深入。在公检法行业，大模型展现出强大的潜力，能够显著提升司法效率和公正性。然而，从技术到实际应用的"最后一公里"，仍然存在着诸多...

04月01日13 views评论

阅读全文

安全文章

deepseek本地部署工具-ollama任意文件读取漏洞复现 POC

漏洞介绍 Ollama是一个专为本地机器设计的开源框架，旨在简化大型语言模型（LLM）的部署和运行过程。它提供了一套工具和命令，使用户能够轻松地下载、管理和运行各种语言模型，包括LLaM...

03月31日21 views评论

阅读全文

人工智能安全

【论文速读】| 迈向智能且安全的云：大语言模型赋能的主动防御

基本信息原文标题：Toward Intelligent and Secure Cloud: Large Language Model Empowered Proactive Defense原文作者：Y...

03月27日36 views评论

阅读全文

人工智能安全

【论文速读】| 跨语言攻击（CL-attack）：通过跨语言触发器进行的文本后门攻击

基本信息原文标题: CL-Attack: Textual Backdoor Attacks via Cross-Lingual Triggers原文作者: Jingyi Zheng, Tianyi H...

03月25日34 views评论

阅读全文

人工智能安全

逐步突破大语言模型限制

重要声明：本文档中的信息和工具仅用于授权的安全测试和研究目的。未经授权使用这些工具进行攻击或数据提取是非法的，并可能导致严重的法律后果。使用本文档中的任何内容时，请确保您遵守所有适用的法律法规，并获...

03月21日44 views评论

阅读全文

人工智能安全

专题解读｜大语言模型低成本微调方法

大语言模型低成本微调方法一、简介预训练大语言模型（LLM）具备强大的通用能力，但在需要深入理解技术语言或特定领域知识的专业领域中，它们往往表现不佳。因此，虽然预训练使LLM能够捕捉通用知识，但微调（F...

03月17日22 views评论

阅读全文

【论文速读】| AutoRedTeamer：具有终身攻击集成功能的自主红队

留神本地部署小模型的大风险

大语言模型权限泛滥：自主性失控带来的安全风险

面向可信大语言模型智能体的安全挑战与应对机制

学术 | 大型语言模型通过图灵测试

本地部署小模型的大风险

大模型在公检法行业的最后一公里应用痛点分析

deepseek本地部署工具-ollama任意文件读取漏洞复现 POC

【论文速读】| 迈向智能且安全的云：大语言模型赋能的主动防御

【论文速读】| 跨语言攻击（CL-attack）：通过跨语言触发器进行的文本后门攻击

逐步突破大语言模型限制

专题解读｜大语言模型低成本微调方法

在线咨询

微信