基本信息原文标题:AutoRedTeamer: Autonomous Red Teaming with Lifelong Attack Integration原文作者:Andy Zhou, Kevin...
留神本地部署小模型的大风险
在AI安全这场长跑中,没有所谓的“免费午餐”。随着大语言模型在各行各业展现威力,如何让它们“瘦身”以降低部署成本,成为业界关注焦点。“模型蒸馏”正是在这样的背景下走红:通过让小模型学习大模型的行为,我...
大语言模型权限泛滥:自主性失控带来的安全风险
要使AI代理能够"思考"并自主行动,必须赋予其自主权(agency),即允许其与其他系统集成、读取分析数据并执行命令。但随着这些系统获得对信息系统的深度访问权限,人们越来越担忧其权限过度扩张——当这些...
面向可信大语言模型智能体的安全挑战与应对机制
论文引用格式:张熙, 李朝卓, 许诺, 等. 面向可信大语言模型智能体的安全挑战与应对机制[J]. 信息通信技术与政策, 2025, 51(1): 33-37.面向可信大语言模型智能体的安全挑战与应对...
学术 | 大型语言模型通过图灵测试
大型语言模型通过图灵测试Large Language Models Pass the Turing Test本文摘要本研究通过两项随机化、对照且预先注册的图灵测试,在两个独立群体中对四类系统(ELIZ...
本地部署小模型的大风险
随着大语言模型在各行各业展现威力,如何让它们“瘦身”以降低部署成本,成为业界关注焦点。“模型蒸馏”正是在这样的背景下走红:通过让小模型学习大模型的行为,我们可以得到“蒸馏量化”后的“小模型”,既保留大...
大模型在公检法行业的最后一公里应用痛点分析
引言随着人工智能技术的快速发展,大型语言模型(LLM)在各行业的应用逐渐深入。在公检法行业,大模型展现出强大的潜力,能够显著提升司法效率和公正性。然而,从技术到实际应用的"最后一公里",仍然存在着诸多...
deepseek本地部署工具-ollama任意文件读取漏洞复现 POC
漏洞介绍 Ollama是一个专为本地机器设计的开源框架,旨在简化大型语言模型(LLM)的部署和运行过程。它提供了一套工具和命令,使用户能够轻松地下载、管理和运行各种语言模型,包括LLaM...
【论文速读】| 迈向智能且安全的云:大语言模型赋能的主动防御
基本信息原文标题:Toward Intelligent and Secure Cloud: Large Language Model Empowered Proactive Defense原文作者:Y...
【论文速读】| 跨语言攻击(CL-attack):通过跨语言触发器进行的文本后门攻击
基本信息原文标题: CL-Attack: Textual Backdoor Attacks via Cross-Lingual Triggers原文作者: Jingyi Zheng, Tianyi H...
逐步突破大语言模型限制
重要声明: 本文档中的信息和工具仅用于授权的安全测试和研究目的。未经授权使用这些工具进行攻击或数据提取是非法的,并可能导致严重的法律后果。使用本文档中的任何内容时,请确保您遵守所有适用的法律法规,并获...
专题解读|大语言模型低成本微调方法
大语言模型低成本微调方法一、简介预训练大语言模型(LLM)具备强大的通用能力,但在需要深入理解技术语言或特定领域知识的专业领域中,它们往往表现不佳。因此,虽然预训练使LLM能够捕捉通用知识,但微调(F...
30