大语言模型中的提示隐私保护 一、简介: 大语言模型(LLM) 拥有庞大的规模、预先训练的知识和卓越的性能,被广泛应用于各种任务。提示学习(prompt learning)和指令微调(instructi...
通用嵌套越狱提示可轻松骗过大型语言模型
招新小广告CTF组诚招re、crypto、pwn、misc、合约方向的师傅,长期招新IOT+Car+工控+样本分析多个组招人有意向的师傅请联系邮箱 [email protected](带上简历和想加入的...
大语言模型越狱攻击综述
今天为大家介绍清华大学计算机系徐恪、宋佳兴、李琦老师团队,高研院丛天硕老师,和香港科技大学(广州)何新磊老师联合完成的综述《Jailbreak Attacks and Defenses Against...
GPT-4o Mini:首创指令层级技术抵御越狱攻击
OpenAI 近日发布了性价比极高的轻量化模型 GPT-4o Mini,入局大模型价格战,支持 128K 上下文长度、多模态,能力接近 GPT-4,价格却比 GPT-3.5 Turbo 便宜 60%,...
诸子云|甲方:AI大模型如何实现内容安全?
“甲方”是安在新媒体为诸子云专家会员开设的全新专栏,旨在帮助专家会员及时准确掌握社群动态,了解行业动向,收集最新观点,挖掘最佳实践。“甲方”将围绕诸子云甲方社群动态、甲方话题、甲方活动、甲方项目等方面...
【警惕人工智能时代的智能体风险】
一群证券交易机器人通过高频买卖合约在纳斯达克等证券交易所短暂地抹去了1万亿美元价值,世界卫生组织使用的聊天机器人提供了过时的药品审核信息,美国一位资深律师没能判断出自己向法庭提供的历史案例文书竟然均由...
AI简史:3分钟读完80年发展史
01萌芽期:人工智能兴起“机器会思考吗?”英国天才数学家、逻辑学家、密码学家、计算机科学家艾伦.图灵,在1950年发表的经典之作《计算机和智能》一文中,提出了这个科技史上颇具哲学色彩的著名问题。图灵为...
【论文速读】| LLMCloudHunter:利用大语言模型(LLMs)从基于云的网络威胁情报(CTI)中自动提取检测规则
本次分享论文:LLMCloudHunter: Harnessing LLMs for Automated Extraction of Detection Rules from Cloud-Based ...
自实现一个LLVM Pass 以及 OLLVM 简单的魔改
一前言总结LLVM,OLLVM相关知识,自实现一个Pass,魔改OLLVM中的Pass,加深OLLVM的理解。环境:LLVM 9.0、CMake:3.16.3二LLVM介绍及编译LLVM介绍首先介绍下...
麻省理工:AI大模型缺乏推理能力
7月11日,麻省理工学院人工智能实验室CSAIL发文称,人工智能大语言模型(LLM)在不熟悉场景中的表现欠佳,缺乏真正的推理能力,对记忆存在依赖。一、研究设计CSAIL的研究比较了“默认任务”(Def...
前沿 | 人工智能深度伪造的规制
扫码订阅《中国信息安全》邮发代号 2-786征订热线:010-82341063以文本、音频和视频为代表的人工智能深度伪造正在潜移默化渗透至生活的各个方面。比如,新闻报道可能由人工智能凭空撰写,亲友声...
警惕:与ChatGPT共享业务数据可能十分危险
您已经在使用ChatGPT了吗?或者您正在考虑使用它来简化操作或改善客户服务?虽然ChatGPT提供了许多好处,但重要的是,您要意识到与ChatGPT这样的人工智能工具共享敏感业务数据相关的安全风险。...
73