首个集内生安全性和有用性于一身的中文大模型安全对齐策略!过往研究通常认为:大模型安全对齐会导致模型遗忘已经学会的知识,从而导致模型在有用性上下降。OpenAI将这一损失称为对齐税(Alignment ...
新型TIKTAG攻击曝光,专门针对谷歌浏览器和Linux系统
近日,来自三星、首尔国立大学和佐治亚理工学院的韩国研究团队的研究人员发现一种以 ARM 的内存标记扩展(MTE)为目标的,名为「TIKTAG」的新型攻击,黑客可利用这种方式绕过安全防护功能,这种攻击专...
技术实践 | RAG精确应对大模型敏感问题知识幻觉难题
一、引言在大模型的实际应用落地过程中,会遇到所谓的幻觉(Hallucination)问题。对于语言模型而言,当生成的文本语法正确流畅,但与原文不符(Faithfulness)或事实不符(Factual...
技术进展 | Fuzz4All:基于大语言模型的通用模糊测试
基本信息原文名称:Fuzz4All: Universal Fuzzing with Large Language Models原文作者:Chunqiu Steven Xia;Matteo Palten...
技术实践|大模型内容安全蓝军的道与术
1、引子大语言模型(LLM)在2023年大放异彩,在许多领域展现出强大的能力,包括角色扮演,文本创作,逻辑推理等。然而,随着其应用范围的扩大,生成内容的安全问题也日益凸显。这包括但不限于生成虚假信息、...
AI安全:LLM的风险揭示与安全性评估
大语言模型(LLM)在当前社会中扮演着日益重要的角色,其广泛应用领域突显了其对社会和技术发展的重要性。然而,强大却也脆弱,大语言模型的这一特性,让我们看到了人工智能发展的双刃剑效应,如何确保大语言模型...
【好文推荐】生成式伪造语音安全问题与解决方案
摘要:生成式人工智能算法的发展使得生成式伪造语音更加自然流畅,人类听力难以分辨真伪.本文首先分析了生成式伪造语音不当滥用对社会造成的一系列威胁,如电信诈骗更加泛滥、语音应用程序安全性下降、司法鉴定公正...
【大模型安全】[文献整理] 大模型对抗攻击
[文献整理] 大模型对抗攻击阅读如下论文和材料,整理与LLM对抗攻击相关内容。Survey of Vulnerabilities in Large Language Models Revealed b...
我们与「邪恶GPT」的距离
大型模型驱动创新变革时代网络安全与伦理道德问题走上舞台是福音还是威胁?是善意还是「邪恶」?虚假信息传播、网络钓鱼社交工程、恶意代码生成未受限制的大模型正危及信息可信和荼毒网络生态洞见大模型风险剖析「善...
新型Volschemer攻击利用无线充电器注入语音指令甚至损坏智能手机
佛罗里达大学和CertiK的学术研究人员最新的成果表示,一组名为“Volschemer”(伏特图式)的新攻击可以通过现成的无线充电器发出的磁场注入语音命令来操纵智能手机的语音助手。volschemer...
专题解读 | 图神经网络GPU内核加速
深度神经网络(DNN)的训练和推理得益于 GPU 的加速。GPU 是功能强大的硬件加速器,GPU 内核是指经过优化可在 GPU 的许多处理单元上并行执行的专用程序,从而使深度学习(DL)的计算更加迅速...
专题笔记征稿 | Security Tasks of LLMs-Driven 2023
2022年底以ChatGPT为代表的大语言模型(LLMs)的横空出世,意味着奇点时刻即将降临,其在知识学习、文本翻译、文本生成等任务中的优秀表现,让科研人员看到了新的曙光。目前,LLMs 正在被尝试应...
3