SecMet#1期理解和度量大模型的安全问题

2024年4月23日06:46:02评论7 views字数 915阅读3分3秒阅读模式

[SecMet]是安全学术圈近期打造的一个线上线下结合的学术研讨模式，研讨会分为全公开和半公开模式，其中半公开模式仅对安全学术圈内部交流群和特殊专题投稿人员参加，每期主题根据领域主席（Primary Area Chair，下文简称AC）来拟定或者学术汇报者内容来拟定（有兴趣组织或者汇报的学者可以发邮件[email protected]，感谢！！！）。

SecMet#1期主要为学术汇报+专题研讨方式进行，详细日程安排如下：

SecMet期数：#1
报告类型：半公开
报告嘉宾：沈馨悦 (CISPA亥姆霍兹信息安全中心)
报告题目：理解和度量大模型的安全问题
报告时间：2023年10月11日(星期三)早上10:00(北京时间)
报告地点：线上(腾讯会议，内部通知)/线下：四川大学江安校区交叉大楼805

序号	内容安排	汇报人	内容
#1	主题汇报	沈馨悦	理解和度量大模型的安全问题
#2	主题研讨	Sec-LLMs投稿者	安全学术研究中如何引入LLMs

报告人简介:

沈馨悦是CISPA亥姆霍兹信息安全中心张阳老师研究组的博士生。她的研究主要集中在大模型安全和仇恨言论分析。她的相关工作发表在Usenix、CCS、ICWSM等顶级国际会议上，并被New Scientist, Deutschlandfunk Nova等媒体广泛报道。

报告内容：

随着机器学习技术的深入发展，预训练大模型如今已经成为深度学习研究中的一种主流范式。通过对特定任务进行微调，大模型展现出了强大的泛化能力和通用性。然而近期的研究也指出了大模型可能会带来一定的安全风险。在这次报告中，我将介绍我们最近在这个领域的三个工作。首先，我将分享我们针对大语言模型上的越狱攻击的最新研究成果。然后，我将介绍大语言模型的可靠性度量研究。最后，我将讲述text-to-image生成模型所面临的提示窃取攻击。

个人主页：https://xinyueshen.me/

特别鸣谢本次SecMet主要组织者：

主办AC：黄诚 (四川大学)

PS：欢迎各位继续投稿【Sec-LLMS】专题笔记

安全学术圈招募队友-ing
有兴趣加入学术圈的请联系 secdr#qq.com

原文始发于微信公众号（安全学术圈）：SecMet#1期理解和度量大模型的安全问题

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

SecMet#1期理解和度量大模型的安全问题

【实战】手把手学习写一个MCP服务，获取热榜文章

深度学习基础架构革新？通过梯度近似寻找Normalization的替代品

AI的攻与防：基于大模型漏洞基因库的威胁狩猎与企业级纵深防御

基于 MCP 的 AI Agent 应用开发实践

【论文速读】| 漏洞放大：针对基于LLM的多智能体辩论的结构化越狱攻击

AAAI 2025｜利用语言模型实现跨异质性知识转移

要给大家泼盆冷水了，使用 MCP 绝对不容忽视的一个问题！

大模型在运维场景中的应用

人工智能对国家安全的冲击

MCP：大模型时代的USB接口

发表评论

在线咨询

微信