语言模型 - 第 17 | CN-SEC 中文网

人工智能安全

【论文速读】| 针对红队攻击和防御大模型的攻击提示生成

本次分享论文：Attack Prompt Generation for Red Teaming and Defending Large Language Models基本信息原文作者：Boyi Den...

04月24日144 views评论

阅读全文

安全新闻

号称最强大的免费开源AI模型，Meta发布Llama 3

4月18日，Meta公司宣布推出最新一代大语言模型 Llama 3，并将之称为人们所能免费使用到的最智能的AI助手。据了解，Llama 3有两种参数大小可供选择：80亿（8B）和700亿（70B），均...

04月22日35 views评论

阅读全文

人工智能安全

使用零信任掌控 LLM 人工智能

模型能干的事情越多，干错事的风险就越大，所以必须给它们设置点规矩，就好比给孙大圣带上紧箍咒。如果一个模型能生成一个Envelope并调用REST API，听着是不是很牛？但这也意味着，如果有人想入侵我...

04月22日14 views评论

阅读全文

人工智能安全

《大语言模型（LLM）攻防实战手册》第一章：提示词注入（LLM01）-概述

前言从本周开始考虑连载关于大模型安全的文章名字就叫做《大语言模型（LLM）攻防实战手册》，主要基于owasp llm top 10所整理的框架进行编写，并辅以案例、代码进行完善，希望我能有精力持续更...

04月22日87 views评论

阅读全文

人工智能安全

【论文速读】| MASTERKEY：大语言模型聊天机器人的自动化越狱

本次分享论文为：MASTERKEY: Automated Jailbreaking of Large Language Model Chatbots基本信息原文作者：Gelei Deng, Yi Li...

04月22日16 views评论

阅读全文

安全闲碎

【论文速读】| 大语言模型平台安全：将系统评估框架应用于OpenAI的ChatGPT插件

本次分享论文为：LLM Platform Security: Applying a Systematic Evaluation Framework to OpenAI’s ChatGPT Plugin...

04月22日10 views评论

阅读全文

人工智能安全

【论文速读】| CHEMFUZZ: 大语言模型辅助模糊测试用于量子化学软件缺陷检测

本次分享论文为：CHEMFUZZ: Large Language Models-assisted Fuzzing for Quantum Chemistry Software Bug Detectio...

04月19日37 views评论

阅读全文

人工智能安全

2024年最重要的AI趋势

文章来源：https://www.ibm.com/blog/artificial-intelligence-trends/本文翻译来自CSA翻译组：翻译：何伊圣，CSA大中华区专家审校：杨皓然，CSA...

04月19日9 views评论

阅读全文

人工智能安全

蚂蚁牵头的大模型安全测评标准发布

第 27 届联合国科技大会（the 27th UN CSTD Annual Meeting）正在瑞士日内瓦召开。大会期间，世界数字技术院（WDTA）发布了两项国际标准：《生成式人工智能应用安全测试标准...

04月19日124 views评论

阅读全文

人工智能安全

CSA大中华区牵头 | 生成式AI应用安全、大模型安全标准发布

4月16日联合国日内瓦总部万国宫，由世界数字技术院（WDTA）与云安全联盟大中华区（CSA GCR）联合主办第27届联合国科技大会AI边会上，世界数字技术院（WDTA）发布了两项具有重要意义的国际标准...

04月19日145 views评论

阅读全文

人工智能安全

【论文速读】| TroubleLLM：与红队专家对齐

本次分享论文为：TroubleLLM: Align to Red Team Expert基本信息原文作者：Zhuoer Xu, Jianping Zhang, Shiwen Cui, Changhua...

04月17日29 views评论

阅读全文

人工智能安全

【论文速读】| 大语言模型是边缘情况模糊测试器：通过FuzzGPT测试深度学习库

本次分享论文为：Large Language Models are Edge-Case Fuzzers: Testing Deep Learning Libraries via FuzzGPT基本信息...

04月17日39 views评论

阅读全文

【论文速读】| 针对红队攻击和防御大模型的攻击提示生成

号称最强大的免费开源AI模型，Meta发布Llama 3

使用零信任掌控 LLM 人工智能

《大语言模型（LLM）攻防实战手册》第一章：提示词注入（LLM01）-概述

【论文速读】| MASTERKEY：大语言模型聊天机器人的自动化越狱

【论文速读】| 大语言模型平台安全：将系统评估框架应用于OpenAI的ChatGPT插件

【论文速读】| CHEMFUZZ: 大语言模型辅助模糊测试用于量子化学软件缺陷检测

2024年最重要的AI趋势

蚂蚁牵头的大模型安全测评标准发布

CSA大中华区牵头 | 生成式AI应用安全、大模型安全标准发布

【论文速读】| TroubleLLM：与红队专家对齐

【论文速读】| 大语言模型是边缘情况模糊测试器：通过FuzzGPT测试深度学习库

在线咨询

微信