国内外AI安全分析

2024年10月16日09:41:31评论25 views字数 869阅读2分53秒阅读模式

国内的安全厂商目前没有一家正常的，我说的正常是指有预训练的，正儿八经的采集了很多和安全相关的数据来做的，拥有正儿八经的安全研究团队的。

国外的LLM安全公司很多，大部分都是在研究jailbreak，因为比如anthropic，gpt之类的不允许做一些违反人类价值观的事情，这些事情可能会导致作恶，但是这个其实也滋生了新的一个问题，就是不对等机会的霸权的可能性，比如 anthropic自己用未处理过的LLM，给别人用加固过后的，使用的人不平等。

LLM安全的机会还是主要在越狱上，LLM infra的安全属于传统的应用安全范畴，比如一些推理框架vllm，ollama，langchain，llamaindex等。应用安全嘛，传统安全你看赚钱嘛？所以llm infra并不会有新的赚钱机会。

国外的比较牛逼的几个公司，一个Gray Swan，一个good fire，一个haize

目前最强的应该就是这个gray swan，这个公司目前的LLM没有被越狱。

他们最近搞了一个越狱大赛，1个越狱4k 美元，越狱越多赏金越多。

国内外AI安全分析

这些安全模型的主要功能是：
1.指令劫持的处理

2.内容安全

3.幻觉和完全不符合科学的结果

所以国内对标的话，主要对标grayswan就行了。但是要解决一个问题，本地部署，grayswan的LLM是saas的。他们使用的是基于llama3.1-8b-instrution做的。

小模型速度快，比如用了量化、底层的推理异步等优化的话可以更快，比如groq的推理8b速度可以超过1000tokens/s，这个速度太快了。

如果拿模型做安全检测，仅仅给出内容安全判断(true/false)的话，1瞬间就完成了，0.01秒，这样的话可以在ai架构中并行使用。

要跟上它的话你必须要看他们最新的研究和文章，当然核心的肯定不会告诉你的啦。不过跟上先。

国内的话大部分公司因为商业模式的问题，都大部分先上公开的数据集来测试，测到一个算一个。

国内的PPT写的很棒。实际。。。。。哎，所以PPT模板能不能发我一份

原文始发于微信公众号（xsser的博客）：国内外AI安全分析

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

国内外AI安全分析

WhiteFox：由大型语言模型驱动的白盒编译器模糊测试

专题·人工智能安全 | 大模型安全风险分析与防护架构

【论文速读】| CAVGAN：通过对内部表征进行生成对抗攻击，统一 LLM 的越狱和防御

人工智能大模型知识库建设通用要求标准共建计划

一文搞懂 | 大模型为什么出现幻觉？从成因到缓解方案

【论文速读】|大语言模型在渗透测试中的惊人有效性研究

大模型基础：模型量化概念与技术详解

安全AI生命周期管理框架：SAIL框架

机器学习常见算法【上】

机器学习在网络安全中的应用

发表评论

在线咨询

微信