数据清洗 | CN-SEC 中文网

人工智能安全

什么样的数据被AI大模型需要？

来源：数据治理架构全文共 2219 个字，建议阅读 10 分钟AI浪潮之下，互联网大厂“内卷”的赛道尤为默契，一致将目标锁定大模型。从百度的文心一言到阿里的通义千问，从腾讯混元到字节豆包……各厂均卷出...

01月25日10 views评论

阅读全文

安全新闻

深度探讨隐藏在你代码中的漏洞：变异型跨站脚本（mXSS）

跨站点脚本 (XSS) 是一种众所周知的漏洞类型，威胁行为者可以将 JavaScript 代码注入易受攻击的页面。当不知情的目标用户访问该页面时，注入的代码将在目标用户的会话中执行。此攻击的影响可能因...

10月07日18 views评论

阅读全文

人工智能安全

AI大模型需要什么样的数据？

来源：CIO之家全文共4987字，建议阅读10分钟数据将是未来AI大模型竞争的关键要素人工智能发展的突破得益于高质量数据的发展。例如，大型语言模型的最新进展依赖于更高质量、更丰富的训练数据集：与GPT...

08月02日23 views评论

阅读全文

安全新闻

大模型在数据领域的十大价值应用

关注👇公众号，回复【资料】，免费领【数字化全流程建设资料包】来源：与数据同行全文共22291字，建议阅读56分钟本文转自与数据同行，作者：傅一平，以下为作者原文世界人工智能大会刚刚结束，大家的一个共识...

07月26日11 views评论

阅读全文

安全闲碎

如何用AI做数据清洗？

数据清洗，是检测和纠正不合理数据的过程。在大多数情况下，数据分析前都需要这个过程，将错误的、不准确的、缺失的以及多余的数据进行修改或删除。具体来说，数据清洗会面临以下四个问题：存储格式不一致数据不完整...

06月07日25 views评论

阅读全文

数据清洗杂项

0x01 正则基础POSIX字符组 POSIX字符组说明范围 [[:alnum:]] 字母字符和数字字符 [a-zA-Z0-9] [[:alpha:]] 字母 [a-zA-Z] [[:ascii:...

04月04日安全博客6 views评论

阅读全文

人工智能安全

探索大模型LLM识别数据安全中的敏感信息

基础介绍大型语言模型（LLM），如OpenAI的GPT-3、谷歌的BERT等，是采用深度学习技术构建的模型，它们能够处理、理解和生成自然语言文本。这些模型通过在大规模文本数据集上进行训练，学习语言的复...

03月31日465 views评论

阅读全文

安全开发

Python人工智能 | 二十三.基于机器学习和TFIDF的情感分类（含详细的NLP数据清洗）

从本专栏开始，作者正式研究Python深度学习、神经网络及人工智能相关知识。前一篇文章分享了自定义情感词典（大连理工词典）实现情感分析和情绪分类的过程。这篇文章将详细讲解自然语言处理过程，基于机器学习...

02月15日14 views评论

阅读全文

安全开发

Python第三方库|pandas用途及常用代码示例

Pandas是一个强大而灵活的数据分析工具，建立在NumPy的基础上。它提供了用于处理大型数据集的数据结构和函数。下面说一个Pandas库的用途、安装方法以及一些常用的代码示例。一. Pandas库的...

02月14日20 views评论

阅读全文

取证分析

电子数据取证中的Python数据清洗介绍

原文始发于微信公众号（网络安全与取证研究）：电子数据取证中的Python数据清洗介绍

01月06日33 views评论

阅读全文

安全新闻

CNCERT国家工程研究中心安全资讯周报20231127期

目录技术标准规范中国信通院联合发布《数据清洗、去标识化、匿名化业务规程（试行）》全球人工智能发展步入治理轨道新形势下我国工业领域关键信息基础设施安全保护工作实践与探讨为人工智能治理提供中国...

11月28日16 views评论

阅读全文

安全闲碎

借助chatgpt进行数据清洗

在很多实际工作情况下，通过python等工具进行内容爬取，爬取的数据到本地后并不可用，需要进行清洗，清洗后导入到mysql数据库进行数据分析。对于少...

04月25日77 views评论

阅读全文

在线咨询

微信