生成可供分析的数据的一个关键要求是数据必须是“好”的。各组织对良好数据质量的定义存在差异,这些定义符合其在分析和数据科学方面的成熟度。由于两个原因,成熟度模型类比似乎适合这里。首先,模型中的关卡是相互...
基于深度学习的恶意软件分类器
本文为看雪论坛优秀文章看雪论坛作者ID:1900一前言1、实验内容参考论文:IMCFN: Image-based Malware Classification using Fine-tuned Con...
构建数据成熟度模型和数据成熟度的4个阶段
数据是世界上增长最快的资源之一,估计每天创建 2.5 万亿字节。数据似乎无处不在,但实际上,我们才刚刚开始使用它。今天存在的超过 90% 的数据可能是在过去五年内创建的。 那么数据成熟度意味...
基于嵌入的知识图谱实体对齐的基准研究
原文标题:A Benchmarking Study of Embedding-based Entity Alignment for Knowledge Graphs原文作者:Zequn Sun, Qi...
从零开始构建基于textcnn的文本分类模型(上)
伴随着bert、transformer模型的提出,文本预训练模型应用于各项NLP任务。文本分类任务是最基础的NLP任务,本文回顾最先采用CNN用于文本分类之一的textcnn模型,意在巩固分词、词向量...
基于自动编码器的DNS隧道自动特征学习检测方法
原文标题:TDAE: Autoencoder-based Automatic FeatureLearning Method for the Detection of DNS tunnel原文作者:Ke...
数据治理的三本数据秘籍
全文约3500字 阅读约5分钟数据目录、数据清单、数据字典是良好数据治理活动的组成部分。它们被经常混用,但它们并不相同。数据目录汇总了组织中数据资产的整体概况;数据清单详细说明了组织中可用...
领域知识驱动的缺陷报告预测
原文标题:Domain knowledge-based security bug reports prediction原文作者:Wei Zheng, JingYuan Cheng, Xiaoxue W...
盘点66个Pandas函数,轻松搞定“数据清洗”!
来自公众号:凹凸数据大家好,我是小五🧐今天我们重新盘点66个Pandas函数合集,包括数据预览、数值数据操作、文本数据操作、行/列操作等等,涉及“数据清洗”的方方面面。Pandas 是基于NumPy的...
在 Python 中使用机器学习来检测钓鱼链接 | Linux 中国
导读:本文将会给出一个简短的教程,旨在介绍如何检测这种网络钓鱼的企图。 本文字数:2130,阅读时长大约:2分钟LCTT 译者 :六开箱🌟🌟🌟🌟...
基于预测的自动驾驶GPS欺骗检测
*本文来自轩辕实验室杨杰森的研究成果和学习笔记。01-概述全球导航卫星系统(GNSS)为使用卫星和无线电通信的自动驾驶车辆(av)提供定位、导航和定时(PNT)服务。由于缺乏加密、粗获取(C/A)代码...
Python人工智能 | 十七.Keras搭建分类神经网络及MNIST数字图像案例分析
从本专栏开始,作者正式研究Python深度学习、神经网络及人工智能相关知识。前一篇文章详细讲解了Keras环境搭建、入门基础及回归神经网络案例。本篇文章将通过Keras实现分类学习,以MNIST数字图...
26