数据科学与软件工程:关键比较

admin 2023年1月12日02:04:35评论18 views字数 3829阅读12分45秒阅读模式

数据科学与软件工程:关键比较

数据科学和软件工程是管理组织中越来越大的数据流的两个重要职能。正如术语所暗示的那样,数据科学更侧重于将科学原理应用于数据分析,而软件工程侧重于将工程原理应用于相关软件系统的设计和实现。

这些领域在很多方面都很相似,并且有很多重叠的角色。从事一些数据科学工作的软件工程师或必须设计其软件的数据科学家的情况并不少见。

重建网络安全威胁检测和响应

但也存在关键差异,角色也在分化。数据科学家负责以某种方式从比特流中提供答案。软件工程师的工作是保持机器一路运行。 

例如,软件工程师可以构建将实时经济、天气、外汇、社交媒体和其他数据引入企业数据运营的集成。数据科学家可以编写算法,通过该算法可以使用该数据来通知组织内的产品需求和供应预测。

数据科学和软件工程:技能和重点

两者都涉及编程计算机

数据科学家和软件工程师为计算机创建指令,在很多情况下工作非常相似。

数据科学家的大部分工作是收集信息并准备分析。过滤、清理和分类通常是工作中最大的部分,这项工作与许多大型系统中完成的一些软件工程没有太大区别。所有软件都必须收集输入、过滤输入并做出决定。 

数据科学的这一部分是计算机科学和软件工程的一个子集。一名优秀的软件工程师将能够完成大量的数据收集和过滤工作,因为这项工作需要许多与创建游戏软件、管理装配线或制作打印副本相同的技能。 

两者都围绕数据组织

企业越来越依赖数据库、数据仓库和数据湖来存储和集成从内部和外部来源收集的海量数据流。数据科学家和软件工程师都依赖于这些,他们的大部分工作都集中在组织这些资源并加以利用。

有不同程度的参与。数据科学家的主要关注点是信息。软件工程师的主要关注点可能在其他特性上,例如响应时间或系统的可靠性;信息的组织不是他们的主要工作。

数据科学家必须懂数学

一旦收集并准备好数据,工作就会发生分歧。数据科学家接受过广泛的数学和统计技术培训。他们了解科学家如何开发这些机制,以便从多年来在实验室和实验中收集的数据中获得意义。他们的工作是将这些技术和机制应用于当今企业中出现的一些更大的问题。

软件工程师必须了解工程原理

虽然数据科学家的一些工作是编写软件来准备数据,但大部分工作使用的是现有的工具和系统,例如数据库或数据管道。他们可以依靠这些系统平稳高效地运行,因为它们是由软件工程师正确构建的。 

软件工程师接受的培训不仅要编写代码,还要确保其正确、快速和高效地运行。他们创建能够解决重大问题的软件,因为他们了解做出有关软件架构的正确决策将如何通过平稳扩展的系统获得回报。  

数据科学家专注于信息

数据科学的主要目标是找到可以指导我们找到正确答案的有用信息。数据科学家的工作是找到信息并对其进行分析,直到出现答案。通常,机器学习 (ML) 涉及从非常大的数据集中提取不断完善的结果。

一路上,数据科学家需要做大量的软件工程,但这不是他们的主要关注点。事实上,当软件层正常运行时——有时这更像是一个梦想而不是现实——他们可以只关注数据。 

软件工程师专注于基础设施

计算机存在的首要原因是组织数据。软件工程师主要致力于保持机器及其各种软件层的平稳运行。他们的工作是编写此代码、对其进行调试,然后对其进行调整以使其有效运行。流经机器的数据留给其他人使用。 

战略战术

数据科学家通常更具战略性

虽然他们的分析可以针对企业的任何部分,包括制造过程参数等模糊区域,但数据科学家工作的很大一部分通常是帮助企业从长远角度进行战略思考。数据科学是帮助管理者了解企业绩效的最佳工具之一。各种指标通常是获得对公司所有部门的良好、公正洞察的唯一途径。

数据科学家在设计这些指标和确保信息准确可用方面发挥着重要作用。他们与任何制定战略决策的团队密切合作是很自然的。

软件工程师通常更具战术性

软件工程师的大部分工作是设计和维护软件堆栈。虽然这项工作是虚拟的,不像检修引擎那样有触觉,但使用“动手”这个词来描述许多必须完成的任务是公平的,以确保软件对用户做出响应。从调整用户界面到观察瓶颈,这项工作是非常互动的,并且主要是寻找交付功能的最佳实践。 

这并不是说它不能具有战略意义。软件工程师需要为代码库的发展制定长期计划。他们需要为工作负载的变化制定计划,并确保软件能够支持他们。所有这些规划都可能非常具有战略意义,特别是对于所有价值都包含在堆栈中的新公司而言。但是当这个架构工作完成后,就是实施这些想法的时候了,这需要更多的策略。 

人工智能连接

人工智能 (AI) 对数据科学很重要 

数据科学家在他们的分析中使用许多算法,但最近一些最令人兴奋的选择涉及人工智能 (AI)(ML)这些算法可以从训练数据集中学习模式,然后将它们重复应用于未来的示例。它们通常用于对数据进行分类和分类,这通常可以带来自动化和更高的效率。

例如,如果一些细节组合表明客户即将购买,人工智能模型可以自动部署销售团队。AI 和 ML 算法有很多机会可以改进组织中的工作流程。 

人工智能开始对软件工程师变得重要

虽然 AI 和 ML 是重要的技术并且需求量很大,但它们对软件工程的重要性不如对数据科学的重要。软件工程师的大部分工作都涉及仔细的编程和测试,以消除错误并使用尽可能最有效的硬件和软件组合来解决问题。这通常需要注意细节和全面的测试程序。

然而,这可能正在改变。一些软件工程师发现 ML 算法可以发现人类有时会错过的提高效率的机会。算法还可以识别需要更多关注的异常或问题。一些开发人员甚至在使用 AI 例程来帮助他们编写软件。未来,软件工程师可能会成为 AI 和 ML 最忠实的用户。 

团队合作和自动化

软件工程师经常团队合作

编写和维护软件堆栈的工作已经发展成为一项巨大的工作,以至于学校通常是软件开发人员最后一次创建自己的东西。软件工程师经常在可能有数千人的团队中工作。他们在大型的、已安装的代码库上工作,而这些代码库是他们一生中永远无法完全阅读的。事实上,有些人正在研究早在他们出生之前就开始的代码。

大部分工作与其说是创建代码,不如说是测试和审查代码以确保代码库尽可能一致。所有这些都意味着软件开发是一个需要团队合作的过程。 

数据科学通常是一项独立的工作

数据科学中的许多项目足够新且足够小,可以由一个小团队甚至独立的数据科学家来管理。这并不是说科学家单独工作。推动科学发展的问题来自更大的企业,组织中的其他人将使用答案来推动变革。只是数据科学家的角色往往是由管理层驱动的额外角色。

不过,随着收集和分析信息的工作嵌入到企业的工作流程中,这种情况正在发生变化。随着时间的推移,越来越少的数据科学项目将是未开发的,因为这些工作将修改和扩展已经存在的工具。 

数据科学家的工作更经常是自动化的

近年来,许多公司已经构建了越来越精细和自动化的数据科学工具。虽然大部分工作曾经是编写原始软件来清理和过滤收集的数据,但新的专用工具能够自动完成大部分工作。这些通常精心设计的管道有时可以完全使用带有拖放界面的无代码工具来构建,几乎不需要手动操作。这些集成工具正在向缺乏传统软件技能的新人开放学科。现在,管理团队自己通常可以构建数据管道来回答他们的大部分(如果不是全部)问题。 

软件工程的自动化程度仍然较低

并不是说更好的工具没有彻底改变软件工程的世界。进步的步伐已经创建了整个系统,这些系统可以自动执行几年前占据软件工程师头脑的许多例行任务。只是工作的规模和范围太大,经常会有新的挑战需要写代码。 

这正在改变。提供“低代码”或“无代码”开发的工具越来越多。虽然他们的能力经常被营销团队夸大,但有些工作可以通过很少或根本不需要传统编程来完成。这意味着软件工程团队可以在传统任务上花费更少的时间。它还向那些拥有更多商业技能而不是计算机知识的人开放工作。 

两者都需要注意细节

那些致力于数据科学或软件工程的人必须特别注意工作流程。必须及时仔细收集信息,以确保任何结论都是有效的。还应该存储这些信息,以便可以检索它以完成未完成的工作。

出于同样的原因,软件工程师必须能够对整个系统中的一般信息流给予同样的关注。虽然有些信息可能需要比其他信息更详细地记录——例如,鼠标点击的详细记录可能并不重要——但所有这些交互都必须小心处理,以便软件响应迅速、用户友好且有用。

原文链接:https://venturebeat.com/enterprise-analytics/data-science-vs-software-engineering-key-comparisons/


网络安全运营和事件管理(二十):执行-缓解和对策之拒绝服务
网络安全运营和事件管理(二十二):执行-缓解和对策之站点可靠性工程
网络安全运营和事件管理(二十六):知识-智能和分析之态势感知
网络安全运营和事件管理(二十七):人为因素:事件管理
网络安全运营和事件管理(二十三):知识-智能和分析之网络安全知识管理
网络安全运营和事件管理(二十四):知识-智能和分析之蜜罐和蜜网
网络安全运营和事件管理(二十五):知识-智能和分析之网络威胁情报
网络安全运营和事件管理(二十一):执行-缓解和对策之SIEM平台和对策
网络安全运营和事件管理(十八):计划-警报关联
网络安全运营和事件管理(十九):执行-缓解和对策之入侵防御系统
网络安全运营和事件管理(十六):分析之基准利率谬误
网络安全运营和事件管理(十七):计划-安全信息和事件管理及数据收集
网络安全运营和事件管理(一):简介
网络安全之事件管理


原文始发于微信公众号(祺印说信安):数据科学与软件工程:关键比较

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2023年1月12日02:04:35
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   数据科学与软件工程:关键比较https://cn-sec.com/archives/1514847.html

发表评论

匿名网友 填写信息