数据科学家| 专业人员日常生活中的三种不同观点

学习是连续的| 埃德加·贝穆德斯(EdgarBermúdez)

作为一个相对较新的专业,数据科学很难描述,并且对于该市场中的专业人士应了解和掌握的东西有各种观点。 实际上,数据科学团队由具有不同背景和能力的人员组成。 我的团队主要由来自数学,统计学和工程学的人组成,他们都具有互补的知识,并且会不断合作。

团队不断学习。 我们处理许多项目,这些项目需要通过在线培训来学习技能,而又不会忘记项目交付的截止日期。 有很多学习和软件要掌握,因此优先学习每个项目所需的软件至关重要。 学习是持续且强制性的。

我的职业生涯始于整合到一个正在进行的项目中,此后不久我负责该项目。 前几天分为两个部分:理解要解决的问题,监视项目开发以及学习Python(对我来说是一种新的编程语言)。 在理解了项目之后,超过80%的工作包括打包从客户那里收到的数据,理解20多个不同的数据库,进行处理和统一以提取必要的信息。 后来,我经历了一个充满挑战的阶段,在该阶段中,除了必须以一种易于理解的方式向客户提供的信息之外,还使用分类和聚类技术进行了发现,使难度增加的复杂技术显得容易。

我的第二个项目也需要大量学习,因为它需要为适用于国家场景的国际场景准备研究结果。 同样,部分工作仅由数据存储组成,以便与它们一起使用。 在这里,除了学习新的Python工具外,还必须学习R分类和特征优先级,以便按时达到预期结果。

当前的第三个项目旨在自动文档识别,这是一个新的挑战,需要深度学习和机器学习知识以及存储信息,呈现信息和使用不同技术的新方法。 最后,与数据科学合作是一个无休止的学习过程。

这是一个知识多样性部门| 路易斯·诺盖拉(Luiz Nogueira)

在咨询环境中,复杂性,动态性和对信息的不断搜索非常重要,并且要求数据科学家紧跟创新技术,以便为客户提供有效的解决方案。 走出舒适区并适应学习和成果交付的速度是我最好地描述我作为数据科学家的早期职业的方式。

我毕业于机械工程专业,与编程几乎没有接触。 在everis ,我有机会学习新的语言,知识,并且随着时间的推移,我能够加深Python知识,这些知识帮助我学习了数据科学领域的高级技术,例如NLP,深度学习和机器学习。 我参加了三个项目,设法证明了该行业的复杂性和异质性,这反映了我职业的独特学习曲线。

我的数据科学团队的特点是知识多样性,使每天充满新的挑战和学习。 团队合作使信息交流成为可能,它的一致性反映了一个创新且结构合理的项目。 团队合作还通过家庭办公选项为营造一个轻便的工作环境做出了贡献,使员工可以有效地使自己的需求适应义务。

全球化使信息迅速流通,应谨慎使用,并始终分析事实真相。 数据科学家必须收集,分析和解释大量数据才能创建或生成针对给定问题的解决方案。 因此,为了使我保持最新状态,我在公司指示的安全平台上执行在线课程。

保持最新状态的主要方法是阅读文章,关注社交网络上的杰出研究人员和公司,始终关注与新技术有关的新帖子。 但是,让自己了解行业创新的难点无疑是将工作,休息和时间结合在一起阅读和学习。

您必须喜欢使用算法,方法,模型和数字:Laryssa Kato

互联网上有几种不同的数据科学家任务定义。 但是,根据我九个月的经验,我知道最低要求是了解基本统计信息,数学,最重要的是熟悉分析几何。 我知道这一点是因为,除了Fortran编程语言的知识外,这是我唯一的知识。

在成为数据科学家之前,我来自学术领域。 我拥有物理学位,那里的工作节奏和动态变化很大。 我花了一些时间适应新的思维方式。 基本上,寻找解决方案仍然是一个问题,但变化的是,现在,必须快速找到解决方案-时间很短,而且我们必须满足项目交付的截止日期,有效解决问题并满足需求。

在新职业的整个学习过程中,我学到的是机器学习方法,这些方法对于理解结构如何创建合适的模型至关重要,并且是必不可少的,所有一切都始于数据的探索和结构化。 在机器学习方面,我在神经网络领域拥有最丰富的经验,尤其是长期短期记忆(LSTM) ,我将其应用于自从我开始职业生涯以来一直从事的项目。 我了解了数据的探索及其重要性,因为我们可以提取非常重要的信息,这些信息决定了我们应该选择哪种模型,应该如何构造数据并查看项目的实际需求。 大多数时候,我们组织,构造和清理这些数据,并且使用Python(我目前正在学习的项目应用程序中需要的一种编程语言)来进行此操作。

我最密切的联系是与我一起工作的项目团队,举行会议,讨论问题,收集数据,更新模型构建方式的状态以及其他活动。 我正在从事的项目不仅仅是数据科学,我们还是完成一个项目的几个难题之一。 我通过神经网络模型实现机器学习。 我并不孤单,我与另一个人一起工作,这在我的帮助下,我们一起学习了很多东西。

自从我开始这一职业以来,我感到有很多算法,方法,模型和问题需要数据科学家具有不同的知识,因为我们永远都不会解决相同的问题。 每个项目都需要进行研究以帮助解决问题。 此外,仅机器学习知识是不够的。 我需要学习SQL语言,以便能够从数据库(配置单元)中搜索和下载数据,并了解一些我具有基本知识的Linux,这是由于我在学术领域执行的程序所致。 我现在正在深入了解这一知识。

在我工作的地方,我们只有一个数据科学家团队,每个人都在一个不同的项目上工作,并且作为项目的一部分,我经常和几个人一起工作。 就我而言,我与客户没有直接联系,但是其他专业人员一直与他们保持联系。

我们每周举行一次会议,帮助您了解所有已插入的项目,并扩展有关事物的基本知识,以便能够在外部进行更多搜索。 我最喜欢的是,我们总是学到很多东西,因为我们提供的课程可以帮助培训,以及致力于分享知识并正在考虑整体团队胜利的人们。 在线课程有助于知识的构建,我们学习理论并将所学知识付诸实践,从而使知识更加完整。

在所有报告中,该行业的工作流程都不尽相同,总是有新的东西要学习,需要解决的问题需要在技术和信息领域拥有更多的知识。

通过数据,有可能获得不明显的信息,而成为对社会有利的知识,优化流程,简化程序,并总体上提高人们的生活质量并提供帮助他人的满意度。