Data Science: o que é, conceito e definição - Maximize Space

Maximize Space - Painel de Controle Profissional Maximize

Data Science: o que é, conceito e definição

Data Science é o estudo dos dados, que te ajuda a tomar as decisões mais assertivas.

Por Leticia Cruz dia em Maximize Space

 Data Science: o que é, conceito e definição
  • Compartilhe esse post
  • Compartilhar no Facebook00
  • Compartilhar no Google Plus00
  • Compartilhar no Twitter

Vamos falar agora sobre um estudo disciplinado dos dados e informações inerentes relacionadas ao negócio e todas as visões que podem englobar um assunto em específico. Data Science é uma ciência que estuda as informações, seu processo de captura, transformação, geração, e futuramente, análise de dados.

A ciência de dados envolve diversas disciplinas, veja a seguir:

  • Computação
  • Estatística
  • Matemática
  • conhecimento do negócio

Então, definimos até aqui claramente o que é ciência de dados. Mas podemos deixar pra você mais especificadamente o que o profissional cientista de dados faz, vamos lá?

Quando se pensa em ciência de dados, a tão famosa data science, nos vem muita coisa em mente, por isso, vamos deixar aqui dois exemplos simplificados para que você possa compreender de maneira clara e objetiva o que um Data Scientist faz.

Vamos imaginar que você possui uma empresa que vende sorvete, ou qualquer outro tipo de comida gelada que todos nós gostamos de saborear, principalmente quando esta calor, bom até ai está fácil. 

No entanto, quando você coloca os dados organizados e começa analisar as vendas mensais ou diárias, e ao lado você coloca como estava a temperatua do dia, ou temperatura média do mês você vai perceber que existe uma correlação entre essas duas sequências de valores.

Provavelmente quando a temperatura se apresentar mais alta o consumo de sorvete será maior, assim simultaneamente, quando a temperatura for baixa o consumo diminuirá.

Há ainda outras variáveis que também podem interferir nas vendas, como um dia chuvoso ou nublado, criando outras correlações com esses números analisados, que se investigados cuidadosamente podem trazer algumas dicas, e levantar algumas questões que o cientista de dados deverá investigar mais a fundo para obter resultados ainda mais assertivos.  

Nesse caso, em específico, a análise de dados futuros ajudaria muito também, como? Vamos te mostrar.

Se por exemplo, no mês seguinte a empresa de sorvete tiver conhecimento que vai fazer muito calor sabe-se que se deve aumentar a produção e o estoque. Todavia, se vier uma temporada mais fria pela frente, seria aconselhavél não produzir tanto sorvete, não é mesmo?

Diferente da maneira que funciona no ramo da moda onde o ciclo de produção é muito longo, e precisa ser antecipado praticamente um ano em estrátégia e quantidade para o próximo verão, por exemplo, para que assim possa dar conta da grande demanda.

Tendo sempre  em vista a média de produtos de vestuário que irão ser vendidos, podendo assim passar essas informações para as fábricas, para elas saberem quanto de roupas e acessórios de verão vão precisar ser confeccionados. E vale lembrar que essa mesma situação acontece com todas as outras estações.

O profissional de Data Science é responsável por transformar dados em informações ou produtos de informações dentro de uma corporação. Esse que por fim é um especialista capacitado e multidiciplinar, encarregado de realizar o processo de pesquisas e resultados de Data Science.

Além disso, esse perito, conhecedor de leitura de dados também será responsável pela formulação dos possíveis e futuros problemas de uma corporação, e ainda pela escolha de modelos de simulação e estatísticas que auxiliem no desenvolvimento da resolução dessas questões. E tudo isso através de muito pesquisa, estudo e análise de dados coletados. 

Sabemos que essa é uma profissão que reune outras profissões, como o estatístico de novos negócios, do analista de dados. Ou seja, não é uma profissão tão nova, é um nome novo dado á uma profissão já existe há muito tempo. 

Esse é basicamente o profissional que têm conhecimetos de estatística, análise de dados e também de programação. Uma pessoa que consegue analisar os dados, mas também programa algorítimos, que faz o trabalho completo. Que consegue tanto identificar têndencias em dados como também vai lá programar em python as coisas. Esse é claramente um estatístico que faz tudo.

E essa na verdade é uma profissão que está em alta no momento, principalmente por causa do avanço da internet. Nessa última década o número de dados que foi gerado pela internet é muito alto, e toda empresa precisa lidar de maneira correta com esses dados, até mesmo a menor startup do mundo pode fazer uso de dados para melhorar seu desempenho, e as empresas grandes então nem se fala, não é mesmo?! 

O uso de dados se tornou uma coisa muito importante. Sendo assim, ter profissionais capacitados na corporação, que sejam Data Scientist e consigam analisar esses dados gerados pelos negócios da empresa é essêncial. 

Sem falar que a força computacional se tornou muito mais barata nas ultimas décadas, antigamente demorava dias para se conseguir fazer um pequeno cálculo estatístico, hoje em dia em poucos minutos é possível se resolver isso, com computação em nuvem e coisas desse tipo. Por isso então a grande demanda e procura por esse tipo de profissional.

Se interessou pelo assunto? Mas enfim, o que é preciso para se tornar um cientista de dados? Quais são os principais requisitos para se tornar um bom profissional nessa área, que está cada dia que passa crescendo cada vez mais? você sabe? Não?! 

Pensando nisso vamos deixar aqui para você algumas dicas de conhecimentos específicos necessários para ser um Data Scientist de qualidade, confira: 

Linguagens

  • Python
  • Java
  • Scala
  • R
  • Java script (node.JS)
  • Dot.net
  • Mat.Lab
  • Ladder
  • Mathematica e
  • SQL

Essas são as habilidades em linguagens mais pedidas pelas empresas atualmente, porém com um grande destaque para o Python, por ele ser umas das melhores linguagens para realizar machine learning e análise de dados.

Bancos de dados

  • MYSQL
  • NOSQL
  • MONGODB
  • NewSQL
  • PostgreSQL
  • Cassandra
  • VoltDB
  • MariaDB
  • Elastic Search
  • Amazon Redshft
  • Google Big Query
  • Oracle

Entre esses bancos de dados os mais requisitados pelas empresas são os MYSQL e o NOSQL, que são bancos de dados bem simples de se mexer, e também são muito eficientes.

Lembrando que uma pessoa que sabe se comuicar corretamente com seus bancos de dados, e puxar exatamente as tabelas certas e colunas que você precisa, consegue resolver os problemas com maior facilidade.

Big Data

  • Apache Hadoop
  • Apache Spark
  • Coherence
  • Hazelcast
  • Apache Hive

Basicamente esses são sistemas de Big Data, trabalham com terabytes de dados. Por isso essas ferramentas entram em jogo, por permitem trabalhar com um grande número de dados. Damos destaque aqui para o  Apache Hadoop e o Apache Spark.

Ambientes de modelagem 

  • Tensorflow
  • Scikit-learn
  • R
  • Apaache Mahaut
  • Spark ML
  • Theano
  • keras
  • H2O
  • SAS
  • SPSS
  • Networkx
  • Numpy e Pandas (Bibliotecas de Python)

E aqui disparado damos destaque ao Tensorflow, que é uma biblioteca de machine learning criada pela Google.

Infraestrutura

  • Openstack ( sistema operacional pra nuvem)
  • Docker (cria maquinas virtuais rapidamente)
  • Openflow e Mininet (desenvolvimento de sistemas)

Técnicas de Machine Learning

  • Deep Learning
  • Reinforcement Learning
  • Regression
  • Recommender Systems
  • SVM
  • Azure ML
  • Amazon ML
  • Markov Chain
  • Neural Networks
  • IBM Watson
  • Randon Forest

No geral, é basicamente isso que um cientista de dados precisa saber. O que, na verdade é um monte de coisas.

Ser um Data Scientist é isso, uma pessoa que faz tudo, sabe tanto de análise de dados quanto de algorítimos muito doidos. E essa é uma profissão que está crescendo bastante.

exatamente por que pessoas de diversas áreas podem se tornar cientistas de dados, pessoas da enenharia, matemática, estatística, economia, administração, por que não? 

Basta você ter conhecimento sobre todas essas coisas listadas acima que poderá virar um profissional nesse ramo, é preciso apenas ter domínio dessas abilidades específicas.

Essa é uma profissão que as empresas atualmente precisam, principlmente por apresentar um conhecimento muito técnico, e que não é tão fácil de se especializar, pois ainda existem poucas faculdades com cursos que ensinam as pessoas sobre todos esses assuntos.

Na maioria das vezes o Data Scientist é autodidata, mas o que isso quer dizer?

Estamos dizendo que a maioria dos cientista de dados vão aprendendo essas coisas sozinhos, por conta própria. Eles mesmos têm que buscar esse conhecimento, se aprofundando e se especializando cada dia mais, através de constante estudo e prática.

Atualmente vale muito a pena investir nessa profissão, pois além de estar cada dia mais aumentando a procura de peritos nessa área, a remuneração é alta e vale muito a pena.

Essa modalidade de trabalhadores especializados em Data Science se encaixa numa nova categoria de profissionais, a chamada Officeless, um movimento que acredita em relações de trabalho baseadas na autonomia, propósito e confiança. Implementam o trabalho remoto, criando equipes com pessoas mais produtivas, realizadas e conectadas independente de suas localizações.

Agregando flexibilidade, transparência, conexão e um propósito no seu trabalho, tendo sempre em mente que confiança gera responsabilidade, que por fim gera resultados.

Então, se animou com essa novidade do mercado de trabalho? Que tal se tornar um especialista em Data Science? 

Vamos deixar aqui mais um artigo cheio novidades sobre todas essas mudanças que estão acontecendo na atualidade, você sabe oque é mentalidadedigital ou transformação digital? Fique por dentro de todos os assuntos do momento, conhecimento e tudo!

 

 

 

 

 

 

 

 

 

 

 

 

  • Compartilhe esse post
  • Compartilhar no Facebook00
  • Compartilhar no Google Plus00
  • Compartilhar no Twitter

Deixe seu comentário aqui: