Tabela de conteúdos

Ciência de Dados

Visão Geral

A ciência de dados é uma área interdisciplinar, que abrange diverso setores (ex.: estatísticas, métodos científicos, machine learning e inteligência artificial). O principal objetivo é capturar e analisar dados para que se possa obter informação a partir deles. Posteriormente essas informações serão utilizadas para a resoluções de problemas.

As Origens

A partir dos anos 1970 a nossa capacidade de processamento passou a crescer em uma escala de progressão geométrica, resultando no grande aumento da quantidade de dados e, consequentemente, na necessidade de interpretá-los. A partir disso, começou-se a desenvolver métodos e procedimentos para padronizar o modo como os dados seriam estudados e abordados. Desde então a ciência de dados faz uso da análise preditiva de dados para tentar descobrir “o que vai, ou pode acontecer?”. Atualmente a ciência de dados é amplamente utilizada em diversas áreas, desde na tomada de decisões empresariais até no descobrimento de padrões em diagnóstico de pacientes.

Grandes Nomes

Ao longo de da história houveram muitos nomes que colaboraram para o seu desenvolvimento. Dentre eles vale destacar: Figura 1.: John Eckert e John Mauchly;

Figura 2.: Ada Lovelace;

Figura 3.: William Cleveland;

Além disso, fica aqui alguns cientistas atuais da área, para que os interessados possam acompanhá-los:

[Referências: link está na seção de referências]

Explorando Dados

A análise e processamento de dados consiste em uma série de etapas a serem seguidas para se chegar em uma conclusão a partir dos fatos analisados. Tais etapas consistem em:

  1. Perguntar: ir atrás do problema que queremos resolver para poder entendê-lo melhor;
  2. Planejar: organizar e administrar como os dados serão coletados;
  3. Processar: de fato processar as informações capturadas e reorganizá-las conforme aspectos semelhantes apareçam;
  4. Analisar: analisar os dados obtidos e descartar os que foram considerados enviesados e/ou irrelevantes;
  5. Agir: elaborar uma conclusão das informações obtidas e colocar em prática o plano de resolução do problema - formado a partir dos dados;

[Referências: curso paralelo sobre Análise de Dados]

Aplicações

Como mencionado anteriormente, a ciência de dados é uma área que se desdobra em diversos setores e por isso há diversas formas de sua aplicação. Dois exemplos são:

[Referências: curso paralelo sobre Análise de Dados]

Impacto Social

A ciência de dados é equivalente a uma faca de dois gumes, pois pode influenciar tanto positivamente como negativamente. Pelo lado positivo ela contribui para a melhora na qualidade de vida e corrobora para a solução de problemas do cotidiano - um exemplo é a iniciativa do movimento “Data Good” (para saber mais acesse o Link na seção de referências). Contudo, pelo outro lado ela abriu os olhos para o mar de dados que as redes proporcionam, o que coloca em risco a privacidade pessoal dos usuários.

Desafios

Como qualquer outra profissão, os cientistas de dados enfrentam uma série de percalços durante a vida profissional, cujos principais são: linguagem de computação favoráveis e computação na nuvem. Esses desafios abrangem principalmente o período inicial das carreiras de um cientista de dados e podem ser solucionados com uma graduação vasta e aplicada, ou seja, basta ir atrás dos assuntos, ser curioso e antenado às novidades na área. Contudo, há uma série de desafios que englobam mais o mercado de trabalho e para os quais se deve estar mais atento: lidar com o crescimento dos dados; gerar insights em tempo hábil; integrar fontes de dados díspares; validação dos dados.

Referências