Ferramentas do usuário

Ferramentas do site


c:ciencia_de_dados

Ciência de Dados

Visão Geral

A ciência de dados é uma área interdisciplinar, que abrange diverso setores (ex.: estatísticas, métodos científicos, machine learning e inteligência artificial). O principal objetivo é capturar e analisar dados para que se possa obter informação a partir deles. Posteriormente essas informações serão utilizadas para a resoluções de problemas.

As Origens

A partir dos anos 1970 a nossa capacidade de processamento passou a crescer em uma escala de progressão geométrica, resultando no grande aumento da quantidade de dados e, consequentemente, na necessidade de interpretá-los. A partir disso, começou-se a desenvolver métodos e procedimentos para padronizar o modo como os dados seriam estudados e abordados. Desde então a ciência de dados faz uso da análise preditiva de dados para tentar descobrir “o que vai, ou pode acontecer?”. Atualmente a ciência de dados é amplamente utilizada em diversas áreas, desde na tomada de decisões empresariais até no descobrimento de padrões em diagnóstico de pacientes.

Grandes Nomes

Ao longo de da história houveram muitos nomes que colaboraram para o seu desenvolvimento. Dentre eles vale destacar: Figura 1.: John Eckert e John Mauchly;

  • John Eckert e John Mauchly: dupla de engenheiros que criaram o primeiro computador do mundo (Eniac), cujas ideias são utilizadas até hoje. Foram elas que permitiram que os computadores fossem programados através de programas - função essencial para a história da Ciência de Dados e para o trabalho do cientista de dados.

Figura 2.: Ada Lovelace;

  • Ada Lovelace: foi a primeira programadora da história, cuja colaboração consistiu no desenvolvimento de um programa para ser utilizado na máquina analítica de Charles Babbage, considerada um ponto de partida para os computadores eletrônicos.

Figura 3.: William Cleveland;

  • William Cleveland: professor que estava a frente de seu tempo e percebeu a importância de aumentar as áreas técnicas da Estatística com foco no analista de dados - por isso começou a treinar esses profissionais para o que ele chamava de “necessidades do futuro”.

Além disso, fica aqui alguns cientistas atuais da área, para que os interessados possam acompanhá-los:

  • Fei-Fei Li: professora de Ciência da Computação na Universidade de Stanford University considerada uma das figuras mais importantes em Inteligência Artificial (IA), machine learning e neurociência cognitiva.
  • Nando de Freitas: principal cientista do Google DeepMind, cujo trabalho vem auxiliando a organização no objetivo da utilização de tecnologias para benefício público, assegurando a plena segurança e ética de trabalho.
  • Mine Çetinkaya-Rundel: seu trabalho se destaca na área de inovação da pedagogia estatística, com a implantação da aprendizagem centrada no aluno, da computação e educação de código aberto.

[Referências: link está na seção de referências]

Explorando Dados

A análise e processamento de dados consiste em uma série de etapas a serem seguidas para se chegar em uma conclusão a partir dos fatos analisados. Tais etapas consistem em:

  1. Perguntar: ir atrás do problema que queremos resolver para poder entendê-lo melhor;
  2. Planejar: organizar e administrar como os dados serão coletados;
  3. Processar: de fato processar as informações capturadas e reorganizá-las conforme aspectos semelhantes apareçam;
  4. Analisar: analisar os dados obtidos e descartar os que foram considerados enviesados e/ou irrelevantes;
  5. Agir: elaborar uma conclusão das informações obtidas e colocar em prática o plano de resolução do problema - formado a partir dos dados;

[Referências: curso paralelo sobre Análise de Dados]

Aplicações

Como mencionado anteriormente, a ciência de dados é uma área que se desdobra em diversos setores e por isso há diversas formas de sua aplicação. Dois exemplos são:

  • Setor Financeiro: quando se está falando de finanças o objetivo principal é sempre o mesmo - quanto menor o risco, melhor - e é justamente isso o que os cientistas de dados querem como objetivo. Por meio de análises preditivas, áreas do segmento financeiro tem conseguido analisar riscos de maneira mais assertiva, porque é somente através da aplicação do pensamento técnico analítico que, com base nos dados do passado, conseguimos predizer situações futuras.
  • Setor de Marketing: O Data Science também tem importância para otimizar os resultados do trabalho de comunicação. Afinal, identificar e reconhecer padrões de comportamento não é útil apenas para a previsão financeira, mas também é super valioso para as ações de marketing digital. No marketing, a analise de dados resulta em um maior entendimento do gosto dos cliente, o que possibilita desenvolver técnicas de venda eficazes para o público alvo.

[Referências: curso paralelo sobre Análise de Dados]

Impacto Social

A ciência de dados é equivalente a uma faca de dois gumes, pois pode influenciar tanto positivamente como negativamente. Pelo lado positivo ela contribui para a melhora na qualidade de vida e corrobora para a solução de problemas do cotidiano - um exemplo é a iniciativa do movimento “Data Good” (para saber mais acesse o Link na seção de referências). Contudo, pelo outro lado ela abriu os olhos para o mar de dados que as redes proporcionam, o que coloca em risco a privacidade pessoal dos usuários.

Desafios

Como qualquer outra profissão, os cientistas de dados enfrentam uma série de percalços durante a vida profissional, cujos principais são: linguagem de computação favoráveis e computação na nuvem. Esses desafios abrangem principalmente o período inicial das carreiras de um cientista de dados e podem ser solucionados com uma graduação vasta e aplicada, ou seja, basta ir atrás dos assuntos, ser curioso e antenado às novidades na área. Contudo, há uma série de desafios que englobam mais o mercado de trabalho e para os quais se deve estar mais atento: lidar com o crescimento dos dados; gerar insights em tempo hábil; integrar fontes de dados díspares; validação dos dados.

Referências

c/ciencia_de_dados.txt · Última modificação: 2022/09/12 17:37 por João Pedro Ramalho