Ferramentas do usuário

Ferramentas do site


c:ciencia_de_dados

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anteriorRevisão anterior
Próxima revisão
Revisão anterior
c:ciencia_de_dados [2022/08/27 18:46] – [Ciência de Dado] correção do título Pedro Folloni Pesserlc:ciencia_de_dados [2022/09/12 20:37] (atual) – [Grandes Nomes] João Pedro Ramalho
Linha 1: Linha 1:
 +====== Ciência de Dados ======
  
 +===== Visão Geral =====
 +
 +A ciência de dados é uma área interdisciplinar, que abrange diverso setores (ex.: estatísticas, métodos científicos, machine learning e inteligência artificial). O principal objetivo é capturar e analisar dados para que se possa obter informação a partir deles. Posteriormente essas informações serão utilizadas para a resoluções de problemas.
 +
 +===== As Origens =====
 +A partir dos anos 1970 a nossa capacidade de processamento passou a crescer em uma escala de progressão geométrica, resultando no grande aumento da quantidade de dados e, consequentemente, na necessidade de interpretá-los. A partir disso, começou-se a desenvolver métodos e procedimentos para padronizar o modo como os dados seriam estudados e abordados. Desde então a ciência de dados faz uso da análise preditiva de dados para tentar descobrir "o que vai, ou pode acontecer?".
 +Atualmente a ciência de dados é amplamente utilizada em diversas áreas, desde na tomada de decisões empresariais até no descobrimento de padrões em diagnóstico de pacientes.
 +
 +===== Grandes Nomes =====
 +Ao longo de da história houveram muitos nomes que colaboraram para o seu desenvolvimento. Dentre eles vale destacar:
 +{{ :c:dlj2eahxoaepffy.jpg?200 |}}
 +Figura 1.: John Eckert e John Mauchly;
 +  * John Eckert e John Mauchly: dupla de engenheiros que criaram o primeiro computador do mundo (Eniac), cujas ideias são utilizadas até hoje. Foram elas que permitiram que os computadores fossem programados através de programas - função essencial para a história da Ciência de Dados e para o trabalho do cientista de dados.
 +
 +{{ :c:ada-lovelace.jpg?200 |}}
 +Figura 2.: Ada Lovelace;
 +  * Ada Lovelace: foi a primeira programadora da história, cuja colaboração consistiu no desenvolvimento  de um programa para ser utilizado na máquina analítica de Charles Babbage, considerada um ponto de partida para os computadores eletrônicos.
 +{{ :c:4ae9fc7f2641b23b544101ed571320c17ed276b200346712d5a1ef73cecf0a4e.jpg?200 |}}
 +Figura 3.: William Cleveland;
 +  * William Cleveland: professor que  estava a frente de seu tempo e percebeu a importância de aumentar as áreas técnicas da Estatística com foco no analista de dados - por isso começou a treinar esses profissionais para o que ele chamava de “necessidades do futuro”.
 +
 +Além disso, fica aqui alguns cientistas atuais da área, para que os interessados possam acompanhá-los:
 +  * Fei-Fei Li: professora de Ciência da Computação na Universidade de Stanford University considerada uma das figuras mais importantes em Inteligência Artificial (IA), machine learning e neurociência cognitiva.
 +  * Nando de Freitas: principal cientista do Google DeepMind, cujo trabalho vem auxiliando a organização no objetivo da utilização de tecnologias para benefício público, assegurando a plena segurança e ética de trabalho.
 +  * Mine Çetinkaya-Rundel: seu trabalho se destaca na área de inovação da pedagogia estatística, com a implantação da aprendizagem centrada no aluno, da computação e educação de código aberto.
 +
 +[Referências: link está na seção de referências]
 +===== Explorando Dados =====
 +A análise e processamento de dados consiste em uma série de etapas a serem seguidas para se chegar em uma conclusão a partir dos fatos analisados. Tais etapas consistem em:
 +  - Perguntar: ir atrás do problema que queremos resolver para poder entendê-lo melhor;
 +  - Planejar: organizar e administrar como os dados serão coletados;
 +  - Processar: de fato processar as informações capturadas e reorganizá-las conforme aspectos semelhantes apareçam;
 +  - Analisar: analisar os dados obtidos e descartar os que foram considerados enviesados e/ou irrelevantes;
 +  - Agir: elaborar uma conclusão das informações obtidas e colocar em prática o plano de resolução do problema - formado a partir dos dados;
 +
 +[Referências: curso paralelo sobre Análise de Dados]
 +===== Aplicações =====
 +Como mencionado anteriormente, a ciência de dados é uma área que se desdobra em diversos setores e por isso há diversas formas de sua aplicação. Dois exemplos são: 
 +  * Setor Financeiro: quando se está falando de finanças o objetivo principal é sempre o mesmo - quanto menor o risco, melhor - e é justamente isso o que os cientistas de dados querem como objetivo. Por meio de análises preditivas, áreas do segmento financeiro tem conseguido analisar riscos de maneira mais assertiva, porque é somente através da aplicação do pensamento técnico analítico que, com base nos dados do passado, conseguimos predizer situações futuras.  
 +  * Setor de Marketing: O Data Science também tem importância para otimizar os resultados do trabalho de comunicação. Afinal, identificar e reconhecer padrões de comportamento não é útil apenas para a previsão financeira, mas também é super valioso para as ações de marketing digital. No marketing, a analise de dados resulta em um maior entendimento do gosto dos cliente, o que possibilita desenvolver técnicas de venda eficazes para o público alvo.
 +
 +[Referências: curso paralelo sobre Análise de Dados]
 +===== Impacto Social =====
 +A ciência de dados é equivalente a uma faca de dois gumes, pois pode influenciar tanto positivamente como negativamente. Pelo lado positivo ela contribui para a melhora na qualidade de vida e corrobora para a solução de problemas do cotidiano - um exemplo é a iniciativa do movimento "Data Good" (para saber mais acesse o Link na seção de referências). Contudo, pelo outro lado ela abriu os olhos para o mar de dados que as redes proporcionam, o que coloca em risco a privacidade pessoal dos usuários. 
 +
 +===== Desafios =====
 +Como qualquer outra profissão, os cientistas de dados enfrentam uma série de percalços durante a vida profissional, cujos principais são: linguagem de computação favoráveis e computação na nuvem. 
 +Esses desafios abrangem principalmente o período inicial das carreiras de um cientista de dados e podem ser solucionados com uma graduação vasta e aplicada, ou seja, basta ir atrás dos assuntos, ser curioso e antenado às novidades na área. Contudo, há uma série de desafios que englobam mais o mercado de trabalho e para os quais se deve estar mais atento: lidar com o crescimento dos dados; gerar insights em tempo hábil; integrar fontes de dados díspares; validação dos dados.
 +
 +===== Referências =====
 +  * Figura 1: [[https://twitter.com/fotosdefatos/status/1032032218582052864]]
 +  * Figura 2: [[https://thehack.com.br/conheca-ada-lovelace-matematica-do-seculo-xix-autora-do-primeiro-programa-de-computador/]]
 +  * Figura 3: [[https://www.stat.purdue.edu/people/faculty/wsc.html]]
 +  * Link: [[https://fundacaotelefonicavivo.org.br/noticias/como-o-uso-de-dados-pode-ajudar-a-aumentar-o-impacto-social-positivo]]
 +  * Info sobre Grandes Nomes na área: https://www.digitalhouse.com/br/blog/cientistas-de-dados/