====== Ciência de Dados ====== ===== Visão Geral ===== A ciência de dados é uma área interdisciplinar, que abrange diverso setores (ex.: estatísticas, métodos científicos, machine learning e inteligência artificial). O principal objetivo é capturar e analisar dados para que se possa obter informação a partir deles. Posteriormente essas informações serão utilizadas para a resoluções de problemas. ===== As Origens ===== A partir dos anos 1970 a nossa capacidade de processamento passou a crescer em uma escala de progressão geométrica, resultando no grande aumento da quantidade de dados e, consequentemente, na necessidade de interpretá-los. A partir disso, começou-se a desenvolver métodos e procedimentos para padronizar o modo como os dados seriam estudados e abordados. Desde então a ciência de dados faz uso da análise preditiva de dados para tentar descobrir "o que vai, ou pode acontecer?". Atualmente a ciência de dados é amplamente utilizada em diversas áreas, desde na tomada de decisões empresariais até no descobrimento de padrões em diagnóstico de pacientes. ===== Grandes Nomes ===== Ao longo de da história houveram muitos nomes que colaboraram para o seu desenvolvimento. Dentre eles vale destacar: {{ :c:dlj2eahxoaepffy.jpg?200 |}} Figura 1.: John Eckert e John Mauchly; * John Eckert e John Mauchly: dupla de engenheiros que criaram o primeiro computador do mundo (Eniac), cujas ideias são utilizadas até hoje. Foram elas que permitiram que os computadores fossem programados através de programas - função essencial para a história da Ciência de Dados e para o trabalho do cientista de dados. {{ :c:ada-lovelace.jpg?200 |}} Figura 2.: Ada Lovelace; * Ada Lovelace: foi a primeira programadora da história, cuja colaboração consistiu no desenvolvimento de um programa para ser utilizado na máquina analítica de Charles Babbage, considerada um ponto de partida para os computadores eletrônicos. {{ :c:4ae9fc7f2641b23b544101ed571320c17ed276b200346712d5a1ef73cecf0a4e.jpg?200 |}} Figura 3.: William Cleveland; * William Cleveland: professor que estava a frente de seu tempo e percebeu a importância de aumentar as áreas técnicas da Estatística com foco no analista de dados - por isso começou a treinar esses profissionais para o que ele chamava de “necessidades do futuro”. Além disso, fica aqui alguns cientistas atuais da área, para que os interessados possam acompanhá-los: * Fei-Fei Li: professora de Ciência da Computação na Universidade de Stanford University considerada uma das figuras mais importantes em Inteligência Artificial (IA), machine learning e neurociência cognitiva. * Nando de Freitas: principal cientista do Google DeepMind, cujo trabalho vem auxiliando a organização no objetivo da utilização de tecnologias para benefício público, assegurando a plena segurança e ética de trabalho. * Mine Çetinkaya-Rundel: seu trabalho se destaca na área de inovação da pedagogia estatística, com a implantação da aprendizagem centrada no aluno, da computação e educação de código aberto. [Referências: link está na seção de referências] ===== Explorando Dados ===== A análise e processamento de dados consiste em uma série de etapas a serem seguidas para se chegar em uma conclusão a partir dos fatos analisados. Tais etapas consistem em: - Perguntar: ir atrás do problema que queremos resolver para poder entendê-lo melhor; - Planejar: organizar e administrar como os dados serão coletados; - Processar: de fato processar as informações capturadas e reorganizá-las conforme aspectos semelhantes apareçam; - Analisar: analisar os dados obtidos e descartar os que foram considerados enviesados e/ou irrelevantes; - Agir: elaborar uma conclusão das informações obtidas e colocar em prática o plano de resolução do problema - formado a partir dos dados; [Referências: curso paralelo sobre Análise de Dados] ===== Aplicações ===== Como mencionado anteriormente, a ciência de dados é uma área que se desdobra em diversos setores e por isso há diversas formas de sua aplicação. Dois exemplos são: * Setor Financeiro: quando se está falando de finanças o objetivo principal é sempre o mesmo - quanto menor o risco, melhor - e é justamente isso o que os cientistas de dados querem como objetivo. Por meio de análises preditivas, áreas do segmento financeiro tem conseguido analisar riscos de maneira mais assertiva, porque é somente através da aplicação do pensamento técnico analítico que, com base nos dados do passado, conseguimos predizer situações futuras. * Setor de Marketing: O Data Science também tem importância para otimizar os resultados do trabalho de comunicação. Afinal, identificar e reconhecer padrões de comportamento não é útil apenas para a previsão financeira, mas também é super valioso para as ações de marketing digital. No marketing, a analise de dados resulta em um maior entendimento do gosto dos cliente, o que possibilita desenvolver técnicas de venda eficazes para o público alvo. [Referências: curso paralelo sobre Análise de Dados] ===== Impacto Social ===== A ciência de dados é equivalente a uma faca de dois gumes, pois pode influenciar tanto positivamente como negativamente. Pelo lado positivo ela contribui para a melhora na qualidade de vida e corrobora para a solução de problemas do cotidiano - um exemplo é a iniciativa do movimento "Data Good" (para saber mais acesse o Link na seção de referências). Contudo, pelo outro lado ela abriu os olhos para o mar de dados que as redes proporcionam, o que coloca em risco a privacidade pessoal dos usuários. ===== Desafios ===== Como qualquer outra profissão, os cientistas de dados enfrentam uma série de percalços durante a vida profissional, cujos principais são: linguagem de computação favoráveis e computação na nuvem. Esses desafios abrangem principalmente o período inicial das carreiras de um cientista de dados e podem ser solucionados com uma graduação vasta e aplicada, ou seja, basta ir atrás dos assuntos, ser curioso e antenado às novidades na área. Contudo, há uma série de desafios que englobam mais o mercado de trabalho e para os quais se deve estar mais atento: lidar com o crescimento dos dados; gerar insights em tempo hábil; integrar fontes de dados díspares; validação dos dados. ===== Referências ===== * Figura 1: [[https://twitter.com/fotosdefatos/status/1032032218582052864]] * Figura 2: [[https://thehack.com.br/conheca-ada-lovelace-matematica-do-seculo-xix-autora-do-primeiro-programa-de-computador/]] * Figura 3: [[https://www.stat.purdue.edu/people/faculty/wsc.html]] * Link: [[https://fundacaotelefonicavivo.org.br/noticias/como-o-uso-de-dados-pode-ajudar-a-aumentar-o-impacto-social-positivo]] * Info sobre Grandes Nomes na área: https://www.digitalhouse.com/br/blog/cientistas-de-dados/