b:big_data
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anteriorRevisão anteriorPróxima revisão | Revisão anterior | ||
b:big_data [2022/08/31 02:38] – [Aplicações] Lucas Santos | b:big_data [2022/09/05 23:43] (atual) – [Visão geral] Marcelo Gyovani Pereira | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
+ | ====== Visão geral ====== | ||
+ | |||
+ | Big Data é a análise e tratamento de conjuntos de dados variados que possuem grande volume e que chegam numa velocidade cada vez maior. Esses conjuntos de dados são tão grandes e complexos que não podem ser processados por um software tradicional de processamento de dados, os dados são diversos e podem ser vídeos, áudios, imagens, textos, operações bancarias, número de acessos a uma página na web e etc. A Big Data é definida | ||
+ | |||
+ | **Volume**: é a quantidade de dados que terão que ser processados. O tamanho dos dados é essencial na determinação do valor dos dados, principalmente se eles podem ou não serem considerados Big Data. | ||
+ | |||
+ | **Velocidade**: | ||
+ | |||
+ | **Variedade**: | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Com o passar do tempo novos Vs foram adicionados, | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ====== História ====== | ||
+ | |||
+ | Embora o conceito de Big Data seja relativamente novo, a origem de grandes conjuntos de dados remontam às décadas de 1960 e 1970, com o surgimento dos primeiros data centers e o desenvolvimento do bando de dados relacional. No entanto, a origem do termo Big Data em si nasceu no início da década de 1990, na NASA, para descrever uma grande quantidade de dados complexos que desafiam os limites computacionais tradicionais de captura, processamento, | ||
+ | |||
+ | Com o passar do tempo os cientistas de dados começaram a verificar que bancos de dados relacionais não conseguiriam suportar uma grande quantidade de dados não estruturados. Desta maneira, novas tecnologias e processos tiveram que ser desenvolvidos para permitir que esses dados não estruturados fossem analisados. Assim, em 2005 foi criado o Hadoop (uma estrutura open source criada pelo Yahoo, especificamente para armazenar e analisar um grande conjunto de dados), considerado uma das maiores invenções de data management desde o modelo relacional. O desenvolvimento de estruturas de código aberto como essa foram essenciais para o crescimento do Big Data, pois transformavam seu trabalho mais fácil e mais barato. Em 2014 foi criado o Spark, uma ferramenta Big Data que tem o objetivo de processar grandes conjuntos de dados de forma paralela e distribuída. Ela estende o modelo de programação MapReduce popularizado pelo Hadoop, facilitando bastante o desenvolvimento de aplicações de processamento de grandes volumes de dados. Atualmente, é utilizado uma combinação das duas estruturas. | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ====== Como Big Data Funciona ====== | ||
+ | |||
+ | O uso de soluções de Big Data se dá através de três etapas: | ||
+ | |||
+ | **Coleta**: É quando a ferramenta busca dados, estejam eles estruturados ou não, reunindo dados de diversas fontes e aplicativos diferentes com a combinação de conteúdos internos e externos. | ||
+ | |||
+ | **Armazenamento**: | ||
+ | |||
+ | **Análise**: | ||
+ | |||
+ | |||
+ | ====== Aplicações ====== | ||
+ | |||
+ | A Big Data é usada por empresas para melhorar operações, | ||
+ | |||
+ | O Big Data é utilizado principalmente no setor corporativo, | ||
+ | |||
+ | Já na esfera estatal, o Big Data pode ser usado na prevenção de crimes, em iniciativas de cidade inteligente, | ||
+ | |||
+ | |||
+ | ====== Desafios ====== | ||
+ | |||
+ | Apesar do desenvolvimento de tecnologias para o armazenamento de dados, os volumes de dados estão dobrando de tamanho a cada dois anos, como a quantidade só aumenta com o passar do tempo, sempre é necessário desenvolver novas soluções de armazenamento para um volume cada vez maior de dados, sendo um problema contínuo que só vai aumentar ao longo dos próximos anos. Além disso, é necessário analisar esses dados e extrair apenas o que for importante e relevante para o negócio. A segurança dos dados também é um desafio, principalmente com o aumento crescente dos ataques de hackers que vão desde da esfera pública até o setor privado. | ||
+ | |||
+ | Outros desafios no gerenciamento de sistemas de big data incluem tornar os dados acessíveis a cientistas e analistas de dados, especialmente em ambientes distribuídos que incluem uma combinação de diferentes plataformas e armazenamentos de dados. Para ajudar os analistas a encontrar dados relevantes, as equipes de análise e gerenciamento de dados estão criando cada vez mais catálogos de dados que incorporam funções de gerenciamento de metadados e linhagem de dados. O processo de integração de conjuntos de big data também costuma ser complicado, principalmente quando a variedade e a velocidade dos dados são fatores. | ||
+ | |||
+ | |||
+ | ========Referências======== | ||
+ | [1] O que é Big Data?. Oracle. Disponível em: < | ||
+ | [2] Big Data: o que é, como funciona e como aplicar?. TOTVS. Publicado em 22 de março de 2021. Disponível em: < | ||
+ | [3] Big Data: Tudo o que você precisa saber. Cetax. Publicado em 05 de março de 2018. Disponível em: < | ||
+ | [4] Doyle, Daniella. O que é Big Data e por que é tão valioso para sua empresa. Siteware. Publicado em 28 de janeiro de 2019. Disponível em: < | ||
+ | [5] Botelho, Bridget; Bigelow, Stephen. What is Big Data?. TechTarget. Atualizado em janeiro de 2022. Disponível em: < | ||
+ | [6] Taylor, David. What is Big Data? Introduction, | ||
+ | |||
+ | |||
+ | |||