Uma parte muito importante do contexto big data é a ingestão dos dados. A partir disso, analise o seguinte cenário:
Uma empresa tem dados oriundos do sensor RFID do sistema de ponto eletrônico e também diversas planilhas eletrônicas em cinco diferentes departamentos, totalizando mais de 15 milhões de registros feitos nos últimos 20 anos. É necessário unificar esses dados em um repositório único, a fim de que a análise e o processamento fiquem mais fáceis.
Diante do exposto, qual é a solução possível no contexto de big data?
A.
Por ter diferentes tipos de arquivos, não é possível uni-los em um único repositório. No entanto, é possível obter os dados de cada um e armazená-los em um banco de dados relacional, em um sistema de arquivos NTFS.
B.
É possível unir os arquivos em um banco de dados relacional, inclusive extraindo os dados das planilhas e fazendo um espelho de seus campos em tabelas. No entanto, os dados RFID ficarão isolados.
C.
É possível unir todos os arquivos em um repositório comum, em um sistema HDFS, inclusive, em estrutura de cluster, a fim de compor a segurança, a replicação e a confiabilidade.
D.
É possível unir os arquivos em um sistema de arquivos como o FAT32, a fim de garantir a confiabilidade. Caso seja necessário, pode-se colocar os dados do RFID dentro de uma nova estrutura, sem a necessidade de um cluster.
E.
O cenário apresentado não é um problema que envolve big data, mas sim a produção de um software que possa consumir as diferentes API's que há dentro da empresa.
Soluções para a tarefa
Respondido por
3
Resposta:
letra C
Explicação:
Perguntas interessantes
Pedagogia,
3 meses atrás
Administração,
3 meses atrás
Contabilidade,
3 meses atrás
História,
9 meses atrás
Filosofia,
9 meses atrás