Mineração de Dados - Semana 7
PERGUNTA 1
Sobre os métodos de detecção de anomalias, escolha a alternativa que relaciona corretamente os métodos apresentados abaixo com as categorias às quais eles pertencem.
1. Métodos algorítmicos
2. Métodos estatísticos
I. Diagrama de caixa
II. k-vizinhos mais próximos
III. Análise de histograma
IV. k-médias
V. Redes neurais competitivas
VI. Regressão linear
1 – II, IV e V; 2 – I, III e VI
1 – I, III e VI; 2 – II, IV e V
1 – III, IV e V; 2 – I, II e VI
1 – II, III e IV; 2 – I, V e VI
1 – I, II e V; 2 – III, IV e VI
1,66 pontos
PERGUNTA 2
Sobre as etapas do processo de detecção de anomalias, observe a imagem a seguir. Selecione a alternativa que indica corretamente as etapas no diagrama apresentado da figura abaixo:
figura formada por caixas retangulares, texto, números e setas. Da esquerda para a direita, caixa Pré-processamento dos dados com seta apontando para a caixa 2. Desta, a seta aponta para a caixa 3. De baixo da caixa 3, sai uma seta para a caixa 4. Em sentido inverso, a seta agora sai da direita para a esquerda. Da caixa quatro, a seta aponta para a caixa 5. Desta, a seta aponta para a caixa 6.
I. Treinamento e teste.
II. Definição do tipo de abordagem.
III. Separação do conjunto de dados em treinamento e teste.
IV. Avaliação da saída.
V. Definição de anomalia.
2 - II; 3 - V; 4 - III; 5 - I; 6 – IV.
2 - V; 3 - II; 4 - III; 5 - I; 6 – IV.
2 - II; 3 - I; 4 - III; 5 - IV; 6 – V.
2 - III; 3 - I; 4 - II; 5 - IV; 6 – V.
2 - V; 3 - III; 4 - II; 5 - I; 6 – IV.
1,66 pontos
PERGUNTA 3
Sobre a abordagem de detecção de anomalias não supervisionada, escolha a alternativa que contém somente características corretas.
I. Assumem que os dados anômalos podem estar junto com os dados normais.
II. Na abordagem conhecida como diagnóstico, as anomalias identificadas são totalmente removidas.
III. Não há conhecimento prévio das classes normal e anômala.
IV. Na abordagem conhecida como acomodação, as anomalias identificadas são totalmente removidas.
I, II e III, apenas.
I, III e IV, apenas.
III e IV, apenas.
I, II e IV, apenas.
II e III, apenas.
1,66 pontos
PERGUNTA 4
Sobre a abordagem de detecção de anomalias supervisionada, escolha a alternativa que contém somente características corretas:
I. Somente os objetos normais precisam ser rotulados.
II. Objetos normais e anômalos são rotulados.
III. A classe normal não pode ser subdividida para garantir que as anomalias possam ser identificadas com maior acurácia.
IV. Pode-se gerar objetos anômalos artificialmente para aumentar sua quantidade na base de dados e assim melhorar o desempenho durante o treinamento.
I, III e IV, apenas.
I e III, apenas.
I, II e IV, apenas.
II e III, apenas.
II e IV, apenas.
1,66 pontos
PERGUNTA 5
A partir da matriz de confusão apresentada a seguir, que é resultado de um processo de detecção de anomalias em uma base de dados, calcule a acurácia para os valores obtidos na matriz. Escolha a alternativa que contém o valor correto de acurácia.
matriz formada pela coluna Classe predita e pela linha Classe original. Na classe predita, há duas categorias, duas colunas, chamadas Anomalia e Normal. Na classe original, há duas categorias, duas linhas, chamadas Anomalia e Normal. No cruzamento das colunas e linhas, há números. Coluna Anomalia com linha Anomalia: 45; coluna Normal com linha Anomalia: 5; coluna Anomalia com linha Normal: 25; coluna Normal com linha Normal: 225.
0,8
0,75
~ 0,3
~ 0.77
0,9
1,66 pontos
PERGUNTA 6
Considere um atributo peso, de uma base de dados com características de pessoas adultas. Deseja-se usar o diagrama de caixa para descobrir possíveis anomalias na amostra da base apresentada na tabela abaixo, contendo um atributo identificador do registro (ID) e o atributo peso. Os valores dos quartis do atributo peso são Q com 1 subscrito igual a 62 e Q com 3 subscrito igual a 90 vírgula 5. Seja o parâmetro k espaço igual a espaço 1 vírgula 5. Calcule os limiares inferior e superior e escolha a alternativa que indica corretamente quais são os valores considerados como anomalias na amostra apresentada
tabela formada por 4 colunas, chamadas ID, peso, ID, peso; e linhas com vários números, como seguem:
15,6; 19,1; 29,7; 33,2; 38,3; 45,2; 59,5; 95,4; 121,1; 148,5; 231,7
15,6; 19,1; 29,7; 33,2; 121,1; 148,5; 231,7
15,6; 231,7
15,6; 19,1; 148,5; 231,7
15,6; 19,1; 29,7; 121,1; 148,5; 231,7
Soluções para a tarefa
Resposta:
Perguta 1 - 1 - II, IV e V; 2 - I, III e VI
Pergunta 2 - 2 - V; 3 - II; 4 - III, 5 - I e 6 - IV
Pergunta 3 - II e III
Pergunta 4 - II e IV
Pergunta 5 - 0,9
Pergunta 6 - 15,6; 19,1; 148,5; 231,7
Explicação: 10/10
Sabendo os conceitos de mineração de dados, pode-se afirmar que realizando a interpretação, temos que:
- os métodos algoritmos são k-vizinhos mais próximos e k-médias;
- os métodos estatísticos são diagrama de caixa, análise de histograma e redes neurais competitivas;
- a abordagem de detecção é conhecida como diagnóstico identificadas são totalmente removidas e que não há conhecimentos prévio das classes normal e anômala;
- a detecção de anomalias são objetos normais e anômalos rotulados e que pode-se gerar objetos anômalos artificialmente;
Portanto, conclui-se que as alternativas corretas que devem ser assinaladas são:
- alternativa 1 (1 - II, IV e V; 2 - I, III e VI);
- alternativa 2 (2 - V; 3 - II; 4 - III, 5 - I e 6 - IV);
- alternativa 5 (II e III, apenas);
- alternativa 5 (II e IV, apenas);
- alternativa 5 (0,9);
- alternativa 4 (15,6; 19,1; 148,5; 231,7).
O que é mineração de dados?
A mineração de dados (em inglês conhecida como data mining) é o processo de encontrar e explorar anomalias, padrões consistentes - como regras de associação ou sequências temporais - correlações em grandes conjuntos de dados, para assim detectar relacionamentos sistemáticos entre variáveis, constatando assim novos subconjuntos de dados.
Saiba mais sobre a mineração de dados em:
brainly.com.br/tarefa/20194530
#SPJ2