Mineração de Dados - Semana 7 PERGUNTA 1 Sobre os métodos de detecção de anomalias, escolha a alternativa que relaciona cor

Mineração de Dados - Semana 7

PERGUNTA 1

Sobre os métodos de detecção de anomalias, escolha a alternativa que relaciona corretamente os métodos apresentados abaixo com as categorias às quais eles pertencem.



1. Métodos algorítmicos

2. Métodos estatísticos



I. Diagrama de caixa

II. k-vizinhos mais próximos

III. Análise de histograma

IV. k-médias

V. Redes neurais competitivas

VI. Regressão linear


1 – II, IV e V; 2 – I, III e VI


1 – I, III e VI; 2 – II, IV e V


1 – III, IV e V; 2 – I, II e VI


1 – II, III e IV; 2 – I, V e VI


1 – I, II e V; 2 – III, IV e VI

1,66 pontos

PERGUNTA 2

Sobre as etapas do processo de detecção de anomalias, observe a imagem a seguir. Selecione a alternativa que indica corretamente as etapas no diagrama apresentado da figura abaixo:

figura formada por caixas retangulares, texto, números e setas. Da esquerda para a direita, caixa Pré-processamento dos dados com seta apontando para a caixa 2. Desta, a seta aponta para a caixa 3. De baixo da caixa 3, sai uma seta para a caixa 4. Em sentido inverso, a seta agora sai da direita para a esquerda. Da caixa quatro, a seta aponta para a caixa 5. Desta, a seta aponta para a caixa 6.

I. Treinamento e teste.

II. Definição do tipo de abordagem.

III. Separação do conjunto de dados em treinamento e teste.

IV. Avaliação da saída.

V. Definição de anomalia.


2 - II; 3 - V; 4 - III; 5 - I; 6 – IV.


2 - V; 3 - II; 4 - III; 5 - I; 6 – IV.


2 - II; 3 - I; 4 - III; 5 - IV; 6 – V.


2 - III; 3 - I; 4 - II; 5 - IV; 6 – V.


2 - V; 3 - III; 4 - II; 5 - I; 6 – IV.

1,66 pontos

PERGUNTA 3

Sobre a abordagem de detecção de anomalias não supervisionada, escolha a alternativa que contém somente características corretas.



I. Assumem que os dados anômalos podem estar junto com os dados normais.

II. Na abordagem conhecida como diagnóstico, as anomalias identificadas são totalmente removidas.

III. Não há conhecimento prévio das classes normal e anômala.

IV. Na abordagem conhecida como acomodação, as anomalias identificadas são totalmente removidas.


I, II e III, apenas.


I, III e IV, apenas.


III e IV, apenas.


I, II e IV, apenas.


II e III, apenas.

1,66 pontos

PERGUNTA 4

Sobre a abordagem de detecção de anomalias supervisionada, escolha a alternativa que contém somente características corretas:



I. Somente os objetos normais precisam ser rotulados.

II. Objetos normais e anômalos são rotulados.

III. A classe normal não pode ser subdividida para garantir que as anomalias possam ser identificadas com maior acurácia.

IV. Pode-se gerar objetos anômalos artificialmente para aumentar sua quantidade na base de dados e assim melhorar o desempenho durante o treinamento.


I, III e IV, apenas.


I e III, apenas.


I, II e IV, apenas.


II e III, apenas.


II e IV, apenas.

1,66 pontos

PERGUNTA 5

A partir da matriz de confusão apresentada a seguir, que é resultado de um processo de detecção de anomalias em uma base de dados, calcule a acurácia para os valores obtidos na matriz. Escolha a alternativa que contém o valor correto de acurácia.

matriz formada pela coluna Classe predita e pela linha Classe original. Na classe predita, há duas categorias, duas colunas, chamadas Anomalia e Normal. Na classe original, há duas categorias, duas linhas, chamadas Anomalia e Normal. No cruzamento das colunas e linhas, há números. Coluna Anomalia com linha Anomalia: 45; coluna Normal com linha Anomalia: 5; coluna Anomalia com linha Normal: 25; coluna Normal com linha Normal: 225.


0,8


0,75


~ 0,3


~ 0.77


0,9

1,66 pontos

PERGUNTA 6

Considere um atributo peso, de uma base de dados com características de pessoas adultas. Deseja-se usar o diagrama de caixa para descobrir possíveis anomalias na amostra da base apresentada na tabela abaixo, contendo um atributo identificador do registro (ID) e o atributo peso. Os valores dos quartis do atributo peso são Q com 1 subscrito igual a 62 e Q com 3 subscrito igual a 90 vírgula 5. Seja o parâmetro k espaço igual a espaço 1 vírgula 5. Calcule os limiares inferior e superior e escolha a alternativa que indica corretamente quais são os valores considerados como anomalias na amostra apresentada

tabela formada por 4 colunas, chamadas ID, peso, ID, peso; e linhas com vários números, como seguem:


15,6; 19,1; 29,7; 33,2; 38,3; 45,2; 59,5; 95,4; 121,1; 148,5; 231,7


15,6; 19,1; 29,7; 33,2; 121,1; 148,5; 231,7


15,6; 231,7


15,6; 19,1; 148,5; 231,7


15,6; 19,1; 29,7; 121,1; 148,5; 231,7

RESPONDER

Luciano Amorim está aguardando sua ajuda, Clique aqui para responder.