Os critérios de seleção mais utilizado para uma melhor divisão das árvores de decisão por indução

de regras, é a busca pelos dados de um nó pai diminuindo a impureza dos nós filhos. É possível realizar por ganho de informação, razão de ganho, dessa forma, tuplas de diferentes classes são alocados em subconjuntos distintos. Dessa forma é possível afirmar que:

A razão de ganho é favorecido se for realizado com denominadores de valores grandes. Tal situação favorece a equação.

Em uma razão de ganho caso o denominador seja igual a zero o resultado será sempre igual ao valor do atributo.

Para que o ganho da informação se torne eficiente é necessário a maior quantidade de valores possíveis por atributo.

A impureza é nula quando todos os nós pertencem a classes diferentes, e se torna mínimo se tiver o mesmo número de exemplos em cada classe.

Para definir através do ganho de informação a condição de teste como boa o grau de entropia se compara com o nó pai.

RESPONDER

Gustastrada está aguardando sua ajuda, Clique aqui para responder.