O ambiente on-line utiliza diversas técnicas e ferramentas para aprender sobre o comportamento do usuário na web, com o objetivo de fornecer respostas mais próximas das preferências das pessoas que utilizam esse ambiente. Suponha que você é um especialista em IA e sua empresa foi contratada para efetuar assessoria em uma campanha política. A equipe do candidato quer que sua empresa desenvolva um sistema que realize previsões das chances de o candidato vencer a eleição, dentro de determinados cenários. Seu chefe resolveu utilizar técnicas de IA no sistema e, estudando o assunto, verificou que poderia utilizar as técnicas de regressão linear ou de rede neural artificial (RNA) para efetuar as previsões. Assim, solicitou que você apresente as seguintes sugestões: a) Elaborar uma pesquisa e efetuar a análise das duas técnicas. Fazer, no mínimo, 5 questões sobre cada uma delas. b) Quais tipos de dados devem ser utilizados na entrada do sistema? c) Qual será o tipo de saída? d) Qual método deve ser utilizado? Justifique. e) Informar se o sistema demandaria poder de processamento e de memória.
Soluções para a tarefa
Resposta:
a) Após a realização da pesquisa e analisando as duas técnicas, constatou-se que:
Regressão linear
1) Depende do conhecimento prévio do relacionamento entre a entrada e a saída.
2) É simples de implementar e fácil de treinar.
3) Muito útil quando existem grandes quantidades de atributos; outros métodos tendem ao overfitting.
4) Por sua natureza, analisa apenas relações lineares entre a entrada e a saída.
5) Tem um modelo fácil de interpretar.
Rede neural
1) Não dependem de nenhum conhecimento prévio entre a entrada e a saída.
2) Necessitam de muita informação para conseguir modelar o relacionamento entre a entrada e a saída.
3) Conseguem tratar sistemas não lineares.
4) Têm grandes variedade de arquiteturas.
5) Desempenho sensível aos parâmetros da RNA, tais como: número de neurônios, número de camadas, tipo de função de ativação, etc.
b) Os tipos de dados de entrada seriam a série histórica das pesquisas com a participação do nome ou não do candidato. A utilização de pesquisas sem o nome do candidato seria para o sistema aprender sobre o comportamento dos eleitores.
c) A saída teria duas informações: a probabilidade de o candidato vencer e o intervalo de confiança da previsão.
d) Como técnica, devemos utilizar a RNAs. Essa tarefa de previsão tem relacionamentos não lineares porque são baseadas no comportamento de grupos de pessoas e, também, podem acontecer mudanças inesperadas nos dados de entrada devido a situações peculiares que acontecem em uma campanha eleitoral. Assim, a RNA é a melhor solução, pois pode generalizar melhor e, além disso, não há necessidade de interpretar o modelo.
e) Os algoritmos RNA exigem muito esforço computacional e muita memória, mas como serão tarefas off-line não há problema com o tempo de processamento.
Explicação: