“…sendo n o número de passos de tempo do rato virtual no campo aberto (iterações); a t a ação tomada pelo robô no instante de tempo t; s t a leitura dos sensores (s t1 ,...,s t6 ); m t o vetor onde são armazenadas as búltimas leituras dos sensores; b o tamanho do vetor de memória; r(a t , s t , m t ) a recompensa, queé igual a 1 se a açãoé andar para frente e z < h(s t , m t ), e 0 caso contrário; z um número aleatório com distribuição uniforme no intervalo [0,1]; h(s t , m t ) a variável que assume valor 1 se a leitura atual dos sensores não se igualaà nenhuma das leituras armazenadas em m t e h(s t , m t ) = 1 − γ/g(s t , m t ), caso contrário; γ uma constante escolhida no intervalo [0,1]; g(s t , m t ) a posição no vetor onde s t se iguala a m t [i], para alguma posição i; p(s t ) a punição.É igual a -1 se l < k(s t ), e 0, caso contrário, sendo l um número aleatório com distribuição uniforme no intervalo [0,1]; k(s t ) a variável que pode assumir valores entre α e α/7, de acordo com a equação: k(s t ) = α/(q + 1), onde qé o número de sensores ativados na leitura s t ; α uma constante escolhida no intervalo [0,1]; β o parâmetro que controla a importância relativa de cada um dos dois termos conflitantes da função de fitness. A função de fitness foi adaptada de [Costa 2015], onde o rato virtual foi desenvolvido para o LCE.…”