Neste artigo, propomos uma estratégia de Busca pelo Equilíbrio de Nash baseada no não-conhecimento do modelo que garanta ao sistema de malha fechada convergência local com propriedades de estabilidade em jogos quadrático não-cooperativos, do tipo duopólio, com ações arbitrariamente atrasadas. Em nosso cenário não-cooperativo, os jogadores têm acesso apenas aos seus próprios lucros. Para compensar atrasos distintos nas entradas dos dois jogadores, emprega-se a busca extremal por controle de fronteira via realimentação por predição com estimativas baseadas na média. Aplica-se uma análise de pequenos ganhos para a malha formada por equações diferencias ordinárias (EDO) - equações diferencias parciais (EDP), bem como a teoria da média em dimensões infinitas, devido ao estado dimensional infinito dos atrasos temporais, a fim de obter resultados de convergência local a uma pequena vizinhança do Equilíbrio de Nash. Quantifica-se o tamanho desse conjunto residual e os resultados teóricos validados através de um exemplo de simulação.