Descrições de imagens visam expressar, em palavras, o conteúdo visual e são essenciais para pessoas que não têm visão. Tais sentenças descritivas são geradas manualmente ou por modelos de Inteligência Artificial (IA). Apesar da sua relevância, a emergência de geradores de descrições automáticas não foi motivada por pessoas com deficiência visual. Portanto, elas ainda causam insatisfação em sua audiência. Neste estudo, nós investigamos problemas em descrições de imagens na literatura por meio da técnica de Snowballing, onde encontramos treze problemas, incluindo aqueles relacionados à Ética, tais como a aparência física, gênero e identidade, raça e deficiência. Nós identificamos cinco razões do porquê pessoas videntes não escrevem descrições para os conteúdos visuais, demonstrando a necessidade de campanhas de acessibilidade para conscientizá-las da importância social das descrições de imagens. Além disso, nós realizamos um conjunto de entrevistas com oito participantes com baixa visão. Nós exploramos as características das sentenças descritivas de 25 imagens de ambientes internos e coletamos as expectativas de descrições de imagens dos participantes. Portanto, através dos resultados do Snowballing e das entrevistas, nós propomos um conjunto de Boas Práticas para auxiliar as ferramentas automáticas e as pessoas videntes na escrita de descrições de imagens de mais satisfatórias e de qualidade. Nós esperamos que os nossos resultados ressaltem a relevância social de sentenças descritivas e encorajam a comunidade a prosseguir com pesquisas interdisciplinares que possam potencialmente minimizar os problemas encontrados no nosso estudo.