Working Paper - Descrição de Coleções Padronizadas para teste de Sistemas de Recuperação da Informação Objetivo: Identificar e descrever duas coleções padronizadas para teste de Sistemas de Recuperação da Informação que foram utilizadas em publicações que avaliam sistemas de recuperação da informação. Método: Trata-se de pesquisa bibliográfica e documental, com abordagem exploratória e descritiva, de natureza qualitativa. Resultados: Identificaram-se as coleções padronizadas utilizadas no contexto da TREC 2022, em Nam et al. (2022) e em Koufakis et al. (2022). Foram descritas as coleções Washington Post 2020, KILT Wikipedia e MS MARCO, que fazem parte da “TREC CAsT 2022 Track” e MS MARCO em “TREC Deep Learning 2022 Track”. Conclusões: Coleções padronizadas continuam sendo úteis para testes de busca, e seu uso contribui para a evolução do conhecimento sobre sistemas de recuperação da informação.
Palavras-chave: Sistemas de Recuperação da Informação. Coleções Padronizadas. TREC.
Palavras-chave: Sistemas de Recuperação da Informação. Coleções Padronizadas. TREC.