DataCite Commons: Descrição de Coleções Padronizadas para teste de Sistemas de Recuperação da Informação

Working Paper - Descrição de Coleções Padronizadas para teste de Sistemas de Recuperação da Informação Objetivo: Identificar e descrever duas coleções padronizadas para teste de Sistemas de Recuperação da Informação que foram utilizadas em publicações que avaliam sistemas de recuperação da informação. Método: Trata-se de pesquisa bibliográfica e documental, com abordagem exploratória e descritiva, de natureza qualitativa. Resultados: Identificaram-se as coleções padronizadas utilizadas no contexto da TREC 2022, em Nam et al. (2022) e em Koufakis et al. (2022). Foram descritas as coleções Washington Post 2020, KILT Wikipedia e MS MARCO, que fazem parte da “TREC CAsT 2022 Track” e MS MARCO em “TREC Deep Learning 2022 Track”. Conclusões: Coleções padronizadas continuam sendo úteis para testes de busca, e seu uso contribui para a evolução do conhecimento sobre sistemas de recuperação da informação.

Palavras-chave: Sistemas de Recuperação da Informação. Coleções Padronizadas. TREC.

Working Paper published 2023 in Zenodo

Text

https://doi.org/10.5281/zenodo.8396201

Descrição de Coleções Padronizadas para teste de Sistemas de Recuperação da Informação

Cite as

Download Reports

Descrição de Coleções Padronizadas para teste de Sistemas de Recuperação da Informação

Cite as

Download Reports

Descrição de Coleções Padronizadas para teste de Sistemas de Recuperação da Informação

Cite as

Download Reports

Share

Descrição de Coleções Padronizadas para teste de Sistemas de Recuperação da Informação

Cite as

Download Reports

Share