Pesquisa alerta para a necessidade de atenção na descrição dos dados de pesquisa
Pesquisa alerta para a necessidade de atenção na descrição dos dados de pesquisa
Pesquisadora da Universidade Federal de São Carlos explora recomendações para a representação e organização dos dados no contexto do desenvolvimento das tecnologias semânticas
Os dados gerados a partir de pesquisas são cada vez mais valorizados. Sua publicação permite, entre outras coisas, a documentação dos resultados obtidos com os trabalhos científicos, além de auxiliarem na produção de novos conhecimentos de forma sustentável. Devido ao constante aumento no número de informações geradas, cresce a necessidade dos usuários de identificar fontes de informação.
Segundo Mark John Costello, a publicação dos dados utilizados no decorrer de uma pesquisa tem se tornado cada vez mais requisitada, uma vez que se trata de importantes insumos cuja consulta pode auxiliar na assimilação e averiguação da pesquisa, além de servirem de base para o desenvolvimento de novos estudos.
Considerando a variedade de conjuntos de dados de pesquisa publicados na Web, o consórcio W3C lançou a recomendação: Date Catalog Vocabulary (DCAT), que funciona como um vocabulário voltado à descrição de catálogos e seus conjuntos de dados, buscando favorecer a interoperabilidade na Web, que é a capacidade de um sistema de se comunicar de forma transparente com outro, trabalhando com padrões abertos.
Nesse contexto, pesquisadora Kazumi Tomoyose investigou as características, fundamentos e os vocabulários adotados pelo Date Catalog Vocabulary (DCAT), para a publicação de dados de pesquisa, e alerta para dificuldades de encontrabilidade, acessibilidade, interoperabilidade e reutilização de plataformas que não o adotam.
Na pesquisa, Kazumi Tomoyose busca compreender como os vocabulários estão envolvidos na recuperação dos dados de pesquisa, assim como os benefícios de seu uso e ressalta que os vocabulários são como conjuntos de termos que padronizam a descrição de recursos, pensando na organização e recuperação da informação.
Os vocabulários voltados à padronização dos elementos de metadados e os que buscam uniformizar os valores, permitem que os dados sejam uniformizados, garantindo consistência em sua organização e recuperação, bem como nas relações Linked Data.
Kazumi Tomoyose identificou que existem poucas discussões sobre o DCAT, em especial no âmbito da Ciência da Informação, e sugeriu de uma melhor exploração das informações, no contexto dos dados de pesquisa, maiores discussões que alinhem o conhecimento da área às ferramentas e aos conceitos semânticos aplicados à Web. “Há uma necessidade em organizar esses dados de pesquisa para a otimizar a recuperação deles, sendo que poderiam ser utilizados, para tal finalidade, os vocabulários“, pontuou.
“DCAT como vocabulário para a publicação de dados de pesquisa diminui problemas como ambiguidade e auxilia no processo de descoberta de dados e serviços, uma vez que busca a padronização dos termos de descrição dos catálogos, conjuntos de dados e dos relacionamentos que podem ser estabelecidos. Desse modo, alinhado também aos princípios Linked Data, o uso do DCAT permite que sejam efetivados os benefícios do compartilhamento dos dados de pesquisa”, apontou Kazumi.
As discussões quanto ao uso do DCAT são escassas, quando comparado a outros vocabulários, principalmente em âmbito nacional, possivelmente pela sua recente data de publicação. A pesquisadora notou que nem todas as plataformas adotavam o DCAT como vocabulário, isso dificultou a disponibilização de registros para download ou busca.
O artigo “Abertura e gestão de dados: desafios para a ciência brasileira”, usado como fonte na pesquisa, traz um olhar de que a capacidade de vinculação e interseção de conjuntos de dados de fontes diferentes aumenta a precisão, o poder de previsão e a generabilidade das descobertas científicas e ajuda os pesquisadores a identificar futuras direções de investigação.
“A busca por novos procedimentos e ferramentas computacionais para obtenção, armazenamento, organização e análise desses dados, pode trazer aperfeiçoamentos na forma de produzir e de dar maior transparência a todo o processo de criação do conhecimento científico”.
Nesse sentido, o profissional da informação também deve se ocupar em atualizar seus conhecimentos para estar apto a lidar com o tratamento dos dados de pesquisa, com os pesquisadores que desejam disponibilizar e compartilhar os seus dados e com os usuários em suas demandas de busca e acesso deles, impactando positivamente a sociedade.
Acesse a dissertação em:
TOMOYOSE, Kazumi. O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data. 2021. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/14116 . Acesso em: 31 maio 2023.
Redação: Marcos Miranda
Revisão: Herta Maria de Açucena do Nascimento Soeiro
Diagramação: Herta Maria de Açucena do Nascimento Soeiro