
Qual repositório de dados escolher para compartilhar seus dados de pesquisa?, por Lucas George Wendt

Qual repositório de dados escolher para compartilhar seus dados de pesquisa?
Lucas George Wendt
lucas.george.wendt@gmail.com
A disponibilização de dados de pesquisa em repositórios digitais tornou-se prática crescente na ciência contemporânea, alinhada aos princípios da Ciência Aberta, aspecto progressivamente considerado em diferentes etapas da prática científica.
Nesse cenário, plataformas como Zenodo, Figshare, Mendeley Data e Harvard Dataverse estão entre as soluções mais empregadas para atender esta demanda, ao oferecerem infraestrutura, visibilidade e mecanismos de preservação digital para dados de pesquisa e documentos oriundos de diferentes áreas do conhecimento.

Cada repositório possui características próprias em termos de gratuidade, armazenamento, usabilidade e interoperabilidade, que precisam ser considerados pelos pesquisadores. Nesta direção, este panorama (não exaustivo) busca comparar essas soluções, destacando vantagens, limitações e potencialidades que orientam o compartilhamento e a reutilização de dados científicos nestas plataformas.
Espera-se que essa esquematização, baseada num levantamento de 27 elementos característicos das plataformas, forneça subsídios para que os pesquisadores dos mais diversos domínios científicos escolham o repositório mais adequado para suas necessidades, equilibrando aspectos gratuidade, capacidade, interoperabilidade, facilidade de uso e conformidade científica.
Provedor/mantenedor
Cada repositório é mantido por uma instituição distinta: o Zenodo é administrado pelo CERN (sigla que é um acrônimo em inglês para Organização Europeia para a Investigação Nuclear) em parceria com o OpenAIRE (acrônimo em inglês para Infraestrutura de Acesso Aberto para Pesquisa na Europa), enquanto o Figshare pertence à Digital Science, inicialmente foi idealizado como um projeto pessoal do empreendedor Mark Hahnel durante seu doutorado. O Mendeley Data é gerenciado pela Elsevier, e o Harvard Dataverse é coordenado pelo Institute for Quantitative Social Science da Universidade de Harvard. O Zenodo foi lançado em 2013 e o Figshare, em 2011. O Mendeley Data foi lançado em 2015, integrado ao ecossistema do Mendeley. O Harvard Dataverse foi criado em 2006.
Tipo de repositório
Os quatro repositórios são multidisciplinares, mas apresentam ênfases distintas. Zenodo é voltado à ciência aberta, Figshare se posiciona como acadêmico e institucional, Mendeley Data foca em dados de pesquisa, e o Dataverse tem histórico em dados das ciências sociais e exatas. A abertura temática permite a pesquisadores de várias áreas depositarem seus dados, ampliando o alcance e impacto científico de acordo com a orientação e as características da pesquisa.
Gratuito?
A gratuidade varia entre as plataformas. O Zenodo é inteiramente gratuito. O Figshare oferece planos gratuitos com limitações e versões pagas institucionais. O Mendeley Data dispõe de um plano básico gratuito com armazenamento limitado. O Harvard Dataverse, por sua vez, é gratuito para usuários.
Armazenamento gratuito
O armazenamento permitido sem custo também diferencia os repositórios: Zenodo oferece 50 GB por depósito, Figshare fornece 20 GB por usuário no plano gratuito, Mendeley Data permite 2 GB por dataset, enquanto no Harvard Dataverse, o volume depende da instância, sendo que Harvard, por exemplo, disponibiliza 1 TB por projeto, expansível sob demanda.
Suporte a DOI (Digital Object Identifier)
Todos os repositórios suportam a atribuição de DOIs para dataset, garantindo rastreabilidade, citação padronizada e reconhecimento formal dos dados publicados, fundamental para integridade e visibilidade acadêmica.

Licenciamento personalizado
A escolha da licença é flexível em todas as plataformas. Os usuários podem optar por licenças Creative Commons, colocar o material em domínio público ou adotar licenças customizadas conforme a necessidade.
Versionamento de dados
Zenodo, Figshare, Mendeley Data e Dataverse permitem versionamento dos datasets. Isso assegura que alterações, correções e evoluções nos dados sejam registradas sem perda de informações anteriores, promovendo transparência.
Suporte a dados privados
Todos os repositórios dão suporte ao armazenamento privado, permitindo embargos temporários antes da abertura pública, o que é útil para proteger informações sensíveis, dar tempo para publicação de artigos derivados dos dados ou cumprir exigências institucionais.
Embargo temporário
É possível embargar dados temporariamente nos quatro repositórios, deixando-os privados por período determinado e podendo torná-los públicos posteriormente, uma funcionalidade interessante para planejamento de divulgação e proteção durante revisões.
Repositório de código
O suporte à hospedagem de código varia: Zenodo integra com o GitHub, permitindo arquivamento de projetos de software. Figshare pode armazenar código, porém não é o foco, assim como Mendeley Data e Harvard Dataverse, que aceitam código como parte de datasets, mas não são direcionados para tal finalidade.
Revisão por pares
Nenhum dos quatro repositórios realiza revisão por pares nativa. Entretanto, datasets podem ser vinculados a periódicos ou iniciativas de revisão externas.
Interoperabilidade e protocolos
Todos têm integração com padrões como OAI-PMH (acrônimo em inglês para Protocolo da Iniciativa de Arquivos Abertos para Coleta de Metadados) e API REST, além de suporte ao ORCID, ou seja, há viabilidade de integração com outras plataformas, sistemas institucionais e ferramentas de descoberta, facilitando a disseminação e reuso dos dados.
Identificação de pesquisador
Integração com ORCID está presente em todos os repositórios, o que garante aos responsáveis pelo depósito de dados a atribuição de autoria e agregação de produção acadêmica.

Citação automática
Todos geram citações automáticas em formatos como BibTeX e APA, simplificando a inclusão dos dados em bibliografias e assegurando a rastreabilidade dos datasets.
Facilidade de uso (UX/UI)
A experiência do usuário varia: Zenodo é intuitivo, mas menos amigável para iniciantes. Figshare se destaca com interface mais moderna e amigável. Mendeley Data oferece ambiente clean, porém exige login via Elsevier/Mendeley, e o Dataverse possui interface mais técnica, pouco amigável para usuários não familiarizados.
Compartilhamento e colaboração
Cada repositório apresenta funcionalidades de compartilhamento variáveis, com opções de links diretos, grupos colaborativos, permissões avançadas e controle de acesso, atendendo diferentes demandas de projetos coletivos e colaborações autorais.
Multimídia e visualização
Figshare lidera no suporte a pré-visualização de imagens, vídeos e áudios. Zenodo oferece pré-visualização para PDFs, imagens e alguns tipos de vídeos. Mendeley Data e Dataverse têm visualização limitada, com foco em tabelas e dados estruturados.
Suporte a metadados
Todos os repositórios fornecem suporte amplo a metadados, adotando padrões como Dublin Core, DataCite e, em alguns casos, esquemas proprietários ou específicos por disciplina.
Instalação local/self-hosted
Apenas o Harvard Dataverse oferece opção de instalação local, pois é um software open source. Os demais não possuem essa possibilidade, embora Figshare ofereça versão institucional paga.
API pública
Os quatro dispõem de APIs públicas RESTful, promovendo automação, integração com sistemas externos e ampliação das funcionalidades por desenvolvedores.
Integração com repositórios institucionais
Zenodo, Figshare e Harvard Dataverse têm integrações via OAI-PMH, API ou já possuem múltiplas instituições parceiras. Mendeley Data tem integração limitada.
Organização em comunidades/grupos
Todos permitem organização de conteúdos em projetos, coleções, comunidades temáticas ou hierarquias de subgrupos, otimizando o gerenciamento e descoberta por grandes equipes ou iniciativas de pesquisa coletiva, como grupos de pesquisa.

Conformidade FAIR
Todos os repositórios são compatíveis com princípios FAIR (Findable, Accessible, Interoperable, Reusable), alguns inclusive reconhecidos por organismos internacionais como a EOSC (European Open Science Cloud).
Política de backup/preservação
Há diferentes estratégias e garantias institucionais para backup e preservação digital dos dados, variando de redundância em servidores (como no CERN, Digital Science e Elsevier) até garantias institucionais específicas em Harvard, proporcionando segurança e longevidade para os dados armazenados.
Registros ORCID e Crossref
Todos realizam vinculação com ORCID e registro de datasets na Crossref, facilitando indexação e contabilização de impacto a partir dos depósitos.
Multilinguismo
Embora a interface principal de todas as bases seja em inglês, os dados podem ser depositados em qualquer idioma em todas as plataformas.
Tempo de upload e indexação
Zenodo e Figshare possuem indexação rápida, enquanto o Mendeley Data é razoável e o Dataverse pode demorar mais, especialmente com grandes volumes ou moderação necessária.
Redação: Lucas George Wendt
Fotografia: Lucas George Wendt
Diagramação: Iasmim Farias Campos Lima
Sobre o autor
Assessor de imprensa na Universidade do Vale do Taquari – Univates. Fundador do Portal de notícias especializadas em ciência e cultura – Notícia dos Vales. Revisor do projeto Jovens Cientistas Brasil: Jornal Científico. Secretário da Rede Brasileira de Jornalistas e Comunicadores de Ciência – RedeComCiência.
Mestre em Ciência da Informação pela Universidade Federal do Rio Grande do Sul. Especialista em Comunicação Institucional pela Faculdade de Desenvolvimento do Rio Grande do Sul. Bacharel em Biblioteconomia pela Universidade de Caxias de Sul – UCS. Bacharel em Jornalismo pela Universidade do Vale do Taquari – Univates.









