
GLAUCO DINIZ DUARTE Recomendações para a gestão de dados de pesquisa dirigidas aos pesquisadores (2019)
É consenso que dados de pesquisa adquiriram grande importância em anos recentes. Sua relevância tem aumentado dia a dia, à medida que pesquisadores, bibliotecas, universidades e financiadores têm adotado políticas e procedimentos de descrição, armazenamento e preservação desses dados.
O documento intitulado Recomendaciones para la gestión de datos de investigación dirigidas a investigadores, de autoria de Remedios Melero [1], faz parte dos resultados da Rede Espanhola de Dados Abertos de Pesquisa MareData [2] e fornece um total de 17 recomendações para o gerenciamento de dados de pesquisa, precedido por uma introdução para contextualizar a importância do compartilhamento, para facilitar o acesso e reutilização de dados de pesquisa e sua preservação. Nesta matéria, reproduzimos algumas destas recomendações.
Existem inúmeras razões para compartilhar os dados da pesquisa:
• Promover a inovação e a reutilização de dados que possam potencialmente ter novos usos.
• Facilitar a colaboração entre usuários de dados, criadores de dados e reutilizadores.
• Maximizar a transparência e confiabilidade dos dados.
• Favorecer a reprodutibilidade de testes experimentais.
• Permitir a verificação dos resultados da pesquisa.
• Reduzir os custos evitando a duplicação de dados.
• Aumentar o impacto e a visibilidade da pesquisa.
• Promover os projetos de pesquisa de onde provêm os dados e suas publicações.
• Gerar um reconhecimento direto dos pesquisadores que produzem
dados, como em qualquer outro resultado de pesquisa.
Segundo o modelo sugerido pelo grupo de especialistas da Comissão sobre os dados FAIR, o ecossistema de dados é composto: pelas políticas que regulam e definem os dados, os planos de gestão de dados, os identificadores, os padrões, os repositórios de confiança e os serviços em nuvem onde são armazenados os dados. Estes componentes devem se desenvolver a partir de quatro elementos chave: competências, métricas (metrics), o sistema de reconhecimento (recompensas) e investimentos que tornam tudo isso possível (Figura 1) [3].
Nesse ecossistema, os objetos de dados FAIR são compostos por seus arquivos de dados, por um identificador persistente, por uma descrição dos padrões e formatos usados na obtenção, representação, visualização de dados, etc., e os metadados que descrevem os conjuntos de dados que permitem sua interpretação e reutilização (figura 2) [4].
Seja localizável (localizável):
• F1 Atribuir um identificador exclusivo e persistente aos dados e metadados.
• F2 Descrever dados com metadados ricos (isto é, adicionar declarações semânticas, anotações, etc.) aos dados que eles descrevem, o que melhora a qualidade dos metadados).
• F3 Registrar e indexar dados e metadados em um sistema (repositório, serviço, etc.) que possui um mecanismo de pesquisa.
• F4. Incluir um elemento de metadados específico para o identificador persistente dos dados.
Seja acessível (acessível):
• A1. Usar protocolos padronizados para recuperar dados e metadados
pelo seu identificador.
• A1.1 Os protocolos devem ser abertos, gratuitos e universalmente aplicáveis.
• A1.2 Os protocolos também devem permitir um procedimento de autenticação e autorização, se necessário.
• A2. Garantir a disponibilidade de acessibilidade aos metadados, mesmo que os dados não estejam mais disponíveis.
Seja interoperável (interoperável):
• I1 Usar linguagens formais (acessíveis, compartilhadas e padronizadas) para representam dados e metadados.
• I2 Descrever dados e metadados com vocabulários (esquemas, ontologias,
etc.) que também seguem os princípios do FAIR.
• I3 Incluir referências cruzadas e links entre dados e metadados.
Seja reutilizável (reutilizável):
• R1 Assegurar-se de que os dados e metadados utilizados tenham uma variedade de elementos ou atributos precisos e relevantes.
• R1.1. Publicar dados e metadados com uma licença de reutilização clara e acessível.
• R1.2. Usar critérios de proveniência (criação, atribuição e histórico de versão) para associar metadados aos dados durante seu ciclo de vida.
• R1.3. Garantir que os dados e os padrões de metadados utilizados estejam de acordo com os padrões comuns da área de conhecimento a que os dados se referem.






