Notas | 05 FEV 2020

A segunda versão do vocabulário do catálogo de dados (DCAT) é uma Recomendação do W3C e a terceira versão já está em desenvolvimento


O Grupo de Trabalho do W3C de Troca de Conjunto de Dados, em inglês Dataset Exchange (DXWG) publicou a segunda versão do vocabulário do Catálogo de Dados, em inglês Data Catalog vocabulary (DCAT) como uma “Recomendação” do W3C. O DCAT fornece às pessoas e às máquinas uma abordagem específica e independente de domínio para criar catálogos que expressam os principais elementos de uma descrição de conjunto de dados de maneira padronizada, adequada para publicação na Web, e permite a interoperabilidade entre domínios, sendo usada por conta própria ou ao lado, como complemento de outros padrões de catálogo de dados. 


Assim, o DCAT facilita a pesquisa e a recuperação efetivas e permite o fácil aprimoramento do processo de consulta por meio da agregação “sem atrito” de descrições de conjuntos de dados e registros de catálogo de várias fontes e domínios diferentes, ou aplicando a mesma consulta em vários catálogos e agregando os resultados. Esses padrões também podem variar, de modo a fornecer às comunidades abordagens personalizadas do catálogo de conjuntos de dados que respeitam as nuances específicas de um determinado tipo de dados.


A versão 2 do DCAT baseia-se no trabalho inicial publicado em 2014, fornecendo, entre outras coisas, classes de descritores que podem ser usados ​​para serviços de dados e um conjunto mais amplo de relacionamentos que caracterizam conjuntos de dados e seus aspectos temporais e espaciais. Remove as restrições inerentes ao uso prescrito de alguns termos de vocabulário para relacionamentos (propriedades) presentes em sua versão original, tornando seu padrão de uso mais flexível.


Apenas alguns anos após seu primeiro lançamento em 2014, o DCAT tornou-se reconhecido como um padrão de interoperabilidade essencial para catálogos de dados em muitos países e organizações. Os fornecedores de mecanismos de pesquisa estão usando para identificar ativos de dados para catalogar, e os editores estão usando para tornar seus materiais mais acessíveis. No futuro, o GT espera que a incorporação de classes para descrever os serviços de dados no modelo torne o DCAT uma ferramenta cada vez mais útil na ciência de dados e forneça um caminho bem trilhado para aqueles que implementarem os Princípios FAIR.


Embora a expectativa seja de que os editores de conjuntos de dados revisem seus catálogos existentes, de acordo com suas atividades gerais de curadoria e atualização para usar os recursos adicionais disponíveis na versão 2, a compatibilidade entre a nova versão e a versão anterior do vocabulário DCAT foi preservada.


O Grupo de Trabalho (GT) também se esforçou em (i) fornecer descrições multilíngues dos diferentes termos e propriedades, facilitando sua aplicação em todo o mundo; e (ii) explicar o alinhamento ao vocabulário Schema.org, que é o conjunto de metadados mais amplamente usado pelos mecanismos de pesquisa para otimizar a indexação do conteúdo da Web, e agora cada vez mais adotado também em catálogos de dados.


O Grupo de Trabalho de Troca de Conjunto de Dados (DXWG) continua ativo e está trabalhando na terceira versão do DCAT. Uma das líderes do grupo, em inglês co-chair, faz parte da equipe do Ceweb.br.


Além disso, o DXWG aprecia ouvir sobre qualquer implementação de catálogos usando o DCAT v2. Também gostariam de saber sobre os erros ou problemas encontrados, para que possam ser inseridos no gerenciamento contínuo da versão 2 e influenciar potencialmente as alterações a serem feitas na versão 3, cujo trabalho está apenas começando. Você pode enviar comentários sobre erros ou dificuldades que enfrenta com o DCAT v2 para o WG por e-mail para public-dxwg-comments@w3.org ou através da página de erratas. Para novos casos de uso e outros problemas, entre em contato conosco por e-mail ou enviando um problema no repositório do GitHub. Esperamos que você ache esse padrão uma adição útil às suas publicações de dados.


*Texto baseado na publicação do Blog do W3C. Tradução feita por Caroline Burle.