Dades enllaçades

De la Viquipèdia, l'enciclopèdia lliure.
Saltar a la navegació Saltar a la cerca

Les dades enllaçades i les dades enllaçades, en informàtica , són un mitjà de publicació de dades estructurades que us permeten enllaçar dades entre elles. La publicació de dades enllaçades es basa en tecnologies i estàndards web oberts com HTTP , RDF ( Resource Description Framework ) i URI . L’objectiu d’aquesta estructuració de dades és permetre als equips llegir i interpretar directament la informació del web. La presència d’enllaços també permet extreure dades de diverses fonts mitjançant consultes semàntiques. [1]

Quan les dades enllaçades enllacen dades obertes o data oberta, parlem de dades obertes enllaçades (LOD) [2]

Criteris

Tim Berners-Lee va presentar dades vinculades a la conferència TED del 2009 [3] definint les bones pràctiques de disseny següents [4] :

  1. Utilitzeu URI per identificar objectes.
  2. Utilitzeu URI HTTP perquè la gent i els usuaris puguin fer referència i cercar aquests objectes.
  3. Proporcioneu informació útil sobre l'objecte quan es desferencia el seu URI , mitjançant formats estàndard com RDF .
  4. Incloeu enllaços a altres URI relacionats amb les dades exposades per millorar la cerca d’altres dades relacionades al web .

Components

Web semàntica

Les dades enllaçades són essencials per a la construcció de la web semàntica , també coneguda com a web de dades [5] , una extensió de la web actual en què les dades són descrites semànticament per metadades per fer possible la consulta i el processament automàtic d’informació de diferents fonts. .

A la web semàntica, una ontologia (informàtica) és la descripció formal que permet representar el coneixement d’un domini de coneixement. Es pot veure com una estructura de dades composta per un conjunt d’elements com ara vocabulari i interconnexions entre objectes [6] . Les ontologies permeten interpretar correctament la informació.

Dades obertes enllaçades

Les dades obertes enllaçades (LOD) són dades enllaçades que es publiquen sota una llicència Open i, per tant, es poden reutilitzar. [7]

DBpedia i Wikidata són exemples de projectes Open Linked Data

El 2010 Tim Berners-Lee va definir l'esquema de 5 estrelles de Linked Open Data [8] :

Disponible al web (en qualsevol format) publicat sota una llicència oberta,
★★ Disponible com a dades estructurades i processades automàticament (per exemple, taula d'Excel en lloc de la imatge d'una taula)
★★★ com (2), però amb l'ús de format de dades no propietari (per exemple, CSV o XML)
★★★★ Totes les propietats anteriors: ús de formats W3C estàndard (RDF i SPARQL) per identificar objectes
★★★★★ Totes les propietats anteriors. Afegir enllaços a altres conjunts de dades

Avantatges de les dades obertes enllaçades

Alguns dels avantatges de Linked Open Data són [9] :

  • Ús eficient dels recursos : les dades obertes enllaçades redueixen la redundància permetent la seva reutilització.
  • Qualitat de la informació : Linked Open Data promou l’ús de formats estàndard per a dades i metadades, cosa que fa que les dades siguin més controlades i fiables.
  • Valor afegit : la connexió entre dades proporciona a l'usuari més possibilitats de descobrir i reutilitzar informació.
  • Correcció d'errors : les dades obertes enllaçades us permeten identificar els errors i corregir-los.
  • Transparència : les dades obertes enllaçades són una eina disponible per als ciutadans per accedir a les dades d’institucions públiques i privades.

Vinculació del projecte de dades obertes

enllaços entre arxius de dades obertes enllaçats

L'objectiu del projecte W3C Linking Open Data [10] és ampliar el web publicant diversos conjunts de dades oberts com RDF al web i establint enllaços RDF entre dades de diferents recursos. A l'octubre de 2007 , els conjunts de dades contenien més de dos milions de triples RDF, vinculats per més de dos milions d'enllaços RDF. Des del maig del 2009 han crescut fins a 4,2 milions de triples RDF, connectats per aproximadament 142 milions d’enllaços RDF.

Els diagrames del núvol de LODi proporcionen una visió general dels conjunts de dades enllaçats disponibles al web [11] .

Projectes de la Unió Europea

Hi ha diversos projectes de la UE que inclouen dades enllaçades. Aquests inclouen el projecte Linked Open Data 24/7 (LATC) [12] , el projecte PlanetData [13] , el projecte DaPaaS (Data-and-Platform-as-a-Service) i Linked Open Data 2 (LOD2) [ 14] [15] [16] . L’enllaç de dades és un dels objectius principals del Portal de dades obertes de la UE, que proporciona milers de conjunts de dades que tothom pot reutilitzar i enllaçar.

Ontologies

Les ontologies són descripcions formals d’estructures de dades. Algunes de les ontologies més conegudes són:

  • FOAF : una ontologia que descriu les persones, les seves propietats i relacions
  • UMBEL: una estructura de referència lleugera de 20.000 classes de conceptes temàtics i les seves relacions derivades d'OpenCyc, que poden actuar com a classes vinculants a dades externes; també té connexions amb 1,5 milions d'entitats nominades per DBpedia i YAGO

Conjunt de dades

  • DBpedia : un conjunt de dades que conté dades extretes de Viquipèdia ; conté aproximadament 3,4 milions de conceptes descrits per 1.000 milions de triples, inclosos resums en 11 idiomes diferents
  • GeoNames : proporciona descripcions RDF de més de 7.500.000 elements geogràfics a tot el món.
  • Wikidata : conjunt de dades enllaçat creat en col·laboració que serveix com a dipòsit central per a dades estructurades dels seus projectes germans de la Fundació Wikimedia
  • Global Research Identifier Database ( GRID ): una base de dades internacional de 89.506 institucions dedicades a la investigació acadèmica, amb 14.401 relacions, modelitza dos tipus de relacions: una relació pare-fill que defineix una associació subordinada i una relació relacionada que descriu altres associacions [17] [18]

Instància del conjunt de dades i relacions entre classes

Hi ha disponibles diagrames en què es pot fer clic mostrant conjunts de dades individuals i les seves relacions dins del núvol LOD generat per DBpedia [19] [20] .

Galeria d'imatges

Nota

  1. Christian Bizer, Tom Heath i Tim Berners-Lee , Linked Data - The Story So Far ( PDF ), a International Journal on Semantic Web and Information Systems , vol. 5, núm. 3, 2009, pàgs. 1-22, DOI : 10.4018 / jswis.2009081901 , ISSN 15526283 ( WC ACNP ) . Consultat el 18 de desembre de 2010 .
  2. ^ ( EN ) Què són les dades enllaçades i les dades obertes enllaçades? , a Ontotext . Consultat el 23 de juny de 2020 .
  3. ^ Presentació de Tim Berners-Lee a la conferència TED
  4. Problemes de disseny Tim Berners-Lee
  5. ^ ( EN ) Què són les dades enllaçades i les dades obertes enllaçades? , a Ontotext . Consultat el 23 de juny de 2020 .
  6. ^ Thomas R. Gruber, Cap a principis per al disseny d'ontologies utilitzades per a l'intercanvi de coneixement? , a International Journal of Human-Computer Studies , vol. 43, núm. 5-6, 1995-11, pàgs. 907–928, DOI : 10.1006 / ijhc.1995.1081 . Consultat el 23 de juny de 2020 .
  7. ^ (EN) Què és Linked Open Data? , al Portal Terrestre . Consultat el 23 de juny de 2020 .
  8. ^ (EN) Open Data de 5 estrelles a 5stardata.info. Consultat el 23 de juny de 2020 .
  9. ^ (EN) Què és Linked Open Data? , a Land Portal , 21 de març de 2018. Obtingut el 23 de juny de 2020 .
  10. ^ Enllaçant dades obertes
  11. ^ LinkedData - W3C Wiki , a www.w3.org . Consultat el 27 de juny de 2020 .
  12. ^ Dades obertes enllaçades tot el dia (LATC) , a latc-project.eu . Consultat el 22 de març de 2018 (arxivat de l' original el 19 de setembre de 2018) .
  13. ^ Benvingut a PlanetData. - PlanetData , a planet-data.eu . Consultat el 22 de març de 2018 .
  14. ^ DaPaaS , a project.dapaas.eu . Consultat el 22 de març de 2018 .
  15. ^ Enllaçant Open Data 2 (LOD2)
  16. ^ Full informatiu del projecte LOD2 - Resum del projecte ( PDF ), a static.lod2.eu , 1 de setembre de 2010. Obtingut el 18 de desembre de 2010 (arxivat de l' original el 20 de juliol de 2011) .
  17. ^ (EN) GRID Statistics , a grid.ac/stats. Consultat el 26 d'octubre de 2018 .
  18. ^ (EN) Polítiques GRID a grid.ac. Consultat el 26 d'octubre de 2018 .
  19. ^ Relacions d'instància entre conjunts de dades , a fu-berlin.de . Consultat el 22 de març de 2018 .
  20. ^ Relacions de classe entre conjunts de dades , a umbel.org . Arxivat de l' original el 28 d'agost de 2011. Obtingut el 22 de març de 2018 .

Articles relacionats

Altres projectes

Enllaços externs

Control de l'autoritat LCCN ( EN ) sh2013002090