Model ER

De la Viquipèdia, l'enciclopèdia lliure.
Saltar a la navegació Saltar a la cerca
Un exemple de diagrama ER

En informàtica , en el context del disseny de bases de dades , el model entitat-relació [1] (o model d’ associació entitat ; model ER més comú) és un model teòric per a la representació conceptual i gràfica de dades a un alt nivell d’ abstracció , formalitzat pel prof. Peter Chen el 1976 [2] .

El model entitat-relació s’utilitza sovint en la primera fase del disseny d’una base de dades, en la qual és necessari traduir la informació resultant de l’ anàlisi d’un domini determinat en un esquema conceptual, anomenat diagrama entitat-relació (o ER) diagrama ). [3]


En el camp del disseny d' enginyeria de bases de dades , hi ha tres nivells de disseny independents i consecutius: disseny conceptual, disseny lògic i disseny físic. Correctament, el model ER és la tècnica principal per a la fase de disseny conceptual, el model relacional per a la fase de disseny lògic. Només en l'última fase del disseny físic, es tenen en compte les aplicacions de programari i maquinari , propietàries o no, existents al mercat.

Generalitat

El model ER es basa en un conjunt de conceptes molt propers a la realitat d’interès : per tant, fàcilment comprensible pels dissenyadors (i generalment considerats prou entenedors i significatius fins i tot per als no tècnics), però no implementables en ordinadors . De fet, encara que orientat al disseny de bases de dades, el model és independent dels criteris específics d’organització física de dades persistents en sistemes informàtics . Hi ha tècniques per traduir conceptes d’alt nivell (millor entesos pels humans) en conceptes de nivell inferior típics dels diversos models lògics (per exemple, el model relacional ) implementats en els diversos SGBD existents.

El model ER ha representat durant molt de temps (i potser encara avui) un dels enfocaments més sòlids per modelar dominis d'aplicacions en el camp de les TI; per aquest motiu, també s'ha utilitzat sovint fora del context del disseny de bases de dades i s'ha utilitzat com a model de referència per a moltes altres notacions de modelatge. Entre altres coses, la notació OMT es va inspirar en el model ER i posteriorment es va fusionar en UML .

Mitjançant una superclau d’identificació (camps: ID codi_ pare, ID_ident de fill), l’esquema Entity-Association representa un gràfic d’arbre en qualsevol nombre de nivells (en particular també un BOM ), molt comú al món de la informàtica. El gràfic Sunburst permet una representació gràfica fàcil i àmplia de dades jeràrquiques.

Les principals construccions del model

Anàlisi dels principals constructes del model ER: entitats, associacions i atributs.

Entitat

Representen classes d’objectes (fets, coses, persones, ...) que tenen propietats comunes i existència autònoma als efectes d’aplicar l’interès. Una ocurrència d'una entitat és un objecte o instància de la classe que representa l'entitat. No parlem aquí del valor que identifica l'objecte, sinó del propi objecte. Una conseqüència interessant d’aquest fet és que una ocurrència d’entitat té una existència independent de les propietats associades. En això, el model ER presenta una marcada diferència respecte al model relacional en què no podem representar un objecte sense conèixer algunes de les seves propietats.

En un diagrama, cada entitat té un nom que l’identifica de manera única i es representa gràficament mitjançant un rectangle amb el nom de l’entitat al seu interior.

Associació

Les associacions (també anomenades relacions) representen un vincle entre dues o més entitats. El nombre d’entitats relacionades s’indica pel grau d’associació: un bon esquema d’ER es caracteritza per una prevalença d’associacions amb el segon grau. És possible vincular una entitat amb ella mateixa (mitjançant una associació d'anells), així com enllaçar les mateixes entitats amb associacions múltiples.

Normalment es representa gràficament mitjançant un diamant que conté el nom de l'associació. El substantiu pot ser un verb per proporcionar una direcció de lectura, o pot ser un substantiu per no donar una direcció de lectura. L'orientació acadèmica i professional més recent tendeix a utilitzar el substantiu precisament per evitar donar una direcció a l'associació.

Atributs

Les entitats i associacions es poden descriure mitjançant un conjunt d’atributs. Tots els objectes de la mateixa classe d’entitat (o associació) tenen els mateixos atributs; això és el que volem dir quan parlem d’objectes similars. L'elecció dels atributs reflecteix el nivell de detall amb què volem representar informació sobre entitats i relacions. Es defineix una clau per a cada classe d'entitat o associació. La clau és un conjunt mínim d’atributs que identifica de manera única una instància d’entitat o associació. L'atribut es representa amb una el·lipse dins de la qual s'especifica el nom de l'atribut o fins i tot simplement, en el cas de diagrames complexos, que només indiquen el nom, possiblement per correspondència. En el cas d’una clau principal, el nom de l’atribut està subratllat o encerclat.

Altres construccions de models

Cardinalitat de les associacions

S’especifiquen per a cada entitat que participa en una associació i indiquen quantes vegades, en una associació entre entitats, es pot vincular una ocurrència d’una d’aquestes entitats amb les ocurrències de les altres entitats implicades en l’associació (indica les ocurrències mínima i màxima) .

Atribut cardinal

També és possible definir restriccions de cardinalitat en atributs, amb dos propòsits:

  • indicar opcionalitat;
  • indiqueu atributs de valor múltiple.

Si falta l’especificació de restricció, com és el cas en la majoria dels casos, la cardinalitat de l’atribut és (1,1). Considerem l'exemple següent:

Exemple de cardinalitat


Com que l’especificació de la restricció de Cardinalitat falta al Nom, significa que la cardinalitat és (1,1).

  • (0,1) NumeroPatente, vol dir que un empleat pot tenir un permís de conduir però tampoc no el té, o més aviat un empleat pot tenir com a màxim un permís de conduir.
  • (0, n) NumeroTelefono, significa que un empleat pot tenir molts números de telèfon, però tampoc no pot tenir cap número de telèfon.
  • (1, n) TitleStudio, vol dir que un empleat pot tenir moltes qualificacions, però ha de tenir almenys una.

Identificadors d'entitats

Constitueixen un subconjunt dels atributs d'una entitat que identifica de manera única cada ocurrència de la mateixa entitat. Un exemple el pot constituir l'atribut CodiceFiscale de l'entitat CittadinoItaliano. De fet, se sap que cada ocurrència de l’entitat CittadinoItaliano, és a dir, tots els ciutadans que resideixen al territori de la República Italiana, es pot identificar inequívocament pel seu codi tributari. Això significa que no hi pot haver dos ciutadans italians amb el mateix codi fiscal (tret que hi hagi un cas d’ homocodi ).

Generalitzacions

Representen enllaços lògics existents entre dues o més entitats. Entre les entitats implicades, destaquen les següents:

  • una única entitat matriu;
  • una o més entitats secundàries.

Les entitats secundàries són "casos especials" de l'entitat principal. Cada atribut de l'entitat principal també és un atribut d'entitats secundàries, però les entitats secundàries poden tenir atributs que les diferencien del seu pare i dels seus germans. L'exemple següent mostra que:

  • cada persona està identificada per un codi tributari i es caracteritza per un cognom, un nom i una edat;
  • cada persona es distingeix en home o dona;
  • també es pot avaluar la posició militar.

Les generalitzacions es divideixen en "total" i "parcial". Una generalització és total quan la unió dels subconjunts dels fills constitueix la totalitat del pare. Per exemple, la generalització presentada a la figura és total ja que totes les persones són homes o dones, per tant, combinant els subconjunts d’homes i dones obtenim el conjunt de persones. Una generalització és parcial quan, en canvi, la unió dels subconjunts dels fills no identifica globalment el conjunt del pare. Per exemple, una entitat matriu Mitjans de locomoció amb les entitats infantils Bicycle and Automobile és una generalització parcial, ja que a més de bicicletes i cotxes hi ha altres mitjans de locomoció com ciclomotors, trens, vaixells, etc. Per tant, la unió dels subconjunts de bicicletes i cotxes no és suficient per identificar el conjunt principal de mitjans de locomoció.

Una generalització també pot ser "exclusiva" o "solapada". Una generalització és exclusiva quan la intersecció dels subconjunts dels fills és buida; en lloc d'això, se superposa quan la intersecció dels subconjunts dels fills no està buida. Una entitat matriu Treballadora amb entitats fills Empleat i estudiant identifica una generalització que se solapa perquè hi pot haver empleats que siguin estudiants simultàniament. En conclusió, una generalització pot ser:

  • total exclusiu (t, e);
  • total superposat (t, s);
  • exclusiva parcial (p, e);
  • parcialment superposat (p, s).

Model de dades Entitat - atribut - valor (EAV)

Un model de dades Entity-attribute-value (EAV) s’utilitza avantatjosament en els casos en què les bases de dades consisteixen en:

  • atributs individuals de tipus variable al llarg del temps;
  • centenars de taules o categories de nombre variable al llarg del temps, però que dins d'elles estan formades per algunes desenes de files o instàncies; i un nombre relativament petit de taules, però cada una té milers o milions de files o instàncies.

En el camp de la intel·ligència empresarial , una estructura d’informació d’aquest tipus podria ser un cub OLAP multidimensional, del qual l’usuari sovint ha d’afegir alguna dimensió d’anàlisi, d’un nombre imprevisible i variable al llarg del temps: les taules EAV proporcionen una representació resum quan les dades a analitzar estan molt disperses, per exemple en una base de coneixement biomèdica. El mateix model EAV també es pot utilitzar per importar taules EAV directament al cub OLAP [4] .

Un model d’ER tindria el límit de gestionar totes les taules de la manera habitual, fins i tot des d’un punt de vista visual, independentment de la seva mida i importància. El model de valor Entitat - atribut - és un model de dades que supera aquest límit i permet representar conceptes d'una manera eficient en TI, en situacions en què les entitats individuals es descriuen per una sèrie d'atributs (propietats o paràmetres) relativament molt més petits. que aquells potencialment adequats per a una representació conceptual i lògica eficaç.

Documentació d’esquemes d’ER

Un esquema d’ER gairebé mai no és suficient per representar tots els aspectes d’una aplicació en detall per diversos motius. En primer lloc, en un esquema ER només apareixen els noms dels diversos conceptes presents, però pot ser insuficient per comprendre el seu significat. En el cas d’esquemes particularment complexos, pot passar que els diversos conceptes no siguin capaços de representar-se de manera completa i comprensiva.

Per aquest motiu, és essencial proporcionar a cada esquema ER documentació justificativa que pugui servir per facilitar la interpretació de l'esquema mateix i per descriure propietats a partir de les dades representades que no poden expressar-se directament amb les construccions del model. D’aquí la necessitat de disposar d’eines per completar l’esquema.

Normes empresarials

Una de les eines més utilitzades pels analistes de sistemes d'informació per a la descripció de propietats d'una aplicació que no es pot representar directament amb models conceptuals és la de les regles de negoci . Aquest significat deriva del fet que, en la majoria dels casos, el que volem expressar és només una regla del domini d'aplicació concret que estem considerant.

El terme regla de negoci l’ utilitzen analistes amb un significat més ampli per indicar qualsevol informació que defineixi o restringeixi algun aspecte d’una aplicació. En particular, basant-se en una classificació força consolidada, una regla empresarial pot ser:

  • la descripció d'un concepte rellevant per a l'aplicació o la definició precisa d'una entitat, atribut o associació del model ER;
  • una restricció d'integritat a les dades de l'aplicació, ja sigui la documentació d'una restricció expressada amb alguna construcció del model ER (com la cardinalitat d'una associació) o la descripció d'una restricció que no es pot expressar directament amb les construccions del model;
  • una derivació o un concepte que es pot obtenir mitjançant una inferència o un càlcul aritmètic a partir d'altres conceptes de l'esquema.

Per a les regles del primer tipus, és clarament impossible definir una sintaxi precisa i, en general, es fa servir frases en llenguatge natural. Aquestes regles normalment es representen en forma de glossaris, agrupant les descripcions adequadament.

Les regles que descriuen restriccions d’integritat i derivacions són més adequades per a definicions formals amb sintaxi més o menys complexa. Tanmateix, donat que no hi ha estandarditzacions i que qualsevol formalisme escollit corre el risc de no ser prou expressiu, seguirem recorrent a definicions en llenguatge natural, tenint cura d’estructurar aquestes definicions adequadament. En particular, les regles que descriuen les limitacions d’integritat es poden expressar en forma d’afirmacions o afirmacions que sempre s’han de verificar a la nostra base de dades. Per raons de claredat i per facilitar-ne la construcció, aquestes afirmacions han de ser atòmiques, és a dir, no es poden descompondre en frases que encara constitueixen afirmacions. A més, atès que s’utilitzen per documentar un esquema ER, les afirmacions s’han d’indicar declarativament en una forma que no suggereixi un mètode per satisfer-les. De fet, aquest és un problema constructiu i, per tant, no pertany a la representació conceptual. Per tant, notacions com ara si <condition> i <action> no són adequades per expressar regles de negoci quan documenten un esquema ER. Una estructura predefinida per a enunciar regles de negoci en forma d’afirmacions podria ser la següent:

<concepte> ha de / no pot <expressions sobre conceptes>

on els conceptes citats poden correspondre a conceptes que apareixen a l’esquema ER al qual es fa referència o a conceptes que poden definir-los.

Les regles de negoci que expressen derivacions es poden expressar especificant operacions (aritmètiques o altres) que permetin obtenir el concepte derivat. Per tant, una possible estructura és:

<concept> dóna lloc a <operació sobre conceptes>

Tècniques de documentació

La documentació dels diversos conceptes representats en un diagrama o les regles de negoci descriptives es pot produir mitjançant un diccionari de dades. Es compon de dues taules: la primera descriu les entitats d’esquema amb el nom, una definició informal en llenguatge natural, la llista de tots els atributs (amb qualsevol descripció associada) i els possibles identificadors. L’altra taula descriu les associacions amb el nom, la seva descripció informal, la llista d’atributs (amb qualsevol descripció) i la llista d’entitats implicades juntament amb la seva cardinalitat de participació.

Pel que fa a altres regles, encara podeu utilitzar una taula on apareguin les diferents regles, especificant-ne el tipus cada vegada. És important representar totes les regles que descriuen restriccions no expressades per l'esquema, però de vegades és útil representar també regles que documenten les restriccions ja expressades en l'esquema.

Traducció de l’esquema ER

La traducció de l’esquema ER a un esquema lògic equivalent (basat en un model lògic, com el model relacional ), és a dir, capaç de representar la mateixa informació, és un pas fonamental del disseny lògic , que normalment va precedit de la fase de reestructuració . de l’esquema ER . L’element principal de la traducció del diagrama ER en un diagrama lògic equivalent és el fet que en el model relacional no hi ha associacions (relacions), per tant, les dues entitats que les associacions han de ser traduïdes en informes, mitjançant regles codificades adequades, d’acord amb identificadors determinats en la fase de reestructuració de l’esquema ER, la cardinalitat de les associacions i la presència d’identificadors externs.

Tot i que la fase preparatòria de la reestructuració de l’esquema ER només és parcialment automatitzable , a partir de l’esquema ER reestructurat , diversos programes del mercat poden obtenir automàticament l’esquema relacional corresponent, la base de dades real. Una conseqüència evident d’aquests fets, i òbviament també de la naturalesa dels models implicats, és que l’activitat de derivar automàticament un esquema d’ ER a partir de l’esquema relacional derivat de la implementació física del DB , una funció posada a disposició d’alguns programari, en general no permet obtenir l’esquema ER original .

El nom de cada entitat correspon a la capçalera d'una taula-matriu, amb tantes columnes com atributs de l'entitat. Si l'atribut és una clau principal o una part d'una superclau formada per diversos atributs, no pot assumir el valor NULL (atribut obligatori no opcional) i no pot assumir dues ocurrències del mateix valor (valors únics no repetits).

Si l'associació entre dues o més entitats té un o més atributs, normalment l'associació donarà lloc a una taula que té com a clau identificativa el conjunt de claus primàries de totes les entitats connectades per la relació (amb qualsevol cardinalitat) i com a camps atributs col·locats a la relació en l'esquema ER. Aquest passatge, de caràcter lògic, no s’ha de confondre amb la reificació d’una associació en una entitat, un passatge de caràcter conceptual que es pot dur a terme en l’esquema ER.

En un segon pas, es pot reduir significativament el nombre de taules, tenint en compte la cardinalitat màxima (unitària, n-air) que connecta dues taules.

Nota

  1. ^ El terme és un repartiment del model anglès entitat-relació .
  2. ^ "El model de relació d'entitats: cap a una visió unificada de les dades" per al modelatge de relacions entre entitats.
  3. ^ Esquema menys comú de relació entitat , fins i tot en comparació amb l' esquema ER .
  4. ^ (EN) Peter Thanisch, Tapio Niemi, Marko Niinimaki, Jyrki Nummenmaa, utilitzant el model Entity-Attribute-Value per a la construcció de cubs OLAP a Document de conferència seleccionat a: Perspectives en la Investigació de Negocis Informàtica: 10ª Conferència Internacional, BIR 2011. Proceedings, Riga, Letònia, 6 d octubre de 2011, DOI : 10.1007 / 978-3-642-24511-4_5 , ISSN 1865-1348 ( WC ACNP ) . Consultat el 17 de maig de 2018 .

Bibliografia

  • EF Codd, Un model relacional de dades per a grans bancs de dades compartides , IBM Research Laboratory, San Jose, Califòrnia, Comunicacions de l'ACM - Volum 13 / Número 6 / juny de 1970
  • Atzeni, Ceri, Paraboschi, Torlone, Bases de dades (models i idiomes de consulta) , McGraw Hill, 2003
  • Atzeni, Ceri, Fraternali, Paraboschi, Torlone, Bases de dades (arquitectures i línies d’evolució) , McGraw Hill, 2003
  • Ramez Elmasri, Shamkant B. Navathe, Sistemes de bases de dades , fonaments , Pearson - Addison Wesley, 2003

Altres projectes

Control de l'autoritat LCCN (EN) sh00009200 · GND (DE) 4230505-6 · BNF (FR) cb167494845 (data)
Informàtica Portal de TI : accediu a les entrades de Viquipèdia relacionades amb TI