Índex KWIC

De la Viquipèdia, l'enciclopèdia lliure.
Saltar a la navegació Saltar a la cerca

Un índex KWIC (acrònim de KeyWord In Context , "paraula clau en context" en anglès) és una llista redundant de frases que s'utilitzen per constituir un índex d'un conjunt de coneixements, és a dir, una llista que facilita l'accés als continguts de la cos esmentat. Aquests índexs s’han utilitzat prou extensament per compilar catàlegs de biblioteques ; alguns índexs de llibres s’acosten als índexs KWIC. El terme índex KWIC es va introduir quan es produeixen aquests índexs amb l' ordinador i, en aquest context, el nostre terme s'oposa a l' índex KWOC , on KWOC significa KeyWord Out of Context .

Considerem un terme útil per a un índex, per exemple. la frase

Llista de polígons, poliedres i politops.

Al seu costat, poden ser útils les variants que s’obtenen sotmetent-lo a permutacions circulars , limitades a aquelles que comencen per paraules que siguin significatives per a aquells que faran servir l’índex. En el cas que es pren com a exemple, les permutacions circulars són interessants

polígons, poliedres i politops. * Llista de
poliedres i politops. * Llista de polígons,
politops. * Llista de polígons, poliedres i

De fet, el terme examinat s’utilitza per designar un document que serveix per descriure una part específica d’un conjunt de coneixements: en aquest cas, el terme és el títol d’una hipotètica pàgina de Viquipèdia que té la tasca de facilitar la visió d’una part. del coneixement sobre la disciplina de les "matemàtiques", un cos que forma part de la nostra enciclopèdia. També passa que les paraules "polígons", "poliedres" i "politops" són clarament significatives per a moltes de les persones que volen conèixer les matemàtiques consultant la Viquipèdia.

D’altra banda, la permutació no és significativa

de polígons, poliedres i politops. * Llista

ja que la paraula "di" té un paper funcional genèric en moltes frases de la llengua italiana i no té cap connotació matemàtica.

Un índex KWIC podria presentar en ordre alfabètic totes les permutacions circulars començant per paraules significatives de les seves frases. Per tant, hi hauria redundàncies: es podria tenir un índex 2-5 vegades més gran que la llista de frases només. Un índex KWIC, però, presenta paraules significatives en evidència i en ordre alfabètic i, per tant, es pot cercar amb més eficàcia.

Tot i que a les biblioteques preelectròniques els índexs KWIC eren feixucs de generar i feixucs, els índexs KWIC es poden construir automàticament o semi-automàticament en bases de coneixement digitals i l’extensió dels índexs té uns costos insignificants. No obstant això, la generació d'índexs KWIC mitjançant procediments planteja diversos problemes, en particular el de l'ambigüitat de les paraules components de les frases i el de l'avaluació del seu nivell de significació a partir de les previsions sobre els possibles usuaris de l'índex. ell mateix.