Glotocronologia

De la Viquipèdia, l'enciclopèdia lliure.
Saltar a la navegació Saltar a la cerca

La glotocronologia (del grec antic: γλῶττα = llengua i χρóνος = temps , és a dir, la cronologia de les llengües) és la part de la lexicostatística que estudia les relacions entre les llengües i la seva divergència o evolució al llarg del temps. [1]

La idea va ser desenvolupada pel lingüista nord-americà Morris Swadesh (1909-1967) sobre la base de dos supòsits:

 • hi ha un vocabulari bàsic relativament estable (que avui es denomina llista Swadesh ) en totes les llengües del món
 • la substitució de les paraules es produeix de manera similar a la desintegració radioactiva , amb una velocitat constant en el temps tal que aproximadament el 14% del lèxic bàsic d'una llengua se substitueix cada mil anys.

La llista original de Swadesh ha tingut una extensió considerable al llarg del temps, però la seva contribució inicial està tan assentada que la glotocronologia de fet està associada al seu nom. [1] [2]

Glotocronologia de Swadesh

Supòsits bàsics

El mètode glotocronològic es basa en dos postulats explícits formulats pel lingüista nord-americà Morris Swadesh :

 • La taxa de reposició lèxica és aproximadament constant si tenim en compte períodes molt llargs, almenys pel que fa al lèxic bàsic.
 • La taxa de substitució lèxica, almenys pel vocabulari bàsic, és aproximadament uniforme en totes les llengües del món.

La formulació matemàtica d’aquests dos postulats s’expressa mitjançant les equacions següents:

 • Si m ( t ) és el percentatge de paraules base retingudes per un idioma després d'un període t (en unitats de temps), el primer postulat es pot escriure en la forma següent:

On C és una constant homogènia a t (és a dir, a la mateixa unitat que t).

La solució d’aquesta equació diferencial és:

 • El segon postulat implica que C ha de ser una constant universal, vàlida per a totes les llengües humanes. Seguint la idea de Swadesh d’una taxa de canvi del 14% per mil·lenni pel vocabulari bàsic, arribem a la següent estimació per a C :

A partir d’aquesta estimació, es pot estimar el temps de separació T s comparant el percentatge de paraules relacionades retingudes p C :

entre una llengua i la seva llengua materna, e

entre dues llengües que tenen una llengua materna comuna, on p 0 = 0,86 (= 86%) és el percentatge de retenció per mil·lenni estimat per Swadesh.

Posteriorment, Robert Lees va ajustar el valor mitjà, estimant-lo en el 80,5% per mil·lenni.

El mètode es va comparar amb les datacions de carboni 14 utilitzades en arqueologia. Gràcies a això és pràcticament possible calcular la data aproximada en què dues o més llengües relacionades haurien format un nucli comú. Els dos procediments tenen similituds, però amb una diferència notable: la degradació del carboni-14 sempre és constant i no depèn de les condicions externes.

Calibratge

La distribució de la probabilitat en funció del nombre de paraules relacionades de la llista de Swadesh retinguda en un mil·lenni, suposant que totes les paraules de la llista tenen la mateixa taxa de retenció, que és constant en el temps i igual a p = 0,86. El valor esperat per al nombre de paraules relacionades és de 86 (aquest valor exacte s’obté en un 11,4% dels casos), però hi ha una probabilitat diferent de zero d’obtenir un valor lleugerament diferent en el cas real.

Morris Swadesh va estimar que la taxa de reposició a la llista de vocabulari bàsic de 100 termes rondava el 14%, de manera que la taxa de retenció és de p 0 = 0,86 (= 86%). Robert Lees va modificar posteriorment el valor mitjà, calculant-lo en un 80,5% per mil·lenni. Altres lingüistes han estimat els índexs de retenció del 92-95%, eliminant els préstecs i centrant-se únicament en la substitució nativa dins la llengua.

Es pot demostrar que la llista està formada per termes de diferent estabilitat (taxa de substitució individual), de manera que el tipus de canvi no pot ser constant, sinó que disminueix en funció del fet que se substitueixin les paraules més volàtils o inestables; per tant, la proporció de paraules estables retingudes augmenta proporcionalment al nombre de paraules retingudes. Aquest fet ha estat analitzat en diverses modificacions posteriors de la glotocronologia.

Les fluctuacions estadístiques també poden ser importants, ja que el nombre de paraules relacionades retingudes segueix una distribució polinòmica com:

Per a diferents valors de la taxa de retenció, es pot veure que el valor esperat del temps de separació es desvia del valor teòric:

Autor Taxa de retenció
Taxa de canvi
Temps de separació
(teòric)
Temps de separació
(mitjà)
Temps de separació
(valorat)
M. Swadesh 0,86 0,14 1.000
anys
1005
anys
8.51
anys
R. Lees 0,805 0,195 1.000
anys
1006
anys
7.22
anys
0,93 0,07 1.000
anys
1005
anys
12.0
anys

Crítiques

El mètode glotocronològic ha estat objecte de nombroses crítiques. El lingüista Eugen Coșeriu el 1962 va proporcionar algunes dades extretes de les llengües romàniques que demostren que el seu ús podria comportar imprecisions importants. Les principals objeccions que ha trobat són les següents:

 • La constant de retenció no és universal, varia amb el temps, l’entorn, el llenguatge i el significat de la paraula;
 • El model d'arbre genealògic ( Stammbaummodel ) sembla massa confús quan s'aplica al camp lingüístic. La influència entre les llengües sovint continua després de la seva separació, mentre que la teoria glotocronològica considera que una vegada que s'ha produït la separació, ja no hi ha interacció;
 • Les transformacions fonètiques poden evitar la identificació de dues paraules relacionades (per exemple, xef en francès i head en anglès) o conduir a reconciliacions incorrectes (per exemple, entre anglès day i castellà día );
 • Alguns idiomes tenen diversos sinònims per a alguns termes bàsics del vocabulari. Va respondre proposant escollir la paraula més comuna.
 • Un parell de paraules es poden relacionar parcialment, com ara sol en castellà i soleil en francès. En aquests casos s’ha proposat considerar-les com a paraules completament relacionades o assignar-los coeficients.
 • En alguns idiomes, el vocabulari bàsic conté paraules préstecs ; en aquests casos no s'ha de tenir en compte la paraula.
 • En alguns idiomes, alguns elements de l'anomenat vocabulari bàsic estan absents i, per tant, es veu obligat a reduir el nombre de paraules de la llista.

Glotocronologia modificada

La glotocronologia clàssica proposada per Morris Swadesh va ser molt criticada als anys seixanta i setanta, fins al punt que va ser rebutjada per molts lingüistes. Les primeres crítiques es van plantejar ja en aquells anys i es van proposar alguns canvis per resoldre les disputes totalment o parcialment. La reconsideració de les crítiques va donar lloc a una visió intermèdia entre el rebuig complet del valor de la glotocronologia i l'entusiasme amb què es va rebre inicialment. Els partidaris de la glotocronologia modificada argumenten que, amb les modificacions adequades, el recompte de paraules relacionades és útil per estudiar la diversificació de les famílies lingüístiques i estimar el temps de separació.

Van der Merwe, el 1966, va estudiar l’efecte de la inhomogeneïtat en la taxa de substitució, dividint la llista de paraules en diversos grups i assignant a cada grup la seva pròpia taxa de substitució. Aquest canvi té en compte el fet que durant molt de temps la taxa de substitució disminueix i, per tant, les paraules amb la taxa de substitució més alta tendeixen a desaparèixer primer; en conseqüència, al cap d’un temps, les paraules amb taxes de substitució més lentes tendeixen a augmentar en percentatge.

Dyen, James i Cole (1967) van estudiar l’efecte de suposar que cada significat té la seva pròpia taxa de substitució. Si dividiu la llista de vocabulari bàsic en dos grups, amb paraules N 1 i N 2 respectivament, la taxa de substitució efectiva compleix la següent equació:

de manera que la taxa efectiva en funció del temps es pot escriure com:

on és:

, indiqueu el percentatge de paraules dels grups 1 i 2, respectivament.
són les taxes de substitució de paraules de cada grup.

Pot passar això , per a temps de separació curts , suposem el valor mitjà entre la taxa de separació dels dos grups.

Kruskal, Dyen i Black van estudiar l'estimació de la divergència al llarg del temps a més de la taxa de reposició. Sankoff (1973) va suggerir introduir un paràmetre de préstec acceptant la presència de sinònims; també va avaluar la combinació de diverses modificacions. [3]

A partir del treball de Sankoff sobre la divergència genètica de les poblacions en un context biològic determinat, Embleton (1981) va derivar una versió simplificada per aplicar en el context lingüístic. L’autor va demostrar amb algunes simulacions que aquest model produeix bons resultats. Els avenços estadístics en un camp diferent, l’estudi filogenètic de les variacions de l’ADN al llarg del temps, han produït estudis que apliquen aquests resultats al context lingüístic, renovant l’interès per la glotocronologia. Tots aquests mètodes han demostrat una major eficàcia que els anteriors i permeten calibrar els punts de l’arbre filogenètic a partir d’esdeveniments datables, interpolant contínuament les taxes de reposició; d'aquesta manera, no és necessària la suposició original d'una taxa de reposició constant. [4]

Mètode de Starostin

El lingüista rus Sergei Starostin .

Un altre intent d’introduir canvis a la glotocronologia tradicional el va fer el lingüista rus Sergei Starostin , que va proposar els canvis següents:

 • Elimineu les paraules clau dels préstecs , que són un factor disruptiu que altera els resultats; Sarostin se centra en els canvis deguts al " reemplaçament natural " de les paraules en la mateixa llengua. Els errors resultants de no corregir aquest factor són la causa principal per la qual l’estimació de Swadesh va ser de 14 substitucions per mil·lenni a la llista base de cent paraules (és a dir, una taxa de 0,14), mentre que la taxa real és molt més lenta (de l’ordre de 0,05 o 006 per mil·lenni). Si introduïm aquesta correcció, eliminem les crítiques avançades pels lingüistes Knut Bergsland i Voigt, ja que basant-nos en l’anàlisi de les dades del riksmal (la llengua noruega derivada de la llengua danesa ), veiem que la llista bàsica inclou 15- 16 préstecs d'altres idiomes germànics , principalment danès.
 • La taxa de reposició no és realment constant, però varia amb el pas del temps. Això es pot atribuir a almenys dos factors diferents:
  • La possibilitat que un lema X sigui substituït per un lema Y augmenta amb el temps a partir del qual s’utilitza X en una llengua; aquest efecte es pot veure com un " envelliment de paraules ", empíricament correlacionat amb el fet que hi ha una " erosió " gradual del significat primari causada pel pes adquirit pels significats secundaris desenvolupats a partir de l'original ( canvi semàntic ).
  • Preses individualment, les paraules d'una llista de vocabulari tenen taxes de substitució diferents (per exemple, la paraula " I " en tots els idiomes és molt més resistent a la substitució que la paraula " groc "). Com ja s’ha esmentat, les paraules menys estables tendeixen a desaparèixer primer, de manera que, a mesura que passa el temps, el percentatge de paraules considerades més resistents al canvi tendeix a augmentar. La formulació proposada per Starostin per tenir en compte la dependència de l'estabilitat individual de les paraules adopta la forma següent:

que substitueix l'original proposat per Swadesh:

Antiguitat d'algunes famílies lingüístiques

S’han fet càlculs per estimar l’antiguitat d’algunes famílies lingüístiques . Entre les famílies amb antiguitat o profunditat temporal inferior a 5.000 anys (50 segles), hi ha pràcticament totes les famílies consolidades, per a les quals s’ha pogut fer una reconstrucció adequada (RA) dels aspectes del protolengua , a addició a algunes famílies en què la relació entre llengües no és molt controvertida: [5] [6]

Per a algunes superfamílies o macrofamílies (MF) i famílies més controvertides en què la reconstrucció ha trobat dificultats majors (DR), [7] la profunditat temporal és superior a 50 segles:

Metodologia

Llista bàsica de paraules

El mètode original suposava que el vocabulari bàsic d'una llengua té una substitució que es produeix a un ritme constant en totes les llengües i cultures i, per tant, es pot utilitzar com a mesura del pas del temps. El mètode fa ús d’una llista de paraules, compilada originalment per Swadesh, que se suposa que és capaç de resistir les paraules de préstec . La llista desenvolupada per Swadesh el 1952 incloïa una llista de 200 termes, que després va reduir a 100 el 1955. [8] Aquesta última versió és la més utilitzada pels lingüistes moderns.

El vocabulari bàsic es va dissenyar per incloure els conceptes essencials comuns a totes les llengües humanes (com ara pronoms, parts del cos, fenòmens celestes, verbs bàsics, numerals un i dos), eliminant aquells conceptes específics d’una cultura o temps. Aviat va resultar que la situació ideal era de fet impossible i que els conceptes expressats havien d'adaptar-se a les llengües a comparar. Per tant, altres lingüistes van desenvolupar llistes alternatives o van utilitzar un conjunt de significats més estret.

En aquest punt, es mesura el percentatge de paraules relacionades , és a dir, paraules que tenen un origen comú. Se suposa que dues llengües s'han separat, més recentment, més extensa és la llista de paraules relacionades.

Nota

 1. ^ a b Sheila Embleton (1992). LINGÜÍSTICA HISTORRICA: Conceptes matemàtics . A W. Bright (Ed.), International Encyclopedia of Linguistics, pàg. 131-133
 2. Holm, Hans J. (2007). El nou Arboretum d'arbres indoeuropeus; Els nous algoritmes poden revelar la filogènia i fins i tot la prehistòria de l’IE? . Journal of Quantitative Linguistics 14-2: 167-214
 3. Sankoff, Lexicostatistics Fully Parameterized , 1972.
 4. Gray, RD i Atkinson, QD (2003), Language-tree divergence times donen suport a la teoria anatoliana d’origen indoeuropeu , Nature, 426, pp. 435-439.
 5. Søren Wichmann , 2008, annexos .
 6. Swadesh, Morris, (1963). Nou Ensayo de Glotocronología Yutonahua . INAH Anales, 15: 263-302.
 7. ^ Hi ha diferents tipus de "dificultats de reconstrucció": (DR-a) no hi ha una reconstrucció adequada, (DR-b) la llista de termes reconstruïts amb prou feines supera les 100 unitats, (DR-c) les reconstruccions dels diferents autors tenen discrepàncies significatives .
 8. Swadesh, Morris. (1955). Cap a una major precisió en la datació lexicostatística . International Journal of American Linguistics, 21 , 121-137

Bibliografia

 • Arndt, Walter W. (1959). L'actuació de la glotocronologia en germànic . Llengua , 35 , 180–192.
 • Bergsland Knut & Vogt, Hans. (1962). Sobre la validesa de la glotocronologia . Antropologia actual, 3 , 115–153.
 • Brainerd, Barron (1970). Un procés estocàstic relacionat amb el canvi d’idioma . Journal of Applied Probability, 7, 69-78.
 • Callaghan, Catherine A. (1991). Utian i la llista de Swadesh . A JE Redden (Ed.), Comunicacions per a la conferència de llengua índia americana, celebrada a la Universitat de Califòrnia, Santa Cruz, juliol i agost de 1991 (pàg. 218-237). Comunicacions ocasionals sobre lingüística (núm. 16). Carbondale: Departament de Lingüística, Southern Illinois University.
 • Campbell, Lyle. (1998). Lingüística històrica; Una introducció [capítol 6.5]. Edimburg: Edinburgh University Press. ISBN 0-7486-0775-7 .
 • Chretien, Douglas (1962). Els models matemàtics de la glotocronologia . Llengua, 38, 11–37.
 • Crowley, Terry (1997). Una introducció a la lingüística històrica . 3a ed. Auckland: Oxford University Press. pàg. 171–193.
 • Dyen, Isidore (1965). Una classificació lexicostatística de les llengües austronèsies. Revista internacional de lingüística americana, memòria 19.
 • Gray, RD i Atkinson, QD (2003): Els temps de divergència entre llenguatge i arbre donen suport a la teoria anatòlica d’origen indoeuropeu. Natura, 426-435-439.
 • Gudschinsky, Sarah. (1956). Els ABC de lexicostatística (glotocronologia) . Paraula, 12 , 175-210.
 • Haarmann, Harald. (1990). Vocabulari bàsic i contactes lingüístics; la desil·lusió de la glotocronologia . A Indogermanische Forschungen 95: 7ss.
 • Hockett, Charles F. (1958). Wayback Machine , (cap. 6). Nova York: Macmillan.
 • Hoijer, Harry. (1956). Lexicoestadística: una crítica . Llengua, 32 , 49-60.
 • Holm, Hans J. (2003). La trampa de proporcionalitat. O bé, què passa amb el subgrup lexicostatístic . Indogermanische Forschungen, 108 , 38-46 .
 • Holm, Hans J. (2005). Genealogische Verwandtschaft. Cap. 45 a Quantitative Linguistik; ein internationales Handbuch . Herausgegeben von R. Köhler, G. Altmann, R. Piotrowski, Berlín: Walter de Gruyter.
 • Holm, Hans J. (2007). El nou Arboretum d'arbres indoeuropeus; Els nous algoritmes poden revelar la filogènia i fins i tot la prehistòria de l’IE? . Revista de lingüística quantitativa, 14-2: 167-214
 • Hymes, Dell H. (1960). Lexicoestadística fins ara . Antropologia actual, 1 (1), 3-44.
 • McWhorter John. (2001). El poder de Babel . Nova York: Freeman. ISBN 978-0-7167-4473-3 .
 • Ortiga, Daniel. (1999). La diversitat lingüística de les Amèriques es pot conciliar amb una colonització recent . a PNAS, 96 (6): 3325-9.
 • Sankoff, David (1970). Sobre la taxa de substitució de les relacions paraula-significat . Idioma, 46.564-569.
 • Sjoberg, Andree; & Sjoberg, Gideon. (1956). Problemes en glotocronologia . American Anthropologist, 58 (2), 296-308.
 • Starostin, Sergei. Metodologia de comparació a llarg abast . 2002. pdf
 • Thomason, Sarah Gray i Kaufman, Terrence. (1988). Contacte lingüístic, creolització i lingüística genètica . Berkeley: University of California Press.
 • Tischler, Johann, 1973. Glottochronologie und Lexikostatistik [Innsbrucker Beiträge zur Sprachwissenschaft 11]; Innsbruck.
 • Wittmann, Henri (1969). Una investigació lèxic-estadística sobre la diacronia de l’hittita. Indogermanische Forschungen, 74.1–10. [1]
 • Wittmann, Henri (1973). La classificació lexicostatística de les llengües criolles de base francesa. a Lexicostatistics in genetic linguistics: Proceedings of the Yale conference, 3-4 d’abril de 1971, dir. Isidore Dyen, 89–99. La Haye: Mouton.[2]
 • Zipf George Kingsley (1965). La psicobiologia del llenguatge: una introducció a la filologia dinàmica. Cambridge, MA: MITPress.