Un possible foyer originel des langues indo-européennes

et les migrations de leurs locuteurs, sous l'angle de la méthode développée de reconstitution du niveau de séparation (Separation Level Recovery under Two Distributions, SLR2D)

                           >Version anglaise                >Deutsche Version

Par Hans J. J. G. Holm (grand merci à Caroline Barzilaï pour la traduction primordiale)

0. La plupart des gens cultivés ont une vague idée de ce que sont les langues « indo-européennes »: ce sont les nombreuses langues qui sont parlées du nord-ouest de l’Europe au sous-continent indien (et même, historiquement, au Xinjiang, dans le nord-ouest de la Chine) et qui sont liées par leur grammaire et par un fond lexical commun hérité (système numérique ou pronoms, par exemple). Pour les notions de base, on peut se reporter aux grandes encyclopédies - les correspondantes pages Wikipedia sont médiocres. La plus grande prudence s’impose concernant les nombreuses pages Internet ésotériques et farfelues qui sont dénuées de tout fondement linguistique, archéologique ou statistique (voir Holm 2007c); ces pages se reconnaissent souvent à leurs maigres références bibliographiques et à leurs inepties raciales.

1. La principale question qui fait encore débat concerne les liens originels et les développements préhistoriques de ces langues, l’ordre dans lequel les différentes branches se sont séparées du tronc commun. La principale erreur (commise encore aujourd’hui) consiste à croire que deux langues sont d’autant plus proches qu’elles possèdent un grand nombre de caractères communs. Cette vision superficielle néglige le fait que la quantité de caractères communs dépend, entre autres, du degré de conservation des caractères d’origine, autrement dit du nombre de remplacements lexicaux intervenus après la séparation des langues étudiées (voir Holm 2003). Il est évident que des langues ayant subi des pertes importantes (comme l’albanais et l’arménien) présentent moins de concordances, malgré leur étroite parenté, que des langues à grand corpus comme le grec ou l’indien. Malheureusement, cette donnée est trop souvent négligée.

1.1. Un tel problème quantitatif ne peut être résolu que par la considération statistiquement indispensable de la distribution des données, ici hypergéométrique. Avec une telle "transformation SLRD" basée sur la distribution (pour l'anglais Separation Level Recovery accounting for the Distribution), nous estimons l'ensemble original de caractéristiques à assumer dans la période de séparation de chaque paire de langues, en bref "l'ensemble de séparation". On trouvera dans Holm 2000 le niveau de séparation de 91 paires de langues appartenant à 14 branches indo-européennes établies.

1.2. Comme le nombre de caractères linguistiques originels ne peut que diminuer avec le temps, par exemple en raison d'influences historiques, il existe une séquence claire de séparations (à ne pas confondre avec la « glottochronologie »), qui peut être visualisée par ce qu'on appelle un >"arbre généalogique", en utilisant ici l'exemple des mots les plus anciens pour "main" dans les 12 principaux groupes linguistiques indo-européens. Cet ordre de séparation peut et doit être appliqué aux différentes hypothèses concernant le foyer originel (« Urheimat ») et les migrations des locuteurs du proto-indo-européen.

1.3. Les premiers contacts des langues indo-européennes avec les langues ouraliennes, qui ont été identifiés linguistiquement (sous forme de mots empruntés ou même de traits héréditaires), suggèrent un foyer d'origine dans les zones de steppe boisée eurasienne. Bien entendu, l'arbre généalogique présenté ci-dessus doit avoir été réalisé dans la zone géographique donnée, par exemple comme sur cette >carte de migrations. On notera qu’à ce jour, aucune thèse des voies de migration n’a pu être validée.

2. A la question du temps: Si l'on remonte chronologiquement depuis la première apparition attestée des Hittites, il semble clair que l'expansion indo-européenne était à peu près parallèle à la diffusion de la métallurgie, des attelages de boufs et des tumulus (tombes au sommet des collines). Cela ne signifie pas que les Indo-Européens aient inventé ces techniques ou ces coutumes, mais cela indique tout de même qu’ils les ont largement employées. Les Indo-Européens étaient des bergers nomades qui possédaient des chevaux et savaient probablement les monter, ce qui devait leur conférer un avantage tactique déterminant dans les guerres. Au début de l'équitation, on avait probablement des brides sans mors ou seulement non métalliques et donc difficilement vérifiables archéologiquement, de sorte qu'elles dataient plus tôt que l'usure des mors qui ne peut être prouvée qu'avec l'avènement des snaffles métalliques. En l’état actuel des connaissances, les migrations ont pu se dérouler beaucoup plus rapidement, mais aussi un peu plus tôt ou un peu plus tard.

3. Les langues dites anatoliennes, en particulier le hittite, sont un autre sujet de débat :
- étaient-elles membres à part entière du proto-indo-européen
- ou les dernières n’ont-elles achevé leur développement qu’après la séparation du hittite ?

4. Reconstituer des arbres généalogiques à l’aide de paquets de logiciels issus de la biosystématique, qu’on utilise de manière machinale, semble être à la mode. Or ces reconstructions reposent sur au moins l’une des hypothèses erronées suivantes :
4.1. Certains spécialistes du cladisme se contentent de supposer a priori, que Hittite n'a pas partagé le développement final de l'indo-européen, utilisent cette langue en tant que extra-groupe ("outgroup"), et ensuite succomber à un raisonnement circulaire, le hittite est le point de départ naturel de leur graphe originellement sans racines. 4.2. le principe primitif de ressemblance qui néglige totalement les interdépendances réelles évoquées au point [1] et prétend que plus les langues partagent de « cognates », plus elles sont proches (confusion avec la « distance créée par l’évolution », voir le « piège de la proportionnalité » dans Holm 2003),
4.3. que les mots ont été échangés "après l'horloge" , ce qui est évidemment faux, et est une renaissance dépassée des erreurs initiales de la glottochronologie. Il suffit de regarder n’importe quel mot dans un dictionnaire étymologique et de tenter de comprendre son origine pour voir l’absurdité de cette thèse : l’apparition d’un mot n’est jamais liée à un cycle quelconque, mais à un événement historique (culturel, technique ou militaire), par nature imprévisible et incalculable. Ainsi environ 50 % du vocabulaire germanique de l’anglais a été remplacé non pas à un rythme donné, mais du fait de la domination des Normands, qui ont remporté la bataille d’Hastings, et de la longue prédominance du latin en théologie et dans les sciences, comme tout Anglais un peu instruit le sait. Le fait que dans le « vocabulaire de base », ces remplacements lexicaux soient de moins en moins fréquents ne change rien au caractère imprévisible de leur origine socio-historique. D’ailleurs, le « vocabulaire de base » de l’anglais contient encore 6 % d’emprunts aux dialectes vikings – fait négligé par les « experts » (voir Holm 2007c). On ne peut reprocher aux journalistes de ne pas saisir les implications de ces théories. Mais il est regrettable que des chercheurs ignorent ces données de base et reprennent aveuglement des méthodes de comparaison machinales.
--------



 5. Publications: (Veuillez consulter également google scholar, academia.edu et reserachgate.net)
ORCID iD iconorcid.org/0000-0001-9527-0553 - Holm, Hans J.J.G. (2022): Ma "Liste de tests lexicostatistiques universels de Holm" mise à jour est une version modifiée de la dernière édition de M. Swadesh (1971 posthume). Les traductions dites "non marquées" dans 17 langues indo-européennes représentatives, éteintes ou vivantes, ont donné 870 racines de mots différentes. Basé sur environ 160 références. Le projet peut être envoyé sur demande à l'adresse e-mail indiquée ci-dessous. - Développé pour des travaux lexico-statistiques sur les 12 branches principales de l'indo-européen! - Holm, Hans J. (révisé seulement occasionnellement): Les notes cartographiques de Hans J.J.G. Holm sur la (pré) histoire - du golfe de Gascogne à la mer Caspienne - de la dernière période glaciaire au moyen Âge; chacun avec barre climatique courante (basée sur Holm 2011a) et barre de culture courante. Afficher comme >Les cartes historiques de Holm. - Une version actuelle peut être envoyée sur demande. - Holm, Hans J. J. G. (2019): The Earliest Wheel Finds, their Archeology and Indo-European Terminology in Time and Space, and Early Migrations around the Caucasus. Avec 306 références, 6 illustrations - Les Indo-Européens ont-ils inventé la roue? pour la plupart en couleur dans le texte, ainsi que des illustrations réduites de 130 trouvailles représentatives de roues (y compris des trouvailles récentes d'Allemagne et de Chine). Series Minor 43. Budapest: ARCHAEOLINGUA ALAPÍTVÁNY. ISBN 978-963-9911-30-5. Veuillez chercher sur google pour connaître la disponibilité!
[Résumé: Le rôle que la roue de chariot a joué dans la vie des Indo-Européens a jusqu'à présent été étudié principalement du point de vue des spécialistes, souvent sans prise en compte des disciplines voisines concernées. Nous avons recherché les plus anciennes découvertes de roues (avant environ 2000 avant JC) et présentons une sélection représentative de 130 découvertes entre la mer du Nord, l'Asie centrale et l'Inde sous forme tabulaire et géographique. Par la suite, nous avons élaboré les cinq noms de roue des principales familles indo- européennes, notamment en ce qui concerne les aspects onomasiologiques. Afin de pouvoir relier ces deux résultats au développement des langues indo-européennes, nous utilisons cadre glottochronologique actuel en arrière. Cela permet déjà de mieux comprendre l'âge de certains noms et d'établir des parallèles clairs avec certains types de construction. En outre, deux questions fréquemment débattues sont abordées dans ce contexte actualisé. D'une part, concernant la séparation des Anatoliens (indo-européens) et des Tochariens il y a de nombreuses indications que cela a eu lieu dans le Caucase à partir de la principale branche orientale. Enfin, les hypothèses pour l'"invention" de la roue sont remplacées par la proposition beaucoup plus réaliste d'un développement à long terme dans un large réseau de communication.] Correction: Dans la note de bas de page 5, c'est correct "S (usanne) Kuprella".
- Holm, Hans J. (2017): Steppe Homeland of Indo-Europeans Favored by a Bayesian Approach with Revised Data and Processing. Glottometrics 37: 54-81. accès ouvert à http://www.ram-verlag.eu/journals-e-journals/glottometrics/ - Approche Bayésienne, avec des parallèles archéologiques et linguistiques.
[Résumé : Malgré des dizaines d'hypothèses, l'origine et le développement de la famille des langues indo-européennes font encore débat. Une approche glottochronologique publiée dans Science (2012/2013) selon la méthodologie bayésienne prétend avoir fourni des preuves de simultanéité avec l'expansion néolithique, et donc de la prétendue "hypothèse anatolienne". Ces dates ont fait l'objet de nombreuses critiques de la part d'autres disciplines. Ici, la preuve alléguée pour les temps calculés fait maintenant l'objet d'une enquête en reproduisant la méthodologie publiée à l'aide de notre propre ensemble de données, qui a été amélioré. Il en résulta d'abord une origine vers 4800 ANE, bien que la structure des pedigrees ait varié considérablement dans plusieurs centaines d'essais. Ce problème a été contré par les travaux précédents avec des directives topologiques précises. La dichotomie ouest-est d'un travail lexicostatistique basé sur 1400 verbes a été choisie ici, ce qui a abouti à une origine vers 4100 ANE. Au cours de ces tests, une autre approche (Language, 2015) a permis de trouver une date d'origine comprise entre 3950 et 4740 ANE. L'une des conclusions de cette étude était que les résultats antérieurs avaient été considérablement perturbés par des langues mal attestées, qui ont donc été supprimées étape par étape. Le nouvel arbre généalogique reflète de nouvelles découvertes issues de la linguistique, de l'archéologie et de la recherche génétique, qui parlent en faveur de l'hypothèse de la steppe. Surtout, une nouvelle juxtaposition archéologique-linguistique de la terminologie des roues de wagons montre que les différentes désignations indo-européennes des roues de wagons sont en corrélation avec les différents types de construction dans les zones linguistiques correspondantes. Enfin, les cultures se trouvant sur les voies de propagation et les temps possibles sont placées en superposition sur le pedigree calculé, sans toutefois postuler leur caractère indo-européen.]
- Holm, Hans J. (2011b): "Swadesh lists" of Albanian Revisited and Consequences for Its Position in the Indo-European Languages. The Journal of Indo-European Studies 39-1&2. - Version anglaise et mise à jour (voir >Corrigenda) -
[Résumé: Au cours de la dernière décennie, un certain nombre de scientifiques ont affirmé avoir trouvé la subdivision correcte des langues indo-européennes en utilisant de nouvelles méthodes lexicostatistiques. Le public, bien sûr, n'a pas été en mesure de percevoir les résultats douteux, dont les positions différentes et idiosyncratiques de l'Albanais sont particulier remarquable. L'une des raisons en est l'inadéquation des méthodes, simplement copiées de la biosystématique (cf. Holm, H. J. 2007a ci-dessus). Que des données défectueuses contribuent beaucoup à ces erreurs, est maintenant ici démontré en analysant la partie albanaise de trois listes représentatives fréquemment employées dans ces études: Les 13% d'erreurs que l'on y trouve se mélangent inextricablement avec la dispersion stochastique négligée. Dix-sept nouvelles étymologies sont proposées, cependant, 30 % de la liste restent non résolus ou douteux. Ceci et l'influence fortement changeante des emprunts constituent finalement un argument supplémentaire contre l'hypothèse de base glottochronologique de taux de remplacement fixes.]
- Holm, Hans J. (2011a): Archäoklimatologie des Holozäns: Ein durchgreifender Vergleich der "Wuchshomogenität" mit der Sonnenaktivität und anderen Klimaanzeigern ("Proxies"). - Moyenne et tard holocène changements climatiques dans carottes de glace en Groenland Archäologisches Korrespondenzblatt 41-1: 119-132. en regard de limites d’arbre dans les Alpes - Pour voir le pdf, s.v.p. click >Archéoclimatologie de Holm. (Connaissances de base sur les causes possibles des migrations)
[Résumé : Schmidt/Gruhle présentent, avec ce qu'ils appellent "l'homogénéité de croissance" - ici : des sites de chênes d'Europe centrale - un bon indicateur des années chaudes et humides par rapport aux années froides et sèches. Ceci est prouvé, du moins pour la région nord-atlantique, entre autres par la corrélation relativement bonne avec les fluctuations des limites des arbres dans les Alpes ainsi qu'avec les courbes de température pouvant être déduites des carottages de glace au Groenland. En revanche, la prétendue bonne corrélation avec le rayonnement solaire (insolation) s'avère être le résultat de considérations à trop court terme, voire d'une interprétation erronée de l'activité solaire.]
- Holm, Hans J. (2010), Examen de Frank Sirocko (Hg.) "Wetter, Klima, Menschheitsentwickung, Von der Eiszeit bis ins 21. Jahrhundert". Critique, en allemand, voir >Mauvaises relations climatiques préhistoriques., s.v.p.)
- Holm, Hans J. (2009): Albanische Basiswortlisten und die Stellung des Albanischen in den indogermanischen Sprachen. Zeitschrift für Balkanologie Nr. 45-2. Wiesbaden, Harrassowitz: 171-205. - Examen critique de quelques listes lexicales utilisées dans les travaux lexicostatiques - (Note : Aujourd'hui, je remplacerais l'expression trompeuse "liste de mots de base" par "liste de concepts universels")
[Résumé : Après avoir étudié la méthodologie des nouvelles tentatives lexicostatiques de classification des langues indo-européennes dans Holm, Hans J. (2007: The new Arboretum of Indo-European 'trees', in: Journal of Quantitative Linguistics, 14-2), nous testons ici les données rapprochées, en l’occurrence la partie sur l’albanais de trois travaux représentatifs. Nous proposons de nouvelles solutions à de nombreux cas jusqu’alors problématiques, par exemple quelques emprunts au turc des Balkans. En outre, le fort taux de remplacement en albanais est un autre argument fort contre l’hypothèse des taux de remplacement de la glottochronologie.]
- Holm, Hans J. (2008): The Distribution of Data in Word Lists and its Impact on the Subgrouping of Languages. In: Ch. Preisach, H. Burkhardt, L. Schmidt-Thieme, - Solution des problèmes de distribution R. Decker (Editors): Data Analysis, Machine Learning, and Applications. Proceedings - plus base de données verbale = emprunt minimisé of the 31th Annual Conference of the German Classification Society (GfKl), à -> « arbre généalogique » indo-européen amélioré - l'Université de Freiburg, Mars 7-9, 2007. Springer-Verlag, Heidelberg-Berlin: 629-636. Pour voir l'ébauche s.v.p. cliquer >Holm SLRD Freiburg.pdf.
[Résumé : Les linguistes supposent généralement que deux langues sont d’autant plus proches qu’elles possèdent un nombre élevé de caractères communs, et en particulier d’innovations communes. Dans Holm 2003, nous avons démontré que cette thèse est erronée car le nombre de concordances entre deux langues est un phénomène stochastique qui dépend de trois autres paramètres. Seule l’utilisation de l’estimateur de probabilité maximale de la distribution hypergéométrique permet de déterminer le nombre de caractères communs à deux langues au moment de leur séparation. On peut ainsi obtenir un ordre de séparation des langues au sein des familles pour lesquelles on dispose des données requises. L’application aux données du « Indogermanisches Etymologisches Wörterbuch » (Pokorny 1959) a montré une séparation tardive du hittite, de l’albanais et de l’arménien – la chose s’expliquait assez naturellement par la situation géographique centrale de ces langues et ne paraissait donc pas suspecte. Mais l’application aux données de la famille Mixe-Zoque a permis la même observation, à savoir que les langues peu documentées semblaient s’être séparées tardivement. Nous avons alors soupçonné une erreur systématique. Les présents travaux révèlent l’origine de cette erreur, qui apparaît uniquement dans les corpus naturels, par opposition aux cas de tests stochastiques sur des données distribuées normalement utilisés dans Holm 2007a. Pour cette étude, nous avons pu puiser nos données dans le « Lexikon der indogermanischen Verben » (Rix et al. 2001), nettement plus moderne et plus fiable. Nos soupçons se sont effectivement confirmés, et nous montrons comment des listes de données mal distribuées peuvent néanmoins fournir un ordre de séparation correct. On obtient ainsi un nouvel ordre de séparation des principales branches indo-européennes qui concorde avec les réalités grammaticales et la distribution géographique. Il apparaît surtout clairement que les langues anatoliennes n’ont pas pu se séparer les premières, ce qui réfute de manière incontestable la thèse « indo-hittite ».]
- Holm, Hans J. (2007d): Ausgliederungsreihenfolge der Indogermania auf Grundlage des LIV2. Présentation donnée à l'Institut de linguistique indo-européenne comparée de l'Université de Bonn. Groupe cible / public: linguistes allemands Voici le diaporama en format pdf : >Holm délocalisation indo-européenne (Bonn)
- Holm, Hans J. (2007c): The Distribution of Data in Word Lists and its Impact on the Subgrouping of Languages. Présentation pour la 31e conférence annuelle de la Société allemande Groupe cible / public: "linguistes quantitatifs", statisticiens de classification (GfKl), Univ. de Fribourg, 7-9 mars 2007. Voici le diaporama en format pdf : >Holm distribution, mots, listes (Freiburg)
- Holm, Hans J. (2007b): The new Arboretum of Indo-European "Trees". Can new Algorithms Reveal the Phylogeny and even Prehistory of IE? In: Journal of Quantitative Linguistics 14-2, S. 167-214. Le projet peut être consulté ici >Arboretum d'arbres indo-européens. - Actualisation jusqu’en 2006, nouvelles approches lexicostatistiques -
[Résumé : Les spécialisations dans les domaines de la linguistique, d’une part, et de la bioinformatique, d’autre part, conduisent à des méprises et à des résultats faux en raison d’une connaissance insuffisante des conditions des méthodes et des matériaux utilisés. Celles-ci sont analysées, et les résultats sont utilisés pour évaluer la multitude d’arbres généalogiques des langues indo-européennes qui fleurissent actuellement.]
- Holm, Hans J. (2007a): Language Subgrouping. In: Grzybek, P. & R. Köhler (Editors), Exact Methods in the Study of Language and Text. Dedicated to Professor Gabriel Altmann on the occasion of his 75th birthday. [Quantitative Linguistics 62]. Berlin: de-Gruyter: 225-235. - Utilisation de la dispersion stochastique dans les classifications multiples -
[Résumé : Après plusieurs années d’essais et face à la concurrence de nombreuses autres méthodes, nous affinons la méthode de reconstitution du niveau de séparation (Holm 2000, passim) en termes de données et d’exigences stochastiques. Nous cherchons à distinguer dispersion stochastique et mauvaises données et à améliorer l’acquisition des données.]
- Holm, Hans J. (2005): Genealogische Verwandtschaft. In: QUANTITATIVE LINGUISTIK; Ein internationales Handbuch [HSK-Serie, Bd. 27], Berlin: de Gruyter. Kapitel 45. - Les approches lexicostatiques dans la classification des langues au XXe siècle. Actualisation voir ci-dessous 2008 -
[Sommaire : 1. Wann sind Sprachen "verwandt"? 2. Datenbewertung; 3. Beziehungsmaße; 3.1. Synchrone Beziehungsmaße; 3.2. Diachrone Beziehungsmaße; 4. Strukturierung genealogischer Abhängigkeiten.]
- Holm, Hans J. (2003): The proportionality trap, Or: what is wrong with lexicostatistical subgrouping? In: Indogermanische Forschungen 108: 39-47. - Principes fondamentaux en anglais; convient aux non-mathématiciens -
[Résumé : Nous montrons, par le biais d’une expérience, que le chiffre brut des concordances (des cognats, par exemple) entre deux langues apparentées ne peut pas refléter leur degré de parenté généalogique. Nous démontrons ensuite qu’il est possible de reconstituer le niveau originel de points communs à deux langues et leur ordre de séparation en considérant tous les paramètres statistiques déterminants.]
- Holm, Hans J. & Embleton, Sheila (2001): Review of 'Mathematical foundations of Linguistics' (by Hubey, H.Mark, 1999, LINCOM handbooks in Linguistics 10, München: LINCOM); In: Journal of Quantitative Linguistics 8-2:149-62.
- Holm, Hans J. (2000): Genealogy of the Main Indo-European Branches Applying the Separation Base Method. In: Journal of Quantitative Linguistics 7-2:73-95. Quelques graphiques peuvent être trouvés dans>Holm Sep Base Meth images - Application au dictionnaire étymologique indo-européen de Pokorny; actualisation voir ci-dessous 2007,2008. Voir les actualisées 2007a,b -
[Résumé : Dans les analyses quantitatives des relations généalogiques entre des langues effectuées précédemment, la distorsion systématique due aux remplacements lexicaux n’a pas été éliminée correctement, ce qui a conduit à des résultats faux. Seul le dépouillement de l’immense masse de données du « Indogermanisches Etymologisches Wörterbuch » (J.Pokorny 1959, Bern: Francke) par N. Bird dans « Distribution of Indo-European root morphemes » (1982, Wiesbaden: Harrassowitz) a permis, en dépit de quelques défauts connus, d’évaluer le nombre de lexèmes communs à l’époque de la séparation de toute paire de langues à l’aide d’un estimateur robuste. Les résultats permettent de déduire leur ordre de séparation. Ces résultats plus différenciés devraient supplanter les hypothèses manichéennes habituelles qui ne rendent pas compte des développements réels – pour ou contre une parenté italo-celtique, par exemple.]
------------

Nouveaux à partir de 2010-05-27:
free counters