> Version française> >English Version
1. Worüber hier vor allem noch gestritten wird, sind die ursprünglichen Zusammenhänge und prähistorischen Entwicklungen, die Reihenfolge der Ausgliederung der idg. Sprachzweige. Hauptirrtum in diesen Diskussionen war und ist leider immer wieder die oberflächliche Annahme, dass Sprachen desto näher verwandt seien, je mehr Gemeinsamkeiten sie aufweisen, ohne zu bemerken, dass diese u.a. (!) vom Restbestand der erhaltenen Merkmale abhängen, also dem Ausmaß der Ersetzungen nach der jeweiligen Abtrennung (s. Holm 2003). Es ist leicht einsehbar, dass Sprachen mit starken Verlusten (wie Albanisch und Armenisch) trotz enger Verwandtschaft aufgrund der kleineren Datenbasis natürlich weniger Gemeinsamkeiten aufweisen als sogenannte Großkorpussprachen, wie Griechisch oder Indisch, was leider regelmäßig übersehen oder nicht beachtet wird.
1.1. Mathematisch ausgedrückt, stehen diese Parameter in einem hypergeometrischen Abhängigkeitsverhältnis und müssen zunächst transformiert werden. Erst aus dieser notwendigen SLRD-Transformation ergibt sich dann der quantitative Urzustand (der ursprüngliche Bestand an Merkmalen) im Zeitraum der Trennung jedes Sprachenpaares, die sog. 'Trennungsmenge'. Diese Mengen wurden in Holm 2000 für 91 Paarungen zwischen 14 belegten idg. Sprachzweigen publiziert.
1.2. Da die Menge an Originalmerkmalen im Laufe der geschichtlichen Einflüsse nur abnehmen kann, ergibt sich aus ihnen eine eindeutige Ausgliederungsreihenfolge (NICHT 'Glottochronologie'), die hier in der vereinfachten Form eines >Stammbaumes veranschaulicht wird, mit Einträgen der Wörter für 'Hand' in den verschiedenen Zweigen (jeweils älteste Form). Diese Ausgliederungsreihenfolge kann und sollte dann auf die verschiedenen Vorstellungen der ("Urheimat") angewendet werden, natürlich einschließlich der notwendigen Wanderbewegungen.
1.3. Da die meisten Wissenschaftler einer Urheimat in den Gebieten nördlich des Schwarzen Meeres ('Pontus') zuneigen (z.B. Anthony 2001:13), gibt es hier einen etwas veralteten Versuch einer >Diashow dieser ersten Option. Eine Version mit den verbesserten Ergebnissen aus Holm 2007b,c ist z.Z. nur als diese Einzelkarte >update map verfügbar. Es muss aber bemerkt werden, dass leider weder diese Urheimat-Hypothese, noch irgendeine andere, noch gar die Wanderwege bisher überzeugend bewiesen werden konnten.
Die in grau angedeuteten 'Kulturen' sind: Trichterbecher(kultur), Glockenbecher; russ. jamnaja = Grubengrab-K.
2. Rechnen wir chronologisch von den Daten der Hethiter zurück, scheint klar, dass die idg. Ausbreitung in etwa parallel zur Adaption der Bronze-Metallurgie, vierrädriger Ochsen-Karren, und überhügelter Gräber stattfand. Was nicht bedeutet(!), dass die Indogermanen diese Techniken und Sitten erfunden, aber sie zumindest intensiv angewandt haben. Als Hirtennomaden mit hohem Anteil an Pferden mussten sie auch gute Reiter sein, was natürlich auch einen ausschlaggebenden taktischen Vorteil beinhaltet. Der Versuch, die Zähmung von Pferden an Gebissspuren zu be- oder wiederlegen, übersieht peinlich, dass es Dutzende gebissloser Zäumungen gibt. Die Jahrhundert-Angaben in den letzten Dias sind Arbeitshypothesen. Bessere Ergebnisse werden durch die Unfähigkeit vieler Autoren behindert, die schnellen Fortschritte archäologischer Datierungen (morphologisch gg. 14-C unkalibriert gg. kalibriert gg. Dendrochronologie, usw.) zu bemerken und klar zu unterscheiden, was zu parallelen Darstellungen um Jahrtausende unterschiedlicher Ereignisse führt, ohne dass ein Laie dies unterscheiden könnte. Nach derzeitigem Wissen könnten die Migrationen sowohl in sehr viel kürzerer Zeit, oder auch etwas früher oder später stattgefunden haben.
3. Ein weiterer Diskussionspunkt ist die Frage, ob die sogenannten
Anatolischen Sprachen, insbesondere Hethitisch,
- noch Vollmitglieder eines Ur-Indogermanisch waren;
- oder die letzteren ihre endgültige Ausprägung erst nach Abwanderung des Hethitischen vollendet haben.
Entgegen teilweise geäußerten Anspruchs können Methoden der Bio-Systematik nichts zur Lösung dieser Frage beitragen, aus Gründen, auf die in Absatz 4 eingegangen wird. Häufig mißverstehen Unbedarfte die a-priori-Ansetzung des Hethitischen als "Außengruppe" der angewandten Methoden (mit dem einzigen Zweck, einen rechnerisch nicht vorhandenen Ausgangspunkt zu schaffen), als Beweis ihrer frühen Abspaltung!
4. Die augenblicklich modischen Stammbaum-Rekonstruktionen durch mechanistische Anwendung von Computer-Programmpaketen aus der Biosystematik beruhen auf mindestens einer der folgenden irrigen Annahmen:
4.1. Dem primitiven Ähnlichkeits-Prinzip unter völliger Missachtung der in [1] dargestellten realen Abhängigkeiten ('Proportionalitätsfalle' - vgl. Ref. Holm 2003), dass Sprachen automatisch näher verwandt seien, je mehr "Kognaten" sie teilen (irrig mit 'evolutionärer Distanz' gleichgesetzt), oder sogar
4.2. Dass Wörter "nach der Uhr" ausgetauscht würden, was offensichtlich falsch ist, und eine blinde Wiederbelebung der obsoleten Glottochronologie darstellt: Kontrollieren Sie bitte irgendein Wort in einem etymologischen Wörterbuch und versuchen Sie, seine Geschichte zurückzuverfolgen: Es wird nie ein zeitlicher Automatismus sein, sondern - entsprechende Geschichtskenntnisse vorausgesetzt - eben historisch bedingte (kulturelle, technische, oder militärische) Ereignisse, die niemand vorhersehen oder gar berechnen kann. Z.B. ist im Englischen ca. 50 % des ursprünglich altsächsischen Vokabulars nicht "nach der Uhr" ersetzt worden, sondern, wie jeder geschichtlich etwas Gebildete weiß, durch die normannische Dominanz nach deren Sieg bei Hastings, neben einem langen lateinischen Bildungshintergrund in Kirche und Wissenschaft. Dass im "lexikostatistischen Grundwortschatz" diese Ersetzungen graduell geringer ausfallen, ändert nichts an der Unberechenbarkeit ihrer soziohistorischen Ursachen; doch selbst im englischen "Grundwortschatz" sind z.B. noch 6% - von diesen "Experten" unbemerkt - Entlehnungen aus nordischen Wikingerdialekten. Ausführlicher vgl. Holm 2007c.
Man kann Journalisten nicht vorwerfen, dass Ihnen diese Zusammenhänge zunächst verborgen bleiben. Doch von Wissenschaftlern sollte erwartet werden können, dass sie sich um Hintergründe und Kausalitäten bemühen, statt diese mechanistischen Vergleiche blind zu übernehmen.
--------
5. Quellen:
- Holm, Hans J. (2000): Genealogy of the Main Indo-European Branches Applying the
Separation Base Method. In: Journal of Quantitative Linguistics 7-2:73-95. -Anwendung auf Pokornys Indogermanisches Etymologisches Wörterbuch; Aktualisierungen s.u. 2007a,b -
[Zusammenfassung: In bisherigen quantitativen Analysen der genealogischen
Beziehungen zwischen Sprachen wurde der durch Ersetzungen bedingte systematische
Fehler nicht angemessen eliminiert, was nur zu falschen Ergebnissen führen konnte. Erst
dank der Auszählung der riesigen und damit statistisch erst signifikanten Datenmenge
aus J. Pokorny „Indogermanisches Etymologisches Wörterbuch“ (Bern: Francke, 1959) in
N. Birds „Distribution of Indo-European root morphemes“ (Wiesbaden: Harrassowitz,
1982) war es trotz einiger bekannter Mängel möglich, die Anzahl der Lexeme im
Zeitraum der Trennung jedes Sprachenpaares mit Hilfe eines robusten Schätzers zu
berechnen und damit die Ausgliederungsreihenfolge zu erschließen. Die üblichen
Schwarz- Weiß-Hypothesen, z.B. pro oder kontra eine italo-keltische Verwandtschaft,
können den realen Entwicklungen nicht gerecht werden und sollten diesen differenzier-
teren Ergebnissen Platz machen.]
- Holm, Hans J. & Embleton, Sheila (2001): Review of 'Mathematical foundations
of Linguistics' (by Hubey, H. Mark, 1999, LINCOM handbooks in Linguistics 10,
Muenchen: LINCOM); In: Journal of Quantitative Linguistics 8-2:149-62.
- Holm, Hans J. (2003): The proportionality trap, Or: what is wrong with
lexicostatistical subgouping? In: Indogermanische Forschungen 108: 39-47. - Grundlagen auf englisch; auch für Nicht-Mathematiker geeignet -
[Zusammenfassung: Es wird anhand eines Experiments gezeigt, dass die rohe Anzahl
von Übereinstimmungen (z.B. der Kognaten) zwischen zwei verwandten Sprachen
prinzipiell nicht den Grad der genealogischen Verwandtschaft wiedergeben kann.
Anschließend wird demonstriert, wie durch Berücksichtigung aller statistisch
bestimmenden Parameter die unterschiedliche Ausgangsbasis der Paarungen und damit
die korrekte Ausgliederungsreihenfolge wieder hergestellt werden kann.]
- Holm, Hans J. (2005): Genealogische Verwandtschaft. Kapitel 45 in
'QUANTITATIVE LINGUISTIK; Ein internationales Handbuch' [HSK-Serie, Bd. 27],
Berlin: de Gruyter. - Lexikostatistische Ansätze zur Gliederung von Sprachen im 20.Jh. Aktualisierung s.u. 2008 -
[Inhalt: 1. Wann sind Sprachen "verwandt"? 2. Datenbewertung; 3. Beziehungsmaße; 3.1.
Synchrone ~; 3.2. Diachrone Beziehungsmaße; 4. Strukturierung genealogischer
Abhaengigkeiten.]
- Holm, Hans J. (2007a): Language Subgrouping. In: Grzybek, P. & R. Köhler (Editors),
Exact Methods in the Study of Language and Text. Dedicated to Professor Gabriel
Altmann on the occasion of his 75th birthday. [Quantitative Linguistics 62].
Berlin: de-Gruyter: 225-235. - Umgang mit stat. Streuungen in mehrstufigen Untergliederungen -
[Zusammenfassung: Nach mehreren Jahren der Erprobung, und angesichts vieler
konkurrierender Verfahren, wird die Trennmengenberechnungsmethode (Holm 2000,
passim) im Hinblick auf ihre Erfordernisse verfeinert. Es wird getestet, wie stochastische
Streuung von schlechten Daten unterschieden werden kann und wie Daten beschaffen
sein sollten.]
- Holm, Hans J. (2007b): The new Arboretum of Indo-European "Trees" - Can new Algorithms
Reveal the Phylogeny and even Prehistory of IE? In: Journal of Quantitative
Linguistics 14-2, S. 167-214. -> in D verfügbar in den Uni-Bibliotheken B,
BO, EF, F, Gö/Phil, M, TR. Original-Kopien gg. Bezahlung(ab 50 Stück) sind erhältlich über
http://cats.tfinforma.com/PTS/in?t=rl&m=237780. Den nicht zitierbaren Entwurf finden Sie
hier >Arbo old.pdf. - Aktualisierung auf 2006, neuere lexikostatistische Ansätze -
[Zusammenfassung: Die Spezialisierungen auf den Gebieten der Linguistik
einerseits und der Bioinformatik andrerseits führen zunehmend zu Missverständnissen
und falschen Ergebnissen, bedingt durch unzureichende Kenntnis der Bedingungen der
jeweils angewandten Methoden und Materialien. Diese werden analysiert und die
Ergebnisse zur Beurteilung der augenblicklichen Schwemme von Versuchen zur
Konstruktion neuer Stammbäume der indogermanischen Sprachen herangezogen.]
- Holm, Hans J. (2008): The Distribution of Data in Word Lists and its Impact on the
Subgrouping of Languages. In: C. Preisach, H. Burkhardt, L. Schmidt-Thieme,
R. Decker (Editors): Data Analysis, Machine Learning, and Applications. Proceedings
of the 31th Annual Conference of the Gesellschaft für Klassifikation e.V., Albert-Ludwigs-
Universität Freiburg, März 7-9, 2007. Springer-Verlag, Heidelberg-Berlin: 629-636.
ISBN 978-3-540-78239-1. (Den Entwurf finden Sie hier HREF="SLRD.pdf">>SLRD.pdf) - Lösung von Verteilungsproblemen in natürlichen Korpora -> verbesserter idg. "Stammbaum" -
[Zusammenfassung: Linguisten pflegen anzunehmen, dass Sprachen desto näher
verwandt sind, je mehr Merkmale, insbesondere gemeinsame Neuerungen, sie teilen. In
Holm (2003) wurde gezeigt, dass diese Annahme irrig ist, weil dabei übersehen wird,
dass die Menge gemeinsamer Übereinstimmungen stochastisch von drei weiteren
Parametern abhängt. Nur mit Hilfe des 'maximum likelihood Schätzers' der
Hypergeometrischen Verteilung sind wir in der Lage, die Anzahl derjenigen
gemeinsamen Merkmale herauszufinden, die im Zeitraum der Trennung von zwei
Sprachen diesen noch gemeinsam eigen war. Dadurch konnte eine Ausgliederungs-
reihenfolge innerhalb solcher Sprachfamilien gewonnen werden, für welche die
erforderlichen Daten verfügbar sind. Nach Anwendung auf die Daten des IEW (Pokorny
1959) waren die sich ergebenden späten Ausgliederungen des Hethitischen, Albanischen
und Armenischen zwanglos mit deren zentraler geographischen Lage erklärbar und
daher unverdächtig. Erst, als in einer weiteren Anwendung auf Daten der Mixe-Zoque-
Familie dieselbe Beobachtung gemacht wurde, dass stets schwach belegte Sprachen spät
auszugliedern schienen, konnte ein systematischer Fehler vermutet werden.
Die Ursache dieses Fehlers wird aufgedeckt, der nur bei Merkmalslisten natürlicher
Sprachen auftritt, im Gegensatz zu den in Holm (2007a) benutzten Testlisten mit
stochastisch normalverteilten Daten. Für diese Untersuchung stand nun als erheblich
modernere und zuverlässigere Datenquelle das "Lexikon der indogermanischen Verben"
(Rix et al. 2001) zur Verfügung. In der Tat bewahrheitete sich der Verdacht, und es wird
gezeigt, wie aus solchen quasi-Pareto-verteilten Daten trotzdem die korrekte
Ausgliederungsreihenfolge gewonnen werden kann.
Es ergibt sich eine (teilweise) neue Ausgliederungsreihenfolge der indogermanischen
Hauptzweige, die gut zu den grammatischen Tatsachen als auch der geographischen
Verteilung passt. Vor allem ergibt sich klar, dass sich die anatolischen Sprachen
keinesfalls als erste getrennt haben können und widerlegt damit eindeutig die "indo-
hethitische Hypothese".]
- Holm, Hans J. (2009):Albanische Basiswortlisten und die Stellung des Albanischen in
den indogermanischen Sprachen. Zeitschrift für Balkanologie Nr. 45-2.
Wiesbaden, Harrassowitz. 172-206. (Sonderdrucke verfügbar. Unpublished English
version available). - Kritische Synopse einiger in lexikostatistischen Arbeiten verwendeter Wortlisten -
[Zusammenfassung: In der vergangenen Dekade hat eine Reihe von Wissenschaftlern
den Anspruch erhoben, mittels neuer lexikostatistischer Verfahren die Untergliederung
der indogermanischen Sprachen gelöst zu haben. Von der Öffentlichkeit konnte indes
nicht erwartet werden, die Fragwürdigkeit der Ergebnisse zu erkennen, wobei die
unterschiedlichen und z.T. idiosynkratischen Einordnungen des Albanischen besonders
auffallen.
Einer der Gründe liegt in der Unangemessenheit der oft aus der Bioinformatik
übernommenen Methodik (vgl. Holm, H. J. 2007, The new Arboretum of Indo-European
‘Trees’, in: Journal of Quantitative Linguistics, 14-2). Nun wird anhand des albanischen
Teils von drei häufig zu diesen Studien herangezogenen Listen gezeigt, dass außerdem
mit etwa dreizehn Prozent linguistischen Fehlern zu rechnen ist. Insgesamt werden
siebzehn neue Etymologien vorgeschlagen, doch bleiben etwa dreißig Prozent des
albanischen Grundwortschatzes weiterhin von unklarer Herkunft. Dies und der stark
wechselnde Einfluss von Entlehnungen bilden letztlich ein weiteres Argument gegen die
glottochronologische Grundannahme fester Ersetzungsraten.]
- Holm, Hans J., im Redaktionsgang 2010: Besprechung zu: Frank Sirocko (Hg.)
"Wetter, Klima, Menschheitsentwicklung, Von der Eiszeit bis ins 21. Jahrhundert".
- Holm, Hans J., im Redaktionsgang 2010: Archäoklimatologie des Holozäns: Ein
durchgreifender Vergleich der Wuchshomogenität mit Sonnenaktivität und anderen Proxies.
[Zuasammenfassung: Bisherige Ansätze zur Validität sowohl der Wuchshomogenität
mitteleuropäischer Eichenstandorte als auch verschiedener Anzeiger der
Sonnenaktivität halten einem durchgreifenden Vergleich nicht stand. Dies gilt vor
allem hinsichtlich behaupteter klimatischer Aussagen, z. B. zum Niederschlag.
Bessere Übereinstimmungen scheinen dagegen über die letzten 9 000 Jahre zwischen
der Wuchshomogenität und den Baumgrenzen der Alpen als auch Temperaturaussagen des
NGRIP-Eiskerns erkennbar zu sein.]
------------
Neu ab 2010-05-27: