O indo-europeu é uma grande família linguística. Mas que família é essa, exatamente? De onde ela vem, quando nasceu, como foi descoberta? Que relação guarda com o latim e o português?

Essas são algumas das perguntas que responderemos neste artigo.

Na antiguidade

***Crátilo****, de Platão: ensaio linguístico na Grécia Antiga.*

Na Grécia e Roma antigas, as ciências, como conhecemos hoje, ainda não existiam. Naquela época, a ciência era chamada de filosofia. Por meio dela, tentava-se explicar os fenômenos naturais a partir de causas naturais (e não de elementos divinos, como se fazia anteriormente, na mitologia). O método científico que conhecemos hoje só foi estabelecido no século XIX, após um longo processo de desenvolvimento histórico. Foi com ele que a linguística pôde finalmente surgir como ciência moderna.

Isso significa que, na antiguidade, sem o método científico atual, as hipóteses etimológicas eram apenas opiniões, geralmente baseadas no som ou na forma das palavras. Assim, a arbitrariedade do signo,¹ que viria a se estabelecer com Saussure apenas no século XIX, de fato já era debatida na Grécia antiga (um ótimo exemplo é o “Crátilo”, de Platão). Contudo, ela carecia do rigor científico atual. Vale dizer, as digressões no campo filológico-etimológico já existiam na esfera grega antiga, mas seus métodos deixavam a desejar.

O latim veio do grego?

Vizinha à Grécia estava Roma. Estes (os romanos) eram peritos em assimilar elementos culturais dos povos que conquistavam. Dos etruscos, por exemplo, tomaram o alfabeto (que os etruscos, por sua vez, haviam tomado da Grécia), a engenharia hidráulica, certos rituais religiosos, combates gladiatoriais e mais. Depois, quando conquistaram a Grécia, não foi diferente: absorveram, vorazmente, conceitos nos campos da arte, literatura, religião, arquitetura, comércio, finanças, administração, filosofia, medicina, geologia, física, astronomia, dentre muitos outros.

De fato, os romanos foram de tal forma arrebatados pela cultura grega que dizia-se que Roma havia conquistado a Grécia, mas a Grécia terminou por conquistar Roma. A frase é do escritor romano Horácio, que, como Ovídio (outro ícone da literatura romana), fora profundamente influenciado pela literatura dos helenos, a ponto de criar poesia em latim utilizando a métrica grega:

Graecia capta ferum victorem cepit et artis intulit agresti Latio.
A conquistada Grécia seus selvagens vencedores conquistou, trazendo a arte ao rústico Lácio.
— Horácio, Cartas II.I.156-157.

A afeição romana pela cultura grega era tão ardente que esta última terminou por gozar de uma reputação altíssima e diferenciada em Roma. Os romanos mais ricos utilizavam tutores gregos para ensinar e escolarizar os filhos. Os jovens da elite romana viajavam a Atenas e/ou à ilha de Rodes para estudar retórica em grandes e conceituadas escolas de filosofia. E dominar apenas o latim era insuficiente: o nobre romano precisava também falar grego — de forma semelhante ao que, depois, viria a acontecer com o francês, língua de grande prestígio há alguns séculos; e, hoje, com o inglês, língua franca atual.

*Loba amamentando Rômulo e Remo: símbolo romano desde o século III aC. Escultura do Museu Capitolino, em Roma.*

A coisa ficou tão séria que Roma, embevecida pelo charme grego, deixou-se levar a ponto de enxertar a cultura helênica na mitologia do próprio surgimento. Tradicionalmente, a mitologia romana contava que a Cidade havia sido fundada por Rômulo e Remo — dois irmãos que, abandonados à própria sorte na selva, ainda bebês, foram amamentados por uma loba, que não os deixou perecer. Mais tarde, os dois fundariam Roma no local exato em que haviam sido amamentados pela loba na infância. A imagem é tão icônica que se tornou um dos símbolos da própria Roma, pelo menos desde o século III aC.

Pouco tempo depois de, em 146 aC, os romanos conquistarem a Grécia (e serem por ela conquistados), o poeta Virgílio revisita a própria mitologia da fundação de Roma. Influenciado pelo escritor grego Homero (autor da Ilíada e da Odisseia, obras altamente conceituadas desde o século VIII aC), Virgílio decide escrever sua própria composição épica. Ele toma da Ilíada (de Homero) uma figura secundária, Eneias, transformando-o em personagem central e narrando a jornada heroica desse troiano. E assim como o grego Odisseu (em latim: Ulisses) é eternalizado na Odisseia — livro que narra suas aventuras em terras (e mares!) estranhos até conseguir voltar ao lar —, Eneias ganha sua Eneida.

No filme Troia (2002), quando a cidade é incendiada, Páris (Orlando Bloom) encontra, nos túneis que dão acesso ao exterior da cidadela, um jovem troiano em vias de fuga. O príncipe (Páris) estende-lhe a espada de Troia — a mesma que seu pai, Príamo, dissera haver recebido do próprio pai, que a herdara do pai deste, e assim por diante, até a própria fundação da cidade. “A história de nosso povo foi escrita com ela”, explicara Príamo ao filho. “O espírito de Troia está nesta espada. Enquanto estiver em posse de um troiano, há um futuro para nosso povo.”

Troia (filme) - Eneias e Páris — *Troia (2002): Eneias e o pai (Anquises), Páris e a Espada de Troia*

Quando Páris encontra o jovem nos túneis e entrega-lhe a espada, ecoa as palavras do pai: “Enquanto estiver nas mãos de um troiano, há um futuro para nosso povo. Protege-a, e encontra para estas pessoas um novo lar”. O nome do jovem? Eneias. O nome desse grupo de pessoas? Enéades ou enéadas.

A Eneida (de Virgílio) narra como esse jovem, havendo sido poupado da destruição de Troia por seu caráter piedoso (que, na Grécia antiga, significava o “caráter dotado de reverência aos deuses”), fora orientado pelos deuses a fugir. Eneias obedece ao comando divino, até chegar à região em que fundará um povoado com o grupo de pessoas que lhe acompanhou (os enéadas). Ali, cria uma linha familiar cuja descendência resultará no nascimento de Rômulo e Remo — os próprios fundadores de Roma, patriarcas dos romanos.

Dado o fascínio pela cultura helênica, é fácil entender por que os gramáticos romanos, percebendo semelhanças entre o latim e o grego, postularam que aquele viria deste. Se a fundação mesma da nação teria origens gregas, naturalmente a língua falada nesta nação seguiria os mesmos princípios. De fato, a crença de que o latim seria um dialeto do grego tem até nome: eolismo, com base na suposição de que a língua romana proviria, em grande parte, do dialeto eólico falado na Grécia.

Catão (234–149 aC) é o primeiro romano a quem se atribui o conceito do eolismo. Ele é citado por João, o Lídio, dizendo que:

Ὁ Ρωμύλος, ἢ οἱ κατὰ αὐτόν, δείκνυται κατ’ ἐκείνο καιροῦ τὴν Ἑλλάδα φωνήν, τὴν Αἰολίδα λέγω [...] Εὐάνδρου καὶ τῶν ἄλλων Ἀρκάδων είς Ἰταλίαν ἐλθόντων ποτὲ καὶ τὴν Αἰολίδα τοῖς βαρβάροις ἐνσπειράντων φωνήν.
Rômulo, ou melhor, seu grupo de acompanhantes, falava, à época, a língua grega, vale dizer, o [dialeto] eólico […] pois Evandro e os demais arcádios em algum momento vieram à Itália e lançaram a semente do eólico entre os bárbaros.
— Var. fr. 295 Funaioli (João, o Lídio — Mag. R.1.5)

A ele seguiram-se muitos outros autores e gramáticos, como Lúcius Élio Stilo e seu aluno, Varrão — que chegou a reprimir o próprio professor por não classificar ainda mais vocábulos latinos como derivados do grego²; e como o historiador e retórico grego Dionísio de Halicarnasso, reconhecidamente quem mais se aprofundou no tema.

Esse romantismo (e, de certa forma, seu revisionismo histórico) envolvendo as línguas e suas origens, com base no que se acreditava carregar mais prestígio (antes que na verdade dos fatos) perdurou muito tempo. Efetivamente, até o século XVIII, boa parte da Academia ainda pensava nesses termos. Para mudar isso, seria necessária uma quebra irreconciliável com o dogma estabelecido — uma guinada de 180 graus, em direção a novas terras, “por mares nunca dantes navegados”.

Reação em cadeia

A tradição de que o latim seria um dialeto do grego (eolismo) perpetuou-se por mais de mil anos. Aparentemente, essa crença — sem rigor científico — havia se solidificado e não iria mudar. No entanto, a história não para, e o império romano, antes invencível, terminou por se fragmentar em dois: 1) no Império Romano do Ocidente e 2) no Império Romano do Oriente (o chamado Império Bizantino). A parte ocidental esfacelou-se primeiro, em 376; e a parte oriental, após duzentos anos sob ataque de diversas frontes (até de cruzadas cristãs!³), terminou, já enfraquecida, por finalmente sucumbir aos otomanos no século XV. Isso provocaria uma reação em cadeia que mudaria para sempre o rumo das ciências, inclusive o da linguística.

*Vasco da Gama deixa o porto de Lisboa com destino às Índias, em 1497. Quadro de* *Alfredo Roque Gameiro* *(~1900)*

Quando Constantinopla — e o próprio Império Bizantino — finalmente caem perante as forças do Império Otomano, em 29 de maio de 1453, a rota das especiarias (há muito consideradas “o ouro das Índias”) é fechada pelos novos donos do pedaço (os otomanos). Os portugueses, então — nossos velhos conhecidos —, avessos à ideia de perder o “ouro”, lançam-se ao mar em busca do trajeto Europa-Índia. Quando Vasco da Gama (~1460 – 1524) realiza a façanha de cruzar o Cabo da Boa Esperança e finalmente desembarca na Índia em 20 de maio de 1498 (após quase um ano no mar), isso marca o começo de uma virada. Não apenas histórico-comercial, mas também linguística. Pois a conquista ocidental de territórios indianos, como Goa, abre as portas para um novo tipo de visitantes: os missionários.

Um desses missionários era o jesuíta inglês Thomas Stephens, estudioso da língua konkani (um tipo de “primo” do sânscrito a que os portugueses chamavam canarim). Em 1583, durante a estadia em Goa, Stephens escreve uma carta ao irmão, que morava em Paris, comentando as semelhanças entre as línguas indianas, de um lado; e o grego e latim, do outro.

Dois anos depois, em 1585, um mercador italiano chamado Filippo Sassetti, que havia deixado Florença rumo à Índia, escrevia, por sua vez, uma carta ao amigo florentino Pier Vettori. Sassetti era um amante da literatura e cultura, e durante sua estadia na cidade de Kochi, notou que o material científico indiano era redigido em uma língua diferente daquela falada pelos nativos. Tão diferente que os próprios indianos precisavam de “6 ou 7 anos” de estudo, regados a profunda ênfase na gramática para conseguir entendê-la. Essa língua, dizia Sassetti por carta, era “dilettevole e di bel suono” (agradável e de bela sonoridade), com 53 sons de difícil pronúncia para os europeus. Os indianos tinham por essa língua a mesma reverência que o Ocidente demonstrava por grego e latim. Seu nome? Sânscrito.

Embora Stephens tenha sido o primeiro a correlacionar as línguas indianas ao grego e latim, Sassetti foi o primeiro a dar nome aos bois, ou melhor, ao boi: sânscrito — que ele notou possuir semelhanças com o italiano,⁴ como estas:

PORTUGUÊS*	ITALIANO	SÂNSCRITO
deus	dio	देवः devaḥ
serpente	serpe	सर्प sarpaḥ
seis	sei	षट् ṣaṭ
sete	sette	सप्त sapta
oito	otto	अष्ट aṣṭa
nove	nove	नव nava

* Termos em português inseridos para facilitar a compreensão.
A tabela original de Sassetti continha apenas italiano e sânscrito.

Seguiram-se a Stephens e Sassetti muitos outros estudiosos, de nacionalidades várias — holandeses, turcos, franceses, russos, ingleses. Muitos deles, posteriormente, notaram também essas semelhanças. Ao realizarem seus próprios estudos, adicionaram ainda mais informações a este leque de conhecimentos. Assim, substantivos, adjetivos, verbos, enfim, todas as classes de componentes morfológicos e, depois, sintáticos, foram postas sob o microscópio. Pouco a pouco, a antiga noção da origem de palavras semelhantes, em dois idiomas diferentes, começou a mudar.

O nascimento do Indo-Europeu

Antes, quando dois termos se pareciam em duas línguas, “A” e “B”, era comum acreditar que “A” havia tomado o termo de “B”, ou vice-versa. Por exemplo, se a palavra “mãe” era muito semelhante em latim e grego, então o termo latino deveria ser proveniente do grego.

No século XIX, isso começou a mudar. O encontro do Ocidente com o sânscrito nos proporcionou uma nova visão desse universo linguístico. Ele agora estava se construindo no sentido de que, se várias línguas demonstravam semelhanças entre si, não era que uma língua necessariamente vinha da outra, mas que haveria uma origem comum a todas elas. Pensemos assim: se duas pessoas (Paula e Aline) são muito parecidas, isso não significa obrigatoriamente que uma venha da outra (que Aline veio de Paula, ou vice-versa); essas duas pessoas podem ser irmãs, nascidas da mesma mãe. O conceito é esse, mas aplicado às línguas.

Mas que línguas estariam incluídas neste rol de mesma proveniência? Que semelhanças seriam necessárias para identificar as línguas que estariam relacionadas, que teriam a mesma origem?

No desenrolar dos anos, a resposta a essas perguntas mudou bastante. No século XVII, o holandês Marcus Zuerius postulou que seriam o albanês, persa, alemão, grego, latim, eslavo, celta e as línguas bálticas; e o russo Mikhail Lomonosov comparou as línguas eslavas, bálticas, iranianas, finlandês, chinês e hottentot. Depois, a hipótese veio a ser esquecida durante alguns anos, reaparecendo apenas em 1786, durante a eminente palestra do inglês Sir William Jones à Sociedade Asiática, em Calcutá, na Índia. Ao descrever as muitas semelhanças entre latim, grego e sânscrito, Jones delineou a ideia de uma mesma língua de origem para essas três, que seriam línguas co-descendentes. O conceito foi eternalizado em suas famosas palavras:

“The Sanscrit [sic] language, whatever be its antiquity, is of a wonderful structure; more perfect than the Greek, more copious than the Latin, and more exquisitely refined than either, yet bearing to both of them a stronger affinity, both in the roots of verbs and the forms of grammar, than could possibly have been produced by accident; so strong indeed, that no philologer could examine them all three, without believing them to have sprung from some common source, which, perhaps, no longer exists.”
“O sânscrito, seja lá o quanto antigo for, é de uma maravilhosa estrutura; mais perfeito que o grego, mais copioso que o latim, e de um requinte dotado de maior sensibilidade que qualquer dos dois, mantendo, porém, com ambos, uma afinidade, tanto nas raízes verbais quanto nas formas gramaticais, mais forte do que poderia ter sido ocasionada por mero acidente; tão forte, de fato, que filólogo algum seria capaz de examinar estas três línguas e não acreditar que tenham surgido de alguma fonte comum, que, talvez, não mais exista.”
— Sir William Jones, 1786.

Jones menciona parcimoniosamente uma “common source” (fonte comum), sem dar-lhe nome — mas a semente havia sido plantada. Ela germinaria quase 30 anos depois, quando Thomas Young utiliza, pela primeira vez,⁵ em 1813, o termo “indo-europeu”, para atribuir-lhe essa “fonte comum”. A nomenclatura do termo tinha por base a extensão geográfica das migrações dos povos indo-europeus, que se espalharam desde a Índia (indo-) até a Europa (-europeu). Os franceses haviam utilizado a denominação “indo-germânico”⁶ um pouco antes, em 1810, mas, com o passar do tempo, ele foi preterido em favor da terminologia “indo-europeu”. O alemão é a única língua que continua a usar o termo “indogermanisch”, por motivos óbvios.

Pouco tempo depois, o alemão Franz Bopp produz extensos trabalhos de gramática comparada envolvendo as línguas indo-europeias. Em 1816, temos o sistema de conjugação comparada do sânscrito com grego, latim, persa e germânico⁷; e entre 1833 e 1852, ele publica sua famosa Gramática Comparada (também chamada de “Gramática Comparativa”): são 6 (seis) tomos comparando sânscrito, grego, latim, lituânio, gótico, alemão, eslavônico antigo (a primeira língua literária eslava) e zenda (o corpus de todas as exegeses feitas sobre o Avestá, coleção de textos religiosos do zoroastrianismo escrita na língua avéstica). A Gramática Comparada de Bopp foi tão importante que, historicamente, terminou por marcar o início dos estudos indo-europeus como disciplina acadêmica.

Linguística comparada

Em resumo, as conquistas do Império Otomano e a queda de Constantinopla, no século XV, levaram a uma série de desenvolvimentos que culminaram (no campo da linguística) no conhecimento do sânscrito e na comparação das gramáticas de várias línguas que aparentavam semelhança. No início, por via dos comentários ainda rasos dos primeiros missionários, a prática era ainda incipiente. Porém, começou a ganhar força, e mais estudiosos se debruçaram sobre essas semelhanças. O método foi inicialmente visto como infundado, mas conforme mais evidências foram sendo acumuladas, ele foi ganhando força e respeitabilidade. Até que, no século XIX, já com a solidez de corpo necessária, a linguística comparada finalmente se estabelece como ciência.

O método

A comparação gramatical entre duas ou mais línguas permitiu entrever a possibilidade de uma origem comum a elas. Tomemos como exemplo as palavras “homem”, “mulher”, “água” e “terra” em várias línguas-filhas do latim (chamadas línguas neolatinas), como português, espanhol, catalão, galego, italiano, francês e romeno:

PORTUGUÊS	HOMEM	MULHER	ÁGUA	TERRA
ESPANHOL	hombre	mujer	água	tierra
CATALÃO	home	dona, muller	aigua	terra
GALEGO	home	mullher	auga	terra
ITALIANO	uomo	donna	acqua	terra
FRANCÊS	homme	femme (moillier*)	eau	terre
ROMENO	om	femeie muiere	apa	tara
LATIM	homō	domina, femina, mulier	aqua	terra

* Em francês antigo.

Graças às linguísticas histórica e comparada, conseguimos entender que, se temos palavras parecidas entre esses idiomas (português, espanhol, catalão, galego, italiano, francês e romeno), não é que um tenha tomado a palavra do outro, mas sim que havia uma origem comum a todas elas. Ou seja, uma língua-mãe comum a todos esses idiomas: o latim.

Suponhamos, por um momento, apenas a título de exercício intelectual, que desconhecêssemos a língua-mãe que deu origem aos idiomas neolatinos. Suponhamos, ainda, que desejássemos reconstruir essa língua-mãe a partir das línguas-filhas. Como descobriríamos como era essa tal língua original?

Se tomarmos a palavra portuguesa “terra” como exemplo, o processo seria mais ou menos o seguinte:

Vemos que o som inicial /t/ é comum a todas as 7 (sete) línguas neolatinas acima elencadas, do português ao romeno. Portanto, a língua de origem também dev(er)ia possuir esse som. Primeiro elemento: “T”.
Para reconstruirmos o som seguinte, basta nos atentarmos ao fato de que somente um único idioma utiliza ditongo (“ie”); todos os outros idiomas utilizam uma vogal simples (“a” ou “e”). Assim, a maior probabilidade é de que o segundo som seja de vogal simples (não de ditongo). Mas que vogal simples seria essa? Ora, novamente, a maioria dos idiomas utiliza “e” (só o romeno utiliza “a”). Portanto, o segundo som (elemento) de nossa língua reconstruída será “E”.
Ainda segundo a regra da maioria, obtemos o terceiro som ao percebermos que só há 1 (um) idioma utilizando “r” — todos os demais utilizam “rr”. Assim, em nossa língua-mãe, o terceiro elemento também será “RR”.
Por último, apenas o francês possui a terminação em “-e”. Todos os outros terminam em “-a”. Claramente, nossa língua reconstruída também levará “-a”. Quarto elemento: “A”.

Ao somarmos os 4 elementos acima, portanto, teremos reconstruído a palavra T-E-RR-A (terra) nessa língua-mãe. Que, neste caso, sabemos, é o latim.

Ramo itálico do indo-europeu.
V. árvore completa e fonte no fim deste artigo.

Por óbvio que o processo descrito acima foi aqui simplificado, haja vista que um dos propósitos deste website é este mesmo: traduzir (descomplicar) conceitos linguísticos complexos em formatos de fácil compreensão, promovendo o acesso ao conhecimento para todos. Por isto mesmo, utilizamos aqui apenas 7 (sete) línguas neolatinas, sendo que há atualmente 44.⁸

Em segundo lugar, um grande elemento facilitador é o fato de que línguas como latim e grego eram (e são) não só conhecidas, mas muito bem documentadas. Basta lembrar que, até meados de 1960, a missa ainda era celebrada em latim!

A grande questão, portanto, é: se unirmos latim, grego e outras grandes famílias linguísticas, como a do sânscrito, que língua-mãe teremos? Nesse sentido, vários foram os termos propostos à família resultante. Abaixo estão alguns exemplos:

Indo-germanique (“indo-germânico”, pelo francês Conrad Malte-Brun, em 1810)
Japetisk ("jafético”, pelo dinamarquês Rasmus Kristian Rask, em 1815)
Indisch-teutsch (“índico-teutônico”, pelo alemão Friedrich Jakob Schmitthenner, em 1826)
Sanskritisch (“sanscrítico”, pelo prusso Wilhelm von Humboldt, 1827)
Indokeltisch (“indo-celta”, pelo hanoveriano August Friedrich Pott, em 1840)
Arioeuropeo (“arioeuropeu”, pelo italiano Graziadio Isaia Ascoli, em 1854)
Aryan (“ariano”, pelo alemão Max Müller, em 1861)
Aryaque (“ariaque”, pelo belga Honoré Chavée, em 1867).

Contudo, foi a denominação Indo-European (“indo-europeu”), proposta pelo inglês Thomas Young, em 1813, que terminou vingando.

O Indo-Europeu

Durante a palestra em que postulou um idioma original (“fonte comum”) para latim, grego e sânscrito, o inglês Sir William Jones deu exemplos de algumas famílias linguísticas que poderiam estar abarcadas por esta grande língua-mãe. Ele ainda não sabia, mas estava enumerando o que terminaria por corresponder a metade das famílias do indo-europeu:

itálico (ramo do latim e das línguas neolatinas)
helênico (ramo da língua grega)
germânico (ramo das línguas germânicas, como inglês, alemão, sueco, norueguês)
celta
indo-iraniano (junção de duas famílias linguísticas: as muitas línguas indianas + as línguas iranianas)

Três décadas de estudo depois, as demais famílias seriam finalmente agrupadas sob a asa do indo-europeu:

balto-eslavo (junção das línguas bálticas + eslavas: servo-croata, russo, ucraniano etc.)
armênio
albanês

Recentemente, no século XX, dois outros ramos (desconhecidos na época de Jones) foram finalmente descobertos e devidamente adicionados ao indo-europeu:

anatólio (que viria a ser compreendido como o mais antigo de todos os ramos, com textos em hitita datados do início do segundo milênio aC)
tocariano

Logo abaixo, é possível ver um mapa (simplificado) desta grande família linguística que é o indo-europeu, com suas muitas línguas-filhas. Estas, por sua vez, também são ramos (itálico, helênico etc.) que deram origem a outros sub-ramos (por exemplo, itálico > latim > português, espanhol). Clique para expandi-lo:

Ao utilizar o método de reconstrução entre os muitos idiomas documentados, os estudiosos chegaram à língua ancestral denominada indo-europeu. Em linguística, essa língua ancestral reconstruída chama-se protolíngua, e suas filhas (seus ramos linguísticos descendentes) chamam-se línguas-filhas.

O prefixo “proto-” é adicionado a uma língua (ou a um conjunto de línguas) para indicar que se trata da versão reconstruída da(s) língua(s) documentada(s) que lhe seguiu(ram). Ou seja, a protolíngua é a versão ancestral reconstruída mais imediata da(s) língua(s) dela descendente(s).

Assim, em sentido estrito, o indo-europeu é o conceito da família linguística em si, enquanto o protoindo-europeu seria a língua-mãe reconstruída, pertencente ao estágio imediatamente anterior ao (e que resultou no) nascimento de suas línguas-filhas (itálico, helênico, germânico, celta, indo-iraniano, balto-eslavo, armênio, albanês, anatólio e tocariano). Dito isso, na prática, os termos “indo-europeu” (IE) e “protoindo-europeu” (PIE) são utilizados, no cotidiano, basicamente como sinônimos.

Da mesma forma, a versão reconstruída da língua-mãe imediatamente anterior ao surgimento das línguas neolatinas (português, espanhol, francês, italiano, romeno etc.) chama-se protorromance. Ela corresponde à forma falada do latim vulgar, já em estágio tardio de desenvolvimento, imediatamente anterior à fragmentação regional que deu origem às línguas neolatinas.

Essa denominação (“romance”) advém do fato de que as línguas neolatinas (descendentes do latim) também são chamadas de línguas românicas (quer dizer, descendentes de Roma). Ou seja, é possível denominá-las com base na língua (latim) ou na localização geográfica (Roma). Em português, o termo “língua neolatina” é o padrão; mas em inglês, por exemplo, a denominação comumente utilizada é “Romance language”.

Conclusão

Por abranger tantos ramos linguísticos diferentes, tão diversos e cobrindo uma área tão extensa do globo (da Índia à Terra do Fogo, ao sul, no Ushuaia; ou ao Canadá, no norte), é natural que a primeira impressão que tenhamos do indo-europeu é que todas as línguas do planeta tenham vindo desta grande família. Embora não seja o caso, o número de falantes (de línguas descendentes) do indo-europeu supera o de qualquer outra família linguística — o que também poderia dar a impressão de que nosso tronco linguístico seja mais prestigiado que os outros.

No entanto, há mais de 7.000 línguas faladas no mundo hoje, e a maioria delas não pertence ao indo-europeu. O que acontece é que o IE corresponde, linguisticamente, ao que chamam, na geografia, de “áreas de alta densidade populacional”: das mais de 7.000 línguas existentes hoje, apenas 448 provêm do indo-europeu. Porém, nessas mesmas 448 línguas está a maior parte dos falantes do planeta. Outras famílias têm poucos falantes, como é o caso das línguas esquimós; e algumas estão até em perigo crítico de extinção, como a língua indígena anambé, falada no Pará, que já em 2006 contava apenas 6 falantes nativos. As línguas descendentes do indo-europeu são poucas em número (comparados ao número total de línguas no planeta), mas essas poucas línguas têm muitos falantes.

Migrações dos povos indo-europeus.
Fonte: *World History Encyclopedia*.

O indo-europeu era apenas uma dentre as centenas (ou mais) de línguas faladas no neolítico tardio. Acredita-se que os falantes mais antigos desse idioma ancestral viveram na região que corresponde, hoje, mais ou menos à Ucrânia, ao Cáucaso e ao sul da Rússia (vide imagem ao lado). De lá, espalharam-se para Europa, Turquia e Ásia.

O fim da língua indo-europeia em sua forma unificada (antes de finalmente fragmentar-se em seus ramos descendentes) provavelmente aconteceu por volta de 3.400 aC.. Nessa época, a civilização minoica estava a todo vapor, na ilha de Creta, na Grécia; os dois reinos separados do Egito começavam a se delinear (cerca de 200 anos antes do Rei Escorpião, do sul, tentar conquistar o reino do norte); os sumérios implementavam algo que mudaria o mundo — um sistema completo de escrita, chamado cuneiforme (que terminaria por se transformar nos hieróglifos egípcios, depois no abjad fenício, que foi transformado no alfabeto grego, que se transformou no alfabeto etrusco, e este virou o alfabeto latino, que utilizamos até hoje); e a cultura 仰韶文化 (Yǎngsháo) florescia às margens do Rio Amarelo, na China, produzindo seda e diversos artigos de cerâmica.

Como os inventores da escrita atual foram os sumérios, isso significa que o indo-europeu (que era anterior) não desenvolveu um sistema de escrita — portanto, não temos evidências preservadas da língua. A reconstrução desse idioma vem sendo realizada há dois séculos, utilizando-se de vários métodos, inclusive o da gramática comparada (como descrevemos acima, neste artigo), mas também da comparação de mitologias, sistemas normativo-legais, instituições sociais, dentre outros elementos. Como não temos acesso direto ao indo-europeu (ao contrário dos textos em latim e grego, que chegaram até nós), talvez seja impossível reconstruir de forma exata esse idioma ancestral. Por isso, as palavras na protolíngua são geralmente iniciadas por um asterisco (*).

Por exemplo, o português “terra” vem do latim “terra” que, por sua vez, vem da raiz indo-europeia “ *ters- ” (note o asterisco), com o significado de “seco, secar”. Esse asterisco inicial é utilizado na linguística histórica para indicar que se trata de uma forma hipotética, quer dizer, uma palavra não atestada (= não preservada) em nenhum tipo de meio (documento, pote de cerâmica, pintura, inscrição funerária etc.). Não temos evidências de sua forma escrita em nenhum lugar, mas, com base em um amplo sistema de reconstrução, com a utilização multidisciplinar de vários métodos, teorizamos haver existido. Vale lembrar que, em outras áreas da linguística, o asterisco é utilizado para outros fins (como marcar frases agramaticais), mas na linguística histórica, ele marca termos de protolínguas reconstruídos.

Atualmente, embora essas reconstruções sejam isso mesmo — reconstruções —, já temos uma boa ideia de quem era o povo indo-europeu, tanto linguística quanto culturalmente. Muitíssimos estudos foram e continuam sendo realizados, em todo o globo, por muitos especialistas. Esses avanços vão paulatinamente descortinando quem foram nossos antepassados e que língua falavam. Isso é importante para entender também a nós próprios hoje, examinando-se os processos que terminaram por dar origem a nossas instituições, nossos costumes, nossas regras e nosso falar. Pois língua e cultura estão intrinsecamente ligados. Abrir a porta de um é abrir a porta do outro. Quando sabemos mais sobre nossos antepassados, sabemos mais sobre nós mesmos.

Notas de rodapé:

A arbitrariedade do signo estipula que não há relação necessária entre o significante (uma palavra) e seu significado (o que a palavra quer dizer). Ou seja, a ligação entre uma palavra (em linguística: signo) e o que ela significa é arbitrária. O vocábulo português “terra” provém do latim “terra”, que provém do indo-europeu *ters-. Porém, se continuarmos regredindo até os primórdios da invenção da palavra, veremos que, em última análise, a etimologia final será um som constituído por convenção, produzido pelo sistema fonológico (boca e demais órgãos da fala) dos primeiros hominídeos. Não há ligação necessária entre, por exemplo, o conceito (ideia) de terra seca e o som /t/ — não mais do que o conceito de “mar” estaria necessariamente ligado ao som da letra /m/. A ligação entre “conjuntos aleatórios de sons” (palavras) e o que significam são construções humanas, meramente convencionadas, em última instância, pelo falante (ou por um conjunto de falantes) de forma arbitrária. Exceções a esta regra são as onomatopeias (p. ex.: pôu, bang, tchibum) e os símbolos, pois nestes casos tentamos imitar, com o aparato fonológico humano, os sons que ouvimos na natureza.
STEVENS, Benjamin. Aeolism: Latin as a Dialect of Greek. In: The Classical Journal, Vol. 102, No. 2 (Dec. - Jan., 2006/2007), pp. 115-144. Ed.: The Classical Association of the Middle West and South.
Em 1204, um exército cristão das Cruzadas chegou a saquear Constantinopla, cidade também cristã. Os venezianos (cuja marinha havia alistado o exército das cruzadas na invasão), pilharam relíquias e obras de arte de Constantinopla. Poucos são os turistas que, hoje, admirando os cavalos de bronze no topo da Basílica de São Marcos, em Veneza, sabem que esses mesmos cavalos são resultado do saque a Constantinopla.
History of the language sciences: an international handbook on the evolution of the study of language from the beginnings to the present. Edited by Sylvain Auroux … [et al.]. Walter de Gruyter GmbH & Co. KG, 10785 Berlin, 2006.
ROBINSON, Andrew. The Last Man Who Knew Everything: Thomas Young, the Anonymous Genius who Proved Newton Wrong and Deciphered the Rosetta Stone, among Other Surprising Feats. Penguin, 2007.
Termo cunhado pelo francês Conrad Malte-Brun.
Intitulado “Über das Konjugationssystem der Sanskritsprache in Vergleichung mit jenem der griechischen, lateinischen, persischen und germanischen Sprache” (“Sobre o sistema de conjugação do sânscrito comparado com as línguas grega, latim, persa e germânica”).
De acordo com o Ethnologue. Acesso em 04/02/2023.

O que é o Indo-Europeu?