Diccionaris, corpora e basas de donadas textualas
Miriam Bras & Joan Thomas
RESUMIT
Dins aquel article, nos interessam a las donadas linguisticas que los lexicografes utilizan (o an utilizadas) per bastir los diccionaris. L’ensem d’aquelas donadas se ditz lo ‘còrpus de trabalh’ dels lexicografes, o mai generalament lo ‘còrpus’. Agacham primièr qualques òbras lexicograficas occitanas (las de De Sauvages, Rochegude, Honnorat, Couzinié, Vayssier, Mistral, Alibert, Laux), donam qualques caracteristicas de lor corpus de trabalh, e fasèm lo bilanç dels metòdes de trabalh. Puèi nos viram cap a d’òbras lexicograficas d’autras lengas que l’occitan. Causissèm dos diccionaris de lenga: un diccionari anglés (lo Collins Cobuild English Language Dictionary) e un diccionari francés (lo Trésor de la Langue Française Informatisé) qu’an totes dos la particularitat d’èsser ligats a de basas de donadas textualas. Aquò nos mena a prepausar de bastir una basa de donadas textualas, la Basa Telòc, que poiriá constituir lo còrpus d’un projècte lexicografic occitan avenidor.
Català
RESUM
Diccionaris, corpora i bases de dades textuals
En aquest article, ens interessem a les dades lingüístiques que els lexicògrafs utilitzen (o han utilitzat) per a bastir els diccionaris. El conjunt d’aquestes dades es diu el ‘corpus de treball’ dels lexicògrafs o més generalment el ‘corpus’. Mirarem de primer qualques obres lexicogràfiques occitanes (les de De Sauvages, Rochegude, Honnorat, Couzinié, Vayssier, Mistral, Alibert, Laux), donem qualques característiques de llur corpus de treball i fem el balanç dels mètodes de treball. Puix ens girem cap a obres lexicogràfiques d’altres llengües que l’occità. Escollim dos diccionaris de llengua: un diccionari anglès (el Collins Cobuild English Language Dictionary) i un diccionari francès (el Trésor de la Langue Française Informatisé) que tenen tots dos la particularitat d’estar lligats a bases de dades textuals. Això ens mena a proposar de bastir una base de dades textuals, la Base Telòc, que podria constituir el corpus d’un projecte lexicogràfic occità avenidor.
SUMMARY
Dictionaries, corpora and text databases
In this article, we are interested in the linguistic data which is used (or was used) by lexicographers to build dictionaries. The whole of this data is called a lexicographer ‘working corpus’ or more generally a ‘corpus’. First, we look at some Occitan lexicographic works (the ones of De Sauvages, Rochegude, Honnorat, Couzinié, Vayssier, Mistral, Alibert, Laux), we expose some characteristics of their working corpus and we assess their working methods. Then we turn to lexicographic works in other languages than Occitan. We select two monolingual dictionaries: an English one (the Collins Cobuild English Language Dictionary) and a French one (the Trésor de la Langue Française Informatisé): both of them share the feature of being linked to a text database. This lead us to propose the building up of a text database, the Telòc base, which could constitute the corpus of a future Occitan lexicographic project.
RÉSUMÉ
Dictionnaires, corpora et bases de données textuelles
Dans cet article, nous nous intéressons aux données linguistiques que les lexicographes utilisent (ou ont utilisées) pour bâtir les dictionnaires. L’ensemble de ces données s’appellent le “corpus de travail” des lexicographes, ou plus généralement le “corpus”. Nous examinons d’abord quelques oeuvres lexicographiques occitanes (celles de De Sauvages, Rochegude, Honnorat, Couzinié, Vayssier, Alibert, Laux), nous donnons quelques caractéristiques de leur corpus de travail, et nous faisons le bilan des méthodes de travail. Ensuite, nous nous tournons vers des oeuvres lexicographiques d’autres langues que l’occitan. Nous choisissons deux dictionnaires de langue : un dictionnaire anglais (le Collins Cobuild English Language Dictionary) et un dictionnaire français (le Trésor de la Langue Française Informatisé) qui ont tous deux la particularité d’être liés à des bases de données textuelles. Cela nous conduit à proposer de bâtir une base de données textuelles, la Base Telòc, qui pourrait constituer le corpus d’un projet lexicographique occitan avenir.
Lo ròtle de la lexicografia dins la planificacion lingüistica
Domergue Sumien
RESUMIT
La lexicografia coneis de constrenchas de foncionament fòrça diferentas dins lei lengas subordenadas e dins lei lengas dominantas. En occitan, cau assumir doas missions complementàrias:
1º Una lexicografia estrictament descriptiva, coma part de la lingüistica descriptiva. Ara aquela fonciona ren qu’en occitan medievau.
2º Una lexicografia d’usatge, coma part de la planificacion lingüistica. Deu prepausar au grand public de diccionaris amb una foncion descriptiva per lo lexic patrimoniau e mai una foncion normativa per porgir un occitan larg (occitan estandard), accessible a totòm e capable de complir lei foncions de la societat actuala.
L’occitan larg es pluricentric: intègra de modulacions regionalas que respèctan lei trachs pus emblematics dei dialèctes, mai tot en restant dins un sistèma pron simple de correspondéncias. Lei futurs diccionaris de l’occitan larg aurián donc de lèmas coma cantar (chantar), agachar (agaitar), fornir (hornir), bèl bèla (bèu bèla, bèth bèra).
La diccionarica, aplicada a l’occitan larg, nos menariá a prepausar un diccionari monolingüe e de diccionaris bilingües, estrechament coordenats entre elei. Cau modular leis objectius en foncion dei mejans materiaus, tròp febles a l’ora d’ara, tot en gardant una ambicion de qualitat (maximalisme). Es dins aqueu sens que trabalha nòstra associacion, lo GIDILÒC, maugrat una abséncia de sosten institucionau.
Català
RESUM
El paper de la lexicografia en la planificació lingüística
La lexicografia coneix constrenyiments de funcionament molt diferents en les llengües subordenades i en les llengües dominants. En occità, cal assumir dues missions complementàries:
1º Una lexicografia estrictament descriptiva, com a part de la lingüística descriptiva. Ara aquesta només funciona en occità medieval.
2º Una lexicografia d’ús, com a part de la planificació lingüística. Ha de proposar al gran públic diccionaris amb una funció descriptiva pel lèxic patrimonial i alhora una funció normativa per oferir un occitan larg (“occità ample”, occità estàndard), accessible a tothom i capaç de complir les funcions de la societat actual.
L’occitan larg és pluricèntric: integra modulacions regionals que respecten els trets més emblemàtics dels dialectes, però tot romanent en un sistema prou simple de correspondències. Els futurs diccionaris de l’occitan larg tendrien doncs lemes com ara cantar (chantar), agachar (agaitar), fornir (hornir), bèl bèla (bèu bèla, bèth bèra).
La diccionàrica, aplicada a l’occitan larg, ens menaria a proposar un diccionari monolingüe i diccionaris bilingües, estretament coordinats entre ells. Cal modular els objectius en funció dels mitjans materials, massa febles avui dia, tot guardant una ambició de qualitat (maximalisme). És en aquesta direcció que treballa la nostra associació, el GIDILÒC, malgrat una absència de suport institucional.
SUMMARY
The role of lexicography in language planning
Lexicography is compelled to work under very different conditions in subordinated languages and dominant languages. In Occitan, two complementary missions have to be held:
1º A strictly descriptive lexicography, as a part of descriptive linguistics. Nowadays, it only functions in Medieval Occitan
2º A usage lexicography, as a part of language planning. It should propose to a large public dictionaries which would have a descriptive function for patrimonial lexicon but also a normative function in order to spread Occitan Larg (“Wide Occitan”, Standard Occitan), a variety which everyone could access and which would fulfill all the functions of our present society.
Occitan larg is pluricentric: it includes regional ajustments which respect the most emblematic dialectal features, while always remaining in a quite simple system of correspondences. So future Occitan Larg dictionaries would have lemmas as cantar (chantar), agachar (agaitar), fornir (hornir), bèl bèla (bèu bèla, bèth bèra).
“Dictionarics”, when applied to Occitan larg, should lead to offer a monolingual dictionary and some bilingual dictionaries which would be closely interconnected. We have to ajust our aims according to our material means, which are too weak nowadays, but we always have to keep an ambition of quality (maximalism). Our association, GIDILÒC, works this way despite the lack of any institutional support.
RÉSUMÉ
Le rôle de la lexicographie dans la planification linguistique
La lexicographie connaît des contraintes de fonctionnement très différentes dans les langues subordonnées et dans les langues dominantes. En occitan, il faut assumer deux missions complémentaires:
1º Une lexicographie strictement descriptive, en tant que partie de la linguistique descriptive. Elle ne fonctionne aujourd’hui qu’en occitan médiéval.
2º Une lexicographie d’usage, en tant que partie de la planification linguistique. Elle doit proposer au grand public des dictionnaires avec une fonction descriptive pour le lexique patrimonial ainsi qu’une fonction normative pour offrir un occitan larg (“occitan large”, occitan standard), accessible à tous et capable d’accomplir les fonctions de la société actuelle.
L’occitan larg est pluricentrique: il intègre des modulations régionales qui respectent les traits les plus emblématiques des dialectes, mais tout en restant dans un système assez simple de correspondances. Les futurs dictionnaires de l’occitan larg auraient donc des lemmes comme cantar (chantar), agachar (agaitar), fornir (hornir), bèl bèla (bèu bèla, bèth bèra).
La dictionnairique, appliquée à l’occitan larg, nous mènerait à proposer un dictionnaire monolingue et des dictionnaires bilingues, étroitement coordonnés entre eux. Il faut moduler les objectifs en fonction des moyens matériels, actuellement trop faibles, tout en gardant une ambition de qualité (maximalisme). C’est dans ce sens que travaille notre association, le GIDILÒC, malgré une absence de soutien institutionnel.
La redaccion d’un diccionari ortografic e la problematica generala de la lexicografia contemporanèa
Josiana Ubaud
RESUMIT
L’incoeréncia deis obratges lexicografics a disposicion dau public nos menèt a redigir un diccionari ortografic per aportar un pauc mai de securitat linguistica ais usatgiers. Se siam acarada a de problèmas d’autant mai nombrós que la lexicografia occitana patís d’una misèria cronica despuei la parucion dau Tresor dóu Felibrige de F. Mistral, que lo diccionari d’Alibèrt n’es qu’una marrida còpia tenent de centenats de decas. Presentarem la metodologia adoptada per l’establiment de la tiera deis entradas, e l’agach critic que fa mestier d’aver a respècte dei diccionaris, notadament pertocant leis atestacions de regionalizacion. Evocarem tanben lo dolorós problèma dau còrpus jamai analisat, que nòstrei lecturas d’autors contemporanèus nos an permés de relevar de centenats de paraulas absentas de totei lei diccionaris, que mòstran la granda libertat de formacion dau lexic occitan.
RESUM
La redacció d’un diccionari ortogràfic i la problemàtica general de la lexicografia contemporània
Josiana Ubaud
La incoherència de les obres lexicogràfiques a disposició del públic ens ha menat a redigir un diccionari ortogràfic per a portar una mica més de seguretat lingüística als usuaris. Ens hem acarat a problemes encara més nombrosos, ja que la lexicografia occitana pateix una misèria crònica des de la publicació del Tresor dóu Felibrige de F. Mistral, del qual el diccionari d’Alibèrt només és una còpia dolenta tenint centenars d’errors. Presentarem la metodologia adpotada per a l’establiment de la sèrie de les entrades i la mirada tècnica que fa menester tenir respecte als diccionaris, especialment tocant les atestacions de regionalització. Evocarem també el dolorós problema del corpus mai analitzat, ja que les nostres lectures d’autors contemporanis ens han permès de remarcar centenars de paraules absents de tots els diccionaris, que mostren la gran llibertat de formació del lèxic occità.
SUMMARY
The redaction of a spelling dictionary and the general problems of contemporary lexicography
Josiana Ubaud
The incoherence of lexicographic works available to public led us to redact a spelling dictionary in order to bring users a little more linguistic security. We faced so many problems, as Occitan lexicography has suffered a chronic misery since the publication of F. Mistral’s Lou Tresor dóu Felibrige, of which Alibèrts’s dictionary is nothing but a bad copy full of errors. We will present the adopted methodology to establish the list of entries and the necessary critical eye we have to keep over dictionaries, in particular concerning attestations of regionalization. We will also bring up the painful problem of corpus, which is never analyzed; our readings of contemporary authors have allowed us to reveal hundreds of words absent from all dictionaries; they show the great freedom in word formation in Occitan lexicon.
RÉSUMÉ
La rédaction d’un dictionnaire orthographique et la problématique générale de la lexicographie contemporaine
Josiana Ubaud
L’incohérence des ouvrages lexicographiques à disposition du public nous a conduite à rédiger un dictionnaire orthographique pour apporter un peu plus de sécurité linguistique aux usagers. Nous avons fait face à des problèmes d’autant plus nombreux que la lexicographie occitane souffre d’une misère chronique depuis la parution du Tresor dóu Felibrige de F. Mistral, dont le dictionnaire d’Alibert n’est qu’une mauvaise copie comportant des centaines de fautes. Nous présenterons la méthodologie adoptée pour l’établissement des entrées, et le regard critique qu’il est nécessaire d’avoir à l’égard des dictionnaires, notamment en ce qui concerne les attestations de régionalisation. Nous évoquerons aussi le douloureux problème du corpus jamais analysé, car nos lectures d’auteurs contemporains nous ont permise de relever des centaines de mots absents de tous les dictionnaires, qui montrent la grande liberté de formation du lexique occitan.
II. Presentacion de l’occitan aranés
Occitan ena Val d’Aran: aranés
José Enrique Gargallo Gil
RESUMIT
Avèm aicí la version occitana (aranesa) d’un capítol publicat d’en primièr en japonés dins lo volum collectiu editat per Shoji Bando e Takehzu Asaka, que se pòt revirar coma La diversitat de las lengas en Espanha e Portugal (Tòquio: Dougahusha, 2005, pp. 183-201). Baila doncas paucas causas nòvas, coma se poiriá esperar d’un article de recèrca scientifica. A puslèu coma tòca de donar als legeires occidentals una idèa de la contribucion occitana (aranesa) a la diversitat lingüistica coma se presentèt, originalament, a de legeires de l’Empèri del Solelh Levant. Las dètz seccions tractan d’aspèctes plan generals de l’occitan de la Val d’Aran: son contèxt politicoadministratiu, lingüistic, geografic e istoric; los noms de la Val, sa lenga autoctòna e sa populacion; sa configuracion geografica e sas divisions administrativas; sa demografía; sas caracteristicas lingüisticas; son encastre legal; son estandardizacion; sa promocion oficiala; la coneissença e la practica de l’aranés dins la vida de la Val; lo contacte de lengas e lo multilingüisme.
Català
RESUM
Occità a la Vall d’Aran: aranès
José Enrique Gargallo Gil
Tenim ací la versió occitana (aranesa) d’un capítol publicat de primer en japonès en el volum col·lectiu editat per Shoji Bando i Takehzu Asaka, que pot traduir-se com La diversitat de les llengües a Espanya i Portugal (Tòquio: Dougahusha, 2005, pàg. 183-201). Dóna doncs poques coses noves, com es podria esperar d’un article de recerca científica. Més aviat té com a objectiu de donar als llegidors occidentals una idea de la contribució occitana (aranesa) a la diversitat lingüística com es presentà, originalment, a llegidors de l’Emperi del Sol Naixent. Les deu seccions tracten aspectes molt generals de l’occità de la Vall d’Aran: el seu context politicoadministratiu, lingüístic, geogràfic i històric; els noms de la Vall, la seva llengua autòctona i la seva població; la seva configuració geogràfica i les seves divisions administratives; la seva demografia; les seves característiques lingüístiques; el seu marc legal; la seva estandardització; la seva promoció oficial; el seu coneixement i la pràctica de l’aranès en la vida de la Vall; el contacte de llengües i el multilingüisme.
SUMMARY
Occitan in Aran Valley: Aranese
José Enrique Gargallo Gil
Here we have the Occitan version of an informative chapter first published in Japanese in the collective volume edited by Shoji Bando and Takehzu Asaka freely translateable as “The Diversity of Languages in Spain and Portugal” (Tokyo: Dougahusha, 2005, pp. 183-201). Therefore it contains little new, as might have been expected in a more scholarly article. Rather, it aims to give Western readers an idea of the Occitan (Aranese) contribution to linguistic diversity as it appeared originally to readers in the Land of the Rising Sun. The ten sections deal with very general aspects of the Occitan of the Valley of Aran: its politico-administrative, linguistic, geographical and historical context; its place-names (Aran), its indigenous language and people; its geographical configuration and administrative division; its demography; its linguistic features; its legal framework; its standardization; its official promotion; knowledge and use of Aranese in the life of the valley; language contact and multilingualism.
RÉSUMÉ
Occitan dans le Val d’Aran: aranais
José Enrique Gargallo Gil
Il s’agit de la version occitane (aranaise) d’un chapitre d’abord publié en japonais dins le volume collectif édité par Shoji Bando et Takehzu Asaka, qu’on peut traduire par La diversité des langues en Espagne et au Portugal (Tokyo: Dougahusha, 2005, pp. 183-201). Il apporte donc peu de nouveautés, comme on pourrait en attendre d’un article de recherche scientifique. Il a plutôt pour but de fournir aux lecteurs occidentaux une idée de la contribution occitane (aranaise) à la diversité linguistique, telle qu’elle s’est présentée à l’origine à des lecteurs de l’Empire du soleil levant. Les dix sections traitent d’aspects bien généraux de l’occitan du Val d’Aran : son contexte politico-administratif, linguistique, géographique et historique ; les noms du Val, sa langue autochtone et sa population; sa configuration géografique et ses divisions administratives; sa démographie; ses caractéristiques linguistiques ; son cadre légal; sa standardisation; sa promotion officielle; la connaissance et la pratique de l’aranais dans la vie du Val; le contact de langues et le multilinguisme.
III. Compte rendut
p. 69-76 : Review of Hervé Lieutard’s PhD thesis (Daniela MULLER, Universitat de Tolosa – lo Miralh and Ruprecht-Karls-Universität Heidelberg)