Logo EHESS

baobab
Base de données des enseignements et séminaires de l'EHESS

La recherche sur le Moyen Orient et l’Asie du Sud au tournant numérique : modèles, défis et ambiguïtés

  • Rocco Rante, archéologue, Musée du Louvre, Paris ( Hors EHESS )
  • Fabrizio Speziale, directeur d'études de l'EHESS (TH) ( CEIAS )

    Cet enseignant est référent pour cette UE

S'il s'agit de l'enseignement principal d'un enseignant, le nom de celui-ci est indiqué en gras.

Jeudi de 13 h à 16 h (salle A06_51, 54 bd Raspail 75006 Paris), les 9 novembre, 7 décembre 2017, 11 janvier, 1er février, 8 mars, 5 avril, 3 mai et 7 juin 2018

Ce séminaire étudie les changements induits par les outils numériques dans les méthodes de penser, de produire et de représenter la recherche dans le domaine des études sur le Moyen Orient et l’Asie du Sud. D’abord, il envisage de réfléchir sur la définition, les contours et les contextes sociaux du nouveau domaine créé à l’intersection des études sur l’Asie et des humanités numériques : un domaine peu homogène qui regroupe des projets issus de différentes disciplines, ainsi que des réseaux d’institutions hétérogènes et de chercheurs basés dans différents pays asiatiques et occidentaux. Il s’interroge sur les spécificités des critères méthodologiques et conceptuels des humanités numériques ainsi que sur les continuités avec la recherche traditionnelle non numérique.

En parallèle, ce séminaire envisage de situer la production de ce type de savoirs dans son contexte politique, social et religieux ; il analyse les limites et les ambiguïtés de certains projets numériques ainsi que les formes de contrôle et de représentation identitaire associées à l’usage de ces outils. Plusieurs institutions de pays asiatiques ont lancé des projets (dont certains ambitieux) visant à numériser et à rendre accessibles différents types de sources, parmi lesquelles des bibliothèques et des départements institués dans ce but qui créent de nouveaux systèmes de contrôle sur les données et sur les sources primaires. Pourtant, les institutions scientifiques ne sont que l’un des acteurs : le phénomène de numérisation et de commercialisation de sources textuelles qui a eu lieu dans plusieurs pays du Moyen Orient, à partir des années 1990, a aussi été lié à des programmes d’institutions politiques et religieuses, ainsi qu’à la création d’entreprises commerciales spécialisées. Dans ce contexte, ce séminaire propose de réfléchir aux modalités selon lesquelles différentes institutions scientifiques, sociales et religieuses se sont emparées des outils numériques afin de contrôler une gamme de phénomènes incluant les définitions identitaires, la diffusion des idées et des doctrines, l’écriture de l’histoire, ainsi que l’appropriation et l’accessibilité aux sources primaires et aux données scientifiques.

Les séances du séminaire présenteront les principaux outils utilisés dans les études historiques, archéologiques, littéraires et sociales sur le Moyen Orient et l’Asie du Sud, à travers une réflexion sur l’histoire des projets numériques dans ce domaine, l’analyse de projets en cours, la lecture de textes et l’intervention de chercheurs et d’ingénieurs impliqués dans des projets de ce type.

Jeudi 9 novembre :

  • Introduction du séminaire
  • Pascal Butterlin (Université Paris 1 Panthéon-Sorbonne), « Mari, la crise syrienne et les humanités numériques, quelques réflexions »

Jeudi 7 décembre :

  • Rocco Rante (Musée du Louvre, Paris), « L’archéologie et les humanités numériques, l’exemple du SIG »
    Comment les humanités numériques interviennent aujourd’hui dans l’univers des études en sciences humaines ? Sur quoi se base ce nouvel approche ? De quelle manière l’archéologie s’approprie de ces outils ? Quels sont, enfin, les espoirs qui reposent sur cette « nouvelles » dynamique ? Quels sont les résultats qui peuvent être observés ?
    Nous essaierons de répondre à ces questions partant d’un cas particulier : les recherches archéologiques dans l’oasis de Boukhara. Pour sa situation géographique, son histoire et surtout par les résultats obtenus pendant la fouille archéologique, ce programme de recherche offre un exemple spécifique montrant l’utilité de l’approche numérique à ce type de recherche. L’utilisation du SIG (Système d’Information Géographique) est le support principal à cette approche à la recherche qui ne pourrait plus être abordée aujourd’hui à travers des pratiques traditionnelles.
  • Fabrizio Speziale (EHESS, CEIAS), « Digital Humanities and Indo-Persian Studies: Perso-Indica »
    Perso-Indica is a long-term project whose aim is to produce a comprehensive survey of Persian works on Indian cultures written in South Asia and the surrounding world between the 12th and the 19th centuries. This project aims at offering a new vision of the history of contacts between Muslim culture and non-Muslim scholarly traditions. The research has been developed from the hypothesis that the production of Persian texts on Indian culture constituted one of the greatest transfers of knowledge to have occurred between different Asian cultures.
    To test this hypothesis, the project adopted a new approach to the study of Persian sources by the creation of Perso-Indica, an online academic publication, based on an electronic survey of Persian sources on Indian learning. This approach enables methods of quantitative analyses of Persian text corpora through the creation of tools for processing textual and prosopographic metadata that produce dynamic indexes of the main entities, contexts and forms of expression. The analytical tools of the online survey - dynamic indexes, graphs and maps - apply an abstract model to the study of the corpus of texts. The model is based on the selection of a group of key entities and features related to the corpus, and enables the cross-referencing, comparison and representation in different forms (graphs, maps) of the range and the evolution of the different entities (sources, authors/translators, contexts, etc.) associated with translation over time.

Jeudi 11 janvier :

  • Gérard Huet (Institut national de recherche en informatique et en automatique, INRIA, Paris), « The Sanskrit Heritage Platform »
    The Sanskrit Heritage Platform (http://sanskrit.inria.fr) offers a number of Web services meant for the assisted processing of classical Sanskrit texts. Its main component is a Sanskrit Reader, that may be used for segmentation and tagging of text at the level of sentences. A graphical user interface allows the user to quickly select the intended segmented text (padapāṭha) over a possibly enormous number of solutions. The segments may be presented as morphological lemmas in a two-level system, accounting for derivative morphology as well as surface inflexion, for nominals as well as verbal forms. They index a choice of lexicons, namely the Heritage Sanskrit to French dictionary and the Monier-Williams Sanskrit to English dictionary. Various sub-services are provided, such as a declension/conjugation tool, and its inverse lemmatizer. A new experimental Corpus Manager allows a community of annotators to develop analysed corpus in a way similar to the Perseus site for Latin and Greek texts, using the Git distribution system for crowd sourcing.
    These tools link with an experimental Sanskrit parser by Pr. Amba Kulkarni at University of Hyderabad, in order to offer dependency parsing (kāraka analysis), up to generation of the dependency graph of the sentence. It is also possible to access the Heritage Reader from the Sanskrit Library digital corpus developed by Peter Scharf. The talk will consist of a demonstration of the various services on typical situations, and of a discussion of its design rationale, its relationship with Paninian methods, and its current short- comings.
  • Christelle Jullien (CNRS, Mondes iranien et indien) - Poupak Rafii Nejad (CNRS, Mondes iranien et indien), « Ctesiphon : Une base de données transdisciplinaire sur le règne du perse Husraw Ier (531-579) ».
    Le programme transdisciplinaire ANR Ctesiphon est un projet de recherche fondamentale qui s’est développé sur une période de 34 mois, depuis janvier 2013 jusqu’au 1er novembre 2015. Ctesiphon est un acronyme pour « Corpus de Textes et de Sources sur l’Iran : Pour une Histoire de l’Orient au VIe siècle ». L’un des enjeux était de réunir de nouvelles données sur le règne du roi perse sassanide Husraw Ier (531-579), qui fut l’un des plus brillants de la dynastie, en mettant en relation, par des perspectives croisées, des sources archéologiques et littéraires inédites ou peu accessibles rassemblées pour la première fois. Pour reconstruire ce règne, et en vue de l’élaboration d’une nouvelle histoire de cette période, ce projet rend donc accessibles 6 corpus différents, en interférence, grâce à la coopération d’une équipe pluridisciplinaire spécialisée. L’un des objectifs était aussi de sauvegarder un patrimoine sigillographique de presque 1 000 sceaux. Le travail de constitution de chaque corpus et d’analyse des matériaux a sous-tendu l’élaboration d’une base de données qui met en synergie des informations interdisciplinaires sur le VIe siècle en Orient.
    Outre l’aspect scientifique du projet et sa finalité, la réalisation de l’outil de recherche a permis un autre type de réflexion et d’ingénierie sur l’articulation entre les données de recherche de natures différentes et le besoin de la mise en place des procédés adéquats du recueil, du traitement et de la structuration de ces données en vue de leur mise en relation. Le principe de cette base de données en libre accès est de centraliser et de mettre en synergie un maximum d’informations sur cette période, en rendant également possible le croisement de plusieurs types de sources d’origine et de nature très variées, de langues différentes, relevant de champs diversifiés (sigillographie, numismatique, informations fournies par les bulles, documentation littéraire en moyen-perse, en syriaque, en grec et en persan) ; leur association nourrit des résultats restés jusqu’ici cloisonnés. Tous les corpus sont reliés entre eux grâce à une sorte de « thesaurus » permettant l’interrogeabilité et l’exploitation des données communes à travers la base de données et via un moteur de recherche multi-critères et multi-lingues sur des thématiques prédéfinies par les acteurs scientifiques du projet : toponymes avec des sous-catégories sectorialisées, patronymes, fonctions administratives et religieuses. Techniquement, ce thesaurus permet de définir les points de connexion item par item entre les différentes bases grâce à un moteur de recherche.

Jeudi 1er février :

  • Alastair Northedge (Université Paris 1 Panthéon-Sorbonne), « Méthodes de prospection à Samarra (Irak) »
    Samarra (836-892 apr. J-C) est un site archéologique inhabituel, étant le plus grand site du monde qui a conservé son plan urbain et même détaillé (58 km²). On n’oublie pas non plus les difficultés provoquées par la situation politique de l’Iraq, qui a influé les méthodes employées. Commençant par les photos aériennes il y a 30 ans, la logique a évolué pour comprendre plusieurs spectres de données, dont chacun a été relevé. Même si tout n’est pas pertinent aux humanités numériques, on a pu publier le relevé des données textuelles, ainsi que cartographiques. La publication de la céramique de surface, qui donne une toute autre vision de l’occupation, viendra d’ici peu, ainsi que l’analyse urbanistique et architectural.
  • Thomas Sagory (Musée Saint Germain-en-Laye) « Cerf-volant, appareil photo et algorithmes​ : les relevés aériens au service de la modélisation 3D des sites archéologiques »
    Si, dans l’imagerie populaire, la truelle et le pinceau figurent parmi les outils incontournables de l’archéologue, que trouve-t-on vraiment dans la besace d’un archéologue du début du XXIe siècle ? Un cerf-volant, une canne à pêche, une gopro et quelques appareils photos équipés d’intervallomètres, un fil à plomb, un mètre, une tablette, un carnet et quelques crayons, sans oublier, au bureau, un ordinateur puissant qui traitent les données en continue via des algorithmes complexes.
    Sommes-nous entrés, sans nous en rendre compte, dans l’ère de la Digital Archaeology ? Les outils numériques sont-il en train de révolutionner le travail de terrain ou bien s’agit-il d’une simple évolution des usages et des métiers ? Nous tenterons de fournir quelques éléments de réflexion en nous appuyant sur différentes études de cas et expérience de terrain.

Jeudi 8 mars :

  • Damien Nouvel (INALCO, ERTIM) « Outils logiciels et problématiques de recherche pour analyser des corpus de textes en langue arabe » 

Le traitement automatique des langues (TAL, ou NLP en anglais) a beaucoup progressé ces dernières années, autant du point de vue de la gamme des traitements disponibles que de la variété des langues analysables. De nombreux scientifiques de disciplines SHS l'utilisent aujourd'hui, en particulier les linguistes, mais aussi de plus en plus d'autres domaines dans lesquels les textes sont devenus données numériques qui sollicitent des traitements à la fois productifs et visant à l'objectivité. Parmi les langues pour lesquelles des avancées importantes ont été réalisées, l'arabe est un exemple prototypique, étant parlée par de vastes populations, mais présentant encore des difficultés, depuis son encodage, jusqu'à sa variabilité (dialectes), l'ambiguïté liée à son système d'écriture ou encore le peu d'outils disponibles pour son traitement. La présentation introduira rapidement dans les grandes lignes des outils TAL couramment sollicités en SHS, un panorama de ressources (logiciels et corpus) dédiées à l'arabe, et quelques travaux plus spécifiques, dont la translittération ou la détection et le traitement des dialectes.

  • Giulia Battaglia (EHESS, IIAC/LAIOS) « Le numérique autour des industries culturelles d’état et du cinéma documentaire en Inde »
Cette présentation vise à mettre en valeur le potentiel et la limite des technologies numériques dans les industries culturelles indiennes et, plus spécifiquement, dans l’industrie et les pratiques du cinéma documentaire. En mettant l’accent sur les productions cinématographiques d’état (de la Films Division de Mumbai et de l’Anthropological Survery of India de Kolkata) et sur la numérisation des images d’archives de ces institutions, on reflètera sur la limite de la ‘préservation’ par le numérique et, par conséquence, sur les nouvelles problématiques de catégorisation d’images que le numérique pose aux institutions d’état.
En outre, on discutera des similitudes et des différences que le cinéma documentaire indien a déjà vécu pendant le tournant vidéo des années 1980s et des nouvelles possibilités que le numérique offre aujourd’hui pour créer des liens entre les industries culturelles.

Jeudi 5 avril :

  • Luigi Tronca (Université de Vérone), « Humanités numériques et relations sociales : un défi pour l’analyse des réseaux sociaux appliquée à l'archéologie »

Cette présentation soutient la thèse selon laquelle l’analyse des réseaux sociaux, en tant qu’ensemble des techniques d’analyse structurale utilisées en sociologie, peut transférer dans le champ d’étude des humanités numériques sa capacité de surmonter, au niveau méthodologique et dans le cadre d’un paradigme relationnel de la recherche sociale, le dilemme entre holisme et individualisme méthodologique, qui se présente aussi, dans une forme particulière, dans les discussions autour de l’histoire des humanités numériques. Considérant un espace physique comme un espace social, l’analyse des réseaux sociaux permet d’utiliser des outils spécifiques, qu’on trouve dans les domaines de l’archéologie et des humanités numériques – la référence est en particulier au SIG et au GPS – pour la réalisation de modèles d’analyse sociale d’un territoire. Dans cette présentation on traitera, tout d’abord, le sujet de la connexion entre humanités numériques et relations sociales, ainsi que celui des aspects fondamentaux de l’analyse des réseaux sociaux. Enfin, un exemple d’utilisation des coordonnés géographiques pour l’analyses des réseaux sociaux sera présenté : il s’agit du cas de l’oasis de Boukhara, de l’Antiquité à l’époque islamique.

  • Andrea Acri (EPHE, Mondes iranien et indien), « Numerisation du corpus textuel en vieux javanais et sanskrit de Java et Bali »

Mon intervention porte sur le projet de numérisation porté par Arlo Griffiths (EFEO) et moi-même au sein de l’initiative de recherche « Scripta-PSL : Histoire et pratique de l’écrit ». Notre projet s’inscrit dans le cadre d’une « approche de corpus » focalisée sur le canon textuel de la religion çivaïte à Java et à Bali jusqu’au XVIe siècle. Prenant une perspective comparatiste et multidisciplinaire, impliquant notamment le recours aux sources Indiennes, le projet permettra l’étude de la canonisation du religieux devant l’arrière-plan plus vaste de phénomènes transrégionales et transculturels dans les domaines des langues, écritures, croyances religieuses et pratiques sociales, et de la matérialité des manuscrits. Le but du projet est la production d’une édition critique en ligne + traduction d’un texte sanskrit-vieux javanais, le Bhuvanakośa « La gaine des mondes », ainsi que la numérisation en format .txt et l’encodage en format TEI du corpus de textes en vieux javanais. Cette tâche aboutira à la création d’une base permanente de données en ligne permettant au public du monde entier de consulter et de rechercher des « e-texts » en vieux javanais ou en sanskrit et vieux javanais appartenant à plusieurs genres. Ma présentation soulignera l’importance de l’étude comparative du corpus textuel vieux javanais à l’aide des nouvelles technologies, ce qui permettra d’établir à la fois les relations entre les textes dans un contexte dominé par l’intertextualité et les lignes de transmission textuelle entre l’Inde et l’Indonésie à l’époque pre-moderne.

Jeudi 3 mai :

  • Alexandre Papas (CNRS, CETOBAC), « Présentation du projet international ATMO (Annotated Turki Manuscripts from the Jarring Collection Online) »

Le projet « Annotated Turki Manuscripts Online » est un programme international d’humanités numériques dont l’ambition est de proposer un modèle d’exploitation des manuscrits orientaux qui substitue à la traditionnelle édition critique une édition numérique. Les manuscrits en langue turki (ou chaghatay) de la Région autonome ouigour du Xinjiang, en Chine, reste largement inaccessibles pour deux raisons : ils sont écrits dans une langue rare et ne sont, pour la plupart, ni transcrits ni traduits ni numérisés. La meilleure collection actuellement accessible de ces documents est la Collection Gunnar Jarring de la Bibliothèque de l’Université de Lund en Suède. Le projet ATMO consiste à éditer des images, des transcriptions et des traductions de manuscrits qui soient disponibles en ligne ; pour un petit nombre de textes, nous présentons des numérisations annotées, dotées de commentaires d’ordre culturel, historique et codicologique. Outre la création d'une archive en ligne, libre d’accès, à partir de la numérisation des manuscrits turki, nous développons des interfaces de requête pour les matériaux. Enfin, ATMO va publier un web-manuel d’analyse des manuscrits turki avec annotations linguistiques.s

  • Anne Castaing (CNRS, CEIAS) - Claudine Le Blanc (Université Sorbonne nouvelle – Paris 3) - Ingrid Le Gargasson (Université Sorbonne Nouvelle - MII - CREM), « Littératures d’Asie du Sud et humanités numériques : le projet DELI de Dictionnaire encyclopédique des littératures de l’Inde »

Le Dictionnaire encyclopédique des littératures de l’Inde (DELI) est un projet de recherche et d'humanités numériques collaboratif qui vise à réunir, développer et diffuser les savoirs sur les littératures d’Asie du Sud et dont le résultat sera la création du premier dictionnaire encyclopédique numérique en Open Access dans ce domaine, parallèlement à sa version imprimée (à paraître fin 2019). Pour favoriser une perspective globale, dynamique et multidisciplinaire des littératures du sous‑continent indien des origines à nos jours, de leur contexte de production en Inde et de réception en France, à travers divers supports, le projet DELI développe une perspective interdisciplinaire, translinguistique et diachronique encore rarement mise en œuvre, qui contribuera à rendre ce patrimoine littéraire exceptionnel plus accessible au public francophone et, à terme, international (traduction des contenus en anglais). La plate‑forme numérique accueillera différents types de documents (articles de spécialistes, bibliographies extensives, liens vers des bases de données, mais également documents audiovisuels inédits, manuscrits originaux numérisés) qui viendront enrichir les notices rédigées par une équipe de chercheurs renommés. Grâce aux outils numériques, elle permettra un usage inédit des contenus : mise en relation de ces contenus avec, par exemple, des adaptations d’une même œuvre dans différentes aires linguistiques ;  recherche par aire linguistique et par période, par mots-clés, par espace géographique, par mouvement, etc. ; approche diachronique, mais également géographique, de l'histoire littéraire ; ancrage des littératures dans leur contexte politique, social et culturel, mais également leur circulation et leur diffusion. 

Jeudi 7 juin : 

  • Rika Gyselen (CNRS - Mondes iranien et indien) - Youssef Monsef (Groupe pour l'Étude de la Civilisation du Moyen-Orient) « Outil informatique pour le décryptage de monogrammes “à lettres” sassanides »

Présentation d’un outil informatique élaboré ad hoc pour décrypter un corpus numériquement et formellement circonscrit : quelque deux cents monogrammes à lettres d’époque sassanide (225-651). Ces monogrammes, composés de lettres moyen-perses, peuvent être lus de façons multiples à cause de l’ambiguïté de plusieurs de ces lettres. Le nombre des combinaisons de ces lettres dépassant la capacité d’une gestion manuelle et intellectuelle, il semblait évident que seul un outil informatique pouvait gérer ce type de problème. L’objectif de cet exposé est de présenter le cheminement qui a mené de l’analyse des monogrammes à leur lecture en mettant en lumière comment une démarche intellectuelle n’aurait jamais pu aboutir sans une numérisation des données. Cette numérisation a donné lieu à un outil informatique, programmé en Java, qui permet le décryptage de monogrammes et qui permet la génération des solutions possibles.

  • Appasamy Murugaiyan (EPHE - Mondes iranien et indien) « Base de données grammaticale et lexicale de l'épigraphie tamoul : objectifs et finalités »

L’épigraphie tamoule, forte de quelques dizaines de milliers de textes (environ 40 000) datant du Ve siècle avant J.-C.- à l’époque moderne, représente un corpus monumental qui semble être numériquement le plus important de toute l’Inde. Le projet pilote en cours est élaboré en collaboration entre l’UMR 7528-Mondes iranien et indien et la Tamil Virtual Academy, Chennai (Gouvernement du Tamil Nadu). Il concerne actuellement des textes datés entre les 4ème et 8ème siècles. Ce projet vise à rendre accessibles les textes épigraphiques tamouls comme source importante de recherche en sciences humaines. La base de données ainsi que le moteur de recherche seront disponibles gratuitement (free software) selon les principes de Licence publique générale (GNU).

Cette base de données comprend quatre volets : 1. Information générale, 2. Estampage, 3. Source (présente le texte en tamoul, en translittération et la traduction) et 4) Analyse grammaticale et lexicale. L’objectif étant de préciser autant que possible l’analyse et l’interprétation des textes épigraphiques tamouls, il a fallu développer une base de données appropriée et un outil d’analyse grammaticale et lexicale. Ce projet de base de données s’appuie sur notre expérience de plus de deux décennies d’enseignement d’épigraphie tamoule et tente de répondre à de nombreuses questions relatives à l’interprétation des textes épigraphiques tamouls.

Suivi et validation pour le master : Mensuel annuel/bimensuel semestriel (8x3 h = 24 h = 6 ECTS)

Mentions & spécialités :

Intitulés généraux :

  • Fabrizio Speziale- Asie du Sud et culture persane (XVIe-XXe siècle). Productions savantes, traductions, interactions
  • Renseignements :

    Fabrizio Speziale, CEIAS, 54 bd Raspail 75006 Paris.

    Adresse(s) électronique(s) de contact : fabrizio.speziale(at)ehess.fr

    Dernière modification de cette fiche par le service des enseignements (sg12@ehess.fr) : 11 mai 2018.

    Contact : service des enseignements ✉ sg12@ehess.fr ☎ 01 49 54 23 17 ou 01 49 54 23 28
    Réalisation : Direction des Systèmes d'Information
    [Accès réservé]