Cet enseignant est référent pour cette UE
S'il s'agit de l'enseignement principal d'un enseignant, le nom de celui-ci est indiqué en gras.
Jeudi de 13 h à 16 h (salle A06_51, 54 bd Raspail 75006 Paris), les 9 novembre, 7 décembre 2017, 11 janvier, 1er février, 8 mars, 5 avril, 3 mai et 7 juin 2018
Ce séminaire étudie les changements induits par les outils numériques dans les méthodes de penser, de produire et de représenter la recherche dans le domaine des études sur le Moyen Orient et l’Asie du Sud. D’abord, il envisage de réfléchir sur la définition, les contours et les contextes sociaux du nouveau domaine créé à l’intersection des études sur l’Asie et des humanités numériques : un domaine peu homogène qui regroupe des projets issus de différentes disciplines, ainsi que des réseaux d’institutions hétérogènes et de chercheurs basés dans différents pays asiatiques et occidentaux. Il s’interroge sur les spécificités des critères méthodologiques et conceptuels des humanités numériques ainsi que sur les continuités avec la recherche traditionnelle non numérique.
En parallèle, ce séminaire envisage de situer la production de ce type de savoirs dans son contexte politique, social et religieux ; il analyse les limites et les ambiguïtés de certains projets numériques ainsi que les formes de contrôle et de représentation identitaire associées à l’usage de ces outils. Plusieurs institutions de pays asiatiques ont lancé des projets (dont certains ambitieux) visant à numériser et à rendre accessibles différents types de sources, parmi lesquelles des bibliothèques et des départements institués dans ce but qui créent de nouveaux systèmes de contrôle sur les données et sur les sources primaires. Pourtant, les institutions scientifiques ne sont que l’un des acteurs : le phénomène de numérisation et de commercialisation de sources textuelles qui a eu lieu dans plusieurs pays du Moyen Orient, à partir des années 1990, a aussi été lié à des programmes d’institutions politiques et religieuses, ainsi qu’à la création d’entreprises commerciales spécialisées. Dans ce contexte, ce séminaire propose de réfléchir aux modalités selon lesquelles différentes institutions scientifiques, sociales et religieuses se sont emparées des outils numériques afin de contrôler une gamme de phénomènes incluant les définitions identitaires, la diffusion des idées et des doctrines, l’écriture de l’histoire, ainsi que l’appropriation et l’accessibilité aux sources primaires et aux données scientifiques.
Les séances du séminaire présenteront les principaux outils utilisés dans les études historiques, archéologiques, littéraires et sociales sur le Moyen Orient et l’Asie du Sud, à travers une réflexion sur l’histoire des projets numériques dans ce domaine, l’analyse de projets en cours, la lecture de textes et l’intervention de chercheurs et d’ingénieurs impliqués dans des projets de ce type.
Jeudi 9 novembre :
Jeudi 7 décembre :
Jeudi 11 janvier :
Jeudi 1er février :
Jeudi 8 mars :
Le traitement automatique des langues (TAL, ou NLP en anglais) a beaucoup progressé ces dernières années, autant du point de vue de la gamme des traitements disponibles que de la variété des langues analysables. De nombreux scientifiques de disciplines SHS l'utilisent aujourd'hui, en particulier les linguistes, mais aussi de plus en plus d'autres domaines dans lesquels les textes sont devenus données numériques qui sollicitent des traitements à la fois productifs et visant à l'objectivité. Parmi les langues pour lesquelles des avancées importantes ont été réalisées, l'arabe est un exemple prototypique, étant parlée par de vastes populations, mais présentant encore des difficultés, depuis son encodage, jusqu'à sa variabilité (dialectes), l'ambiguïté liée à son système d'écriture ou encore le peu d'outils disponibles pour son traitement. La présentation introduira rapidement dans les grandes lignes des outils TAL couramment sollicités en SHS, un panorama de ressources (logiciels et corpus) dédiées à l'arabe, et quelques travaux plus spécifiques, dont la translittération ou la détection et le traitement des dialectes.
Jeudi 5 avril :
Cette présentation soutient la thèse selon laquelle l’analyse des réseaux sociaux, en tant qu’ensemble des techniques d’analyse structurale utilisées en sociologie, peut transférer dans le champ d’étude des humanités numériques sa capacité de surmonter, au niveau méthodologique et dans le cadre d’un paradigme relationnel de la recherche sociale, le dilemme entre holisme et individualisme méthodologique, qui se présente aussi, dans une forme particulière, dans les discussions autour de l’histoire des humanités numériques. Considérant un espace physique comme un espace social, l’analyse des réseaux sociaux permet d’utiliser des outils spécifiques, qu’on trouve dans les domaines de l’archéologie et des humanités numériques – la référence est en particulier au SIG et au GPS – pour la réalisation de modèles d’analyse sociale d’un territoire. Dans cette présentation on traitera, tout d’abord, le sujet de la connexion entre humanités numériques et relations sociales, ainsi que celui des aspects fondamentaux de l’analyse des réseaux sociaux. Enfin, un exemple d’utilisation des coordonnés géographiques pour l’analyses des réseaux sociaux sera présenté : il s’agit du cas de l’oasis de Boukhara, de l’Antiquité à l’époque islamique.
Mon intervention porte sur le projet de numérisation porté par Arlo Griffiths (EFEO) et moi-même au sein de l’initiative de recherche « Scripta-PSL : Histoire et pratique de l’écrit ». Notre projet s’inscrit dans le cadre d’une « approche de corpus » focalisée sur le canon textuel de la religion çivaïte à Java et à Bali jusqu’au XVIe siècle. Prenant une perspective comparatiste et multidisciplinaire, impliquant notamment le recours aux sources Indiennes, le projet permettra l’étude de la canonisation du religieux devant l’arrière-plan plus vaste de phénomènes transrégionales et transculturels dans les domaines des langues, écritures, croyances religieuses et pratiques sociales, et de la matérialité des manuscrits. Le but du projet est la production d’une édition critique en ligne + traduction d’un texte sanskrit-vieux javanais, le Bhuvanakośa « La gaine des mondes », ainsi que la numérisation en format .txt et l’encodage en format TEI du corpus de textes en vieux javanais. Cette tâche aboutira à la création d’une base permanente de données en ligne permettant au public du monde entier de consulter et de rechercher des « e-texts » en vieux javanais ou en sanskrit et vieux javanais appartenant à plusieurs genres. Ma présentation soulignera l’importance de l’étude comparative du corpus textuel vieux javanais à l’aide des nouvelles technologies, ce qui permettra d’établir à la fois les relations entre les textes dans un contexte dominé par l’intertextualité et les lignes de transmission textuelle entre l’Inde et l’Indonésie à l’époque pre-moderne.
Jeudi 3 mai :
Le projet « Annotated Turki Manuscripts Online » est un programme international d’humanités numériques dont l’ambition est de proposer un modèle d’exploitation des manuscrits orientaux qui substitue à la traditionnelle édition critique une édition numérique. Les manuscrits en langue turki (ou chaghatay) de la Région autonome ouigour du Xinjiang, en Chine, reste largement inaccessibles pour deux raisons : ils sont écrits dans une langue rare et ne sont, pour la plupart, ni transcrits ni traduits ni numérisés. La meilleure collection actuellement accessible de ces documents est la Collection Gunnar Jarring de la Bibliothèque de l’Université de Lund en Suède. Le projet ATMO consiste à éditer des images, des transcriptions et des traductions de manuscrits qui soient disponibles en ligne ; pour un petit nombre de textes, nous présentons des numérisations annotées, dotées de commentaires d’ordre culturel, historique et codicologique. Outre la création d'une archive en ligne, libre d’accès, à partir de la numérisation des manuscrits turki, nous développons des interfaces de requête pour les matériaux. Enfin, ATMO va publier un web-manuel d’analyse des manuscrits turki avec annotations linguistiques.s
Le Dictionnaire encyclopédique des littératures de l’Inde (DELI) est un projet de recherche et d'humanités numériques collaboratif qui vise à réunir, développer et diffuser les savoirs sur les littératures d’Asie du Sud et dont le résultat sera la création du premier dictionnaire encyclopédique numérique en Open Access dans ce domaine, parallèlement à sa version imprimée (à paraître fin 2019). Pour favoriser une perspective globale, dynamique et multidisciplinaire des littératures du sous‑continent indien des origines à nos jours, de leur contexte de production en Inde et de réception en France, à travers divers supports, le projet DELI développe une perspective interdisciplinaire, translinguistique et diachronique encore rarement mise en œuvre, qui contribuera à rendre ce patrimoine littéraire exceptionnel plus accessible au public francophone et, à terme, international (traduction des contenus en anglais). La plate‑forme numérique accueillera différents types de documents (articles de spécialistes, bibliographies extensives, liens vers des bases de données, mais également documents audiovisuels inédits, manuscrits originaux numérisés) qui viendront enrichir les notices rédigées par une équipe de chercheurs renommés. Grâce aux outils numériques, elle permettra un usage inédit des contenus : mise en relation de ces contenus avec, par exemple, des adaptations d’une même œuvre dans différentes aires linguistiques ; recherche par aire linguistique et par période, par mots-clés, par espace géographique, par mouvement, etc. ; approche diachronique, mais également géographique, de l'histoire littéraire ; ancrage des littératures dans leur contexte politique, social et culturel, mais également leur circulation et leur diffusion.
Jeudi 7 juin :
Présentation d’un outil informatique élaboré ad hoc pour décrypter un corpus numériquement et formellement circonscrit : quelque deux cents monogrammes à lettres d’époque sassanide (225-651). Ces monogrammes, composés de lettres moyen-perses, peuvent être lus de façons multiples à cause de l’ambiguïté de plusieurs de ces lettres. Le nombre des combinaisons de ces lettres dépassant la capacité d’une gestion manuelle et intellectuelle, il semblait évident que seul un outil informatique pouvait gérer ce type de problème. L’objectif de cet exposé est de présenter le cheminement qui a mené de l’analyse des monogrammes à leur lecture en mettant en lumière comment une démarche intellectuelle n’aurait jamais pu aboutir sans une numérisation des données. Cette numérisation a donné lieu à un outil informatique, programmé en Java, qui permet le décryptage de monogrammes et qui permet la génération des solutions possibles.
L’épigraphie tamoule, forte de quelques dizaines de milliers de textes (environ 40 000) datant du Ve siècle avant J.-C.- à l’époque moderne, représente un corpus monumental qui semble être numériquement le plus important de toute l’Inde. Le projet pilote en cours est élaboré en collaboration entre l’UMR 7528-Mondes iranien et indien et la Tamil Virtual Academy, Chennai (Gouvernement du Tamil Nadu). Il concerne actuellement des textes datés entre les 4ème et 8ème siècles. Ce projet vise à rendre accessibles les textes épigraphiques tamouls comme source importante de recherche en sciences humaines. La base de données ainsi que le moteur de recherche seront disponibles gratuitement (free software) selon les principes de Licence publique générale (GNU).
Cette base de données comprend quatre volets : 1. Information générale, 2. Estampage, 3. Source (présente le texte en tamoul, en translittération et la traduction) et 4) Analyse grammaticale et lexicale. L’objectif étant de préciser autant que possible l’analyse et l’interprétation des textes épigraphiques tamouls, il a fallu développer une base de données appropriée et un outil d’analyse grammaticale et lexicale. Ce projet de base de données s’appuie sur notre expérience de plus de deux décennies d’enseignement d’épigraphie tamoule et tente de répondre à de nombreuses questions relatives à l’interprétation des textes épigraphiques tamouls.
Mots-clés : Archéologie, Archives, Histoire, Humanités numériques, Islam, Littérature, Sociologie,
Aires culturelles : Asie centrale, Asie méridionale, Inde, Iranien (monde), Musulmans (mondes),
Suivi et validation pour le master : Mensuel annuel/bimensuel semestriel (8x3 h = 24 h = 6 ECTS)
Intitulés généraux :
Renseignements :
Fabrizio Speziale, CEIAS, 54 bd Raspail 75006 Paris.
Adresse(s) électronique(s) de contact : fabrizio.speziale(at)ehess.fr
Ce séminaire a étudié les changements induits par les outils numériques dans les méthodes de penser, de produire et de représenter la recherche dans le domaine des études sur le Moyen-Orient et l’Asie du Sud. En parallèle, ce séminaire a eu pour objectif de situer la production de ce type de savoirs dans son contexte politique, social et religieux ; il a analysé les limites et les ambiguïtés de certains projets numériques ainsi que les formes de contrôle et de représentation identitaire associées à l’usage de ces outils. Les séances du séminaire ont présenté les principaux outils utilisés dans les études historiques, archéologiques, littéraires et sociales sur le Moyen Orient et l’Asie du Sud. L’intervention de Pascal Butterlin (Université Paris 1 Panthéon-Sorbonne) a présenté le cas de la ville de Mari (Syrie) et le rôle des humanités numériques dans la crise syrienne. Rocco Rante (Musée du Louvre, Paris) a abordé la question des humanités numériques en archéologie et de l’utilisation du SIG (Système d’Information Géographique) dans les fouilles archéologiques dans l’oasis de Boukhara (Ouzbékistan). Fabrizio Speziale a abordé la question de l’utilisation des humanités numériques dans l’analyse quantitative et qualitative des corpus de textes et de traductions persans. Gérard Huet (Institut national de recherche en informatique et en automatique, INRIA, Paris) a présenté le projet « Sanskrit Heritage Platform » consacré à l’analyse de la langue sanskrite. Christelle Jullien (CNRS, Mondes iranien et indien) et Poupak Rafii Nejad (CNRS, Mondes iranien et indien) ont présenté le projet « Ctesiphon », une base de données transdisciplinaire sur le règne du roi iranien Husraw Ier (531-579). Damien Nouvel (INaLCO, ERTIM) a présenté une intervention portant sur les logiciels pour analyser les corpus de textes en langue arabe. Giulia Battaglia (EHESS, IIAC/LAIOS) a analysé la question du numérique dans les industries culturelles d’État et du cinéma documentaire en Inde. Le sociologue Luigi Tronca (Université de Vérone) a présenté une intervention portant sur l’analyse des réseaux sociaux appliquée à l’archéologie. Alexandre Papas (CNRS, CETOBaC) a présenté le projet ATMO (Annotated Turki Manuscripts from the Jarring Collection Online) qui propose un modèle d’exploitation des manuscrits orientaux qui substitue à la traditionnelle édition critique une édition numérique. Rika Gyselen (CNRS - Mondes iranien et indien) et Youssef Monsef (Groupe pour l’Étude de la Civilisation du Moyen-Orient) ont présenté un outil informatique pour décrypter les monogrammes à lettres d’époque sassanide (225-651). Appasamy Murugaiyan (EPHE – Mondes iranien et indien) a présenté une base de données grammaticale et lexicale consacrée à l’étude de l’épigraphie tamoule, réalisée en collaboration avec la Tamil Virtual Academy de Chennai (Gouvernement du Tamil Nadu).
Dernière modification de cette fiche par le service des enseignements (sg12@ehess.fr) : 11 mai 2018.