< Accueil..

L'atelier des Sources aux Données pour les Humanités Numériques

Mots-Clés : humanités numériques, représentation de connaissances, raisonnement, analyse, graphe de connaissances, archives.

Porteur.euse.s :

Présentation et activités

Contexte et positionnement scientifique

Les humanités numériques constituent un domaine à l’interface des arts, lettres, sciences humaines et sociales et des sciences du numérique. La finalité des approches proposées est de mettre en place des solutions opérationnelles offertes par les sciences du numérique pour soutenir et amplifier l’exploitation des données produites et manipulées dans les domaines relevant des humanités. La richesse des humanités numériques naît précisément de la forte interdisciplinarité que ce domaine implique. Là où les sciences du numérique permettent de nouvelles perspectives aux pratiques des sciences humaines, ces dernières constituent un champ applicatif venant mettre en lumière les limites des approches et modèles utilisés couramment en sciences du numérique, notamment pour ce qui est de la gestion et la représentation des incertitude et des imprécisions inhérentes à des disciplines comme l’Histoire ou la Sociologie. Dans le cadre de cet atelier, nous proposons de nous intéresser à trois axes qu’il est nécessaire de prendre en compte lorsqu’il s’agit de représenter et d’analyser des données en Humanités Numériques.

Le premier axe est lié à la nature des données. Les données issues des humanités peuvent en effet relever de dimensions :

Le deuxième axe est le lien fort qu’il existe entre la donnée et la source dont elle est extraite. Sans connaissance et accès à ce lien, la donnée est inexploitable par les experts en humanités. Manipuler des données en Humanités Numériques implique donc d’être en mesure de prendre en compte le contexte associé à la donnée elle-même mais également le contexte associé à la source. Ces contextes sont particulièrement complexes à capturer car les sources manipulées sont souvent peu structurées, potentiellement anciennes et donc difficilement transcriptibles et la donnée extraite relève d’une interprétation de l’expert. Pour cet axe, il s’agira donc d’identifier les approches existantes et les verrous restant à lever pour prendre en compte ce rapport de la donnée à la source en humanités.

Le troisième axe concerne l’analyse des données qu’il est possible de faire une fois les données et les sources représentées. Nous souhaitons ainsi identifier les approches allant au-delà de la production et du partage de données et qui mettent en évidence l’analyse de comportements et de pratiques dont les données sont des marqueurs. Ces approches soutiennent des études critiques des sources.

En suivant ces trois axes, l’atelier aura pour objectif de s’adresser aux domaines scientifiques en lien avec les humanités numériques au sens large comme par exemple l’Informatique, les Mathématiques Appliquées, la Géomatique, l’Histoire, l’Histoire de l’art, la Géographie, l’Archéologie, la Sociologie, la Littérature, l’Economie et la Démographie. Les défis sociétaux adressés concernent l’exploitation des sources muséales, archivistiques, etc., en cherchant à proposer des approches pour structurer les données, les informations et les connaissances qu’elles contiennent à des fins d’accès, de réutilisation et d’analyses.

Dans le cadre de MADICS, l’atelier reprendra une partie des thématiques abordées par l’action ROCED en se concentrant sur les spécificités liées aux humanités numériques qui ont notamment été mises en évidence lors de la dernière journée organisée par ROCED durant le symposium MADICS 2023. L’atelier aura un lien étroit avec le GDR CNRS MAGIS via son action de recherche Graphes de connaissances géohistoriques.

Objectifs de l’atelier

L’atelier a pour objectif de mettre en relation les chercheurs en ALL-SHS et en sciences du numérique en organisant des journées sur les 3 axes proposés. Des appels à contributions ouverts ainsi que des invitations ciblées seront proposés par les porteurs de l’atelier de façon à susciter des échanges riches sur ces thèmes. Au-delà des chercheurs travaillant sur ces thématiques, les centres de production et d’exploitation de données que sont les archives (nationale, départementales), la BnF, les bibliothèques et l’IGN seront directement sollicités pour participer à ces évènements ainsi que les opérateurs de plateformes dédiées aux Humanités tels que Huma-Num.

Nous avons également pour but de produire une première cartographie des laboratoires travaillant sur les thématiques ciblées ainsi que des jeux de données et plus particulièrement des graphes de connaissances produits ou manipulés par les chercheurs français. Elle sera publiée sur le site Web de l’atelier. L’objectif de cette cartographie est d’une part de favoriser les collaborations et d’autre part de faire naître des interactions entre chercheurs en sciences du numérique et en humanités. La mise à disposition de jeux de données caractérisés permettra d’évaluer et de comparer des approches existantes et de susciter la proposition de nouvelles répondant à des problématiques ouvertes.

Activités de l’atelier au cours de l’année 2024

Session thématique du Symposium MADICS

Cette session thématique “des Sources aux Données en Humanités Numériques” vise à présenter un éventail des défis ouverts en science des données pour l’extraction et la représentation des données et l’analyse critique des sources en humanités numériques.

Informations pratiques

Date: 29 mai 2024, de 13h30 à 15h30

Lieu: 6ème symposium du GdR MADICS, IUT de Blois, site Jean Jaurès.

Programme

14h30 Présentation de l’atelier et retour sur la journée AFIA-MADICS-MAGIS Humanités Numériques & IA

14h45 Présentation de Cyrille Suire (L3i): Humanités numériques au L3i : exploration et convergence interdisciplinaire

15h15 Présentation de Maxime Morge (CRIStAL): Modélisation informatique et analyse empirique de processus sociaux au sein des communautés numériques. Le cas de R et Pandas sur la plateforme Stack Overflow.

15h45 Présentation de Yannis Addi (Archives Henri Poincaré, Nancy): Intégrer et modéliser des connaissances : python comme outil du web sémantique

15h45 Conclusions

16h00 Fin de la session

Journée Humanités Numériques et Intelligence Artificielle

Motivation et objectifs de la journée

Le vocable humanités numériques s’est aujourd’hui imposé pour désigner les travaux de recherche relevant tantôt de la création, la gestion et la mise en œuvre de jeux de données numériques dans les domaines des sciences humaines et sociales, de la modélisation et la formalisation de processus sociaux à l’aide d’outils mathématiques et informatiques, ou de l’analyse des usages et des communautés numériques du point de vue des sciences humaines et sociales [1]. Si ces trois domaines mobilisent des communautés scientifiques potentiellement différentes, tous posent de véritables défis scientifiques aux approches développées dans le domaine de l’intelligence artificielle, qu’il s’agisse d’analyse automatique de documents anciens, de traitement automatique du langage naturel, de recherche d’informations, de représentation de connaissances, de classification, de simulation, etc.

La journée “Intelligence Artificielle et Humanités Numériques” est organisée sous l’égide de l’Association Française pour l’Intelligence Artificielle, et des GdR CNRS MADICS et MAGIS. Elle sera accueillie le 3 mai 2024, par le Datalab de la Bibliothèque nationale de France. Elle vise à rassembler les chercheurs en Intelligence Artificielle, Humanités Numériques et Sciences Humaines et Sociales autour de présentations sur les enjeux et les défis de la mise en œuvre de l’IA dans les Humanités Numériques.

[1] Camille Roth. Digital, digitized, and numerical humanities. Digital Scholarship in the Humanities, 2019, 34 (3), pp.616-632.

Appel à contributions

Les propositions de communications sont à envoyer par email à sebastien.poublanc{at}univ-tlse2.fr avant le lundi 1er avril 2024, sous la forme d’un titre et d’un résumé de 300 mots maximum. Les propositions retenues feront l’objet d’une présentation de 20 minutes.

Nous encourageons les propositions de communications sur des travaux, originaux ou déjà publiés, ayant une portée théorique, méthodologique ou pratique, sur l’un des thèmes listés ci-dessous (liste non exhaustive):

Informations pratiques

Dates importantes:

Date limite pour l’envoi des résumés: 1er avril 2024

Réponse aux auteurs: 8 avril 2024

Date de la journée: 3 mai 2024

Lieu:

Bibliothèque nationale de France, Site François Mitterrand (salle 70, à coté du Petit Auditorium), Quai François Mauriac, 75006 Paris.

Programme

9:00 - 9:15: Accueil - Café

9:15 - 9:55: Introduction de la journée

Fatiha SAIS (AFIA), Nathalie HERNANDEZ (MADICS) et par Nathalie ABADIE (MAGIS), Mots d’accueil de l’AFIA et des GdR .

Tiphaine Vacqué (adjointe à la directrice des services et des réseaux et responsable de la Cellule IA de la BnF), La feuille de route et les projets IA de la BnF.

Catherine Eloi (Datalab, BnF), Le DataLab comme lieu d’expérimentations et d’accueil des chercheurs qui souhaitent faire des traitements IA sur les collections de la BnF.

9:55 - 10:45: Session 1 - Systèmes de recommandation pour l’analyse de grands corpus textuels

Tim Faverjon et Pedro Ramaciotti (Médialab, Sciences Po Paris), La politique dans la machine: identifier, mesurer et limiter l’information politique apprise par les algorithmes.

Stéphane Pouyllau (Huma-Num CNRS UAR 3598), ISIDORE 2030 : refactorisation d’un moteur de recherche à l’ère des IA de traitement et des IA génératives.

Pause

11:00 - 12:35: Session 2 - Graphes de connaissances pour les humanités numériques

Francesco Beretta (LARHRA UMR CNRS 5190), Une ontologie des lieux géographiques et de leur évolution spatio-temporelle dans le contexte de l’écosystème d’extensions du CIDOC CRM pour les sciences humaines et sociales: le projet SDHSS.

Arnaud Soulet (LIFAT, Université de Tours), Vers l’analyse à la demande des connaissances de Wikidata.

Camille Bernard (LIG, Steamer, Univerité Grenoble Alpes), Graphes de connaissances pour la représentation et la compréhension des évolutions des territoires.

Prunelle Daudré-Treuil, Mathieu d’Aquin, Olivier Bruneau, Jean Liber, Emmanuel Nauer, Laurent Rollet (équipe K, LORIA), Exploitation et appréhension de la correspondance d’Henri Poincaré.

12:35 - 14:00 : Déjeuner libre

14:00 - 15:15 : Session 3 - Numérisation, transcription et analyse de documents textuels

Ariane Pinche (CNRS, CIHAM, UMR 4856), CATMuS-Medieval : Créer un jeu de données multilingue pour un modèle générique de reconnaissance Automatique de texte

Christopher Kermovant (Teklia), Structuration, reconnaissance d’écriture et extraction d’entités dans les documents manuscrits avec Arkindex.

Alain Bouju (L3i, Université de La Rochelle), Projet DAI-CRéTDHI. Des données à l’exploitation en démographie historique.

Pause

15:30 - 16:45: Session 4 - Modèles d’IA pour l’analyse de sources

Rémi Petitpierre (Digital Humanities Institute, EPFL), Des cartes au modèle 4D. Des sources pour catalyser la reconstruction historique des villes.

Julien Velcin ( Université de Lyon, Lyon 2, ERIC UR 308), Retour d’expérience sur des collaborations pluridisciplinaires entre Informatique et SHS.

Ljudmila Petkovic (Sorbonne Université, équipe-projet ObTIC), Mesurer l’influence de Charcot sur ses contemporains à l’aide de l’extraction des mots-clés.

Pause

17:00 - 18:00: Table ronde - Défis ouverts en IA pour les humanités numériques

Intervenants: Stéphane Lamassé (LaMOP, UMR 8589, CNRS – université Paris 1 Panthéon-Sorbonne), Mathieu d’Aquin (équipe K, LORIA), Stéphane Pouyllau (Huma-Num CNRS UAR 3598), Nicolas Sauger (IR* Progedo), Christopher Kermovant (Teklia)

Ressources

Les supports des présentations et les illustrations réalisées par Adèle Huguet au cours de la journée sont accessibles sur le site Web de l’AFIA.

© 2025 SaD-2HN   •  Powered by Soopr   •  Theme  Moonwalk