Journée Intelligence Artificielle Et Humanités Numériques
Action SaD-2HN / February 2025 (736 Words, 5 Minutes)
Motivation et objectifs de la journée
Cette journée thématique “Humanités Numériques et IA” est organisée avec le soutien de l’AFIA et de l’action des Sources aux Données Historiques en Humanités Numériques du GdR MADICS dans le cadre de la Plate-Forme Intelligence Artificielle (PFIA) qui aura lieu du 30 juin au 4 juillet 2024 à Dijon. La journée se tiendra le vendredi 4 juillet 2025.
Le vocable humanités numériques s’est aujourd’hui imposé pour désigner les travaux de recherche relevant tantôt : de la création, la gestion et la mise en œuvre de jeux de données numériques dans les domaines des sciences humaines et sociales ; de la modélisation et la formalisation de processus sociaux à l’aide d’outils mathématiques et informatiques ; ou de l’analyse des usages et des communautés numériques du point de vue des sciences humaines et sociales [1]. La journée “Humanités Numériques et IA” a pour but de faire un point sur les usages de l’intelligence artificielle dans le domaine des humanités numériques. Elle fait suite à une première journée organisée en 2024 sous l’égide de l’AFIA et des GdR MADICS et MAGIS, qui s’est concentrée sur les défis posés par les humanités numériques aux approches développées en intelligence artificielle.
Appel à contributions
Pour cette deuxième édition, nous recherchons des contributions portant sur le lien entre les sources de connaissances mobilisées par les chercheurs en sciences humaines et sociales et les données produites, manuellement ou automatiquement, à partir de ces sources pour servir de support à leurs analyses. Il peut s’agir de sources numériques ou non, de différentes natures : documents d’archives textuels ou iconographiques, formulaires d’enquêtes, relevés de capteurs, données du Web (réseaux sociaux, données participatives, etc.), données structurées de la recherche, etc. Leur traitement pour produire des données exploitables et diffusables peut présenter diverses difficultés: données non structurées, sous contraintes de droits d’auteur, nominatives, langues anciennes, rares, peu dotées, etc. Leur résolution impose des choix de transcription, de structuration, d’annotation, d’anonymisation, etc. qu’il convient de documenter afin de permettre aux futurs utilisateurs des données produites de prendre en compte les limites d’utilisation inhérentes aux choix effectués et aux traitement appliqués aux sources.
Nous sommes donc particulièrement intéressés par les propositions qui mettront en avant des approches relevant de l’intelligence artificielle et prenant en compte les questions suivantes:
- Découverte et accès aux sources: identifiants, métadonnées, approches de recherche d’informations, standards de diffusion, infrastructures de stockage et de diffusion, etc.
- Approches pour la reconnaissance et l’extraction d’informations dans des sources non structurées: quelle traçabilité pour les informations extraites?
- Annotation sémantique de sources: quels référentiels pour les sciences humaines et sociales (thésaurus, ontologies, graphes de connaissances, etc.)?
- Représentation et exploitation des informations de provenance entre données et sources.
- Utilisabilité des données produites: comment évaluer la réutilisation des données de la recherche? Qu’est-ce qui favorise la réutilisation d’un jeu de données, au-delà des principes FAIR [2]?
La journée s’adresse aussi bien aux jeunes chercheurs qu’aux chercheurs plus expérimentés ainsi qu’aux industriels, à la fois dans les domaines des sciences humaines et sociales, des humanités numériques et de l’intelligence artificielle. Elle est ouverte à la présentation de travaux à différents stades d’avancement.
[1] Camille Roth. Digital, digitized, and numerical humanities. Digital Scholarship in the Humanities, 2019, 34 (3), pp.616-632.
[2] Principes FAIR
Dates importantes
- Soumission des articles : 11 avril 2025
- Notification aux auteurs : 9 mai 2025
- Réception des versions définitives : 16 mai 2025
- Date de la journée : 4 juillet 2025
Soumissions
Dans la mesure où la langue officielle de la conférence est le français, les articles devront prioritairement être soumis en français. Les soumissions d’articles en anglais sont toutefois possibles, mais il faudra traduire le texte en français pour la version finale, en cas d’acceptation.
Thèmes de la conférence
Les soumissions devront porter sur un ou plusieurs des thèmes ci-dessous, en mettant l’accent sur le lien entre sources et données. La liste proposée n’est toutefois pas exhaustive.
- Recherche d’informations, indexation, recommandation à partir de grands corpus de documents.
- Préparation de documents anciens numérisés : normalisation, redressement automatique de pages, géoréférencement de cartes, etc.
- Analyse de documents anciens (textuels ou iconographiques) : traitement automatique de documents numérisés, qualité des documents numérisés, analyse de mises en page, reconnaissance de texte et de symboles, reconnaissance d’écriture manuelle, vectorisation automatique de cartes, etc.
- Acquisition de connaissances à partir de textes, à partir d’images (photographies, estampes, cartes, etc.), de données non structurées, etc.
- Représentation des connaissances et raisonnement, ontologies pour les humanités numériques.
- Extraction et acquisition de connaissances, peuplement d’ontologies, annotation sémantique de documents anciens.
- Provenance et confiance dans les données, incertitude, incomplétude, croisement de sources, métriques et évaluation de la qualité des données et des connaissances.
- Analyse de liens, communautés en ligne, réseaux sociaux, médias sociaux.
- Fouille de données d’opinions, de dépêches, de microblogging, géoréférencement de textes.
- Autres mises en œuvre de l’IA pour l’extraction, la structuration ou l’analyse de données spatiales, temporelles, incertaines, incomplètes pour des applications en Humanités Numériques…
Format des soumissions
Nous acceptons un format unique d’articles comportant 4 à 6 pages. Chaque soumission fera l’objet d’une évaluation par plusieurs membres du comité de programme. Les articles sélectionnés donneront lieu à des présentations orales (en français sauf impossibilité majeure).
Les actes de la journée seront regroupés dans un document pdf publié en ligne.
Modèle de documents
Les articles doivent respecter le style PFIA 2025 et être soumis au format PDF via EasyChair.