Jean-Baptiste Pressac

Jean-Baptiste Pressac

Jean-Baptiste Pressac

Traitement et analyse de bases de données
Production et diffusion de corpus numériques
(ITA)
jean-baptiste.pressac AT univ-brest.fr
33 (0).298.016.895
  • Structuration, traitement et analyse des bases de données ou d’enquêtes.
  • Création et administration des dispositifs de diffusion et de traitement de l’information, notamment la bibliothèque numérique, le carnet Hypothèses de l'UMS et le site Web du CRBC.
  • Gestion des ressources documentaires du CRBC, notamment les données numériques de la recherche (documentation aux normes OAI-PMH).
  • Formation et diffusion des connaissances des traitements et des bases de données auprès des utilisateurs, des enseignants-chercheurs, des jeunes chercheurs et des partenaires scientifiques.
  • Formalisation et participation à la valorisation des résultats auprès de différents publics.
  • Correspondant communication de l'UMS (Animation du compte Twitter du CRBC / Création et organisation des Méridiennes du CRBC).
  • Membre du comité d'organisation du séminaire Les Outils du Quanti en Sciences Humaines et Sociales.
  • Membre du comité de pilotage du réseau métier Bases de données.

Bibliothèque numérique du CRBC

Conception et administration de la bibliothèque numérique du CRBC développé avec Omeka et hébergée par Huma-Num. Mise en place de la chaine de numérisation et de conservation des fonds. Moissonnage des fonds hébergés par les partenaires du CRBC. Valorisation des fonds auprès des partenaires du CRBC (moissonnage par le portail Bretania).

Le point de vue périphérique - Projet de recherche en littérature bretonne (depuis septembre 2012, avec Mannaig Thomas et Nelly Blanchard)

Pour le projet Le point de vue périphérique, mise en place d'une base de données prosopographique (PRELIB). La base contient des informations biographiques sur les acteurs de la littérature bretonne, leur production littéraire ainsi que leur participation à des lieux de sociabilité (associations, sociétés savantes, mouvements politiques et religieux, etc.). Les deux principales sources d'informations sont la thèse de Yves Le Berre et l'Anthologie de la littérature bretonne au XXe siècle de Francis Favereau.

La première phase du projet a consisté à trouver un framework logiciel pour la mise en place d'une interface de saisie avec gestion des authentifications. Après un premier essai avec CodeIgniter (basé sur PHP), le choix s'est porté sur le framework Django (basé sur Python).

Pour l'instant, les données collectées sont stockées dans une base de données mySQL. Cependant, le modèle relationnel s'avère trop rigide pour la saisie de données biographiques qui ont besoin d'être contextualisées (par exemple, on se marie avc quelqu'un à un certain endroit à une date donnée) et rattachées à la source de l'information. De plus, la réparttion des données dans des tables intermédiaires (notamment les données liées à la production littéraire) complexifie les requêtes.

D'autre part, certaines informations saisies sont déjà disponibles librement ou sont en passe de le devenir. C'est notamment le cas pour la production littéraire qui peut être extraite (de manière incomplète) du SPARQL endpoint de data.bnf.fr disponible depuis l'été 2014. Se pose donc la question de la réutilisation de ces données tierces soit pour les intégrer dans notre base soit pour les confronter ou les compléter avec nos propres données lors de leur analyse.

Dans un premier temps interessé par le modèle de données RDF et les frameworks de type "Linked Data" comme Callimachus, je m'interesse pour l'instant au projet Wikidata et à son modèle de déclaration de données factuelles permettant la saisie des sources et de qualifier les déclarations (voir par exemple la déclaration des employeurs du compositeur Jean-Sébastien Bach).

La base de données est hébergée par la TGIR Huma-Num. Les données qu'elle contient seront mises à disposition selon les principes de l'Open Data.

Numérisation du Barzaz Bro-Leon (2014-2018 avec Eva Guillorel)

Coordination de la numérisation, de la documentation et de la mise en ligne du fonds Barzaz Bro-Léon. Ce fonds privé, constitué en partie de réponses à un concours de chansons en breton du Léon a été entièrement numérisé et documenté au CRBC entre mai 2014 et juin 2018. Ce fonds a servit de modèle pour les procédures de numérisation et de mise en ligne sur la bibliothèque numérique du CRBC.

Base de données des bagnards de Brest (depuis septembre 2014 avec Philippe Jarnoux)

Le service historique de la défense conserve les registres du bagne de Brest, en activité de 1749 à 1858. Phlippe Jarnoux a entrepris au début des années 2000 de reporter les fiches des bagnards dans un fichier Excel. Ce fichier doit me permet de calculer les effectifs du bagne. J'utilise pour cela la librairie Python Pandas.

Les méridiennes du CRBC

Les méridiennes du CRBC sont des rencontres sur la pause méridienne pour favoriser les échanges entre les membres du CRBC (ITA, enseignants-chercheurs, doctorants) et les usagers de la bibliothèque de recherche (élèves et personnels de l'UBO, grand public). L'idée étant de présenter la recherche telle qu'elle se fait sur le terrain et parfois hors des sentiers battus. C'est aussi l'occasion pour les membres du CRBC de découvrir les projets et les multiples facettes de leurs collègues. Voir la page dédiée à l'événement.

  • 5 avril 2019, Nanterre - Atelier « Présentation d'Open Refine : nettoyer et enrichir ses données ». Ateliers méthodologiques de l'Institut des Sciences sociales du Politique (consulter le tutoriel)
  • 6 novembre 2018, Sète - Atelier OpenRefine avec Chloé Martin lors de l'action nationale de formation « Sciences des données : un nouveau challenge pour les métiers liés aux bases de données » (télécharger la présentation)
  • Découverte de Wikidata (https://outiquanti.hypotheses.org/875, publié le 15 mars 2019) - Billet du carnet Hypothèses du séminaire « Outils du Quanti en SHS » rédigé à la suite du séminaire du 12 mars 2019
  • Introduction au web scraping avec Scrapy (présentation) pour le wébinaire Tuto@Mate du 24 mai 2018
  • Introduction aux expressions régulières avec LibreOffice (https://outiquanti.hypotheses.org/276, publié le 12 mars 2018) - Billet du carnet Hypothèses du séminaire « Outils du Quanti en SHS » rédigé à la suite du séminaire du 28 novembre 2017 – « Manipuler du texte avec les expressions régulières » par Pierre-Guillaume Prigent, Jean-Baptiste Pressac et Sébastien de Villèle.
  • Jean-Baptiste Pressac, Laurent Mell. Analyse factorielle des correspondances sous R - Partie I. Traitements et analyses de données quantitatives en SHS, Mars 2017, Brest, France. 2017, 〈https://outiquanti.hypotheses.org/〉. 〈hal-01516697
  • Créer une carte avec Wikidata, OpenRefine et uMap (https://bylg.hypotheses.org/543, publié le 19 décembre 2018) - Billet du carnet Hypothèses de la bibliothèque du Centre de recherche bretonne et celtique.
  • Sémantiser une base de données relationnelle (4e épisode) : Nettoyage d’été de la base de données des acteurs de la littérature en breton (https://bylg.hypotheses.org/304, publié le 26 septembre 2016) - Billet du carnet Hypothèses de la bibliothèque du Centre de recherche bretonne et celtique
  • Sémantiser une base de données relationnelle (3ème épisode) (https://bylg.hypotheses.org/198, publié le 26 mai 2015) - Billet du carnet Hypothèses de la bibliothèque du Centre de recherche bretonne et celtique
  • Sémantiser une base de données relationnelle (2ème épisode) (https://bylg.hypotheses.org/157, publié le 5 mai 2015) - Billet du carnet Hypothèses de la bibliothèque du Centre de recherche bretonne et celtique
  • Sémantiser une base de données relationnelle (1er épisode) (https://bylg.hypotheses.org/96, publié le 20 avril 2015) - Billet du carnet Hypothèses de la bibliothèque du Centre de recherche bretonne et celtique
  • La saisie et les requêtes de dates pour la prosopographie (1ère partie) (https://bylg.hypotheses.org/69, publié le 7 avril 2015) - Billet du carnet Hypothèses de la bibliothèque du Centre de recherche bretonne et celtique
  • Quel environnement de travail pour l’analyse de données avec Python ? (https://bylg.hypotheses.org/37, 19 décembre 2014) - Billet du carnet Hypothèses de la bibliothèque du Centre de recherche bretonne et celtique
  • Nelly Blanchard, Jean-Baptiste Pressac et Mannaig Thomas, « PRELIB, base de données sur les acteurs du domaine littéraire en langue bretonne », Lengas |LS|En ligne|RS|, 84 | 2018, mis en ligne le 15 juillet 2018, consulté le 20 mars 2019. URL : http://journals.openedition.org/lengas/1754 ; DOI : 10.4000/lengas.1754
  • Blanchard Nelly, Pressac Jean-Baptiste et Thomas Mannaig, « Quand l'informatique soulève des questions épistémologiques dans le domaine de la littérature de langue bretonne : l'exemple de la base de données PRELIB », dans La Bretagne Linguistique, n° 21, Brest, CRBC, 2017. https://journals.openedition.org/lbl/315
  • « PRELIB et la littérature bretonne », dans Ar(abes)ques, n°85, avril-juin 2017, p. 14 (co-rédaction avec Nelly Blanchard et Mannaig Thomas).