Stage BTS SIO - SLAM

Stage 1ère année au CNRS

Du 22 mai au 30 juin 2023

Ce stage comportait deux missions : l’extraction de données SQL via des scripts Python et la création d’une interface web en PHP/HTML.

Mission 1 : Scripts Python

Mettre en place des chaînes de traitement en Python, visant à fournir à la porteuse de projets des extractions d'informations sur certaines entités de la base de données RSPA (Répertoire des sources philosophiques antiques).

Mission 2 : Interface Web

Créer une interface web en PHP et HTML permettant à un utilisateur lambda de récupérer simplement les informations souhaitées, en important un fichier d'identifiants correspondant aux entités recherchées.

Compétences acquises

Ces réalisations m'ont permis de mettre en pratique et d'approfondir mes connaissances en SQL, Python et en langages web (PHP, HTML, CSS, JS), ainsi que de me familiariser avec des librairies telles que SQLAlchemy et Pandas.

Contexte du stage

Information sur l'entreprise

  • Nom : Centre National de la Recherche Scientifique (CNRS)
  • Activité : Recherche
  • Forme juridique : EPST (Établissement Public à caractère Scientifique et Technologique)
  • Adresse : Campus de Villejuif (7 Rue Guy Môquet, 94800 Villejuif)
  • Effectif à l'adresse : De 1 000 à 4 999 employés
  • Effectif total : Plus de 33.000 agents

Service d'accueil

  • Unité Ardis : Appui à la Recherche et Diffusion des Savoirs - Une unité qui comporte 4 équipes, dont une équipe informatique
  • Activités de l'équipe : Prestations web, gestion de bases de données, administration des serveurs, dépannage des machines

Expression des besoins

Le projet a pour but de remplacer l'interface actuelle, jugée complexe et peu maniable, par une nouvelle interface plus simple et ergonomique. L'objectif principal était d'aider la porteuse de projets à préparer la migration des données du RSPA vers la base IPHIS en lui fournissant un outil d'aide au dédoublonnage des entités (en particulier les auteurs antiques).

La création de ce site permettrait à la porteuse de projets un grand gain de temps. Actuellement, elle fournit à ma tutrice un fichier Excel contenant une liste d'identifiants d'auteurs nécessitant des informations supplémentaires. Ensuite, ma tutrice exécute des scripts Python pour générer des fichiers CSV, qu'elle convertit en Excel.

Cahier des charges

  • Mise à jour de 2 fichiers Python en vue de la migration de la base de données du RSPA
    • Le premier fichier contenait 2 requêtes SQL brutes sur 4 à compléter
    • Le second utilisait la librairie SQLAlchemy pour l'interaction avec la base de données
  • Réalisation d'un site web permettant la gestion et la visualisation de la base de données de références bibliographiques

Ressources mises à disposition

  • PC portable HP : Windows 11 Pro, Intel Core i7, 16 Go de RAM
  • IDE JetBrains : IntelliJ IDEA et PhpStorm
  • Serveur Web local : WampServer
  • PhpMyAdmin pour la gestion du SGBD MySQL
  • Microsoft Excel

Création du site

J'ai développé une interface web en PHP et HTML qui simplifie la récupération d'informations pour les utilisateurs. Elle leur permet d'importer un fichier contenant des identifiants d'entités et d'obtenir les données correspondantes sous forme de tableau.

L'objectif principal de cette interface est d'éliminer la nécessité d'exécuter manuellement des scripts ou de manipuler des requêtes SQL complexes. Elle offre une approche intuitive et simplifiée pour récupérer les informations souhaitées, évitant ainsi aux utilisateurs de naviguer dans la structure très complexe de la base de données.