E : Informatique, statistiques et calcul scientifique

Ingénieur d'études

Concours N° 103

Délégation organisatrice : Ile-de-France Meudon (DR 05) (MEUDON)

 

Nbre de postes : 2
Emploi-type : Ingénieur-e en ingénierie logicielle

1er poste du concours N° 103

Affectation : Direction des Données Ouvertes de la Recherche, PARIS
Groupe de fonction : Groupe 2

 

Mission :  
L'ingénieur-e d'étude a pour mission de participer au développement de nouveaux
logiciels CNRS à forts impacts scientifiques et sociétaux dans le domaine de la
fouille de textes déployés dans certaines unités en collaboration avec la DDOR. Le
travail portera plus spécifiquement sur les interfaces utilisateur (front-ends)
dans le but de développer de nouveaux usages et de rendre plus ergonomique et
facile l'exploitation de l'écosystème numérique autour de ces logiciels. Ce
développement se fera dans une optique d'analyse, d'exploration et de
visualisation de données, en les articulant avec les bases de données accessibles
aux personnels CNRS et les bases de données ouvertes

 

Activités :  
- Développer des interfaces web pour l'analyse et l'exploration interactive
de données, en particulier celles structurées sous forme de graphes complexes ou
de data visualisation et celles impliquant de l'analyse de bases de données
textuelles non structurée ou structurée (text-mining)
- Travailler sur de nouvelles méthodes de visualisation de l'information
avec les chercheurs CNRS,
- Intégrer ces méthodes dans des interfaces logiciels en tant que web
service (en particulier au sein de GarganText : https://gargantext.org),
- Former et assurer un transfert technologique des outils de cartographie
des sciences auprès des utilisateurs et partenaires scientifiques de la DDOR et
notamment auprès de certaines directions du CNRS (Instituts ou directions
fonctionnelles).
- Analyser, critiquer et représenter les données,
- Formaliser les résultats des traitements de données,
- Faire de la veille technologique sur les nouvelles approches dans le
domaine de la gestion de bases de données, de l'analyse de données de la
visualisation d'information,
- Participer à la diffusion des résultats auprès de la communauté
scientifique nationale et internationale dans sa spécialité (publications,
colloques, enseignements, formations, rapports de recherches...)
- Participer à l'élaboration d'un cahier des charges,
- Établir une documentation des outils déployés,
- Assurer le suivi des travaux confiés aux prestataires de services
- Concevoir et animer des actions de formation en interne et en externe

 

Compétences :  
- Connaissance et pratique des bases de données relationnelles comme PostgreSQL.
- Connaissance approfondie des technologies web (react JS, purescript, javascript,
html5, CSS),
- Connaissance approfondie des technologies de visualisation d'information, de
manipulation de graphes complexes et des librairies associées (ex. : Sigma.js,
D3.js, Echarts, Polymaps, networkX, etc.),
- Connaissance des méthodes et langages de la programmation fonctionnelle et une
expérience dans la programmation fonctionnelle est un plus
- Connaissance dans le développement de « front-end » d'applications web
impliquant de la visualisation de données,
- Avoir une expérience dans le développement « back-end » d'applications
impliquant la gestion de données textuelles est un plus,
- Maîtrise des méthodes d'analyse et de représentation de données numériques,
graphiques et des méthodes d'analyse et de cartographie de réseaux,
- Maîtrise les méthodes de visualisation d'information et d'analyse exploratoire
de données,
- Savoir travailler en interaction avec des équipes pluridisciplinaires et
d'origines diverses : acteurs publics, entreprises, associations professionnelles¿
- Maîtrise des techniques de présentation orale ou écrite,
- Savoir analyser les besoins des utilisateurs, les traduire en spécifications
techniques
- Compétences linguistiques : niveau B2 à C1 du Cadre européen commun de référence
pour les langues (CECRL)
- Une formation dans le domaine de l'informatique est fortement souhaitée

 

Contexte :  
La Direction des Données ouvertes de la recherche (DDOR) a pour mission de
proposer et d'accompagner la mise en application d'une politique et d'une
stratégie de science ouverte pour l'ouverture des publications et des données de
la recherche au CNRS.

L'Institut des Systèmes Complexes de Paris Île-de-France (ISC-PIF,
http://iscpif.fr) est une Unité d'Appui à la Recherche du CNRS, comportant une
vingtaine de personnes qui conjuguent les efforts de 12 EPST franciliens autour
de recherches interdisciplinaires sur les systèmes complexes,
L'ISC-PIF héberge de nombreux services mutualisés dans le domaine de l'analyse
de données (en particulier concernant l'analyse de grands corpus textuels) et le
calcul haute performance. Ces services sont accessibles à distance depuis des
interfaces ad hoc ; ils utilisent et génèrent des masses de données importantes.

L'ingénieur(e) recruté(e) sera rattaché(e) à la DDOR. La personne recrutée y
sera intégrée au pôle « services et veille » et sera hiérarchiquement
rattaché(e) à la directrice de la DDOR.

Dans un premier temps, le poste nécessitera de travailler sur l'écosystème
GarganText (logiciel libre), à l'ISC-PIF sous la responsabilité du chef de
projet de GarganText, au sein de l'équipe Humanités Numériques et Science
sociales computationnelles, et de créer le lien avec ISTEX la base de données
textuelles hébergée à l'Inist.

Ainsi, dans un premier temps l'activité hebdomadaire sera répartie sur deux
sites : la DDOR située au siège du CNRS (Campus G. Mégie, 3, rue Michel-Ange,
75016) et l'ISC-PIF, située 113, rue Nationale 75013.

A l'ISC-PIF, l'ingénieur(e) recruté(e) travaillera en open space en étroite
collaboration avec les équipes travaillant sur les plates-formes de l'ISC-PIF.
Elle/Il pourra être amené(e) à effectuer des déplacements fréquents en France
pour les besoins du poste.

2eme poste du concours N° 103

Affectation : Appui à la Recherche et à la DIffusion des Savoirs, VILLEJUIF
Groupe de fonction : Groupe 3

 

Mission :  
L'ingénieur.e en ingénierie logicielle sera basé.e au sein de l'UAR ARDIS pour réaliser et mettre en place des logiciels et outils dans le cadre des projets scientifiques du SEDYL et du LLACAN, situées sur le Campus CNRS de Villejuif. Il/elle assurera en particulier le traitement de corpus linguistiques et multilingues, corpus écrits comme oraux (audio/vidéo) pour des langues peu décrites ou rares, ainsi que la création et l'amélioration d'outils numériques pour l'exploitation scientifique de ces corpus.

 

Activités :  
Assurer le développement d'outils informatiques spécifiques pour traiter des corpus linguistiques et multilingues, écrits et oraux (ex : concordanciers, dictionnaires automatiques, outils de fouille de données, représentation formelle des langues etc.) et les doter ainsi d'outils informatiques véritablement innovants.
- Analyser les besoins des utilisateurs, les traduire en spécifications techniques.
- Concevoir et développer des applications et outils pour les projets du SEDYL et du LLACAN.
- Assurer la maintenance évolutive et curative des développements réalisés
- Rédiger les documentations techniques et fonctionnelles
- Assister les utilisateurs (formations et suivi de projets)

- Assurer la veille technologique, suivre les évolutions des normes et standards du domaine (linguistique de corpus, annotation de ressources linguistiques, fouille de données hétérogènes)
- Assurer le développement de formats permettant d'assurer l'interopérabilité des ressources.
- Assurer la gestion des données et archives de la recherche et leur valorisation.

 

Compétences :  
Savoirs :
- Maîtrise des méthodes d'analyse, de modélisation et de développement (UML,...)
- Maîtrise de langages de développement et de script (php, python, java,...)
- Connaissance des problématiques de la représentation des données linguistiques, de l'enregistrement et de la manipulation de corpus (XML, XSLT,...)

Savoirs faire :
- Maîtriser les bases de données relationnelles
- Maîtriser les formalismes d'encodage, d'annotation et de traitement de l'information dans les chaînes documentaires XML (XML, XML Schema, XSLT, XPath)
- Maîtriser les méthodes et techniques de la programmation web (HTML/CSS, Javascript, PHP,...)
- Connaissance d'un outil de traitement linguistique (ex : ELAN) appréciée
- Connaissance des référentiels de bonnes pratiques (CMMI, ITIL) et de sécurité, accessibilité et interopérabilité (RGS, RGAA, RGI, RGPD)
- Connaissance de l'anglais technique écrit du domaine, et capacité à communiquer à l'oral (écrit niveau B2, oral niveau B1).

Savoirs-être :
- Aptitude à travailler en équipe, en particulier au sein de projets collaboratifs
- Aisance pour les interactions avec les chercheurs et adaptation aux pratiques de la recherche
- Rigueur
- Force de proposition
- Curiosité, adaptabilité, bonne culture générale en linguistique

 

Contexte :  
Le poste sera basé au sein de l'UAR2259 ARDIS, dans le service informatique. Le poste est mutualisé entre le SEDYL et le LLACAN, unités de recherche en linguistique de terrain situées sur le Campus CNRS de Villejuif. La personne recrutée dépendra administrativement et hiérarchiquement de l'unité ARDIS et participera à la vie de cette unité. Elle sera chargée préférentiellement de projets du SEDYL et du LLACAN. Pour chacun de ces projets, issus des activités de recherche sur corpus de ces unités (description des langues, théorisation, description des contacts de langues), la personne recrutée sera intégrée aux équipes de recherche correspondantes. Elle assurera le développement d'outils informatiques spécifiques pour traiter ces corpus (ex : concordanciers, dictionnaires automatiques, outils de fouille de données, représentation formelle des langues, etc) et offrir ainsi aux équipes et à la communauté scientifique des outils informatiques innovants.