Notre compétence ? La science du texte numérique

Notre code est libéré sous licence libre. Mais...

...notre compétence première, c'est la gestion et la manipulation de données textuelles et la conception/gestion de bases de données textuelles. Nous travaillons au service des personnes intéressée par la lutte contre le plagiat, la construction de moteurs de recherches, l'extraction et la fouille de données à des fins d'expertises; l'évaluation de la qualité de la langue littéraire; l'évaluation des performances de visibilité d'un produit, d'une oeuvre; le mind mapping au service d'une idée; le text mining et la reconstruction documentaire à partir d'archives numérisées.

Vous possédez des archives numériques sans savoir comment les rendre dynamiques ?Contactez-nous.

Vous vous demandez quel est le facteur d'impact de votre publication ? Sa diffusion ?Contactez-nous.

C'est l'analyse et la gestion des données collaboratives au service de projets en équipe: analyse des besoins, prévision et gestion du temps long, conservation et consultation des archives, production automatique d'archivages aux formats standards de l'édition numérique en lien avec les besoins des projets, formation des équipes.

L'extraction de données bibliographiques

Les méthodes CRF à base d'entraînement (Cermine, Bilbo, GrobId) donnent d'excellents résultats lorsque les données sont parfaitement structurées. Malheureusement, la documentation française est loin d'être homogène.

Notre chaîne de traitement promeut une approche sémantique du corpus qui permet d'isoler très rapidement l'ensemble des occurrences qu'un oeil humain peut identifier comme une référence bibliographique. Lorsque les méthodes d'entraînement faillissent, nous proposons des extractions quasi exaustive de toute focumentation scientifique.

L'édition numérique

Isilexparle de lui-même: comment extraire sa documentation des griffes des multinationales ? Comment sortir des données à bas coût sans dépendre d'un développement ? Comment produire une documentation scientifique qui obéisse à des normes, à des standards internationaux sans dépendre d'un développement long et coûteux ? Comment s'affranchir des réseaux sociaux ? Comment publier ses données immédiatement sur le web ou sur le réseau interne de l'entreprise, de manière sécurisée et fiable ?

Si vous avez la réponse, passez votre chemin; sinon, il suffit de nous contacter

L'identification du plagiat

Sur la base de ressources propres, nous proposons l'analyse de corpus concurrents pour la détection et l'indexation automatique des échos morphologiques ou sémantiques: plagiat, traitement de thèmes identiques, indexation de notions synonymes..

On parle de nous

  • Chronique RTL
  • Chronique Figaro
  • Chronique CPU
  • Innovatives CNRS
  • Productions

    I-def développe ses activités dans le domaine de la détection et de l'analyse automatique de textes et de documents. Elle est à votre écoute pour la conception et la réalisation de sites Internet liés à la gestion collaborative de bases de données linguistique ou textuelles. Elle développe son activité également dans la production automatique de synthèse, de résumés liés à l'extraction automatique de données textuelles, sociales (Twitter, Facebook, Google) et autres. Il collabore à de nombreux projets universitaires ou entrepreneuriaux et développe des projets entièrement tournés vers l'Univers des Humanités Numériques.

    (c) Xavier-Laurent Salvador - Sylvain Chea
    (c) Xavier-Laurent Salvador - Sylvain Chea: