Jeu de données catégories Inist

fr
Cette table correspond au choix de documenter des données ISTEX et plus particulièrement les catégories INIST. Il s'agit des codes de classement (tronqués à 3 niveaux) utilisés lors de l'indexation pour constituer les bases de données PASCAL et FRANCIS. Ces catégories ont fait l'objet d'une structuration hiérarchique au format SKOS après enrichissement, et d'un alignement avec la classification décimale universelle (CDU) et le thésaurus de référence dans le domaine biomédical MeSH (Medical Subject Headings).
fr
Liste des ressources
    Contexte d'applicationskos:scopeNote

    Dans le cadre de l’enrichissement des documents du fond Istex, opérés par l’équipe Istex-rd en 2016 et 2017, les catégories scientifiques des bases Pascal et Francis de L’Inist-CNRS ont été attribuées à chaque document.

    A partir d’un corpus d’apprentissage constitué de documents issus des bases Pascal et Francis, des catégories Inist sont attribuées de manière automatique aux documents du fonds Istex. Il s’agit d’une catégorisation supervisée : dans un premier temps, l’outil connait les catégories définies a priori et doit s’entraîner à reconnaître ce qui distingue une catégorie d’une autre. La deuxième étape est une phase de prédiction, où l’outil associe une catégorie à un document à partir de ce qu’il a appris dans la phase précédente. La ressource est le plan de classement Refcode des bases Pascal et Francis de l'INIST-CNRS : http://refcode.inist.fr/ , qui couvre les disciplines suivantes :

    • Sciences exactes et technologie : codes commençant par 001 (Pascal)
    • Sciences biologiques et médicales : codes commençant par 002 (Pascal)
    • Sciences Humaines et Sociales (Francis)

    L’outil utilisé est rd-nb (nb pour "naive Bayes") qui a été développé par l’équipe Istex-rd. Les catégories prédites (codes Pascal/Francis et leur verbalisation) sont disponibles sur l’API Istex sous forme d’une balise TEI déportée (standoff).

    fr
    Lien vers la page Bayésien Naïfhttps://www.w3.org/ns/prov#wasGeneratedBy
    Modèle conceptuelschema:image
    ISTEX
    LODEX team
    Date de modificationdcterms:modified
    2018/03/19
    Date de créationdcterms:created
    2017/06/09
    Powered by Lodex 8.21.0