Paris Sémantique: Une initiative d’exploitation des données publiques de la ville de Paris
A propos de la méthodologie
Les données brutes issues d’opendata.paris.fr sont téléchargées puis “sémantisées” à l’aide d’un moteur interne construit sur mesure. Ce moteur permet la création d’un fichier TURTLE, résultat de la transformation en triples RDF des données généralement tabulaires soumises sur son entrée grâce à une configuration de transformation spécifique à chaque jeu de donnée.
Une fois ces données importées au sein du triple-store (OpenRDF Sesame) et du serveur SOLR (recherche), le moteur de présentation WEB (Django) prends le relai, capable d’afficher toute entités RDF du référentiel sémantique grâce à un système de configuration générique définissant leur propriétés d’affichage et les widgets associés.
Le stockage des données dans un modèle relationel non compatible avec un modèle objet. il est donc nécessaire de passer par de couteuses transformations plus ou moins facilitée par les framework faisant du mapping objet/relationnel générant de nombreuses requêtes. Cela nécessite souvent de couteuses optimisations sur les bases et sur l’outil de mapping.
Pas de chance en sortie il faut des pages web ou des documents xml, c’est à dire des structures hierarchiques différentes du monde objet. Il est donc nécessaire de repasser par une couche de plus pour transformer en document les objets.