Encodage

Le nouvel Index numérique n’est pas simplement une reproduction de l’édition imprimée. Sa structure interne a été repensée et explicitement encodée afin que les relations auparavant visibles uniquement pour les lecteurs humains puissent désormais être reconnues, recherchées et traitées par l’ordinateur.

Qu’est-ce qui change ?

Hiérarchie

Les auteurs, les œuvres et les sous-œuvres sont reliés comme des unités structurées.

Chronologie

Les dates de la colonne aetas ont été converties dans un format lisible par machine.

Citations

Elles sont segmentées en auteur, œuvre et localisation au sein du nouveau TLL numérique

Genres

Il sera possible d’explorer l’Index au moyen de métadonnées de genre.

Pourquoi réencoder l’Index ?

L’Index imprimé est l’un des outils essentiels du TLL. Il identifie les auteurs, les œuvres, les informations chronologiques, les formes de citation et les éditions de référence. La précédente version numérique de l’Index le conservait largement comme une transcription visuelle. L’indentation, la typographie et la mise en page restaient significatives pour les utilisateurs, mais non pour le traitement informatique.

Printed ed. Lipsiae 1990 — Édition imprimée, Lipsiae 1990

L’anatomie du nouvel Index numérique

🦴

HTML

Le squelette

Il définit la structure de la ressource : les auteurs, les œuvres et les sous-œuvres sont encodés comme des entités significatives plutôt qu’affichés comme de simples lignes de tableau.

⚡

JavaScript

Le système nerveux

Il permet à la page de réagir aux recherches, de préserver les dépendances et de reconstruire le contexte lorsqu’un résultat appartient à un ensemble plus vaste.

👁️

CSS

La forme visible

Il rend la structure encodée lisible grâce à l’indentation, au codage par couleurs, à l’espacement et à une interface de consultation plus claire.

Du texte simple aux entrées structurées

Dans l’Index imprimé, la hiérarchie est souvent communiquée par l’indentation. Par exemple, une œuvre peut apparaître sous l’auteur correspondant. Alors que, dans la précédente version numérique, les deux entrées restaient structurellement indépendantes, dans la nouvelle version ces dépendances sont rendues explicites grâce à l’emploi d’attributs dans la structure HTML.

Avant : transcription simple

<tr>
  <td><u>Ablab.</u></td>
</tr>

<tr>
  <td>epigr. 2</td>
</tr>

Après : encodage structuré

<tr id="ablab." class="group">
  <td><u>Ablab.</u></td>
</tr>

<tr class="group">
  <td><p class="work">epigr. 2</p></td>
</tr>

Dans le nouvel Index numérique, les utilisateurs peuvent toujours naviguer au moyen de la barre alphabétique, désormais fixée sur le côté gauche de l’interface, mais ils peuvent aussi effectuer des recherches textuelles (insensibles à la casse et à la distinction u/v) soit dans toutes les colonnes, soit dans une colonne spécifique. La recherche ne se réduit plus à une simple correspondance linéaire : lorsqu’une requête correspond à un auteur, une œuvre ou une sous-œuvre, le système reconstruit et récupère le contexte pertinent.

Recherche : rhet.

Résultat simple

rhet.
rhet.
rhet.
rhet.

Résultat contextualisé

Aug.

rhet.

Cassiod.

rhet.

Recherche : pim.

Apic.

exc.

pim. p. 87, 22

Puisque les informations chronologiques contenues dans la colonne aetas ont été transformées dans un format lisible par machine, les résultats peuvent désormais être ordonnés chronologiquement. Il convient toutefois de noter que cet ordre ne reflète pas la séquence dans laquelle les citations apparaissent dans le TLL, car la datation fournie par l’Index ne correspond pas nécessairement à la durée de vie réelle des auteurs.

Indication de l’aetas

Avg. 354–430

Cic. * 106, cos. 63, † 43 a. Chr.

Ivl. Rvf. saec. IV?

→

Conversion lisible par machine

Avg. data-from: 350 data-to: 430

Cic. data-from: -106 data-to: -43

Ivl. Rvf. data-from: 301 data-to: 400

→

Ordre chronologique

↑ Croissant

Cic.

Ivl. Rvf.

Avg.

↓ Décroissant

Avg.

Ivl. Rvf.

Cic.

Perspectives

L’Index enrichi, qui intégrera prochainement une option de filtrage par genre, est conçu comme une partie de l’infrastructure numérique plus large du TLL actuellement en cours de développement à la Sapienza. En modélisant la hiérarchie, la chronologie, les conventions de citation, et les métadonnées de genre, le nouvel encodage prend en charge la reconnaissance automatique des citations, la recherche structurée et de nouvelles formes de recherche philologique et linguistique. L’objectif n’est pas simplement de numériser un ouvrage de référence, mais de le transformer en un environnement de recherche savante interopérable.