PAGE (Page Analysis and Ground truth Elements) est un standard XML pour l'encodage de documents numérisés. Comparable au format ALTO, il permet de rendre compte de l'organisation et de la structure d'une page et de ses contenus. PAGE XML peut être utilisé afin de décrire : * le contenu des pages (régions, lignes de texte, mots, glyphes, ordre de lecture, contenu du texte, ...) * l'évaluation de l'analyse de la mise en page (profils d'évaluation, résultats d'évaluation, ...) * le découpage de l'image du document (grilles de découpage)

Property Value
dbo:abstract
  • PAGE (Page Analysis and Ground truth Elements) est un standard XML pour l'encodage de documents numérisés. Comparable au format ALTO, il permet de rendre compte de l'organisation et de la structure d'une page et de ses contenus. PAGE XML peut être utilisé afin de décrire : * le contenu des pages (régions, lignes de texte, mots, glyphes, ordre de lecture, contenu du texte, ...) * l'évaluation de l'analyse de la mise en page (profils d'évaluation, résultats d'évaluation, ...) * le découpage de l'image du document (grilles de découpage) Le format est développé par le Pattern Recognition & Image Analysis Lab (PRIMA), au sein de l'Université de Salford à Manchester. Ce schéma a été conçu pour être utilisé conjointement de techniques de segmentation et de transcription automatique (OCR et HTR) : en effet, PAGE vise à prendre en charge chacune des différentes étapes de la chaîne de traitement pour l'analyse de documents images (de l'amélioration de l'image à l'analyse de la mise en page en passant par l'OCR). Le schéma PAGE XML est notamment utilisé comme format d'export et d'import par logiciels de transcription automatique tels qu'eScriptorium et Transkribus. C'est également un format d'export utilisé par Kraken, un système OCR clé en main optimisé pour les documents en caractères historiques et non-latins. (fr)
  • PAGE (Page Analysis and Ground truth Elements) est un standard XML pour l'encodage de documents numérisés. Comparable au format ALTO, il permet de rendre compte de l'organisation et de la structure d'une page et de ses contenus. PAGE XML peut être utilisé afin de décrire : * le contenu des pages (régions, lignes de texte, mots, glyphes, ordre de lecture, contenu du texte, ...) * l'évaluation de l'analyse de la mise en page (profils d'évaluation, résultats d'évaluation, ...) * le découpage de l'image du document (grilles de découpage) Le format est développé par le Pattern Recognition & Image Analysis Lab (PRIMA), au sein de l'Université de Salford à Manchester. Ce schéma a été conçu pour être utilisé conjointement de techniques de segmentation et de transcription automatique (OCR et HTR) : en effet, PAGE vise à prendre en charge chacune des différentes étapes de la chaîne de traitement pour l'analyse de documents images (de l'amélioration de l'image à l'analyse de la mise en page en passant par l'OCR). Le schéma PAGE XML est notamment utilisé comme format d'export et d'import par logiciels de transcription automatique tels qu'eScriptorium et Transkribus. C'est également un format d'export utilisé par Kraken, un système OCR clé en main optimisé pour les documents en caractères historiques et non-latins. (fr)
dbo:thumbnail
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 13747174 (xsd:integer)
dbo:wikiPageLength
  • 4642 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 177516059 (xsd:integer)
dbo:wikiPageWikiLink
prop-fr:wikiPageUsesTemplate
dct:subject
rdfs:comment
  • PAGE (Page Analysis and Ground truth Elements) est un standard XML pour l'encodage de documents numérisés. Comparable au format ALTO, il permet de rendre compte de l'organisation et de la structure d'une page et de ses contenus. PAGE XML peut être utilisé afin de décrire : * le contenu des pages (régions, lignes de texte, mots, glyphes, ordre de lecture, contenu du texte, ...) * l'évaluation de l'analyse de la mise en page (profils d'évaluation, résultats d'évaluation, ...) * le découpage de l'image du document (grilles de découpage) (fr)
  • PAGE (Page Analysis and Ground truth Elements) est un standard XML pour l'encodage de documents numérisés. Comparable au format ALTO, il permet de rendre compte de l'organisation et de la structure d'une page et de ses contenus. PAGE XML peut être utilisé afin de décrire : * le contenu des pages (régions, lignes de texte, mots, glyphes, ordre de lecture, contenu du texte, ...) * l'évaluation de l'analyse de la mise en page (profils d'évaluation, résultats d'évaluation, ...) * le découpage de l'image du document (grilles de découpage) (fr)
rdfs:label
  • PAGE (XML) (fr)
  • PAGE (XML) (fr)
owl:sameAs
prov:wasDerivedFrom
foaf:depiction
foaf:isPrimaryTopicOf
is dbo:wikiPageDisambiguates of
is dbo:wikiPageWikiLink of
is oa:hasTarget of
is foaf:primaryTopic of