About: dbpedia-fr:Segmentation

Facets (new session)
Description
Metadata
Settings
- owl:sameAs
- Inference Rule:

About: dbpedia-fr:Segmentation_(linguistique) Goto Sponge Distinct Permalink

An Entity of Type : owl:Thing, within Data Space : fr.dbpedia.org associated with source document(s)

Attributes	Values
rdfs:label	Segmentation (linguistique) (fr)
rdfs:comment	La segmentation représente, en linguistique, un prétraitement d'un ou de plusieurs documents textuels dans le but de pouvoir par la suite les traiter, représenter graphiquement et/ou le plus souvent les indexer. * Les composés lexicaux à apostrophe : " aujourd’hui " ne devra pas être segmenté en {" aujourd' ", " hui "} alors que " l'encyclopédie " devra devenir {" l' ", " encyclopédie "} * Les acronymes : " P.-V " ne devra pas se retrouver scinder en deux lettres distinctes * Les formes contractés : " M'sieur " etc. (fr)
rdfs:seeAlso	http://www.universalis.fr/encyclopedie/segmentation-psycholinguistique
sameAs	wikidata:Q25394236 http://g.co/kg/m/075k9v
Wikipage page ID	8747805 (xsd:integer)
Wikipage revision ID	177878290 (xsd:integer)
dbo:wikiPageWikiLink	dbpedia-fr:Acronymie High German languages Apostrophe category-fr:Linguistique_informatique category-fr:Traitement_de_texte String (computer science) Space (punctuation) dbpedia-fr:Eyrolles dbpedia-fr:Français dbpedia-fr:Indexation dbpedia-fr:Langues_chinoises Grammar dbpedia-fr:Mot Punctuation dbpedia-fr:Visualisation_de_données
Link from a Wikipage to an external page	http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/ https://books.google.com/books%3Fid=fQ8Qc_RS_QgC&printsec=frontcover
page length (characters) of wiki page	2708 (xsd:nonNegativeInteger)
dct:subject	category-fr:Linguistique_informatique category-fr:Traitement_de_texte
prop-fr:wikiPageUsesTemplate	dbpedia-fr:Modèle:Lien_web dbpedia-fr:Modèle:Ouvrage dbpedia-fr:Modèle:Portail dbpedia-fr:Modèle:Références dbpedia-fr:Modèle:Ébauche
prov:wasDerivedFrom	wikipedia-fr:Segmentation_(linguistique)?oldid=177878290&ns=0
prop-fr:année	2013 (xsd:integer)
prop-fr:auteur	Massih-Reza AMINI - Éric GAUSSIER (fr)
prop-fr:isbn	978 (xsd:integer)
prop-fr:langue	fr (fr)
prop-fr:lieu	Paris (fr)
prop-fr:lireEnLigne	https://books.google.com/books%3Fid=fQ8Qc_RS_QgC&printsec=frontcover
prop-fr:pagesTotales	256 (xsd:integer)
prop-fr:passage	page 10-12 (fr)
prop-fr:sousTitre	Applications, modèles et algorithmes (fr)
prop-fr:titre	Recherche d'information (fr) TreeTagger - a language independent part-of-speech tagger (fr)
prop-fr:url	http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/
prop-fr:éditeur	dbpedia-fr:Eyrolles
foaf:isPrimaryTopicOf	wikipedia-fr:Segmentation_(linguistique)
has abstract	La segmentation représente, en linguistique, un prétraitement d'un ou de plusieurs documents textuels dans le but de pouvoir par la suite les traiter, représenter graphiquement et/ou le plus souvent les indexer. Le principe est de segmenter une chaîne de caractères en mots (ou éléments sémantiques). Cette opération est très sensible car une mauvaise segmentation entraine des problèmes d'interprétation du document, notamment si certains mots ne sont pas correctement indexés voire perdus. Dans la langue française, bien que les espaces, apostrophes et signes de ponctuation délimitent souvent des mots aisément identifiables, certains types de mots peuvent poser problème : * Les composés lexicaux à apostrophe : " aujourd’hui " ne devra pas être segmenté en {" aujourd' ", " hui "} alors que " l'encyclopédie " devra devenir {" l' ", " encyclopédie "} * Les acronymes : " P.-V " ne devra pas se retrouver scinder en deux lettres distinctes * Les formes contractés : " M'sieur " etc. Chaque langue a ainsi ses spécificités à prendre en compte. Pour l'allemand, ce sera le fait que les noms composés s’écrivent sans espaces et donc complexifie l'étape de segmentation. Pour les langues chinoises, le défi est d'autant plus grand qu'il n'y a aucun espace entre les caractères pour faciliter cette segmentation (qui est actuellement un défi majeur pour réussir une indexation efficace, la méthode la plus utilisée étant la séparation en groupe de caractères, qui reste une méthode grandement améliorable). (fr)
is dbo:wikiPageWikiLink of	dbpedia-fr:Analyse_conversationnelle Psycholinguistics Segmentation
is Wikipage disambiguates of	Segmentation
is oa:hasTarget of	Wikidata Fr related
is foaf:primaryTopic of	wikipedia-fr:Segmentation_(linguistique)

Faceted Search & Find service v1.16.111 as of Oct 19 2022

Alternative Linked Data Documents: ODE Content Formats:

RDF

ODATA

Microdata

About

OpenLink Virtuoso version 07.20.3234 as of May 18 2022, on Linux (x86_64-ubuntu_bionic-linux-gnu), Single-Server Edition (39 GB total memory, 3 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software