About: http://fr.dbpedia.org/resource/Bandit_manchot

Property	Value
dbo:abstract	En mathématiques, plus précisément en théorie des probabilités, le problème du bandit manchot (généralisable en problème du bandit à K bras ou problème du bandit à N bras) se formule de manière imagée de la façon suivante : un utilisateur (un agent), face à des machines à sous, doit décider quelles machines jouer. Chaque machine donne une récompense moyenne que l'utilisateur ne connait pas a priori. L'objectif est de maximiser le gain cumulé de l'utilisateur. C'est un exemple d'apprentissage par renforcement. Typiquement, la politique de l'utilisateur oscille entre exploitation (utiliser la machine dont il a appris qu'elle récompense beaucoup) et exploration (tester une autre machine pour espérer gagner plus). Le problème de bandit manchot peut être vu comme un processus de décision markovien avec un seul état. (fr) En mathématiques, plus précisément en théorie des probabilités, le problème du bandit manchot (généralisable en problème du bandit à K bras ou problème du bandit à N bras) se formule de manière imagée de la façon suivante : un utilisateur (un agent), face à des machines à sous, doit décider quelles machines jouer. Chaque machine donne une récompense moyenne que l'utilisateur ne connait pas a priori. L'objectif est de maximiser le gain cumulé de l'utilisateur. C'est un exemple d'apprentissage par renforcement. Typiquement, la politique de l'utilisateur oscille entre exploitation (utiliser la machine dont il a appris qu'elle récompense beaucoup) et exploration (tester une autre machine pour espérer gagner plus). Le problème de bandit manchot peut être vu comme un processus de décision markovien avec un seul état. (fr)
dbo:namedAfter	dbpedia-fr:Machine_à_sous
dbo:thumbnail	wiki-commons:Special:FilePath/Las_Vegas_slot_machines.jpg?width=300
dbo:wikiPageID	102255 (xsd:integer)
dbo:wikiPageLength	13037 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	189661638 (xsd:integer)
dbo:wikiPageWikiLink	dbpedia-fr:Agent_logiciel dbpedia-fr:Apprentissage_automatique dbpedia-fr:Apprentissage_par_renforcement category-fr:Processus_stochastique category-fr:Statistiques dbpedia-fr:Fisher dbpedia-fr:Fonction_caractéristique_(théorie_des_ensembles) dbpedia-fr:Herbert_Robbins dbpedia-fr:Indépendance_(probabilités) dbpedia-fr:Inférence_bayésienne dbpedia-fr:Loi_bêta dbpedia-fr:Médicament dbpedia-fr:Plan_d'expériences dbpedia-fr:Processus_de_décision_markovien dbpedia-fr:Radio_intelligente dbpedia-fr:Théorie_des_probabilités dbpedia-fr:Théorème_de_Bayes dbpedia-fr:Vaccin dbpedia-fr:Variable_aléatoire dbpedia-fr:Échantillonnage_de_Thompson dbpedia-fr:Mathématiques dbpedia-fr:Fichier:Las_Vegas_slot_machines.jpg
prop-fr:wikiPageUsesTemplate	dbpedia-fr:Modèle:, dbpedia-fr:Modèle:Portail dbpedia-fr:Modèle:Référence_nécessaire dbpedia-fr:Modèle:Références dbpedia-fr:Modèle:Voir_homonyme dbpedia-fr:Modèle:Ébauche
dct:subject	category-fr:Processus_stochastique category-fr:Statistiques
rdfs:comment	En mathématiques, plus précisément en théorie des probabilités, le problème du bandit manchot (généralisable en problème du bandit à K bras ou problème du bandit à N bras) se formule de manière imagée de la façon suivante : un utilisateur (un agent), face à des machines à sous, doit décider quelles machines jouer. Chaque machine donne une récompense moyenne que l'utilisateur ne connait pas a priori. L'objectif est de maximiser le gain cumulé de l'utilisateur. (fr) En mathématiques, plus précisément en théorie des probabilités, le problème du bandit manchot (généralisable en problème du bandit à K bras ou problème du bandit à N bras) se formule de manière imagée de la façon suivante : un utilisateur (un agent), face à des machines à sous, doit décider quelles machines jouer. Chaque machine donne une récompense moyenne que l'utilisateur ne connait pas a priori. L'objectif est de maximiser le gain cumulé de l'utilisateur. (fr)
rdfs:label	Bandido multibrazo (es) Bandit manchot (mathématiques) (fr) El problema de la màquina escurabutxaques (ca) Bandido multibrazo (es) Bandit manchot (mathématiques) (fr) El problema de la màquina escurabutxaques (ca)
owl:sameAs	dbr:Multi-armed_bandit wikidata:Q2882343 dbpedia-ca:El_problema_de_la_màquina_escurabutxaques dbpedia-es:Bandido_multibrazo dbpedia-uk:Багаторукий_бандит http://g.co/kg/m/087186 http://ma-graph.org/entity/123197309
prov:wasDerivedFrom	wikipedia-fr:Bandit_manchot_(mathématiques)?oldid=189661638&ns=0
foaf:depiction	wiki-commons:Special:FilePath/Las_Vegas_slot_machines.jpg
foaf:isPrimaryTopicOf	wikipedia-fr:Bandit_manchot_(mathématiques)
is dbo:wikiPageDisambiguates of	dbpedia-fr:Bandit_manchot
is dbo:wikiPageRedirects of	dbpedia-fr:Bandit_Manchot_(Mathématiques) dbpedia-fr:Bandit_manchot_(mathematiques)
is dbo:wikiPageWikiLink of	dbpedia-fr:Apprentissage_par_renforcement dbpedia-fr:Arbre_de_probabilité dbpedia-fr:Bandit_manchot dbpedia-fr:Herbert_Robbins dbpedia-fr:Optimisation_en_ligne dbpedia-fr:Peter_Whittle dbpedia-fr:Plan_d'expériences dbpedia-fr:Échantillonnage_de_Thompson dbpedia-fr:Bandit_Manchot_(Mathématiques) dbpedia-fr:Bandit_manchot_(mathematiques)
is oa:hasTarget of	tag-fr:CaFrResource tag-fr:EsFrResource tag-fr:WdtFrResource
is foaf:primaryTopic of	wikipedia-fr:Bandit_manchot_(mathématiques)

About: http://fr.dbpedia.org/resource/Bandit_manchot_(mathématiques)