About: http://fr.dbpedia.org/resource/Processus_de_décision

Property	Value
dbo:abstract	En théorie de la décision et de la théorie des probabilités, un processus de décision markovien (en anglais Markov decision process, MDP) est un modèle stochastique où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les MDPs sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement. Les MDPs sont connus depuis les années 1950. Une grande contribution provient du travail de avec son livre de 1960, Dynamic Programming and Markov Processes. Ils sont utilisés dans de nombreuses disciplines, notamment la robotique, l'automatisation, l'économie et l'industrie manufacturière. Un processus de décision markovien est un processus de contrôle stochastique discret. À chaque étape, le processus est dans un certain état et l'agent choisit une action . La probabilité que le processus arrive à l'état est déterminée par l'action choisie. Plus précisément, elle est décrite par la fonction de transition d'états . Donc, l'état dépend de l'état actuel et de l'action sélectionnée par le décideur. Cependant, pour un et un , le prochain état est indépendant des actions et états précédents. On dit alors que le processus satisfait la propriété de Markov. Quand le processus passe de l'état à l'état avec l'action , l'agent gagne une récompense . Les MDPs sont une extension des chaînes de Markov. La différence est l'addition des actions choisies par l'agent et des récompenses gagnées par l'agent. S'il n'y a qu'une seule action à tirer dans chaque état et que les récompenses sont égales, le processus de décision markovien est une chaîne de Markov. (fr) En théorie de la décision et de la théorie des probabilités, un processus de décision markovien (en anglais Markov decision process, MDP) est un modèle stochastique où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les MDPs sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement. Les MDPs sont connus depuis les années 1950. Une grande contribution provient du travail de avec son livre de 1960, Dynamic Programming and Markov Processes. Ils sont utilisés dans de nombreuses disciplines, notamment la robotique, l'automatisation, l'économie et l'industrie manufacturière. Un processus de décision markovien est un processus de contrôle stochastique discret. À chaque étape, le processus est dans un certain état et l'agent choisit une action . La probabilité que le processus arrive à l'état est déterminée par l'action choisie. Plus précisément, elle est décrite par la fonction de transition d'états . Donc, l'état dépend de l'état actuel et de l'action sélectionnée par le décideur. Cependant, pour un et un , le prochain état est indépendant des actions et états précédents. On dit alors que le processus satisfait la propriété de Markov. Quand le processus passe de l'état à l'état avec l'action , l'agent gagne une récompense . Les MDPs sont une extension des chaînes de Markov. La différence est l'addition des actions choisies par l'agent et des récompenses gagnées par l'agent. S'il n'y a qu'une seule action à tirer dans chaque état et que les récompenses sont égales, le processus de décision markovien est une chaîne de Markov. (fr)
dbo:namedAfter	dbpedia-fr:Andreï_Markov_(mathématicien)
dbo:thumbnail	wiki-commons:Special:FilePath/Markov_Decision_Process_example.png?width=300
dbo:wikiPageExternalLink	http://www.cs.ualberta.ca/~sutton/book/the-book.html
dbo:wikiPageID	915991 (xsd:integer)
dbo:wikiPageLength	19272 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	190809710 (xsd:integer)
dbo:wikiPageWikiLink	dbpedia-fr:Application_contractante dbpedia-fr:Apprentissage_par_renforcement dbpedia-fr:Apprentissage_par_renforcement_hors_ligne dbpedia-fr:Automatisme dbpedia-fr:Boîte_noire_(système) dbpedia-fr:Calcul_stochastique category-fr:Décision category-fr:Intelligence_artificielle category-fr:Processus_de_Markov dbpedia-fr:Chaîne_de_Markov dbpedia-fr:Contrôle dbpedia-fr:Discret dbpedia-fr:Ensemble_dénombrable dbpedia-fr:Industrie_manufacturière dbpedia-fr:Itération dbpedia-fr:Linéarité dbpedia-fr:Littérature dbpedia-fr:MIT_Press dbpedia-fr:Modèle dbpedia-fr:Métaheuristique dbpedia-fr:Méthode_itérative dbpedia-fr:Optimisation_(mathématiques) dbpedia-fr:Point_fixe dbpedia-fr:Probabilité dbpedia-fr:Processus_de_décision_markovien_partiellement_observable dbpedia-fr:Processus_stochastique dbpedia-fr:Programmation_dynamique dbpedia-fr:Propriété_de_Markov dbpedia-fr:Puissance_du_continu dbpedia-fr:Raisonnement dbpedia-fr:Richard_Bellman dbpedia-fr:Robotique dbpedia-fr:Stochastique dbpedia-fr:Suite_définie_par_récurrence dbpedia-fr:Système_de_transition_d'états dbpedia-fr:Théorie_de_la_décision dbpedia-fr:Théorie_des_probabilités dbpedia-fr:Économie_(discipline) dbpedia-fr:Élimination_de_Gauss-Jordan dbpedia-fr:Fichier:Markov_Decision_Process_example.png dbpedia-fr:Fichier:Policy-iteration.svg dbpedia-fr:Ronald_A._Howard
prop-fr:wikiPageUsesTemplate	dbpedia-fr:Modèle:Langue dbpedia-fr:Modèle:Portail dbpedia-fr:Modèle:Référence_nécessaire
dct:subject	category-fr:Décision category-fr:Intelligence_artificielle category-fr:Processus_de_Markov
rdfs:comment	En théorie de la décision et de la théorie des probabilités, un processus de décision markovien (en anglais Markov decision process, MDP) est un modèle stochastique où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les MDPs sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement. Les MDPs sont connus depuis les années 1950. Une grande contribution provient du travail de avec son livre de 1960, Dynamic Programming and Markov Processes. Ils sont utilisés dans de nombreuses disciplines, notamment la robotique, l'automatisation, l'économie et l'industrie manufacturière. (fr) En théorie de la décision et de la théorie des probabilités, un processus de décision markovien (en anglais Markov decision process, MDP) est un modèle stochastique où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les MDPs sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement. Les MDPs sont connus depuis les années 1950. Une grande contribution provient du travail de avec son livre de 1960, Dynamic Programming and Markov Processes. Ils sont utilisés dans de nombreuses disciplines, notamment la robotique, l'automatisation, l'économie et l'industrie manufacturière. (fr)
rdfs:label	Марковський процес вирішування (uk) Markow-Entscheidungsproblem (de) Processo decisionale di Markov (it) Processus de décision markovien (fr) Марковский процесс принятия решений (ru) قرارات عملية ماركوف (ar) 馬可夫決策過程 (zh) Марковський процес вирішування (uk) Markow-Entscheidungsproblem (de) Processo decisionale di Markov (it) Processus de décision markovien (fr) Марковский процесс принятия решений (ru) قرارات عملية ماركوف (ar) 馬可夫決策過程 (zh)
rdfs:seeAlso	http://psh.ntkcz.cz/skos/PSH7713
owl:sameAs	dbr:Markov_decision_process wikidata:Q176789 dbpedia-ar:قرارات_عملية_ماركوف dbpedia-cs:Markovův_rozhodovací_proces dbpedia-de:Markow-Entscheidungsproblem dbpedia-fa:فرایندهای_تصمیم‌گیری_مارکوف dbpedia-he:תהליך_החלטה_מרקובי dbpedia-is:Markov_ákvarðanaferli dbpedia-it:Processo_decisionale_di_Markov dbpedia-ja:マルコフ決定過程 dbpedia-ko:마르코프_결정_과정 dbpedia-ru:Марковский_процесс_принятия_решений dbpedia-simple:Markov_decision_process dbpedia-tr:Markov_karar_süreci dbpedia-uk:Марковський_процес_вирішування dbpedia-vi:Quá_trình_quyết_định_Markov dbpedia-zh:馬可夫決策過程 http://g.co/kg/m/048gl8 http://ma-graph.org/entity/106189395
prov:wasDerivedFrom	wikipedia-fr:Processus_de_décision_markovien?oldid=190809710&ns=0
foaf:depiction	wiki-commons:Special:FilePath/Markov_Decision_Process_example.png wiki-commons:Special:FilePath/Policy-iteration.svg
foaf:isPrimaryTopicOf	wikipedia-fr:Processus_de_décision_markovien
is dbo:basedOn of	dbpedia-fr:Processus_de_décision_markovien_partiellement_observable
is dbo:wikiPageRedirects of	dbpedia-fr:Processus_de_Décision_Markovien dbpedia-fr:Processus_de_decision_markovien
is dbo:wikiPageWikiLink of	dbpedia-fr:Aide_à_la_décision dbpedia-fr:Apprentissage_par_renforcement dbpedia-fr:Apprentissage_par_renforcement_hors_ligne dbpedia-fr:Apprentissage_par_renforcement_profond dbpedia-fr:Bandit_manchot_(mathématiques) dbpedia-fr:Calcul_stochastique dbpedia-fr:Chaîne_de_Markov dbpedia-fr:MDP dbpedia-fr:Métaheuristique dbpedia-fr:Planification_(intelligence_artificielle) dbpedia-fr:Prise_de_décision dbpedia-fr:Processus_de_Markov dbpedia-fr:Processus_de_décision_markovien_partiellement_observable dbpedia-fr:Q-learning dbpedia-fr:Recherche_de_chemin dbpedia-fr:Temporal_difference_learning dbpedia-fr:Échantillonnage_de_Thompson dbpedia-fr:Processus_de_Décision_Markovien dbpedia-fr:Processus_de_decision_markovien
is oa:hasTarget of	tag-fr:UkFrResource tag-fr:DeFrResource tag-fr:ArFrResource tag-fr:RuFrResource tag-fr:ItFrResource tag-fr:ZhFrResource tag-fr:WdtFrResource
is foaf:primaryTopic of	wikipedia-fr:Processus_de_décision_markovien

About: http://fr.dbpedia.org/resource/Processus_de_décision_markovien