Mostrar el registro sencillo del objeto digital

dc.contributor Valdovinos Rosas, Rosa María
dc.contributor.advisor MARCIAL ROMERO, JOSE RAYMUNDO; 39478
dc.contributor.author Francisco Valencia, Iván
dc.creator Francisco Valencia, Iván; 634704
dc.date.accessioned 2022-02-12T04:05:34Z
dc.date.available 2022-02-12T04:05:34Z
dc.date.issued 2021-11
dc.identifier.uri http://hdl.handle.net/20.500.11799/112236
dc.description.abstract Durante la historia de la Inteligencia Artificial se han desarrollo diversos agentes inteligentes capaces de jugar juegos de tablero de entre los m´as destacados se tiene a DeepBlue para el ajedrez y AlphaGo para el juego de Go. Sin embargo, estos agentes solo est´an enfocados en un solo juego por lo cual el paso natural es desarrollar agentes capaces de jugar m´as de un juego, idea que persigue el ´area General Game Playing la cual se enfoca en desarrollar agentes completamente aut´onomos que puedan jugar cualquier juego de tablero sin intervenci´on humana y sin conocimiento previo. La mayor´ıa de los agentes est´an basados en el m´etodo de Arbol de B´usqueda Monte Carlo que usa ´ simulaciones Monte Carlo para estimar movimientos prometedores, este m´etodo consiste en cuatro pasos: Selecci´on, Expansi´on, Simulaci´on y Propagaci´on Hacia Atr´as. Los esfuerzos para incrementar el rendimiento del Arbol de B´usqueda Monte Carlo se enfocan en el paso de simulaci´on, sin embargo, ´ es tambi´en el paso de Selecci´on el que repercute en dicho rendimiento. El paso de selecci´on controla la forma en que se recorre el ´arbol asociado al juego de tablero, dicho recorrido es guiado por una Pol´ıtica de Selecci´on de la cual Upper Confidence Bound es la popularmente usada. En esta tesis de investigaci´on se presentan dos pol´ıticas de selecci´on UCBα1 y UCBα2, las cuales est´an basadas en Upper Confidence Bound pero est´an pensadas completamente para su aplicaci´on en General Game Playing. UCBα1 y UCBα2 a diferencia de Upper Confidence Bound aprovechan la estructura del ´arbol asociados a los juegos de tablero para determinar para un nodo padre, cu´anto se debe explorar los nodos hijos que representan los movimientos disponibles antes de decidirse por explotar un nodo hijo con un movimiento prometedor. Upper Confidence Bound controla la exploraci´on de nodos hijos por medio de una constante de exploraci´on, sin embargo, esta constante permanece fija en todo el ´arbol sin importar el n´umero de nodos hijos. UCBα1 y UCBα2 usan una funci´on que depende del 1 es
dc.language.iso spa es
dc.publisher Universidad Autónoma del Estado de México es
dc.rights openAccess es
dc.rights openAccess
dc.rights.uri http://creativecommons.org/licenses/by/4.0
dc.subject game playing es
dc.subject problema del bandido multi-armado es
dc.subject game playing
dc.subject problema del bandido multi-armado
dc.subject.classification INGENIERÍA Y TECNOLOGÍA es
dc.subject.classification INGENIERÍA Y TECNOLOGÍA
dc.title Desarrollo de una política de selección para general Game Playing basada en el problema del bandido multi-armado es
dc.type Tesis de Doctorado es
dc.provenance Científica es
dc.road Verde es
dc.road Verde
dc.organismo Ingeniería es
dc.ambito Local es
dc.cve.progEstudios 1009 es
dc.modalidad Tesis es
dc.audience students
dc.audience researchers
dc.type.conacyt doctoralThesis
dc.identificator 7


Ficheros en el objeto digital

Este ítem aparece en la(s) siguiente(s) colección(ones)

Visualización del Documento

  • Título
  • Desarrollo de una política de selección para general Game Playing basada en el problema del bandido multi-armado
  • Autor
  • Francisco Valencia, Iván
  • Director(es) de tesis, compilador(es) o coordinador(es)
  • Valdovinos Rosas, Rosa María
  • Fecha de publicación
  • 2021-11
  • Editor
  • Universidad Autónoma del Estado de México
  • Tipo de documento
  • Tesis de Doctorado
  • Palabras clave
  • game playing
  • problema del bandido multi-armado
  • game playing
  • problema del bandido multi-armado
  • Los documentos depositados en el Repositorio Institucional de la Universidad Autónoma del Estado de México se encuentran a disposición en Acceso Abierto bajo la licencia Creative Commons: Atribución-NoComercial-SinDerivar 4.0 Internacional (CC BY-NC-ND 4.0)

Mostrar el registro sencillo del objeto digital

openAccess Excepto si se señala otra cosa, la licencia del ítem se describe cómo openAccess

Buscar en RI


Buscar en RI

Usuario

Estadísticas