Naukowcy opracowali algorytm self-play reinforcement learning do gry Big 2, gdzie gracze nie mają pełnej informacji o kartach przeciwników. To badanie rozszerza zastosowania self-play RL na gry z ukrytymi informacjami, będące bardziej skomplikowanymi niż gry z pełną widzialność. Wyniki mogą mieć znaczenie dla rozwoju bardziej zaawansowanych agentów AI potrafiących konkurować w strategicznych grach o dynamice podobnej do pokera.
Badania
arXiv CS.LG