Em 2017, o jogo de poker ofereceu Libratus causou alvoroço, já que o jogo poderia vencer em single contra um jogador de poker de verdade. Agora, a IA foi desenvolvida e o sucessor Pluribus competiu contra diferentes jogadores de poker ao mesmo tempo - surpreendentemente, a máquina conseguiu vencer o jogador de poker.
No campo do poker, um desenvolveu uma IA em 2017, que deve acomodá -lo com profissionais de poker reais. Thomas Sandholm, professor de ciência da computação da Universidade Carnegie Mellon, e seu colega Noam Brown fizeram manchetes há 2 anos, quando seu programa de computador Libratus atingiu os reais jogadores de poker em detalhes. Agora você desenvolveu o programa para que a nova IA chamada Pluribus possa competir contra vários jogadores de poker ao mesmo tempo.
Lutar contra o homem contra a máquina - um chapéu velho e ainda diferente
O homem da luta contra a Machine não foi apenas adotado por vários filmes de Hollywood. O campeão mundial de xadrez Garri Kimovich Kasparov jogou contra o computador Blue Deep em 1996 e 1997 - o 2º torneio em 1997 que ele havia perdido contra o computador da IBM. Foi o primeiro computador a vencer contra um atual campeão mundial de xadrez. Desde então, nenhuma nova partida foi disputada, mas Kasparov sofreu com a derrota naquela época.
O Google Deep Mind desenvolveu um programa de computador para o jogo de tabuleiro em 2015. Ele apareceu sob o Pseudonyms Master (P) e o Magister (P), mas agora é conhecido como Alpha Go. Em 2015, competiu contra o fã do campeão reaispeu Hui no Go, em 2016, contra o sul -coreano Lee Sedol, que ainda é considerado o melhor jogador. Ele venceu os dois jogos.
Nesse contexto, Librato e Pluribus foram desenvolvidos. Os programas de computador contra players profissionais do Texas Hold'em competiram sem limites. A partir da complexidade do jogo, o poker é um pouco diferente do xadrez e do Go. Os dois jogos de tabuleiro que você tem todos os dados necessários para desenvolver sua própria estratégia para o jogo.
No caso do poker, os dados disponíveis para o cálculo dos movimentos são incompletos. Você só conhece seus próprios cartões e os cartões na mesa. A mão do oponente é desconhecida. Essa pontuação incompleta dificulta tomar decisões confiáveis para um computador. Os jogadores usam sua intuição ou a avaliação de outros jogadores com base na linguagem corporal, por exemplo, o programa de computador não possui essas opções.
O início foi com o Librato
Ao contrário de Alpha Go, o Libratus não depende de redes neurais, mas no aprendizado clássico de reforço. Uma árvore de decisão com os movimentos possíveis é sistematicamente restrita aos melhores movimentos. A comparação com as probabilidades de ganhar é realizada pela IA.
Nos jogos únicos contra os 4 jogadores profissionais, Libratus não conseguiu buscar uma estratégia clara no início, então os oponentes tiveram a chance de vencer. Antes do início dos jogos, o computador jogou 15 milhões de horas de CPU contra si mesmo. Depois que o Sandholm redondo treinou com sua equipe, o programa com o supercomputador, "Brigdes", com um total de 4 milhões de horas de CPU. No dia seguinte, os jogadores tiveram que se acostumar com uma IA que não tinha mais as fraquezas do dia anterior. Dong Kim, Jimmy Chou, Daniel McAulay e Jason Les competiram na competição "Brains vs. Intelligence Artificial" em meados de janeiro de 2017. Os Jogos no Rivers Casino em Pittsburgh foram jogados em frente a seus próprios monitores e computadores usando o programa Librato. Essa situação é, portanto, mais semelhante ao poker online.
Stephan Kalhamer, matemática de graduação e presidente do "Deutsche Poker Sportbund", uma vez comentou o torneio da seguinte maneira:
Há um momento em que você praticamente pega o computador no pé errado através da sua criatividade. Depois disso, o sistema humano se decompõe completamente, então, desde o dia sete, são 13 dias realmente enormes; E a derrota já é grosseira.
O jogo foi jogado por 20 dias por quase 120.000 mãos de pôquer. Do dia 4 ao dia 6, os profissionais pareciam ter a máquina sob controle, mas as perdas e derrotas se seguiram. O desenvolvedor Sandholm descreveu uma vez o procedimento dos robôs do poker da seguinte maneira:
Não tentamos encontrar buracos na estratégia do inimigo e depois aproveitamos melhor deles. Em vez disso, analisamos quais buracos o oponente encontrado em nossa estratégia e usado com o maior sucesso?
O que há de diferente no novo pluribus?
O Pluribus competiu no No Limit Texas Hold'em contra outros 5 jogadores profissionais em mais de 10.000 mãos de poker. Devido aos diferentes jogadores, a situação é mais uma vez muito mais complexa no poker. Por esse motivo, eles deveriam ter desenvolvido um algoritmo que reduz a complexidade da situação individual do jogo, mas ainda reconhece uma mudança na estratégia se ela prometer mais sucesso.
Inicialmente, o programa foi treinado com cópias de si mesma. Depois disso, o Pluribus entrou contra 5 jogadores de poker reais ao mesmo tempo. Mais tarde, cinco versões de IA jogaram contra um profissional de poker. Em todos os torneios, o software foi significativamente. Darren Elias foi um toca-discos no reaispean Poker Tour e Chris Ferguson, seis vezes vencedor do torneio da World Series of Poker.
Os desenvolvedores analisaram toda a situação em torno do pluribus da seguinte forma:
Um jogo com seis em vez de jogar com dois jogadores exige mudanças fundamentais na forma como a inteligência artificial desenvolve sua estratégia de jogo. Estamos entusiasmados com o desempenho do programa e achamos que algumas das estratégias de jogo "pluribus" até mudarão o comportamento do jogo dos profissionais.
Nova IA A Milestone?
Os desenvolvedores chamam o pluribus de um marco e acima do solo. Outros pesquisadores reconhecem o trabalho técnico dos desenvolvedores, mas ainda veem os resultados como terrenos. Marcus Liwicki, chefe da Mind Garage da Universidade de Kaiserslautern, mantém a maneira dos testes adequados e muito bons. No entanto, ele gostaria de testes adicionais de uma equipe de avaliação independente com outros pares de jogadores para excluir todos os preconceitos.
O termo "sobre -humano", que já é derivado do título da publicação "Superhuman AI para o Multiplayer Poker", deve ser evitado. Afinal, calcule uma calculadora melhor do que a maioria das pessoas e carros é mais rápida que as pessoas. No entanto, deve -se reconhecer que quando uma IA aprende mais rapidamente em situações desconhecidas e toma melhores decisões do que um ser humano. No entanto, a maioria dos especialistas vê marcos muito maiores na vitória de Blue Deep ou Alpha Go.
Seja o primeiro a comentar