Xadrez improvisado

Uma maneira de promover o pensamento especulativo

“Improv Chess” é uma ideia para torneios de jogos que encoraja os participantes a confiar no pensamento especulativo e no que Shneiderman chama de pensamento de fronteira. Em vez de confiar em sequências memorizadas ou em pesos e pré-análises cuidadosamente elaborados, esse formato exige que você amplie seu conhecimento e suas ideias e descubra implicações e possibilidades.

A maneira como funciona em um torneio de xadrez (ou você pode substituir Go, ou gamão, damas ou qualquer outro tipo de jogo) é que você aparece pronto para jogar xadrez, mas com um pequeno ajuste.

Os organizadores do torneio se encontram com antecedência e selecionam um ajuste. Eles identificam uma pequena mudança nas regras, mas não anunciam essa mudança até que o torneio esteja prestes a começar.

Que tipo de mudança? Pode ser que os peões não possam mais começar pulando dois espaços – eles só podem pular um movimento. Ou torres extras substituiriam os cavaleiros. Ou o rei desaparece, deixando um quadrado vazio, e a rainha agora é ainda mais central – você vence capturando a rainha do oponente. Ou há um quadrado no meio, digamos D4, que nenhuma peça pode ocupar.

É isso aí. Uma mudança de regra de última hora. E, de repente, os milhões de jogos que os sistemas de Machine Learning jogam contra si tornam-se irrelevantes. O que importa é uma apreciação imediata das limitações, oportunidades e novas estratégias. O formato favorece a adaptação e descoberta sobre a compilação de casos anteriores.

Na verdade, Bobby Fischer desenvolveu seu próprio jogo de xadrez inovador, o Fischer Random Chess, que atinge praticamente o mesmo resultado que estou mirando. Esquema de Fischer é projetado para eliminar a necessidade de memorizar lotes e lotes de aberturas de xadrez.

O Xadrez Aleatório de Fischer deixa os peões onde eles normalmente estão. As peças brancas restantes ainda estão no primeiro posto, mas são colocadas aleatoriamente, com algumas restrições: os bispos ainda estão em quadrados de cores opostas. O rei branco tem que ir a algum lugar entre as duas torres brancas. As peças pretas espelham as peças brancas.

O Xadrez Aleatório de Fischer atinge o mesmo tipo de embaralhamento que o Xadrez de Aperfeiçoamento, e é muito mais fácil de implementar. No entanto, o Xadrez Aleatório Fischer pertence principalmente às aberturas, enquanto o Xadrez Improv pode ressoar durante todo o jogo se, por exemplo, o quadrado D4 nunca pode ser ocupado ou o rei é retirado do jogo.

Outra vantagem do formato Improv é que ele pode ser usado com outros jogos, incluindo jogos como Go e gamão que não possuem uma posição inicial. O formato Improv pode servir como um complemento aos prodígios digitais, como AlphaZero (Campbell, 2018; Silver et al., 2018), que podem ensinar-se sobre qualquer jogo (por exemplo, xadrez, shogi e go).

Ben Shneiderman sugeriu alguns formatos para tornar os jogos de tabuleiro mais ambíguos, em vez de ter a identidade e localização de cada peça claramente marcada. Por exemplo, em momentos aleatórios você pode alterar aleatoriamente uma única peça para outra peça. Eu gosto dessa idéia, usando um computador de gerenciamento para fazer substituições de peças em pontos aleatórios no jogo. As substituições da peça teriam que ser legais, é claro. Eles também seriam simétricos – a mesma substituição em nível de ponto seria feita simultaneamente para ambos os jogadores. Tal procedimento transformaria um jogo em uma disputa real, favorecendo os espertos que poderiam se adaptar melhor ao longo do jogo.

Ben também sugeriu que um quarto do tabuleiro fosse coberto para cada jogador, para que o outro tivesse conhecimento incompleto. Esse procedimento iria injetar incerteza no jogo. Assemelha-se ao jogo Kriegspiel, que é uma variante do xadrez. Em Kriegspiel, eu interpreto um adversário, mas nenhum de nós vê onde a outra pessoa se mudou. Cada um de nós tem um tabuleiro de xadrez à nossa frente e movemos nossas próprias peças. Um árbitro assiste a nós dois e entra em cada movimento em uma prancha master; o árbitro informa os jogadores se eles fizeram uma jogada ilegal ou fizeram uma captura. O jogo continua até que alguém vença por xeque-mate. O jogo foi um pouco popular na RAND Corporation há algumas décadas. Algumas pessoas ficaram frustradas e disseram que era apenas aleatório. Outros disseram que havia estratégias reais – eram eles que geralmente ganhavam seus jogos. O Kriegspiel tem limitações logísticas: precisa de mais espaço e equipamento (as três pranchas) mais os serviços de um árbitro.

Uma regra do torneio Improv deveria ser que os participantes podem trazer laptops, mas não podem conectar-se a supercomputadores que podem jogar um milhão de vezes rapidamente para aprender as novas regras. os próprios laptops seriam proibidos de se envolver nesse tipo de Aprendizado de Máquina.

A razão para essa estipulação é que eu quero que o formato Improv enfatize a compreensão conceitual e o raciocínio causal em vez do raciocínio correlacional que o Machine Learning atualmente implementa.

Algumas das mais poderosas abordagens de Machine Learning baseiam-se em técnicas estatísticas para classificar padrões usando redes neurais com múltiplas camadas – comumente descritas como Deep Learning. Estas são as abordagens responsáveis ​​por avanços dramáticos no reconhecimento de fala, reconhecimento de imagem, tradução de linguagem e jogos para o Go e outras atividades. Portanto, não há como negar suas realizações. Mas, como assinala Marcus (2018), “profundo” refere-se ao grande número de camadas, não à maior abstração. Marcus usa o exemplo do jogo Atari “Breakout”, que é resolvido por um sistema em cerca de quatro horas de treinamento – o sistema aprende a cavar um túnel através de uma parede de tijolos. No entanto, o sistema não tem ideia do que é um túnel ou o que é uma parede. E quando os pesquisadores da IA ​​fazem uma ligeira perturbação, como mover a altura do remo ou inserir uma parede no meio da tela, os sistemas de IA falham. Eles não são adaptativos. O atual estado da arte não é capaz de lidar com o Improv Chess.

Talvez o uso de formatos de Improv dará aos humanos uma vantagem; talvez estimule os cientistas da computação a insistir mais em sua busca de adicionar raciocínio de senso comum e diagnósticos conceituais a seus sistemas. Independentemente disso, eu imagino o formato Improv como um meio de celebrar e fortalecer capacidades inteligentes, como o pensamento especulativo e o pensamento de fronteira, que atualmente são negligenciados.

Referências

Campbell, M. (2018). Dominando jogos de tabuleiro. Science, 362, 1118.

Marcus, G. (2018). Aprendizagem profunda: uma avaliação crítica. arXiv preprint arXiv: 1801,00631, 2018 – arxiv.org.

Silver, D., Hubert, T., Schrittwieser, J., Antonoglou, I., Lai, M., Guez, A., Lanctot, M., Sifrre, L., Kumaran, D., Graepel, T., Lillicrap, T., Simonyan, K., & Hassabis, D. (2018). Um algoritmo de aprendizado de reforço geral que domina o xadrez, o shogi e o modo de jogar por conta própria. Science, 362, 1140-1144.