AlphaGo se aposenta no auge; Google vai usar o que aprendeu com IA em outras áreas

Facebook
VKontakte
share_fav

Uma frase diz que quando você atinge o topo, não importa em que categoria só resta um lugar possível para ir: para baixo. Só que isso se aplica a humanos, logo o que fazer quando um sistema competitivo especializado vence todos os possíveis adversários e não resta mais nada a fazer para provar seu valor?

Simples, você o aposenta. E é exatamente isso que a divisão DeepMind do Google está fazendo com o AlphaGo, sua IA heurística que varreu o chão com os melhores jogadores de Go do planeta.

Primeiro vamos recapitular. Há uma tremenda diferença entre ensinar lógica e heurística para um computador, já que no primeiro caso o sistema só precisa analisar um conjunto limitado de ações de modo que ele selecione a mais simples e que traga melhores resultados a curto prazo. É assim por exemplo que você consegue programar uma IA para jogar xadrez, já que ela precisa “apenas” calcular 1050 jogadas possíveis. Isso limita o jogo a 10120 partidas possíveis de serem jogadas.

Go no entanto é bem diferente. Ele não é um jogo de lógica e sim de intuição, em que o jogador precisa analisar as inúmeras jogadas possíveis para ele, as de seu adversário, pesar, concatenar consequências e chegar a uma conclusão que pode não ser a mais lógica a curto prazo (ela inclusive pode ser prejudicial), mas irá se refletir em maiores ganhos muitas jogadas à frente. Num tabuleiro profissional de 19 x 19 quadros o Go permite nada menos que 10172 movimentos e suporta 10761 partidas. Para se ter uma ideia, calcula-se que o universo observável tenha “só” entre 1078 e 1082 átomos. Cada jogada permite 200 movimentos por vez, contra 20 do xadrez.

Isso é heurística, o processo de pensamento que analisa as inúmeras soluções possíveis para um determinado problema, considerando mesmo as mais viáveis ainda que demonstrem resultados inferiores, mas que numa análise profunda levem ao objetivo final.Por muito tempo convencionou-se dizer que um computador seria incapaz de aprender heurística, que ele seria um processo exclusivamente humano e um fator limitante para o desenvolvimento de IAs fortes.

É aí que o Google DeepMind, o laboratório de pesquisa em inteligência artificial de Demis Hassabis brilha. O AlphaGo opera com um sistema de redes neurais em camadas não-lineares de relação; uma delas analisa o tabuleiro e tenta realizar a próxima jogada, ao mesmo tempo em que outra tenta prever quem será o vencedor da partida e o Monte Carlo Tree Search (MCTS), um algoritmo de busca heurística se encarrega de basear as tomadas de decisão em aprendizado de máquina, de forma que o algoritmo se mantenha o tempo inteiro analisando jogadas e partidas passadas, trabalhe pesado para ponderar todos os seus movimentos possíveis, os do jogador e filtre as inúmeras possibilidades de movimento sem considerar passos lógicos, se baseando em tomadas de decisão que levem ao objetivo final mesmo que elas não sejam as melhores para aquele momento, mas se mostrem as de mais simples execução e que apresentem resultados vários movimentos à frente.

Ke Jie, o número um do mundo: derrotado por 3 a 0

O resultado? O AlphaGo é uma IA heurística imbatível, tendo derrotado todos os adversários que encarou. O primeiro a cair foi o campeão europeu Fan Hui, que levou uma lavada de 5 a 0. A seguir o Google desafiou o sul-coreano Lee Sedol, 18 vezes campeão mundial e um dos primeiros do ranking, e ganhou por 4 a 1.

Agora foi a vez do chinês Ke Jie, considerado o maior jogador de Go do planeta e o número um do ranking oficial, que chegou inclusive a contar vantagem dizendo que jamais seria derrotado. Pois bem, ele não só perdeu como foi massacrado, o AlphaGo ganhou todos os três embates. Sedol é o único humano que conseguiu confundir o algoritmo e ganhar uma única partida, ainda que tenha sido derrotado na contagem final.

Demis Hassabis diz que a vitória do AlphaGo sobre Jie representa o ponto máximo que a IA pode chegar sendo utilizada competitivamente, logo não há mais razão para continuar realizando novas ações do tipo. Isso posto o VP de Engenharia e IA do Google DeepMind anunciou após a vitória que a IA será aposentada, com o time de desenvolvimento sendo direcionado a novas áreas que poderão se aproveitar do que o AlphaGo ensinou: sistemas especialistas, que fazem um excelente uso de IA fraca serão os mais beneficiados, como ajudar pesquisadores em suas pesquisas sejam atrás de curas para doenças, para reduzir o consumo de energia ou no desenvolvimento de novos materiais.

Isso significa que o AlphaGo deixará um tremendo legado: ao demonstrar que um computador pode aprender heurística o Google abre caminho para novas pesquisas em inteligência artificial, seja na resolução de problemas simples em menos tempo como nos mais complexos, principalmente aqueles em que mentes humanas ainda se atrapalham. Claro que isso não significa computadores com consciência, nem sabemos como ela se forma e nem se é possível que uma máquina a desenvolva (Miguel Nicolelis e Roger Penrose defendem que o cérebro não é computável), mas estamos aprendendo e graças ao AlphaGo, podemos andar mais alguns passos adiante no escuro.

Fonte: Wired.

The post AlphaGo se aposenta no auge; Google vai usar o que aprendeu com IA em outras áreas appeared first on Meio Bit.

ver Meio Bit
#aprendizado
#deepmind
#heurística
#redes neurais
#especialista
#algoritmo heurístico
#alphago