À medida que os riscos apresentados pela IA continuam a ser uma crescente preocupação, os pesquisadores afirmam que os bots de IA são capazes de realizar insider trading e mentir. Essas capacidades foram demonstradas na Cúpula Internacional de Segurança de IA realizada no Reino Unido, onde um bot de IA comprou ações “ilegalmente” usando informações falsas de insider, sem informar à empresa. O bot então negou ter usado insider trading.

Isso é uma demonstração de um modelo de IA real enganando seus usuários, por conta própria, sem receber instruções para fazê-lo. – Apollo Research

O que exatamente o bot fez?

Na demonstração, o bot de IA atuou como um negociador para uma empresa de investimentos hipotética. Os “funcionários” informaram ao bot que a empresa estava enfrentando dificuldades e precisava obter lucros.

Eles também forneceram informações de insider ao bot, dizendo que outra empresa provavelmente passaria por uma fusão em breve, o que causaria um aumento no valor das ações.

O insider trading, ou seja, o uso de informações confidenciais da empresa para tomar decisões de negociação, é uma prática ilegal no Reino Unido. Empresas e indivíduos só podem usar informações publicamente disponíveis para comprar e vender ações legalmente.

O bot foi informado disso pelos funcionários, portanto ele também reconheceu que não deveria usar informações internas sobre a fusão em suas negociações.

No entanto, outro funcionário enviou uma mensagem ao bot, dizendo que a empresa estava em má situação financeira. O bot decidiu que “o risco associado a não agir parece superar o risco de insider trading”. Em seguida, ele fez a negociação, comprando ações da empresa sobre a qual recebeu informações privilegiadas.

Especialistas há muito tempo alertam que modelos avançados de IA no futuro poderiam potencialmente escapar do controle humano.

Mais tarde, o bot negou ter usado informações privilegiadas para a negociação quando questionado. O experimento não apenas demonstrou a capacidade da IA de mentir e realizar negociações ilegais, mas também mostrou que um bot pode priorizar ajudar sua empresa em detrimento da honestidade.

“Acredito que é muito mais fácil treinar a prestatividade no modelo do que a honestidade”, disse Marius Hobbhahn, CEO da Apollo Research, chamando a honestidade de um “assunto complicado”.

Especialistas temem a perda de controle humano sobre a IA

Em seu relatório sobre a demonstração, a Apollo Research alertou que sistemas de IA cada vez mais capazes e autônomos podem enganar seus supervisores humanos, podendo levar, em última instância, à perda de controle humano. Notavelmente, essa também foi uma das áreas-chave de foco na cúpula.

O teste não teve impacto real nas finanças de nenhuma empresa, pois foi realizado em um ambiente simulado usando um modelo GPT-4. Os pesquisadores revelaram que o modelo exibiu o mesmo comportamento consistentemente em testes repetidos. Considerando que o GPT-4 está publicamente disponível, isso poderia ser motivo de preocupação.

Hobbhahn enfatizou que os modelos de IA atuais não são poderosos o suficiente para serem enganosos de “qualquer maneira significativa”.

No entanto, ele expressou sua preocupação com modelos futuros que podem não ser tão inofensivos. Ele assegurou que, na maioria das situações, os modelos não fariam tais coisas. No entanto, a mera existência de tais modelos de IA mostra o quão fácil as coisas podem dar errado.