Injeção de contexto em IA é um risco real de segurança

Injeção de contexto em IA é um risco real de segurança

A injeção de contexto em IA é um problema grave que implica na segurança no uso de ferramentas de inteligência artificial.

Injeção de contexto em IA é um risco real de segurança
Injeção de contexto em IA é um risco real de segurança

O problema da injeção de contexto em IA pode resultar em respostas erradas e induzir o uso da ferramenta.

Similar ao SQL Injection, injetar contexto em uma ferramenta de IA altera sua base de conhecimento refletindo diretamente nas respostas fornecidas.

O caso mais recente utiliza o Reddit para difundir um contexto alterado e com isso atingir diversos modelos de IA.

Injeção de contexto em IA é um risco real de segurança

Atualmente o Reddit é utilizado como repositório de conhecimento para indexação de ferramentas de inteligência artificial.

O ChatGPT e o Google o utilizam para que suas ferramentas de IA obtenham conhecimento.

Desta forma, diversas empresas começaram a imundar fóruns do Reddit com postagens coordenadas com o intuito de obter engajamento artificial.

Notadamente um fórum antigo e muito buscado sobre o tema de suplementos, farmacologia experimental e outros temas relacionados ao condicionamento físico foi severamente afetado.

Basicamente empresas do setor coordenam milhares de postagens para além do engajamento conseguir indexação de ferramentas de IA.

O resultado é alterar as repostas dessas ferramentas e neste caso em específico fazer com que adolescentes buscando formulas mágicas tenham informações falsas que indiquem determinados produtos de determinadas empresas.

Esta forma de ataque é particularmente preocupante pois ferramentas de IA buscam conversas autênticas através de scraping nesses fóruns.

Neste caso do Reddit moderadores estão agindo para conter essas mensagens, porém muita coisa já passou e causou estrago.

Tecnicamente este é um problema complexo de resolver, pois nem sempre um mecanismo de IA vai conseguir filtrar o conteúdo antes de indexa-lo.

Atualmente formas de spam burlam ferramentas de controle e mensagens massivas continuam aos montes em fóruns.


Descubra mais sobre ViamaisBLOG

Assine para receber nossas notícias mais recentes por e-mail.

matrix