IA generativa
A IA generativa é a base da IA contemporânea, embora, técnica e potencialmente, tenha nascido de
formas anteriores de aprendizado de máquina.
Ela faz exatamente o que o nome indica: gera novo conteúdo, mais comumente texto, a partir de
um modelo de IA, geralmente um LLM (large language model, ou grande modelo de
linguagem). Os chatbots são a interface dos usuários com o LLM, permitindo que perguntas,
conhecidas como prompts, sejam aplicadas e que respostas sejam recebidas em linguagem natural. Os
chatbots são a interface, e os LLMs são o motor de raciocínio. Para a maioria das pessoas, no uso
direto, os dois parecem inseparáveis: uma única grande aplicação de IA generativa.
“A IA generativa é treinada em conjuntos massivos de dados, aprende padrões estatísticos e
relacionais, e então usa esses padrões para sintetizar uma saída original a partir de um prompt”, explica
Ahmad Shadid, cofundador e CEO (chief executive officer, ou diretor executivo) da ORGN.com. Isso é
importante. Ela não cria respostas factualmente corretas para os prompts; ela prevê respostas
prováveis com base nos padrões de relacionamento que aprendeu. Mas cria respostas linguisticamente
corretas e convincentes.
Quatro arquiteturas de deep learning sustentam o treinamento das variantes modernas de IA
generativa. A arquitetura transformer, o “T” em GPT (Generative Pre-trained Transformer, ou
transformador generativo pré-treinado) e BERT (Bidirectional Encoder
Representations from Transformers, ou representações codificadoras bidirecionais de
transformadores), é usada em LLMs como ChatGPT, BERT e Claude.
O treinamento por difusão gera variantes focadas na criação de imagens de alta qualidade, além
de áudio e vídeo. Fundamentalmente, esse processo começa com ruído aleatório. Matematicamente,
guiado pelo prompt do usuário, ele reduz e remodela o ruído até chegar ao resultado claro desejado. A
difusão inverte o processo de destruição. O resultado gerado também se baseia em probabilidade;
neste caso, na distribuição provavelmente correta de pixels.
A difusão clássica está evoluindo para a tecnologia de diffusion transformer, como no Sora, e para o
flow matching, usado em ferramentas como DALL-E 3 e Midjourney, que podem ser descritos como a
próxima geração da difusão.
As GANs (generative adversarial networks, ou redes adversárias generativas) são
treinadas por meio de duas redes adversárias presas em um ciclo de feedback. Uma cria dados falsos,
enquanto a outra aprende a detectar falhas, sugerindo repetidamente os problemas e devolvendo esse
feedback à criação. Ambas melhoram até que o detector não consiga mais encontrar falhas na criação.
Essa abordagem é boa para criar imagens, vídeos e áudios, mas foi amplamente substituída pela
tecnologia de difusão no uso empresarial. No entanto, criminosos ainda usam modelos simples,
rápidos e em tempo real baseados em GAN para troca de rosto e clonagem de voz, criando deepfakes.
A quarta arquitetura, os VAEs (variational autoencoders, ou autoencoders variacionais)
, usa uma arquitetura encoder-decoder para geração de dados sintéticos, compressão de dados
e detecção de anomalias. “Suas principais aplicações estão em imagens médicas e geração molecular
para descoberta de medicamentos”, comenta Shadid.
Confiança na IA generativa
“A IA generativa é um mecanismo de previsão. Ela gera aquilo que é estatisticamente plausível com
base em padrões que já viu antes”, explica Emanuel Salmona, CEO e cofundador da Nagomi Security.
“Isso a torna boa para exploração: gerar hipóteses de exploração, testar diferentes entradas e conectar
um comportamento estranho a padrões conhecidos de vulnerabilidade”, amplia Albert Ziegler, chefe de
IA da XBOW.
“É uma ferramenta que as empresas podem usar para automatizar trabalho criativo”, acrescenta
David Karandish, CEO e fundador da Capacity. Por causa disso, “ela está se tornando profundamente
incorporada aos fluxos de trabalho das equipes de segurança, desde resumir relatórios de incidentes
até ajudar a redigir planos de resposta”, continua Devvret Rishi, gerente geral de IA da Rubrik.
Galina Kho, diretora de estratégia da Cyberbay, descreve a chegada da IA generativa como uma
revolução de eficiência. “Não é que capacidades totalmente novas tenham surgido; é que as
capacidades existentes se tornaram dramaticamente mais fáceis de executar em escala.”
A maior questão no uso da IA é se é possível confiar em uma saída baseada em probabilidade, em
vez de fundamentada em uma verdade conhecida. A resposta aqui é uma ampla variação de “não”. “Ela
pode ser considerada confiável e não confiável ao mesmo tempo, dependendo da intenção, dos
modelos usados e do fluxo geral de dados envolvido”, comenta Melissa Ruzzi, diretora sênior de IA da
AppOmni.
“A IA generativa não é inerentemente confiável”, diz Yichuan Zhang, CEO e cofundador da Boltzbit.
“Ela é propensa a alucinações, declarações confiantes porém falsas, e vazamento de dados,
reproduzindo exatamente conteúdo de treinamento ou conteúdo de contexto.”
Trever Falconi, diretor de segurança e operações de TI (tecnologia da informação) da HOPPR, explica: “Implantar um modelo de IA generativa não é como instalar um software. Um modelo treinado em uma instituição se comportará de maneira diferente em outra, porque aprendeu a partir de um conjunto específico de dados e fluxos de trabalho. Leve-o para um novo ambiente e você introduziu uma mudança de distribuição: os dados do mundo real que ele encontra agora já não correspondem ao que ele foi criado para lidar, e o desempenho se degrada
silenciosamente.”
A confiabilidade é uma questão complicada, sugere Aaron Sant-Miller, VP (vice president, ou vicepresidente) de IA da Booz Allen. “O modelo está fazendo sua melhor tentativa de dar a resposta correta, mas não é perfeito.” Como a IA generativa é a base de toda IA, há um efeito cascata de seus pontos fortes e fracos tanto na IA agentiva quanto na IA sombra, discutidas adiante.
Defensores cibernéticos devem sempre estar cientes de que a IA generativa pode produzir erros;
mas isso não deve impedir seu uso. No entanto, como Ruzzi destaca ao citar o livro de Henri Thiel de
1971, Principles of Econometrics: “Modelos devem ser usados, não acreditados. A IA deve auxiliar
analistas, não substituir o julgamento.”
O perigo é que a natureza humana leva as pessoas a acreditarem em qualquer coisa dita com
confiança, e a IA generativa pode mentir com total confiança. Randell McNair, professor adjunto da
Florida Polytechnic University, explica no LinkedIn: “[A IA generativa] é, para todos os efeitos práticos,
uma criança ‘inteligente’ que ouviu a vida inteira que é ‘brilhante’, quando na verdade é apenas uma
criança de quase 8 anos que nunca experimentou uma única consequência tangível por estar errada, e
não tem memória de ter realmente falhado com alguém e precisado se arrepender genuinamente da
vergonha e do constrangimento que deveriam fazer parte do processo de ‘aprender com o fracasso’.”
Uso da IA generativa
Zhang sugere três áreas em que o uso da IA generativa oferece benefícios: produtividade do
SOC (security operations center, ou centro de operações de segurança), resumindo
logs complexos de incidentes e escrevendo rascunhos iniciais de relatórios; programação segura,
auxiliando desenvolvedores com código padrão que siga normas de segurança; e vibe coding,
auxiliando pessoas que não são desenvolvedoras a criar aplicações de software do zero.
“Muitas empresas usam esses modelos para gerar documentos, escrever artigos, gerar software ou
replicar mensagens que um humano enviaria ao orquestrar um fluxo de trabalho maior”, diz SantMiller. “Ela ajuda a redigir e-mails, resumir informações e reduzir esforço manual”, acrescenta Travis Springer, presidente da Sagiss.
“Equipes de imagens médicas estão testando modelos de visão e linguagem para revelar achados
em estudos de imagem”, diz Falconi, “e pesquisadores usam geração de dados sintéticos para
preencher lacunas quando dados reais de pacientes são escassos ou sensíveis demais para uso em
escala.”
Novos usos para a IA generativa continuam sendo desenvolvidos, mas, dentro da cibersegurança, o
uso mais eficaz vem da IA agentiva, que pode transformar a IA generativa de uma respondedora
passiva em uma participante ativa.
Mau uso da IA generativa
O mau uso da IA generativa dentro das empresas geralmente é involuntário: surge de uma falha de
governança em torno da tecnologia. O uso não governado de IA generativa é sempre um mau uso de
IA.
Indivíduos começam a depender da IA para fornecer respostas rápidas, mas não necessariamente
precisas, a perguntas ou problemas. Se um modelo de IA é implantado em toda a empresa sem
controle adequado sobre seu uso, isso pode levar à degradação dos níveis de habilidade pessoal e a um
aumento não governado de custos, pois a ideia de que IA é barata está errada. Se o acesso a um
chatbot não for fornecido, funcionários usarão serviços externos com ainda menos controle, como será
discutido na seção sobre IA sombra.
O problema vem tanto de indivíduos quanto da gestão ao tratarem a IA como uma solução, e não
como uma assistente. Por exemplo, existe o potencial de usar a capacidade de programação da IA para
reduzir o número de programadores qualificados e caros. Qualquer pessoa que consiga escrever
prompts para uma IA agora pode produzir um programa, mas tais programas inevitavelmente
introduzirão novas vulnerabilidades. Esse problema desaparece se pessoas qualificadas usarem a IA
como assistente, uma ferramenta para melhorar desempenho, em vez de um meio para reduzir pessoal
caro.
A governança é a chave para evitar o mau uso da IA generativa.
Abuso da IA generativa
Por abuso, queremos dizer uso por agentes mal-intencionados. Na cibersegurança, agentes malintencionados sempre adotam novas tecnologias em ritmo mais rápido que empresas legítimas. Isso
certamente tem sido verdadeiro com a IA. A principal razão é o poder e a complexidade da IA. Quando
uma empresa desenvolve uma aplicação interna de IA, precisa ter certeza de que tudo está correto ou
pode enfrentar uma catástrofe autoinfligida. Isso leva tempo.
Criminosos não têm essa preocupação. Se algo que implementam não funciona perfeitamente,
simplesmente recomeçam sem custo disruptivo. O resultado é que novos ataques tendem a aparecer
antes de defesas adequadas. Os defensores podem até esperar esses ataques, mas não têm
conhecimento detalhado deles antes que comecem.
Zhang destaca três exemplos principais de abuso da IA generativa: phishing hiper-realista,
eliminando os indícios de gramática e ortografia do phishing tradicional; malware polimórfico, usando
IA generativa para reescrever sutilmente código malicioso e contornar detecção baseada em
assinaturas; e sites de phishing ou softwares agressivos criados por vibe coding, usando IA generativa
para reescrever sutilmente aplicativos que se parecem com os originais, mas roubam dados sensíveis
do usuário.
Gino Sciretta, CEO da BranditScan, alerta: “Gerar uma identidade falsa convincente agora leva
segundos. Detectar uma com confiabilidade ainda exige ferramentas especializadas e analistas
treinados. A maioria das plataformas e dos usuários não está equipada para isso. A tecnologia
ultrapassou as salvaguardas, e a lacuna está aumentando, não diminuindo.”
A IA generativa introduziu uma mudança significativa na qualidade da engenharia social
adversária. Ela pode ser usada para traçar o perfil de um indivíduo ao analisar qualquer presença em
redes sociais e, então, desenvolver uma isca direcionada. Pode construir uma história de fundo
convincente para o ataque e preparar um site falso ou disfarçado para capturar dados pessoais.
“A IA generativa torna phishing direcionado em massa, iteração de malware e pesquisa de
vulnerabilidades muito mais acessíveis a agentes mal-intencionados. Ferramentas como WormGPT
removem completamente as barreiras de segurança, então os atacantes obtêm as mesmas vantagens
de velocidade da IA generativa comum, mas sem fricção”, comenta Harshit Agarwal, cofundador e CEO
da Appknox.
Clonagem de imagem e voz, além da geração de vídeo, está criando um cenário de deepfake que
aumenta a ameaça de BEC (business email compromise, ou comprometimento de e-mail
corporativo) e VEC (vendor email compromise, ou comprometimento de e-mail de
fornecedor), que só deve crescer em escala e sofisticação.
“Noventa e quatro por cento das imagens geradas por IA tinham artefatos visuais, mas esses
artefatos eram tão sutis que a maioria dos alvos nunca os notou”, acrescenta Sciretta. “Os sinais
reveladores estão lá se você souber onde procurar, como reflexos de luz inconsistentes nos olhos, em
que uma pupila reflete uma janela e a outra reflete algo completamente diferente. Mas consumidores
não são treinados para observar isso, e os geradores estão melhorando mais rápido que a
conscientização pública.”
Mas ele acrescenta: “O desenvolvimento mais perigoso não são as fotos falsas. São as conversas
falsas. Sistemas de chat movidos por IA agora conseguem sustentar diálogos emocionalmente
convincentes por dias ou semanas, acelerando a manipulação emocional cerca de 300% mais rápido do
que um operador humano conseguiria.”
Como diz Ted Miracco, CEO da Approov: “O perigo não é apenas o que a IA pode fazer; é a
velocidade com que ela age antes que alguém perceba.”
Por enquanto, criminosos usam principalmente a IA para melhorar aquilo que já fazem: engenharia
social mais eficiente, descoberta de vulnerabilidades em código e geração de exploits. O próximo passo
será automatizar o processo completo de ataque por meio de sistemas de IA agentiva.
Futuro da IA generativa
A lei de Amara afirma: “Nós superestimamos o impacto da tecnologia no curto prazo e
subestimamos seu efeito no longo prazo.” A dificuldade com a IA é que o curto prazo pode ser a
próxima semana, enquanto o longo prazo provavelmente são apenas alguns meses. Quando a maioria
das pessoas realmente entende o que está acontecendo, o que está acontecendo já mudou.
Ainda assim, alguns especialistas corajosos fizeram previsões. Ronan Murphy, diretor de estratégia
de dados da Forcepoint, acredita: “A IA generativa estará incorporada em tudo: em cada planilha, cada
vídeo, cada fluxo de trabalho. A distinção entre ‘usar IA’ e simplesmente ‘fazer seu trabalho’
praticamente desaparecerá. Para equipes de segurança, isso significa que a superfície que você tenta
proteger continua se expandindo, provavelmente mais rápido do que sua estrutura de políticas
consegue acompanhar.”
Zhang vê um futuro com SLMs (small language models, ou pequenos modelos de
linguagem). “Estamos caminhando para pequenos modelos de linguagem hiper
especializados em domínios específicos, como um modelo treinado exclusivamente em
vulnerabilidades do kernel Linux, para reduzir ruído e aumentar a precisão.”
Sant-Miller é mais cauteloso, questionando se a própria natureza da IA atual torna seu futuro
indeterminável. “O futuro da IA generativa é complicado”, diz ele.
“Os modelos continuam ficando maiores e, consequentemente, mais poderosos. Mas há duas
forças opostas. Modelos maiores são mais caros, tanto para treinar quanto para usar, então capacidade
vem com custo. E os modelos são treinados com conteúdo gerado por humanos, que fornece uma
aproximação do raciocínio humano. O que acontece quando a maior parte do conteúdo for gerada por
IA e já não fornecer essa aproximação? Essas são as grandes questões que precisamos resolver como
indústria.”