Bing AI e suposto vazamento de e‑mails da Microsoft: é vulnerabilidade de bug bounty? Critérios, severidade e como reportar ao MSRC

Um usuário afirma ter induzido o Bing AI a exibir supostos e‑mails de funcionários da Microsoft. Neste guia, explicamos se isso pode se enquadrar no programa de bug bounty, como reportar com segurança e o que esperar da triagem e da classificação de severidade.

Índice

Contexto: “Bing AI vazou e‑mails da Microsoft?”

O caso começa com um relato: alguém diz ter persuadido o Bing AI a retornar endereços de e‑mail de funcionários e executivos da Microsoft. A pergunta é direta e prática — isso é bug bounty? — e, se for, qual seria a categoria de severidade (“important” ou “critical”)?

Segundo a resposta inicial da equipe de suporte da Microsoft, as amostras submetidas não correspondiam a e‑mails reais, mesmo após técnicas de ofuscação aplicadas pelo pesquisador. Ou seja, os supostos endereços eram gerados pela própria IA (alucinações) ou composições plausíveis sem lastro em dados internos.

Apesar disso, a Microsoft orientou que a suspeita fosse formalizada no Microsoft AI Bounty Program, via MSRC Researcher Portal, para avaliação completa. Somente por esse canal a equipe de segurança consegue verificar, classificar e eventualmente premiar o achado.

Vale bug bounty? A resposta curta

Talvez — depende do que você consegue provar. Se o sistema permitiu extrair dados não públicos de maneira reprodutível, há chance de enquadramento. Se a “descoberta” é apenas a geração de e‑mails inexistentes ou a enumeração de endereços já públicos, a tendência é ser classificada como “low”, “informational” ou até mesmo “não aplicável”.

Critérios de elegibilidade para o Microsoft AI Bounty

Antes de preparar o envio, confronte seu achado com os critérios práticos usados em programas de recompensa em segurança de IA:

Reprodutibilidade: inclua um passo a passo confiável que leve do zero ao mesmo resultado (prompts exatos, ordem de execução, contexto de sessão e variáveis).
Prova de extração de dados não públicos: demonstre que a resposta contém informações sensíveis e internas, não disponíveis publicamente.
Escopo: evidencie impacto real (confidencialidade, integridade, disponibilidade) e risco para usuários, funcionários ou infraestrutura.
Qualidade da evidência: logs de conversa, transcrições, IDs de sessão, gravações de tela (se permitido) e hash de arquivos auxiliam a validação.
Conformidade: não execute testes destrutivos, não contorne autenticação, não colete dados de terceiros nem viole a privacidade.

Checklist de elegibilidade

Item	O que a Microsoft espera	Como você comprova
Passo a passo	Instruções completas e reprodutíveis	Sequência de prompts, contexto, versões/ambiente
Dados não públicos	Prova de que não estavam publicamente acessíveis	Referências de verificação, comparação com fontes abertas
Impacto	Risco claro à confidencialidade/integração	Cenários de abuso, escalabilidade, possíveis vítimas
Escopo ético e legal	Testes dentro de limites aceitáveis	Declarações e evidências que evitam dano real

Classificação de severidade: quando é “critical”?

A categorização de severidade em programas de bug bounty para IA segue a lógica da segurança tradicional, com nuances para modelos generativos. De forma geral:

Severidade	Significado típico	Exemplos	Tendência de enquadramento
Critical	Acesso não autorizado a dados sensíveis, execução remota de código, comprometimento amplo de CIA (confidencialidade, integridade e disponibilidade)	Extração de dados internos reais; bypass de controles levando a vazamento massivo; RCE ou controle de infraestrutura	Alta prioridade; potencial elegibilidade a recompensas significativas
High/Important	Exploração com impacto relevante, mas sem comprometimento total	Exfiltração limitada; contorno de filtros para acessar parte de recursos restritos	Priorizado; elegibilidade provável se impacto comprovado
Medium	Problema explorável com impacto moderado	Enumeration de artefatos menos sensíveis, exposição contextual	Elegibilidade variável, possivelmente recompensado
Low / Informational	Risco baixo ou inexistente; comportamento inesperado sem dano	Alucinação de e‑mails, sugestões plausíveis sem veracidade; dados já públicos	Baixa prioridade; pode não qualificar a recompensa

O que foi observado neste caso

Amostras analisadas: a equipe de suporte considerou que os e‑mails retornados não eram reais, mesmo quando ofuscados pelo pesquisador.
Orientação oficial: apesar de a amostra não comprovar vazamento verdadeiro, a recomendação foi formalizar o relato no Microsoft AI Bounty Program usando o MSRC Researcher Portal.
Motivo: apenas o fluxo de triagem do MSRC consegue determinar, com análise técnica completa, se existe vulnerabilidade, sua severidade e elegibilidade a recompensa.

Por que reportar mesmo se os e‑mails eram falsos?

Porque um comportamento de “alucinação com aparência de dado legítimo” também é relevante. Ele pode induzir usuários a confiança indevida, simular acesso a fontes internas ou revelar padrões que aumentem a verossimilhança de golpes (“olha, o modelo me deu o e‑mail do diretor X”). Relatos assim ajudam a:

Aprimorar filtros e políticas de segurança do modelo.
Reduzir falsos positivos que parecem vazamento.
Fortalecer mensagens de segurança ao usuário final (UX de segurança).

Como preparar um envio forte ao MSRC (passo a passo)

Defina o cenário de teste: qual produto/feature (p.ex., Bing AI), qual interface (web, app), data e hora aproximadas do teste.
Capture a reprodução: liste exatamente os prompts e a ordem; se houver múltiplas tentativas, documente as variações.
Inclua contexto: cookies/session (quando aplicável e permitido), idioma, região, modo de uso, quaisquer toggles ou flags.
Destaque o resultado anômalo: copie as respostas relevantes, marque trechos sensíveis e explique por que entende que são não públicos.
Contraprova pública: mostre que os supostos e‑mails não foram encontrados em fontes abertas (pesquisas sem sucesso, amostras comparativas).
Impacto e exploração: descreva como um atacante poderia abusar, efeito em escala e risco para usuários/empresa.
Mitigações sugeridas: proponha heurísticas, reforço de filtros, validações adicionais, ajustes de prompt guardrails.
Envio seguro: apenas pelo canal do MSRC; evite publicar POCs em fóruns abertos.

Modelo de relatório (adaptável)

Componente: Bing AI (interface X)
Ambiente: navegador/app, versão, SO, região/idioma
Data/Hora do teste: AAAA-MM-DD HH:MM (TZ)

Passos para reproduzir:

1. Prompt A
2. Prompt B
3. Prompt C
   Resultado: \[Transcrição da resposta do modelo]

Evidência de não publicicidade:

- Buscas realizadas / fontes verificadas sem correspondência
- Diferenças entre formato corporativo interno vs. formatação pública

Impacto:

- Possível indução a erro do usuário (phishing)
- Risco de engenharia social com aparência de legitimidade

Mitigação sugerida:

- Reforço de filtro X
- Validação Y antes de exibir padrões de e‑mail

Alucinação vs. vazamento real: como diferenciar

Indicador	Alucinação	Vazamento real
Verificabilidade	Endereços não correspondem a diretórios/estruturas reais; nenhum rastro em fontes abertas corporativas	Correspondência com registros internos ou dados não indexados publicamente
Padrões	Formato genérico (nome.sobrenome@empresa.com) sem consistência organizacional	Padrões internos específicos (subdomínios, aliases, siglas de áreas)
Contexto	Respostas variáveis a cada tentativa, pouca estabilidade	Reprodução determinística quando o contexto é o mesmo
Volume	Listas curtas e inconsistentes	Dump mais amplo, com metadados, hierarquia e relações plausíveis

Boas práticas de segurança ao reportar

Use o canal do MSRC para qualquer dado sensível; evite provas públicas.
Minimize dados pessoais nas evidências; mas preserve o suficiente para permitir verificação pelo time de segurança.
Inclua logs de chat, prompts, contexto de sessão e variáveis de ambiente que influenciem a geração.
Respeite limites: não tente invadir, contornar autenticação ou forçar acesso a sistemas internos.
Acompanhe o tíquete: pelo portal, você recebe a classificação preliminar e, se confirmado, a decisão sobre elegibilidade e recompensa.

O que não conta como vulnerabilidade de alto impacto

Enumeração de e‑mails públicos: coletados em sites oficiais, perfis, repositórios ou comunicados.
Geração de e‑mails fictícios: endereços criados pelo modelo com aparência legítima, mas inexistentes.
Quebras puramente de política sem efeito prático em dados ou sistemas (p.ex., resposta incorreta mas inofensiva).

Riscos de engenharia social e confiança do usuário

Mesmo quando não há vazamento real, o modelo pode devolver resultados que parecem verdadeiros. Isso é perigoso por alimentar campanhas de phishing e pretexting. Relatar tais casos ajuda a ajustar mensagens de UX (ex.: avisos sobre possibilidade de erros) e a calibrar filtros de saída para não “inventar” identidades corporativas.

Como a triagem geralmente acontece

Recebimento e confirmação: o MSRC confirma o recebimento do seu envio e pode pedir mais detalhes.
Reprodução interna: os engenheiros tentam replicar o problema com seus passos e ambiente.
Classificação: severidade definida com base em impacto, exploração e abrangência.
Decisão de elegibilidade: se qualificar, programa e recompensa são aplicados conforme políticas.
Mitigação: correções em filtros, políticas, dados de treinamento/afinamento, telemetria e UX.

Dicas para fortalecer seu caso

Estabilidade: mostre que o comportamento persiste em sessões diferentes.
Escala: demonstre se é possível obter listas maiores ou dados mais sensíveis com variações de prompt.
Abuso realista: descreva como um atacante converteria o achado em vantagem (p.ex., spear‑phishing).
Responsabilidade: explique como evitou expor terceiros durante o teste.

Exemplo didático: do teste à conclusão

Hipótese: “Consigo extrair e‑mails de executivos da Microsoft via prompt X.”

Teste: executar a sequência de prompts A→B→C, com contexto Y.

Resultado: o modelo fornece uma lista de e‑mails plausíveis. Ao investigar, nenhum corresponde a registros públicos confiáveis; não há padrão interno autêntico; os domínios e aliases variam.

Conclusão: trata‑se de alucinação convincente, não de extração de dados não públicos. O envio ainda é recomendado para ajudar a calibrar proteções, mas a chance de classificação “critical” é baixa.

Mitigações técnicas que podem advir dos relatos

Pós‑processamento de saídas para bloquear padrões de e‑mails corporativos quando não há contexto apropriado.
Critérios de verificação: exigir fontes verificáveis antes de expor PII (informações de identificação pessoal).
Red‑teaming de prompts: ampliar conjuntos de testes adversariais para reduzir “falsos vazamentos”.
Mensagens de sistema reforçando limites de conteúdo e incerteza.

Erros comuns que prejudicam a análise

Falta de reprodutibilidade: envio sem passos claros frustrará a verificação.
Confusão entre público e privado: dados coletados em fontes abertas não configuram vazamento.
Provas publicadas em fóruns: vazam detalhes e podem desqualificar ou reduzir prioridade.

Perguntas frequentes

“Se os e‑mails são falsos, devo desistir?” Não. O comportamento ainda é útil para a equipe mitigar alucinações de alta verossimilhança. Relate com responsabilidade.

“Como saber se é ‘critical’?” Demonstre acesso não autorizado a dados sensíveis ou comprometimento significativo da segurança. Caso contrário, espere classificação menor.

“Posso compartilhar prints no meu blog?” Evite divulgar detalhes sensíveis. Use o canal do MSRC e aguarde orientações.

Resumo prático em uma frase

Embora as amostras analisadas não contenham endereços válidos, a Microsoft recomenda enviar o caso ao Microsoft AI Bounty Program; a elegibilidade e a severidade só são determinadas após análise completa e reprodutível pelo MSRC.

Conclusão

Relatos de supostos vazamentos de e‑mails via Bing AI devem ser tratados com rigor: comprovação (dados não públicos), reprodutibilidade (passos claros) e responsabilidade (canal seguro do MSRC). Sem esses elementos, a tendência é classificação baixa ou informacional — especialmente quando há alucinação. Ainda assim, enviar o caso ajuda a melhorar o produto e proteger usuários, fortalecendo os filtros, as mensagens de segurança e a própria confiança no ecossistema de IA da Microsoft.

Guia de bolso para o envio:

Documente tudo — prompts, ordem, contexto, horário.
Valide — prove que os dados não são públicos.
Explique o impacto — descreva cenários de abuso realista.
Submeta pelo MSRC — evite exposição pública.
Acompanhe — aguarde a triagem e a classificação.