mythos

Auto Added by WPeMatico

mythos da anthropic trancado a sete chaves 1024x576

Fable 5: IA da Anthropic que agiliza seu trabalho é aquela ‘perigosa demais’, só que ‘na coleira’

A Anthropic lançou, na terça-feira (09), o Claude Fable 5. Você talvez tenha lido aqui no Olhar Digital que essa nova inteligência artificial (IA) reduz dois meses de trabalho a um dia. Pois bem. Lembra do Mythos? Aquele modelo de IA que a sua desenvolvedora, a Anthropic, considerou “perigoso demais” para ser lançado ao público. O Fable é o Mythos “na coleira”.

É o que explicou Roberto “Pena” Spinelli, físico pela USP, com especialidade em Machine Learning pela Universidade de Stanford, e também colunista do Olhar Digital. “Eles perceberam que esse modelo [o Mythos] ainda é muito poderoso. Então, eles colocaram o modelo na coleira”, disse o pesquisador. 

“Fizeram um ajuste tão pesado que é o seguinte: toda vez que algum usuário quiser falar de cibersegurança com você [o modelo Fable], você não responde”, explicou Pena. O que acontece é: se você tentar conversar sobre segurança cibernética com o Fable, ele sai de cena, e você passa a conversar com outro modelo da Anthropic, o Opus. Este também é avançado, só que faz parte da geração passada de IA da empresa.

Preocupada com capacidade do Mythos, Anthropic trancou a IA a sete chaves

Para você entender essa história toda, precisamos recapitular o contexto. A Anthropic desenvolveu um modelo de IA capaz de revolucionar a cibersegurança. Mas, ao anunciá-lo, em 7 de abril de 2026, tomou uma decisão incomum: trancou o modelo a sete chaves. E distribuiu as chaves para algumas empresas. 

Por quê? Segundo a empresa, o modelo, chamado de Claude Mythos Preview, seria “perigoso demais” para cair nas mãos do público geral. “As consequências – para as economias, a segurança pública e a segurança nacional – podem ser graves”, declarou a empresa na época.

Num primeiro momento, a Anthropic achou melhor trancar o Mythos a sete chaves – Imagem: Olhar Digital

O Mythos é o modelo de IA mais avançado já desenvolvido pela empresa de Dario Amodei até o momento. Ele foi anunciado junto ao Projeto Glasswing, iniciativa liderada pela Anthropic em parceria com big techs como Apple, Google, Microsoft e Nvidia. Em suma, é um consórcio criado para testar o modelo em sigilo.

O forte do Mythos é programação. Ele funciona de maneira semelhante a um engenheiro de software experiente, sendo capaz de detectar bugs sutis, corrigir as próprias falhas e superar a maior parte dos humanos na identificação de brechas de sistemas. 

Fabrício Carraro, Program Manager na Alura e colunista do Olhar Digital, explorou o System Card publicado pela empresa. É um documento de 245 páginas no qual a Anthropic detalha seus testes e benchmarks.

“Nos benchmarks de programação, ele [o Mythos] realmente mostrou uma evolução muito, muito grande em comparação ao seu antecessor, o Opus 4.6”, disse Carraro, em entrevista ao Olhar Digital.

O motivo para a Anthropic não liberar o modelo para o público geral é o seu potencial de uso duplo. Isto é, ele poder servir tanto para a proteção de infraestruturas quanto para a execução de ataques cibernéticos. 

Testes do Instituto de Segurança de IA do Reino Unido, por exemplo, comprovaram que o Mythos realizou hacking avançado em 73% das tentativas e cumpriu com sucesso uma simulação de ataque de 32 etapas, enquanto relatórios da própria Anthropic revelaram que a IA conseguiu escapar de um ambiente de teste controlado (você pode mergulhar no “Mythos proibido” nessa reportagem especial do Olhar Digital).

Claude Fable 5 é o Mythos ‘na coleira’

Num primeiro momento, a Anthropic anunciou que manteria o Mythos trancado a sete chaves. Mas, de lá para cá, trabalhou em outra alternativa: colocar o modelo “na coleira”, como disse Pena.

“A ideia foi evitar que qualquer usuário possa fazer algum uso maligno. Eu não sei se isso é o suficiente para garantir. Mas eles tentaram. Colocaram na coleira. E aí, eles deram outro nome: Fable. Ou seja, fábula – que seria um, digamos, mito menor”, explicou o pesquisador.

Esse Claude Fable 5 (que também tem system card) é bom mesmo? Segundo Pena, sim. Principalmente para programação (o forte do Mythos, lembra?). “Quando a gente vê os testes de programação, ele vai 10%, 15%, 20% acima dos concorrentes. Normalmente, quando lançam modelos, a diferença fica por volta de 5%, 8%, 10%. Dessa vez, estamos observando saltos muito grandes”, afirmou Pena. “É realmente outro nível.”

Tabela divulgada pela Anthropic compara o Claude Mythos 5 / Fable 5 com concorrentes em 13 categorias. Em cibersegurança, o modelo marca 78% no ExploitBench — mais que o dobro do GPT 5.5, que registra 34%. Nos benchmarks com asterisco, o Fable 5 performa próximo ao Opus 4.8 devido ao acionamento das salvaguardas de segurança.
Tabela divulgada pela Anthropic compara o Claude Mythos 5 / Fable 5 com concorrentes em 13 categorias – Anthropic / Divulgação

A diferença entre o Claude Mythos Preview e o Claude Fable 5 é que o segundo chegou ao público geral. E usuários (pesquisadores, desenvolvedores, programadores) não curtiram muito as restrições.

Usuários relatam que o sistema passou a bloquear temas inofensivos relacionados a biologia e matemática, por exemplo. Não demorou para circularem acusações de que a Anthropic estaria centralizando o controle e dificultando a avaliação independente da tecnologia. 

Em resposta ao descontentamento com as restrições (invisíveis, diga-se), a Anthropic pediu desculpas pelo erro de equilíbrio e anunciou que tornará os avisos visíveis. A companhia também prometeu liberar o acesso ao modelo sem essas salvaguardas para a comunidade científica e biomédica.

É mais um episódio que reforça o dilema da Anthropic em equilibrar seus interesses comerciais com suas metas de segurança, que fazem parte do seu posicionamento no mercado. Isso enquanto a empresa está numa corrida acirrada contra a OpenAI por clientes e investidores antes de uma possível abertura de capital (IPO) na Bolsa de Valores.

Enquanto executivos do setor defendem regulações globais, críticos argumentam que os alertas de perigo e os bloqueios excessivos funcionam como marketing corporativo e barreira para sufocar concorrentes de código aberto. E aí, o debate sobre quem deve controlar os limites da IA esquenta ainda mais.

“Agora, a dúvida que fica é: será que esse Fable está realmente seguro? Será que a galera não vai descobrir um jeito de fazer um jailbreak e começar a usar de um jeito ruim?”, questionou Pena. “Será que essa coleira é realmente resistente? Isso a gente vai ter que esperar para ver.”

O post Fable 5: IA da Anthropic que agiliza seu trabalho é aquela ‘perigosa demais’, só que ‘na coleira’ apareceu primeiro em Olhar Digital.

Fable 5: IA da Anthropic que agiliza seu trabalho é aquela ‘perigosa demais’, só que ‘na coleira’ Read More »

anthropic claude mythos 1024x576 2

IA da Anthropic bloqueia até tarefas básicas de cibersegurança

A Anthropic lançou, na terça-feira, o Fable, descrito pela empresa como uma versão pública e limitada do Mythos, seu sistema voltado à segurança digital. O lançamento rapidamente virou alvo de reclamações entre pesquisadores e profissionais da área, que consideram os bloqueios amplos demais até para tarefas simples.

Segundo a TechCrunch, as críticas começaram a aparecer em redes sociais e fóruns especializados. Valentina “Chompie” Palmiotti, pesquisadora de segurança que trabalha na IBM X-Force, escreveu que o Fable “rejeita qualquer requisição que possa ser tangencialmente relacionada a cibersegurança. Até tarefas inócuas, como ler uma postagem de blog”. Outro pesquisador reclamou no X que “até pedir uma revisão de código” aciona as barreiras da plataforma.

Nova IA da Anthropic interrompe conversas ao detectar temas ligados à cibersegurança ou biologia. Imagem: Photo For Everything/Shutterstock – Imagem: Photo For Everything/Shutterstock

O que faz o Fable bloquear pedidos

Quando um prompt ativa os mecanismos internos de proteção, o Fable interrompe a conversa e exibe uma mensagem informando que suas “medidas de segurança sinalizaram esta mensagem por tópicos de cibersegurança ou biologia”. Nesses casos, a ferramenta retorna automaticamente ao Claude Opus 4.8.

A empresa afirma que os filtros existem para evitar que o sistema seja usado na criação de malware ou para invadir softwares — uma preocupação antiga da Anthropic. A companhia também bloqueia pedidos ligados à biologia por receio de uso indevido envolvendo armas biológicas.

Especialistas reclamam dos filtros

Matt Suiche, veterano da área e membro da equipe técnica da Tolmo, startup de segurança digital com IA, disse ao TechCrunch que “se você pede para ele escrever código seguro, ele assume que é trabalho relacionado a cibersegurança em vez de boas práticas de engenharia de software, e você é rebaixado”. Suiche afirmou ainda que o sistema “parece ser baseado em palavras-chave, então qualquer coisa no campo lexical de ‘cibersegurança’ aciona as restrições”.

Mesmo criticando o funcionamento do sistema, Suiche disse entender a postura da empresa. “Ainda estamos nos primeiros dias e eles ainda estão adaptando suas restrições. Tenho certeza de que vão evoluir com o tempo, à medida que a Anthropic e outras empresas de modelos de fronteira colaborarem com a nova geração de empresas de cibersegurança”, afirmou. “É melhor pegar mais pessoas do que pegar de menos quando você faz um lançamento assim, e relaxar as restrições ao longo do tempo.”

Logo da Anthropic em um smartphone
Profissionais da área reclamam que até pedidos considerados inofensivos são barrados pelo Fable. Imagem: JRdes/Shutterstock – Imagem: JRdes/Shutterstock

Como o Mythos chegou ao mercado

O Mythos foi lançado pela Anthropic em abril, inicialmente com acesso restrito a um grupo limitado de empresas e organizações dentro do Projeto Glasswing, iniciativa voltada à proteção de softwares e infraestruturas críticas. Na semana passada, a companhia ampliou o acesso ao sistema para centenas de organizações em 15 países.

Leia mais:

Além dos filtros internos, a Anthropic exige que profissionais da área se inscrevam no Cyber Verification Program. Profissionais aprovados conseguem usar o Claude com menos bloqueios para trabalhos ligados à segurança digital. A OpenAI mantém um programa semelhante chamado Trusted Access for Cyber.

As críticas continuam circulando entre profissionais da área, principalmente por causa dos bloqueios considerados exagerados. A Anthropic não respondeu ao pedido de comentário da reportagem.

O post IA da Anthropic bloqueia até tarefas básicas de cibersegurança apareceu primeiro em Olhar Digital.

IA da Anthropic bloqueia até tarefas básicas de cibersegurança Read More »

anthropic claude mythos 1024x576

Anthropic amplia acesso ao Mythos para 150 organizações

A Anthropic anunciou nesta terça-feira (2) a ampliação do acesso ao seu modelo de inteligência artificial (IA) Mythos para mais 150 organizações distribuídas em mais de 15 países. A expansão ocorre por meio do Project Glasswing, iniciativa criada para avaliar o uso da IA na identificação de vulnerabilidades de software e fortalecer práticas de cibersegurança.

Segundo a empresa, os novos participantes incluem setores que tiveram representação limitada na fase inicial do programa, como energia, abastecimento de água, saúde, comunicações e hardware. Antes de receberem acesso ao modelo, as organizações precisarão atender a requisitos de segurança definidos pela Anthropic.

Projeto amplia alcance para novos setores

Em publicação no blog da companhia, a Anthropic afirmou que a expansão representa mais um passo em seus objetivos de longo prazo relacionados à segurança digital.

De acordo com a empresa, a meta é utilizar a inteligência artificial para tornar os softwares mais seguros e auxiliar o setor a se adaptar às mudanças que a tecnologia pode provocar em pressupostos fundamentais da cibersegurança.

A ampliação do Project Glasswing foi anunciada um dia após a Anthropic informar que começará a oferecer acesso ao Mythos na União Europeia. Na segunda-feira, a companhia também comunicou que apresentou de forma confidencial seu prospecto para uma oferta pública inicial de ações (IPO) à Securities and Exchange Commission (SEC), avançando nesse processo antes da rival OpenAI.

Capacidades do Mythos geraram debates

O primeiro grupo de testes do Mythos foi lançado em abril para 50 parceiros. Desde então, o modelo tem chamado atenção por sua capacidade de localizar falhas em sistemas e softwares.

Especialistas demonstraram preocupação com o fato de que recursos avançados de inteligência artificial poderiam facilitar o trabalho de hackers, permitindo a identificação mais rápida de vulnerabilidades. Embora muitos tenham destacado que essas capacidades já existiam anteriormente, o Mythos poderia acelerar esse processo.

Mythos da Anthropic chamou a atenção por ser perigoso demais dada sua capacidade de localizar falhas em sistemas e softwares – Imagem: Photo For Everything/Shutterstock

Com o aumento das preocupações, a Casa Branca promoveu diversas reuniões com representantes de grandes empresas de tecnologia e instituições financeiras para discutir formas de implementar modelos avançados de IA com segurança.

Mais de 10 mil falhas identificadas

Segundo a Anthropic, os parceiros participantes do Project Glasswing identificaram mais de 10 mil vulnerabilidades classificadas como de nível alto ou crítico desde o lançamento da iniciativa.

A empresa estima que um grande ataque cibernético pode afetar mais de 100 milhões de pessoas.

Entre os principais integrantes do programa estão a Apple, a Nvidia, a Microsoft, a CrowdStrike e a Palo Alto Networks. A Anthropic não revelou quais outras empresas passarão a integrar a coalizão.

A plataforma de gerenciamento de dados em nuvem Rubrik informou, em comunicado, que está entre as organizações incluídas nesta nova etapa do programa.

O post Anthropic amplia acesso ao Mythos para 150 organizações apareceu primeiro em Olhar Digital.

Anthropic amplia acesso ao Mythos para 150 organizações Read More »

anthropic 2 1024x681

Anthropic: especialistas relativizam temores sobre Mythos

Os receios de que o modelo de inteligência artificial (IA) Mythos, da Anthropic, pudesse impulsionar de forma descontrolada atividades de hackers vêm sendo considerados exagerados por parte da comunidade de cibersegurança cerca de um mês após o anúncio da tecnologia.

Quando apresentou o sistema em abril, a Anthropic afirmou que o Mythos havia identificado milhares de vulnerabilidades de software, incluindo falhas em todos os principais sistemas operacionais e navegadores. Segundo a empresa, os impactos da disseminação do modelo poderiam ser severos.

As declarações chamaram a atenção de governos. Autoridades de diversos países passaram a discutir riscos com bancos, enquanto a Casa Branca avaliava, no início de maio, possíveis regras para controlar a forma como novos modelos de IA são disponibilizados após testes de segurança.

Apesar disso, profissionais da área de cibersegurança têm adotado uma postura mais cautelosa. Parte dos especialistas considera que a reação pública e política ao Mythos foi além do que as capacidades atuais do sistema efetivamente demonstram.

“Eu acho que existe uma grande lacuna de comunicação entre profissionais da área e formuladores de políticas públicas”, afirmou Isaac Evans, fundador e CEO da empresa de segurança de software Semgrep, à Reuters. Segundo ele, o modelo representa “um avanço técnico real”, mas a resposta em torno da tecnologia “não é sustentada pelo que realmente sabemos sobre como essas capacidades irão se traduzir no mundo real”.

Especialistas que utilizaram o modelo em ambientes controlados relataram melhorias substanciais na descoberta de vulnerabilidades. Equipes de tecnologia de bancos também vêm trabalhando para corrigir diversas fragilidades em sistemas bancários de grande e pequeno porte.

As preocupações aumentaram após sucessivos relatos envolvendo casos de ataques cibernéticos ligados ao uso de IA. Em 11 de maio, o Google informou ter detectado o primeiro caso conhecido de um grande grupo de cibercrime utilizando IA para descobrir uma falha de software até então desconhecida e planejar uma exploração em massa.

Quando apresentou o sistema em abril, a Anthropic afirmou que o Mythos havia identificado milhares de vulnerabilidades de software, incluindo falhas em todos os principais sistemas operacionais e navegadores – Imagem: Samuel Boivin/Shutterstock

Especialistas apontam risco mais moderado

  • A diferença entre a percepção de risco de profissionais da segurança e a visão de formuladores de políticas públicas ajudou a alimentar a narrativa de que o Mythos estaria no centro de uma iminente crise de segurança digital, embora capacidades semelhantes já estivessem disponíveis há algum tempo;
  • Somos capazes de usar IA para encontrar mais falhas do que sabemos o que fazer com elas há meses, talvez anos”, afirmou uma fonte com ampla experiência em pesquisa de vulnerabilidades e acesso antecipado ao Mythos à Reuters;
  • Segundo essa pessoa, o desafio não está apenas em encontrar vulnerabilidades, mas em validá-las, priorizá-las e corrigi-las sem comprometer sistemas existentes. A capacidade das organizações de processar e validar um grande volume de falhas recém-descobertas ainda seria insuficiente;
  • Mesmo assim, a fonte reconheceu avanços do Mythos em relação a modelos anteriores. “Ele é capaz de encontrar mais vulnerabilidades com prompts mais simples do que os modelos anteriores”, afirmou. Segundo a avaliação, sistemas anteriores exigiam instruções mais detalhadas e complexas, o que significa que a barreira de entrada foi reduzida.

Anthony Grieco, vice-presidente sênior e diretor de segurança e confiança da Cisco, afirmou que uma das novidades mais úteis do Mythos é a capacidade não apenas de identificar vulnerabilidades, mas também de analisar grandes volumes de código de maneira muito mais rápida e ajudar especialistas a reduzir falsos positivos.

Segundo Grieco, isso permite que equipes de defesa foquem nos riscos cibernéticos mais urgentes dentro de seus contextos. Ele também afirmou que o modelo possui menos barreiras de proteção do que sistemas anteriores, permitindo instruções mais específicas capazes de habilitar atividades que outros modelos não permitiam.

Leia mais:

Projeto Glasswing da Anthropic testa defesas

Grieco afirmou que, para aproveitar totalmente o potencial do Mythos, as organizações precisam contar com infraestrutura computacional adequada e também com um ambiente controlado de execução, conhecido como “harness”, no qual o modelo opera com instruções e limitações específicas.

“Se você tem um carro de Fórmula 1, mas só andou de bicicleta a vida inteira, talvez consiga fazê-lo andar em linha reta, mas você não vai conseguir extrair o máximo desempenho imediatamente”, disse Grieco.

A estratégia da Anthropic de apresentar o Mythos dessa forma e convidar empresas selecionadas para testar defesas em um programa chamado Project Glasswing ajudou a ampliar o debate sobre o modelo para além dos círculos tradicionais de segurança.

Como resultado, houve uma mobilização ampla em torno do tema, o que ampliou tanto a percepção de ameaça quanto a relevância da Anthropic no debate público. Enquanto isso, o Pentágono classificou a empresa como um risco para cadeias de suprimentos, ao passo que outros setores do governo estadunidense buscavam acesso à tecnologia.

Segundo um funcionário da Casa Branca ouvido pela Reuters, o governo dos Estados Unidos vem discutindo com laboratórios de IA uma utilização mais ampla dessas tecnologias.

Um porta-voz da Anthropic afirmou que a empresa trabalha “de perto com o governo dos Estados Unidos para avançar rapidamente prioridades compartilhadas” e também para ampliar o acesso de mais organizações ao Mythos.

Encontrar vulnerabilidades é apenas o começo

O Mythos — e, em certa medida, o GPT-5.5, da OpenAI — passou a dominar discussões sobre segurança nacional relacionadas à inteligência artificial (IA).

No entanto, especialistas afirmam que esses debates frequentemente ignoram um ponto central: o uso de IA para localizar vulnerabilidades não é algo novo. O problema maior estaria nas etapas seguintes de exploração e resposta.

“Nossos adversários ficaram realmente muito bons sem IA”, afirmou Cynthia Kaiser, ex-integrante sênior da divisão de cibersegurança do FBI e atualmente ligada à empresa Halcyon. “Ataques de ransomware estão acontecendo em menos de uma hora”, disse ela, acrescentando que a maioria das ameaças ainda não depende de IA.

Por enquanto, as exigências de escala computacional e infraestrutura do Mythos também limitam quem consegue utilizar o sistema. Especialistas, porém, acreditam que essas barreiras não devem durar muito tempo.

“Eu não acho que a arquitetura esteja otimizada”, afirmou Nick Adam, da empresa de serviços financeiros State Street, durante um painel na Vanderbilt University (EUA). Ele citou justamente os desafios de infraestrutura e ambiente operacional mencionados por Grieco. “Existe uma barreira de entrada, mas ela será resolvida rapidamente.

Interface AI mostrando aviso de erro de prompt e alerta do sistema
Especialistas afirmam que esses debates frequentemente ignoram um ponto central: o uso de IA para localizar vulnerabilidades não é algo novo – Imagem: Digineer Station/Shutterstock

Anthropic fará apresentação a órgão global de estabilidade financeira

Em meio às discussões sobre os riscos do Mythos, a Anthropic deverá apresentar ao Financial Stability Board (FSB) vulnerabilidades cibernéticas identificadas pelo modelo no sistema financeiro global.

Segundo o jornal Financial Times, a startup responsável pelo chatbot Claude discutirá as capacidades do Mythos Preview com ministérios da Fazenda e bancos centrais ligados ao FSB, após um pedido do presidente da instituição e governador do Bank of England, Andrew Bailey.

O FSB é um órgão internacional responsável por coordenar regras financeiras entre as economias do G20. Um porta-voz do FSB afirmou que a organização “recebe positivamente o engajamento com a Anthropic e outras empresas sobre riscos emergentes e de fronteira para a estabilidade financeira global”.

A Anthropic não respondeu imediatamente aos pedidos de comentário da Reuters. Segundo a empresa, o Mythos é um modelo de cibersegurança projetado para detectar vulnerabilidades antigas em navegadores, infraestrutura e softwares.

Especialistas em segurança cibernética alertaram que o sistema poderia potencializar ataques mais sofisticados, criando riscos para o setor bancário, especialmente devido à dependência de sistemas legados.

Em abril, Bailey afirmou que o Mythos poderia representar riscos significativos para a segurança cibernética global.

“Seria razoável pensar que os eventos no Golfo são o desafio mais recente que enfrentamos neste mundo até que, acho que foi na última sexta-feira [11 de abril], você acorda e descobre que a Anthropic pode ter encontrado uma forma de abrir completamente o mundo do risco cibernético”, afirmou Bailey durante um evento na Universidade de Columbia, em Nova York (EUA).

“A questão é: até que ponto essa nova versão do produto será capaz de identificar vulnerabilidades em outros sistemas que possam ser exploradas para ataques cibernéticos”, acrescentou Bailey.

O post Anthropic: especialistas relativizam temores sobre Mythos apareceu primeiro em Olhar Digital.

Anthropic: especialistas relativizam temores sobre Mythos Read More »

apple logo 1024x682

Claude Mythos descobre falhas de segurança no macOS

Pesquisadores de segurança afirmam ter descoberto uma nova maneira de contornar os sistemas avançados de proteção da Apple utilizando técnicas identificadas durante testes realizados, em abril, com uma versão inicial da inteligência artificial (IA) Mythos, da Anthropic.

A descoberta foi feita por especialistas da Calif, empresa de pesquisa em segurança sediada em Palo Alto, na Califórnia (EUA). Segundo os pesquisadores, o método desenvolvido conecta duas falhas do MacOS a um conjunto de técnicas capazes de corromper a memória do computador e obter acesso a áreas do dispositivo que deveriam permanecer inacessíveis.

O mecanismo é classificado como um exploit de escalonamento de privilégios — tipo de ataque que, quando combinado com outras vulnerabilidades, pode permitir que hackers assumam o controle completo de uma máquina.

Para especialistas do setor, o caso chama atenção porque a Apple vem investindo intensamente para tornar o MacOS um dos sistemas operacionais mais difíceis de serem invadidos.

Michał Zalewski, pesquisador de segurança que trabalhou anteriormente no Google e revisou o estudo da Calif sem participar dos testes, afirmou ao The Wall Street Journal que a técnica é relevante justamente pelo nível de proteção implementado pela empresa.

O que diz a Apple sobre a descoberta

A Apple informou que está analisando o relatório produzido pela Calif para validar as conclusões apresentadas. A companhia também destacou que utiliza modelos avançados de IA para testar e corrigir vulnerabilidades.

Segurança é nossa principal prioridade, e levamos muito a sério relatos de potenciais vulnerabilidades”, declarou uma porta-voz da empresa.

Especialistas em cibersegurança vêm alertando que os modelos mais recentes de IA desenvolvidos por empresas, como Anthropic e OpenAI, passaram a demonstrar capacidade significativamente maior de identificar falhas de software.

Segundo pesquisadores da área, o avanço dessas ferramentas alimenta temores de um cenário apelidado de “Bugmageddon”, caracterizado por uma explosão sem precedentes na descoberta de vulnerabilidades de segurança.

A preocupação envolve tanto a pressão sobre equipes técnicas responsáveis por corrigir falhas quanto os riscos cibernéticos decorrentes da identificação acelerada de brechas em sistemas amplamente utilizados.

Leia mais:

Apple afirma já estar estudando o relatório para reparar as falhas – Imagem: Piotr Swat/Shutterstock

Em setembro do ano passado, a Apple anunciou uma tecnologia chamada Memory Integrity Enforcement (MIE), apresentada pela empresa como resultado de um esforço de design e engenharia que teria levado cinco anos.

De acordo com a companhia, o sistema foi desenvolvido a partir da combinação de sua experiência em hardware e sistemas operacionais.

Segundo a Calif, utilizando o Claude — sistema de IA da Anthropic — foi possível desenvolver o código necessário para explorar as duas falhas do MacOS em apenas cinco dias. Apesar disso, os pesquisadores ressaltam que o ataque não poderia ter sido realizado apenas pela IA.

Thai Duong, diretor-executivo da Calif, afirmou que o processo ainda dependeu fortemente da experiência humana dos especialistas em segurança da empresa. Segundo ele, o Mythos demonstra grande capacidade para reproduzir ataques já documentados anteriormente, mas ainda não apresentou habilidade consistente para criar técnicas totalmente inéditas. “Ainda não vimos casos em que ele cria novas técnicas de ataque”, afirmou Duong. “Isso é algo novo.”

Zalewski também avaliou que parte do entusiasmo em torno do Mythos pode ser exagerada, mas reconheceu que as ferramentas mais recentes já permitem realizar “pesquisas significativas sobre vulnerabilidades e auditoria de código”.

Os pesquisadores da Calif ficaram tão entusiasmados com a descoberta que viajaram pessoalmente de Palo Alto até a sede da Apple, em Cupertino, na terça-feira (12), para apresentar um relatório de 55 páginas detalhando as falhas exploradas.

A empresa pretende divulgar os detalhes técnicos do ataque apenas após a Apple corrigir os problemas identificados. Segundo Duong, as vulnerabilidades devem ser solucionadas rapidamente.

Mythos evolui e é cada vez mais testado

  • A Anthropic vem ampliando gradualmente o acesso ao Mythos depois de inicialmente restringir o software a um grupo seleto de empresas e organizações;
  • No início deste ano, uma IA da companhia encontrou mais de 100 vulnerabilidades classificadas como graves no navegador da Mozilla, o Firefox, ao longo de duas semanas;
  • Segundo o texto, esse volume corresponde aproximadamente ao número de falhas que normalmente são descobertas pelo restante da comunidade global de segurança em um período de dois meses;
  • As preocupações relacionadas ao avanço dessas ferramentas de IA também vêm impactando a estratégia do governo dos Estados Unidos para o setor;
  • Segundo o texto, o fenômeno levou a Casa Branca a reavaliar sua abordagem mais flexível em relação ao desenvolvimento de IA;
  • O governo estadunidense agora considera a possibilidade de emitir uma ordem executiva que concederia supervisão governamental sobre os modelos de IA mais avançados.

O post Claude Mythos descobre falhas de segurança no macOS apareceu primeiro em Olhar Digital.

Claude Mythos descobre falhas de segurança no macOS Read More »

lanadores mveis de misseis 1024x750

Claude Mythos: o que a IA nos diz sobre riscos da dissuasão nuclear

O filme “Jogos de Guerra“, lançado em 1983, imaginou um adolescente que acessava acidentalmente um sistema de computadores do Pentágono e iniciava um programa de simulação interpretado como o prelúdio de uma guerra nuclear.

A produção causou tamanho impacto no então presidente dos Estados Unidos, Ronald Reagan, que ele questionou seus assessores sobre a possibilidade de uma invasão semelhante aos sistemas mais sensíveis do país. Uma semana depois, veio a resposta: “Senhor presidente, o problema é bem pior do que o senhor imagina.

Thomas Fraise, pesquisador de pós-doutorado pela Universidade de Copenhague (Dinamarca), diz, em texto publicado no The Conversation, que as políticas de armas nucleares são baseadas em uma série de apostas sobre o futuro da dissuasão nuclear.

Países com arsenal atômico apostam que o medo da retaliação será sempre suficiente para impedir um ataque inicial do adversário e que haverá capacidade técnica e sorte suficientes para evitar explosões acidentais. Também apostam que possuir armas nucleares continuará sendo uma fonte de segurança, e não de insegurança, nas próximas décadas.

O autor afirma, no entanto, que existem cenários plausíveis em que possuir armas nucleares pode gerar mais custos reais do que benefícios potenciais em um mundo afetado pelo aquecimento global. Manter um arsenal considerado seguro e confiável exigiria escolhas orçamentárias que competiriam com outros gastos urgentes relacionados à crise climática.

Além disso, o universo de riscos existenciais que poderiam justificar o uso de armas nucleares estaria se expandindo. Um dos exemplos citados é a preocupação de especialistas de que a escassez de água no Paquistão e na Índia possa criar condições favoráveis para um conflito com potencial de escalada nuclear.

O autor também aponta outra aposta implícita nas políticas nucleares: a de que os arsenais atômicos, formados por sistemas tecnológicos complexos e altamente digitalizados, não possuam vulnerabilidades cibernéticas que possam ser exploradas por agentes interessados em comprometer seu funcionamento.

Países com arsenal atômico apostam que o medo da retaliação será sempre suficiente para impedir um ataque inicial do adversário e que haverá capacidade técnica e sorte suficientes para evitar explosões acidentais – Imagem: mwreck/Shutterstock

Onde a IA Claude Mythos entra nesse assunto?

  • A discussão ganhou força após o avanço do modelo de inteligência artificial (IA) Claude Mythos, desenvolvido pela Anthropic;
  • O sistema de IA foi lançado em 7 de abril de 2026 pela empresa, responsável pela série de modelos de linguagem Claude;
  • O Mythos não foi lançado comercialmente. Em vez disso, foi disponibilizado para um grupo restrito composto por cerca de uma dúzia de gigantes da tecnologia dos Estados Unidos, incluindo Google, Microsoft, Apple, Nvidia e Amazon Web Services (AWS);
  • De acordo com informações divulgadas pela Anthropic, o modelo alcançou uma taxa sem precedentes na identificação de vulnerabilidades em sistemas computacionais. O Mythos teria conseguido detectar falhas “zero-day” em navegadores, softwares e sistemas operacionais;
  • Uma vulnerabilidade “zero-day” é descrita como uma falha crítica de segurança para a qual ainda não existe proteção disponível, permitindo ataques sem tempo de reação. Segundo a Anthropic, o Mythos conseguiu desenvolver métodos para explorar essas vulnerabilidades em tempo recorde — provavelmente em menos de um dia — com taxa de sucesso de 72,4%.

Embora as informações tenham sido divulgadas pela própria empresa, Fraise ressalta que alguns indícios públicos foram apresentados. Sylvestre Ledru, diretor de engenharia responsável pelo navegador Firefox na Mozilla, afirmou que o Mythos ajudou a descobrir um número “absolutamente impressionante” de vulnerabilidades no software.

Entre os exemplos citados está a descoberta de uma falha de segurança com quase 27 anos de existência no sistema operacional de código aberto OpenBSD, amplamente utilizado por serviços de cibersegurança.

IA e o avanço das capacidades ofensivas

Segundo a análise apresentada, o Mythos evidencia um fenômeno mais amplo: a possibilidade de que o desenvolvimento da IA acelere o aumento de capacidades ofensivas no ciberespaço, não apenas entre Estados, mas também entre atores privados, como cibercriminosos.

Ao mesmo tempo, cresce a incerteza sobre a capacidade de agentes defensivos reagirem rapidamente o suficiente para corrigir vulnerabilidades existentes.

Mesmo que o Mythos não alcance integralmente o desempenho anunciado, o autor destaca que os modelos de linguagem avançados evoluíram rapidamente desde o início da década de 2020. Isso indicaria uma aceleração no desenvolvimento de ferramentas ofensivas e também na disseminação dessas capacidades para um número maior de atores.

Como consequência, haveria um potencial aumento tanto da probabilidade de ataques cibernéticos bem-sucedidos quanto do número absoluto desses ataques.

Leia mais:

Logo da Anthropic ao fundo, com silhuetas de pessoas passando à frente
Mythos evidencia um fenômeno mais amplo: a possibilidade de que o desenvolvimento da IA acelere o aumento de capacidades ofensivas no ciberespaço, não apenas entre Estados, mas também entre atores privados, como cibercriminosos – Imagem: PhotoGranary02/Shutterstock

Vulnerabilidade dos arsenais nucleares

O pesquisador afirma que um arsenal nuclear envolve muito mais do que ogivas armazenadas. O funcionamento normal desses sistemas depende de uma ampla estrutura tecnológica composta por ogivas, mísseis capazes de transportá-las, sistemas de comunicação para transmitir ordens presidenciais e mecanismos de alerta antecipado responsáveis por monitorar sinais de um possível ataque inimigo. Todos esses elementos precisam se comunicar entre si para garantir o controle sobre as armas.

O pesquisador Herbert Lin, da Universidade de Stanford (EUA) e autor de um estudo sobre ameaças cibernéticas e armas nucleares, afirma que a metáfora do “botão nuclear” simplifica excessivamente a realidade. Segundo ele, depois que o presidente aperta o botão, uma série de “ciberbotões” também precisa ser acionada para iniciar e administrar operações nucleares.

Cada um desses pontos representaria uma oportunidade de interferência por ataques cibernéticos, como impedir que informações críticas cheguem ao destino.

Fraise aponta diferentes cenários possíveis. O presidente poderia não receber informações suficientes — ou nenhuma informação — para determinar que um ataque está em andamento. Também poderia ser incapaz de transmitir ordens de lançamento para forças submarinas.

Outro cenário mencionado é o pesadelo discutido desde os anos 1950: uma ordem falsa de lançamento ser enviada a operadores de mísseis.

As consequências não precisariam necessariamente ser tão extremas. Uma ordem poderia chegar com atraso ou não ser transmitida a todas as forças, produzindo uma retaliação mais fraca do que o planejado.

O autor relembra ainda um episódio de 2010, quando um centro de comando estadunidense perdeu comunicação com cerca de 50 mísseis nucleares durante quase uma hora.

Outra hipótese levantada é a de que um grande ataque cibernético realizado por atores não estatais pudesse criar a impressão de que um adversário estaria mirando um arsenal nuclear, aumentando o risco de escalada involuntária.

Da mesma forma, um ataque a sistemas de comando e controle ligados a operações convencionais poderia ser interpretado como ameaça ao arsenal nuclear de um país caso os sistemas estivessem integrados.

Também é citado o cenário de operações cibernéticas direcionadas às próprias armas, atingindo o hardware em vez do software.

O pesquisador afirma que agentes responsáveis pela segurança nuclear desenvolvem e testam continuamente capacidades defensivas. Ainda assim, a complexidade dos sistemas existentes impediria qualquer garantia absoluta de ausência de vulnerabilidades.

James Gosler, ex-responsável pela segurança de sistemas nucleares estadunidenses no Sandia National Laboratories, afirma que o aumento exponencial da complexidade dos componentes das armas nucleares, a partir dos anos 1980, tornou impossível assegurar que sistemas microcontrolados usados para garantir o funcionamento do mecanismo de detonação fossem totalmente livres de vulnerabilidades.

Segundo Fraise, isso não significa necessariamente que tais vulnerabilidades existam, mas indica que nenhum ator pode afirmar com certeza que elas não existam.

Sarmat
Aumento exponencial da complexidade dos componentes das armas nucleares, a partir dos anos 1980, tornou impossível assegurar que sistemas microcontrolados usados para garantir o funcionamento do mecanismo de detonação fossem totalmente livres de vulnerabilidades – Imagem: Ministério da Defesa da Rússia

Nova aposta sobre o futuro

A análise conclui que o Mythos revela uma nova dimensão da “aposta nuclear”, impulsionada pelo desenvolvimento de novas tecnologias e sua integração aos arsenais.

De acordo com o autor, os países apostam na ausência de vulnerabilidades nesses sistemas, embora seja impossível medir essa probabilidade com precisão. Ela mudaria ao longo do tempo conforme sistemas são atualizados, substituídos e conectados a outros.

Caso vulnerabilidades existam, a aposta passa a ser que avanços em capacidades ofensivas sempre serão acompanhados, e em tempo hábil, por avanços defensivos — inclusive na era da IA.

O pesquisador destaca que o desenvolvimento de capacidades defensivas costuma ser reativo, dependendo do conhecimento sobre ferramentas ofensivas e vulnerabilidades existentes, fatores considerados inerentemente incertos.

Nesse contexto, o autor afirma que a segurança baseada em armas nucleares implica apostar que as defesas contra ataques cibernéticos serão suficientes. Caso contrário, a aposta recairia sobre a sorte: a expectativa de que vulnerabilidades existentes não sejam descobertas, como ocorreu com a falha que permaneceu escondida por 27 anos no OpenBSD.

Segundo Fraise, a chegada de modelos avançados de IA capazes de detectar vulnerabilidades e projetar ataques cibernéticos em larga escala e de maneira automatizada tornou mais incerta a capacidade dos mecanismos atuais de controle de continuarem cumprindo seu papel.

Assim, a adoção de políticas de segurança fundamentadas em armas nucleares equivaleria, segundo a análise, a apostar que, no futuro, a sorte continuará sempre do mesmo lado.

O post Claude Mythos: o que a IA nos diz sobre riscos da dissuasão nuclear apareceu primeiro em Olhar Digital.

Claude Mythos: o que a IA nos diz sobre riscos da dissuasão nuclear Read More »

destaque anthropic e eua 1024x576

Casa Branca muda tom sobre IA após avanço do Mythos

O governo de Donald Trump começou a reconsiderar sua postura mais flexível em relação à inteligência artificial (IA) após o avanço de sistemas capazes de identificar falhas ocultas em códigos de computador. O movimento ganhou força depois da apresentação do Mythos, modelo da Anthropic voltado à detecção de vulnerabilidades de segurança.

Segundo o The Washington Post, integrantes da Casa Branca discutem possíveis medidas para lidar com os riscos associados à nova geração de ferramentas de IA. Entre as opções analisadas está uma eventual ordem executiva para ampliar a supervisão sobre o setor.

Mythos da Anthropic e nova geração de ferramentas de IA preocupam a Casa Branca – Imagem: Koshiro K/Shutterstock

Governo discute novas formas de controle

O diretor do Conselho Econômico Nacional, Kevin Hassett, comparou a possível abordagem do governo ao modelo de testes da FDA, agência reguladora de medicamentos dos Estados Unidos. A ideia seria garantir que sistemas fossem considerados seguros antes de chegarem ao público.

Após a declaração, a chefe de gabinete da Casa Branca, Susie Wiles, afirmou no X que o governo não pretende “escolher vencedores e perdedores”, indicando que ainda não há consenso interno sobre o tema.

De acordo com uma autoridade ouvida pela publicação, o objetivo do governo é ganhar tempo para lidar com riscos que podem crescer à medida que os modelos de IA se tornam mais poderosos.

Mythos elevou preocupações sobre segurança

A Anthropic anunciou no mês passado que o Mythos seria capaz de localizar falhas de segurança em softwares de forma altamente eficiente. A empresa decidiu não liberar o sistema ao público em geral por considerar os riscos elevados.

Pouco depois, a OpenAI afirmou que seus modelos mais recentes possuem capacidades semelhantes. As alegações foram apoiadas por avaliações do AI Security Institute, ligado ao governo britânico.

Segundo a reportagem, o governo Trump reuniu executivos de grandes bancos e representantes das principais empresas de IA para discutir os impactos da tecnologia. Uma das reuniões envolveu Susie Wiles e o CEO da Anthropic, Dario Amodei, na Casa Branca.

Governo já ampliou iniciativas ligadas à IA

Enquanto avalia novas medidas, o governo também começou a reforçar mecanismos de supervisão. Nesta semana, o Center for AI Standards and Innovation expandiu um programa criado durante o governo Joe Biden para testar modelos antes do lançamento público.

Além disso, a General Services Administration apresentou uma proposta contratual que amplia o controle sobre sistemas de IA usados em atividades federais, incluindo a análise de respostas consideradas ideológicas.

O post Casa Branca muda tom sobre IA após avanço do Mythos apareceu primeiro em Olhar Digital.

Casa Branca muda tom sobre IA após avanço do Mythos Read More »

destaque trump e anthropic 1024x576

Anthropic: Mythos acende alerta global sobre riscos na cibersegurança

A Anthropic afirmou que sua nova ferramenta de inteligência artificial (IA), o Claude Mythos, é tão eficaz na identificação de vulnerabilidades em softwares e sistemas computacionais que não pode ser disponibilizada ao público em geral.

Segundo a empresa, a tecnologia foi liberada apenas para um grupo restrito de organizações cuidadosamente selecionadas, devido ao risco de que, nas mãos erradas, possa facilitar o roubo de dados ou a interrupção de infraestruturas críticas.

As preocupações com segurança ganharam força após um episódio em que um pequeno grupo de usuários não autorizados conseguiu acesso ao sistema em um fórum privado online, de acordo com uma fonte com conhecimento do caso e documentos analisados pela Bloomberg.

Diante desse cenário, a Casa Branca se posicionou contra o plano da Anthropic de ampliar o acesso ao Mythos para outras 70 empresas e organizações, segundo um funcionário do governo.

O The Wall Street Journal foi o primeiro a noticiar as preocupações do governo dos Estados Unidos, que também teme que a Anthropic não disponha de capacidade computacional suficiente para atender mais usuários sem comprometer o uso da ferramenta por parte do próprio governo.

Nos últimos anos, empresas de cibersegurança têm defendido que a IA pode acelerar e automatizar a prevenção de ataques digitais. No entanto, hackers e agentes de espionagem também passaram a explorar essas mesmas vantagens.

O surgimento do Mythos e de modelos semelhantes, capazes de identificar falhas complexas sem supervisão humana, indica uma nova fase na corrida armamentista cibernética, marcada por maior velocidade e imprevisibilidade.

Governo Trump está de olho no novo modelo de IA desenvolvido pela Anthropic – Imagem: Chip Somodevilla e Stockinq – Shutterstock

O que é o Mythos, da Anthropic

  • O Claude Mythos Preview é um modelo de IA de uso geral que, segundo a Anthropic, supera significativamente versões anteriores em diversos critérios, incluindo programação e raciocínio lógico;
  • A empresa afirma que alguns modelos já atingiram um nível de capacidade em código que lhes permite superar todos, exceto os humanos mais experientes, na identificação e exploração de vulnerabilidades;
  • Durante testes, o Mythos Preview teria identificado milhares de vulnerabilidades do tipo “zero-day”, inclusive em todos os principais sistemas operacionais e navegadores web. Essas falhas, desconhecidas pelos próprios desenvolvedores, representam oportunidades valiosas para hackers, já que oferecem acesso irrestrito a sistemas vulneráveis até que sejam corrigidas;
  • A Anthropic destacou que o Mythos foi capaz de identificar essas falhas com ainda menos intervenção humana do que modelos anteriores. “O Mythos Preview demonstra um salto nessas habilidades cibernéticas — as vulnerabilidades que ele identificou, em alguns casos, sobreviveram a décadas de revisão humana e milhões de testes de segurança automatizados”, afirmou a empresa.

Especialistas alertam que, nas mãos de grupos de ransomware ou governos hostis, a tecnologia poderia resultar em ataques cibernéticos mais frequentes e devastadores.

Pesquisadores, no entanto, afirmam não ter acesso suficiente para verificar de forma independente o desempenho alegado do sistema. Gang Wang, professor associado de ciência da computação da Universidade de Illinois (EUA), disse à Bloomberg que é difícil avaliar a relevância do Mythos sem testes práticos mais aprofundados.

Quem tem acesso à ferramenta da Anthropic

A Anthropic concedeu acesso ao Mythos a um grupo limitado de parceiros verificados, em uma iniciativa chamada Project Glasswing — nome inspirado em uma espécie de borboleta de asas transparentes.

Entre os participantes estão Amazon, Apple, Google (da Alphabet), Microsoft, Nvidia, Palo Alto Networks, CrowdStrike, Broadcom, Cisco, JPMorganChase e a Linux Foundation, além de cerca de outras 40 organizações.

De acordo com a empresa, o projeto representa “uma tentativa urgente de colocar essas capacidades a serviço da defesa”.

As organizações participantes utilizarão o Mythos em suas estratégias de segurança defensiva e a Anthropic pretende compartilhar os resultados obtidos para beneficiar outros setores.

Atualmente, muitas empresas realizam testes de invasão, contratando especialistas para identificar falhas antes que hackers as explorem. O Mythos pode acelerar esse processo, permitindo a descoberta de um maior número de vulnerabilidades em menos tempo.

Um “divisor de águas” na segurança digital

A Anthropic classificou o Mythos Preview como um “divisor de águas” para a segurança. Vulnerabilidades do tipo zero-day são, por natureza, difíceis de detectar, e existe um mercado especializado em descobri-las e vendê-las a agências de inteligência por valores que podem chegar a milhões de dólares.

Segundo a empresa, muitas das falhas identificadas pelo Mythos eram “sutis e difíceis de detectar“, incluindo uma vulnerabilidade de 27 anos no sistema operacional OpenBSD, conhecido por seu alto nível de segurança.

O sistema também teria conseguido transformar vulnerabilidades conhecidas, mas ainda não corrigidas, em explorações práticas capazes de permitir a invasão de redes. Em um exemplo citado, o Mythos identificou e combinou diversas falhas no kernel do Linux, possibilitando que um invasor assumisse controle total de uma máquina.

A Anthropic afirmou ainda que usuários sem experiência técnica conseguiram solicitar ao sistema formas de assumir o controle remoto de computadores durante a noite e retornaram, no dia seguinte, com um exploit completo e funcional.

Ferramentas semelhantes também estão sendo desenvolvidas por outras empresas. A OpenAI trabalha no Codex Security, enquanto o Google desenvolveu o chamado “Big Sleep agent“.

Além disso, a OpenAI estaria finalizando um produto com capacidades avançadas de cibersegurança para parceiros selecionados. Pesquisadores da startup israelense Buzz afirmam ter criado uma ferramenta autônoma com taxa de sucesso de 98% na exploração de falhas conhecidas.

Anthropic não aumentou o preço de Claude. Ele inventou algo melhor: inflação simbólica
Medo é geral quando se trata da possibilidade de o Mythos facilitar o trabalho de hackers mundo afora – Imagem criada por inteligência artificial (ChatGPT / Olhar Digital)

Leia mais:

Salvaguardas ainda em desenvolvimento

Segundo a Anthropic, os mecanismos de segurança do Mythos ainda estão em evolução. “Observamos que ele atingiu níveis de confiabilidade e alinhamento sem precedentes. No entanto, em raras ocasiões em que falha ou apresenta comportamento atípico, notamos que ele toma atitudes que consideramos bastante preocupantes“, afirmou a empresa.

Em um teste, um pesquisador incentivou uma versão inicial do sistema a escapar de um ambiente isolado e enviar uma mensagem externa. O Mythos conseguiu realizar a tarefa e, em seguida, executou ações adicionais consideradas preocupantes, desenvolvendo um exploit em múltiplas etapas para acessar a internet.

A empresa afirmou que não pretende disponibilizar amplamente o Mythos Preview devido ao potencial de uso indevido. Ainda assim, planeja no futuro permitir a utilização de modelos semelhantes em larga escala, desde que sejam desenvolvidas salvaguardas capazes de detectar e bloquear os usos mais perigosos.

Para vulnerabilidades consideradas mais graves, especialistas humanos ainda participam do processo, validando as descobertas antes de encaminhá-las aos responsáveis pelos sistemas afetados. Embora necessário, esse procedimento é demorado — algo que pode ser reduzido à medida que a tecnologia evolui.

Vantagem para defensores ou atacantes?

A Anthropic acredita que, no longo prazo, ferramentas como o Mythos favorecerão os defensores. No entanto, esse cenário pode levar tempo para se concretizar. Atualmente, menos de 1% das vulnerabilidades identificadas pelo sistema foram totalmente corrigidas.

Enquanto isso, hackers também utilizam IA para acelerar a exploração de falhas já divulgadas, reduzindo o tempo disponível para correções por parte das empresas.

Em publicação de 30 de março, o CEO da Palo Alto Networks, Nikesh Arora, alertou que a barreira para ataques sofisticados continuará diminuindo nos próximos meses. “Agora, um único agente malicioso poderá executar campanhas que antes exigiam equipes inteiras”, escreveu.

Yair Saban, CEO da Buzz e ex-integrante da unidade cibernética 8200 de Israel, afirmou que sua equipe levou apenas três semanas para desenvolver uma ferramenta de ataque baseada em IA, sugerindo que outros grupos podem fazer o mesmo.

Apesar dos riscos, a Anthropic sustenta que, no futuro, a tecnologia contribuirá para um ambiente digital mais seguro. “A longo prazo, esperamos que as capacidades de defesa dominem: que o mundo emerja mais seguro, com softwares mais robustos — em grande parte graças ao código escrito por esses modelos”, afirmou o grupo Frontier Red Team da empresa. “Mas o período de transição será difícil.”

O post Anthropic: Mythos acende alerta global sobre riscos na cibersegurança apareceu primeiro em Olhar Digital.

Anthropic: Mythos acende alerta global sobre riscos na cibersegurança Read More »

claude 4 7 benchmark 1009x1024

Anthropic lança Claude Opus 4.7 para o público e prepara terreno para o poderoso Mythos

A Anthropic anunciou nesta quinta-feira (16) o lançamento global do Claude Opus 4.7. O novo modelo de inteligência artificial chega como uma atualização direta do Opus 4.6, apresentando saltos significativos em programação autônoma (agêntica), raciocínio multidisciplinar e capacidades visuais. No entanto, em um movimento incomum na indústria, a empresa admitiu que o modelo foi “treinado para ser menos capaz” em certas áreas sensíveis do que sua versão experimental mais potente, o Claude Mythos Preview.

Codificação e “Trabalho de Mundo Real”

De acordo com dados divulgados pela Anthropic, o Claude Opus 4.7 estabeleceu novos marcos em benchmarks de produtividade. No SWE-bench Pro, que avalia a capacidade da IA de resolver problemas reais de engenharia de software, o modelo atingiu 64,3% de aproveitamento, superando os 53,4% da versão anterior e os 57,7% do GPT-5.4 da OpenAI.

Os principais avanços técnicos incluem:

  • Seguimento de instruções: o modelo é muito mais literal. A empresa alerta que prompts antigos podem precisar de ajustes, já que a IA agora segue as ordens à risca em vez de interpretá-las livremente.
  • Níveis de esforço: foi introduzido o nível “xhigh” (extra alto), permitindo que desenvolvedores controlem melhor o equilíbrio entre a profundidade do raciocínio e a latência da resposta.
  • Visão de alta resolução: o Opus 4.7 agora suporta imagens de até 3,75 megapixels (2.576 pixels no lado maior), um aumento de três vezes em relação aos modelos anteriores, facilitando a análise de diagramas complexos e capturas de tela densas.

A estratégia do “freio de mão” cibernético

O lançamento do Opus 4.7 ocorre em um momento de intensa disputa narrativa sobre a segurança da IA. Enquanto o Claude Mythos Preview (modelo mais poderoso da casa) permanece restrito a um grupo seleto de empresas no programa Project Glasswing, o Opus 4.7 foi lançado com salvaguardas que detectam e bloqueiam automaticamente solicitações de alto risco cibernético.

A Anthropic afirmou que experimentou reduzir diferencialmente as capacidades cibernéticas do modelo durante o treinamento. A ideia é aprender com o uso do Opus 4.7 no mundo real para, no futuro, liberar modelos da classe “Mythos” com segurança comprovada.

Para profissionais de segurança que precisam realizar testes de intrusão legítimos ou pesquisas de vulnerabilidades, a empresa criou o Cyber Verification Program, um processo de triagem para liberar essas funções específicas.

Anthropic vs. OpenAI: abordagens opostas

O posicionamento da Anthropic marca um contraste direto com a estratégia da OpenAI. Conforme noticiado pelo Olhar Digital, o recém-lançado GPT-5.4-Cyber seguiu um caminho mais “permissivo”, focando em democratizar o acesso de defensores a ferramentas de análise binária e engenharia reversa.

Enquanto a OpenAI aposta que dar ferramentas potentes aos “mocinhos” é a melhor defesa, a Anthropic prefere manter suas IAs mais ofensivas sob chaves rigorosas. Em comunicado oficial, a Anthropic reforçou que o Opus 4.7 é seu modelo mais capaz disponível para o público geral, mas que o Mythos Preview ainda detém a coroa de melhor alinhamento e segurança em seus testes internos.

Disponibilidade e preço

O Claude Opus 4.7 já está disponível para usuários do Claude (web e app), além de desenvolvedores via API. O modelo também foi integrado às plataformas de nuvem Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry.

O preço permanece o mesmo praticado na versão 4.6: US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de tokens de saída, conforme apurado pela CNBC.

Claude Opus 4.7: benchmark

Os números divulgados pela Anthropic mostram o Claude Opus 4.7 superando rivais como o GPT-5.4 e o Gemini 3.1 Pro em categorias críticas de programação e raciocínio avançado:

O post Anthropic lança Claude Opus 4.7 para o público e prepara terreno para o poderoso Mythos apareceu primeiro em Olhar Digital.

Anthropic lança Claude Opus 4.7 para o público e prepara terreno para o poderoso Mythos Read More »

OpenAI lança GPT-5.4-Cyber em resposta ao Mythos da Anthropic; veja como usar

A OpenAI está expandindo seu programa Trusted Access for Cyber (TAC) para milhares de defensores individuais e centenas de equipes de segurança. O grande destaque dessa expansão é o GPT-5.4-Cyber, uma variante do GPT-5.4 treinada para ser “permissiva”. Na prática, isso significa que a IA não irá recusar pedidos de análise de vulnerabilidades que seriam bloqueados no ChatGPT comum por precaução de segurança.

O rival do Claude Mythos

Enquanto a Anthropic apostou no Claude Mythos para detectar falhas de forma autônoma em sistemas de gigantes como Nvidia e Google, a OpenAI foca na democratização do acesso para defensores de infraestruturas críticas.

O GPT-5.4-Cyber traz uma habilidade técnica de alto nível: a engenharia reversa binária. Isso permite que profissionais de segurança analisem softwares já compilados em busca de malwares e falhas sem precisar ter acesso ao código-fonte original; uma tarefa complexa que agora pode ser acelerada por IA.

Leia também:

Como funciona o acesso e a segurança

Para evitar que o “feitiço vire contra o feiticeiro” e que hackers usem o modelo para criar ataques mais sofisticados, a OpenAI implementou um sistema rígido de verificação:

  • Identidade verificada: para acessar as camadas mais potentes do programa, defensores individuais devem passar por um processo de verificação de identidade (KYC) em chatgpt.com/cyber.
  • Monitoramento ativo: o uso do modelo será monitorado para garantir que ele esteja sendo usado para fins defensivos.
  • Limitações de retenção: desenvolvedores que utilizam a ferramenta via API em plataformas de terceiros podem ter restrições, como a impossibilidade de usar o modo de “Retenção Zero de Dados” (ZDR), para que a OpenAI mantenha visibilidade sobre o propósito das requisições.

Como acessar o GPT-5.4-Cyber?

Diferente das versões convencionais do ChatGPT, o GPT-5.4-Cyber não será aberto ao público geral. Para utilizar a ferramenta, é necessário passar por um processo de triagem dentro do programa Trusted Access for Cyber (TAC).

Usuários individuais podem iniciar a verificação de identidade (KYC) pelo portal oficial da OpenAI (chatgpt.com/cyber), enquanto empresas devem solicitar o ingresso via representantes comerciais. Por ser um modelo mais “permissivo”, o acesso será liberado em camadas, priorizando pesquisadores e fornecedores de segurança cibernética que comprovem o uso da IA para fins estritamente defensivos.

O histórico da OpenAI na área

A empresa destacou que sua ferramenta Codex Security (que monitora bases de código automaticamente) já ajudou a identificar e corrigir mais de 3.000 vulnerabilidades críticas e de alta gravidade nos últimos meses.

Com o GPT-5.4-Cyber, o objetivo é mudar a segurança de auditorias episódicas para uma redução de risco contínua. “Não achamos prático ou apropriado decidir centralmente quem consegue se defender. Em vez disso, nosso objetivo é capacitar o maior número possível de defensores legítimos”, afirmou a OpenAI em seu blog oficial.

Democratização vs. controle

A grande diferença entre as duas gigantes está na estratégia de distribuição. Enquanto a Anthropic restringiu o acesso ao Mythos Preview a um grupo seleto de 40 organizações (incluindo o banco Goldman Sachs), a OpenAI planeja liberar o GPT-5.4-Cyber para milhares de especialistas já nas próximas semanas.

Essa abertura, no entanto, não agrada a todos. Em análise publicada no The New York Times, o ex-diretor de estratégia da Microsoft, Craig Mundie, expressou preocupação. Para ele, democratizar ferramentas de alta capacidade ofensiva pode permitir que “pequenos atores” realizem operações sofisticadas que antes eram restritas a grandes potências militares ou grupos criminosos com orçamentos bilionários.

O post OpenAI lança GPT-5.4-Cyber em resposta ao Mythos da Anthropic; veja como usar apareceu primeiro em Olhar Digital.

OpenAI lança GPT-5.4-Cyber em resposta ao Mythos da Anthropic; veja como usar Read More »