celular xiaomi 1024x683

Origem de modelo de IA ‘secreto’ é revelada

Um modelo de inteligência artificial que apareceu anonimamente em uma plataforma para desenvolvedores na semana passada teve sua origem finalmente revelada: trata-se de uma criação da Xiaomi. O sistema, batizado de Hunter Alpha, havia gerado especulações no setor de tecnologia, com suspeitas de que poderia estar ligado à DeepSeek.

O mistério começou em 11 de março, quando o modelo surgiu no OpenRouter, uma plataforma que reúne diferentes sistemas de IA. Sem identificação de desenvolvedor, ele foi classificado como um “modelo furtivo” e rapidamente chamou atenção por suas capacidades técnicas e acesso gratuito.

Nesta semana, a equipe de inteligência artificial da Xiaomi, conhecida como MiMo, confirmou que o Hunter Alpha é uma versão inicial de testes do MiMo-V2-Pro. O modelo é projetado para atuar como base de agentes de IA.

A revelação ocorre em um momento de intensa movimentação no mercado de IA, especialmente na China. O avanço de estruturas voltadas a agentes autônomos, como o OpenClaw, tem acelerado a transição de modelos focados em conversa para sistemas capazes de agir diretamente em nome do usuário.

Segundo Luo Fuli, líder da equipe MiMo e ex-pesquisadora da DeepSeek, a rápida evolução desse novo paradigma surpreendeu até os próprios desenvolvedores. Em publicação nas redes sociais, ela afirmou que a mudança do modelo de interação para agentes ocorreu em ritmo mais acelerado do que o esperado.

O MiMo-V2-Pro deve ser integrado a cinco das principais plataformas de agentes de IA, incluindo o OpenClaw, com uma semana de acesso gratuito para desenvolvedores ao redor do mundo.

Xiaomi assumiu autoria do modelo Hunter Alpha (Imagem: 8th.creator/Shutterstock)

Modelo de IA secreto já tem ampla adoção

Durante o período em que permaneceu anônimo, o Hunter Alpha apresentou características que alimentaram as especulações sobre sua origem. Segundo a agência Reuters, o sistema se descrevia como um modelo chinês e treinado principalmente em chinês, com base de conhecimento atualizada até maio de 2025 – semelhante aos modelos recentes da DeepSeek.

Além disso, o modelo exibe especificações de alto desempenho, como cerca de 1 trilhão de parâmetros e capacidade de processar até 1 milhão de tokens por interação, o que indica um elevado poder de processamento e memória contextual. Esses atributos costumam estar associados a modelos de ponta, geralmente com alto custo de operação.

Especialistas consultados pela agência apontaram que a combinação entre grande capacidade de contexto, raciocínio avançado e acesso gratuito contribuiu para a rápida popularização do sistema. Em poucos dias, o Hunter Alpha alcançou grande volume de uso e liderou rankings dentro da própria plataforma OpenRouter.

O uso de lançamentos discretos como forma de teste não é incomum no setor. Plataformas abertas permitem que desenvolvedores coletem dados de uso real e feedback sem exposição inicial da marca, prática já adotada por outras empresas de IA.

A divulgação do modelo pela Xiaomi também teve impacto no mercado financeiro. As ações da empresa registraram alta de até 5,8% após a confirmação.

O post Origem de modelo de IA ‘secreto’ é revelada apareceu primeiro em Olhar Digital.

Origem de modelo de IA ‘secreto’ é revelada Read More »

paulo correa ceo ca 300x169

Na C&A, a IA sai do bastidor e vai para a vitrine

🔍 Curadoria Studio Mestre Digital: Nossa equipe monitora as principais movimentações de mercado e tecnologia para manter você atualizado.


paulo correa CEO C&A

A inteligência artificial deixou de ser um experimento na C&A para figurar na vitrine da estratégia da companhia. O sinal dessa mudança está no organograma da rede varejista de moda: o CTO passou a reportar diretamente ao CEO. Tecnologia deixou de ser uma área de suporte para sentar na mesa onde as decisões estratégicas são […]

O post Na C&A, a IA sai do bastidor e vai para a vitrine apareceu primeiro em NeoFeed.


Insight Studio Mestre: Esta notícia reflete tendências que podem impactar diretamente o seu modelo de negócio digital.

Conteúdo original publicado em: Acesse a fonte oficial

Read More »

google stitch 2

Google Stitch: big tech remodela design da platafoma

A ferramenta Google Stitch, voltada ao design de interfaces com uso de inteligência artificial (IA), está sendo reformulada para se tornar uma plataforma nativa de IA capaz de transformar descrições em linguagem natural em interfaces completas, interativas e de alta fidelidade.

A proposta é permitir que qualquer pessoa — de designers profissionais a iniciantes — possa criar, iterar e colaborar no desenvolvimento de software de forma mais rápida e intuitiva.

Segundo os desenvolvedores, o avanço da IA ao longo do último ano mudou profundamente a forma como softwares são criados, permitindo que descrições simples se convertam diretamente em aplicações funcionais. O Stitch foi lançado com o objetivo de dar vida a ideias desde o início do processo de design e, agora, evolui para ampliar esse conceito.

Vibe design no Google Stitch

  • A nova abordagem introduz o conceito de “vibe design”, em que o processo criativo começa não com wireframes, mas com intenções;
  • Em vez de desenhar estruturas iniciais, o usuário pode descrever objetivos de negócio, sensações desejadas para o usuário ou até referências inspiradoras;
  • A IA atua como um multiplicador de criatividade, possibilitando a exploração rápida de múltiplas ideias e contribuindo para resultados de maior qualidade;
  • Uma das principais mudanças é a reformulação completa da interface da plataforma, que passa a contar com um canvas infinito nativo de IA;
  • Esse espaço permite que ideias evoluam desde concepções iniciais até protótipos funcionais, reunindo diferentes formatos de entrada — como texto, imagens e código — em um único ambiente;
  • O objetivo é acompanhar o fluxo natural do design, que alterna entre momentos de expansão e refinamento até chegar a uma solução final.

Leia mais:

Nova abordagem introduz o conceito de “vibe design”, em que o processo criativo começa não com wireframes, mas com intenções (Imagem: Divulgação/Google)

O sistema também incorpora um novo agente de design capaz de analisar todo o histórico e evolução de um projeto. Esse agente trabalha em conjunto com o chamado “Agent manager”, que organiza o progresso e permite explorar múltiplas direções simultaneamente, mantendo o processo estruturado.

Outra novidade é a ampliação das ferramentas de design system. A plataforma agora permite extrair sistemas de design a partir de qualquer URL e introduz o arquivo DESIGN.md, um formato em markdown voltado para agentes de IA. Com ele, é possível exportar e importar regras de design entre diferentes ferramentas, facilitando a reutilização de padrões e evitando retrabalho em novos projetos.

A rapidez na prototipagem é outro destaque. O Stitch transforma designs estáticos em protótipos interativos de forma imediata, permitindo que o usuário visualize a jornada completa do usuário em tempo real.

Telas podem ser conectadas em segundos, e um simples comando de “Play” permite testar o fluxo da aplicação. A ferramenta também é capaz de sugerir automaticamente próximas etapas com base nas interações, mapeando jornadas de forma ágil.

Esse ciclo acelerado de feedback permite ajustes rápidos, seja em elementos específicos ou em fluxos completos, com o objetivo de validar e refinar ideias em menos tempo.

A colaboração também ganha um novo papel dentro da plataforma, passando a ser tratada como uma parceria criativa integrada à IA. Entre os recursos adicionados estão comandos por voz, que permitem ao usuário interagir diretamente com o sistema. O agente pode oferecer críticas em tempo real, sugerir soluções e até conduzir entrevistas para criação de páginas, além de executar alterações instantâneas a partir de instruções faladas.

Nesse contexto, a IA funciona como um “interlocutor criativo”, ajudando o usuário a desenvolver e refinar ideias por meio de diálogo contínuo, sem interromper o fluxo de trabalho.

Além do design, o Stitch também busca integrar-se ao restante do ecossistema de desenvolvimento. A ferramenta pode atuar como ponte para outras soluções utilizadas por equipes, por meio do servidor MCP e de um kit de desenvolvimento (SDK). Também é possível exportar projetos para ferramentas de desenvolvimento, garantindo continuidade entre as etapas de design e implementação.

De acordo com os desenvolvedores, o objetivo é reduzir significativamente o tempo entre a concepção de uma ideia e sua execução prática. A proposta é que tanto designers experientes quanto empreendedores em estágio inicial consigam transformar conceitos em produtos funcionais em minutos, e não mais em dias.

O post Google Stitch: big tech remodela design da platafoma apareceu primeiro em Olhar Digital.

Google Stitch: big tech remodela design da platafoma Read More »

jensen huang nvidia 1024x576

CEO da Nvidia elogia OpenClaw: “é definitivamente o próximo ChatGPT”

O CEO da Nvidia, Jensen Huang, destacou o avanço do OpenClaw, um novo modelo de inteligência artificial baseado em agentes autônomos. Durante entrevista concedida ao programa Mad Money, na conferência GTC, o executivo defendeu que o projeto representa uma mudança significativa na forma como usuários interagem com sistemas de IA e afirmou que a plataforma “é definitivamente o próximo ChatGPT”.

Segundo Huang, o OpenClaw já se consolidou como um dos projetos de código aberto mais relevantes da “história da humanidade”, com potencial para redefinir o papel da IA no cotidiano.

Diferentemente dos chatbots tradicionais, que se limitam a responder perguntas, a plataforma permite a criação de agentes capazes de executar tarefas, tomar decisões e operar com pouca intervenção humana. O Olhar Digital já deu os detalhes sobre ele neste link.

O OpenClaw amplia o escopo de uso da IA ao permitir que usuários criem seus próprios agentes com comandos simples. De acordo com o CEO, a tecnologia possibilita delegar atividades complexas a esses sistemas, que podem aprender, iterar e aprimorar resultados de forma autônoma.

Segundo o site CNBC, Huang citou como exemplo o desenvolvimento de um projeto de design, como a criação de uma cozinha. Nesse cenário, o agente seria capaz de analisar referências, aprender ferramentas específicas, propor soluções e revisar o próprio trabalho, em um ciclo contínuo de aperfeiçoamento.

Para o executivo, esse tipo de automação tende a democratizar habilidades especializadas. Ele argumenta que profissionais de diferentes áreas poderão ampliar suas capacidades com o apoio desses agentes, assumindo funções mais complexas sem a necessidade de formação tradicional em determinadas áreas.

Huang fez as declarações sobre o OpenClaw durante a conferência GTC da Nvidia, que acontece esta semana na Califórnia (Imagem: FotoField/Shutterstock)

NemoClaw: Nvidia lançou seu próprio OpenClaw

A Nvidia não ficou para trás e anunciou nesta semana o NemoClaw, uma versão voltada ao ambiente corporativo que integra o OpenClaw ao ecossistema de softwares da empresa. A iniciativa busca adaptar os agentes autônomos para uso em larga escala, com foco em segurança, controle e confiabilidade.

A segurança, inclusive, era uma das preocupações em relação ao OpenClaw. O avanço dos agentes de IA levou receios relacionados ao controle, especialmente à medida que essas ferramentas passam a executar ações de forma independente.

Leia mais:

No caso do NemoClaw, a companhia pretende incorporar mecanismos de proteção, como ferramentas de supervisão e recursos voltados à privacidade, para mitigar riscos associados à autonomia desses sistemas.

Para a Nvidia, enfrentar esses desafios será essencial para viabilizar a próxima etapa da inteligência artificial – uma fase em que os sistemas não apenas auxiliam usuários, mas atuam diretamente em seu nome em diferentes contextos.

O post CEO da Nvidia elogia OpenClaw: “é definitivamente o próximo ChatGPT” apareceu primeiro em Olhar Digital.

CEO da Nvidia elogia OpenClaw: “é definitivamente o próximo ChatGPT” Read More »

halito 1024x448

IA aprende a sentir cheiros: conheça o nariz eletrônico

A inteligência artificial (IA) tem avançado em diversas habilidades, incluindo a capacidade de ver, ouvir, ler e falar. Agora, pesquisadores estão desenvolvendo a habilidade de cheirar.

Nos últimos anos, um novo tipo de tecnologia conhecido como nariz eletrônico, ou e-nose, tem sido refinado. Esses aparelhos são capazes de detectar e distinguir aromas com uma precisão que pode ser até mil vezes maior do que a de um ser humano. Além disso, eles não sofrem a perda de sensibilidade que ocorre quando nossos narizes se acostumam a um odor, fenômeno comum em humanos.

A inovação na tecnologia do nariz eletrônico não se limita apenas à precisão. A IA é capaz de verificar as substâncias voláteis que compõem um cheiro, entendendo a combinação desses elementos e o significado dessas combinações.

Isso tem implicações significativas. Atualmente, pesquisadores estão explorando, e até mesmo comercializando, sistemas que podem, por exemplo, analisar o hálito de uma pessoa para detectar infecções graves. Eles também podem examinar o ar em um ambiente em busca de contaminantes ou até mesmo auxiliar na criação de perfumes de uma forma mais rápida e econômica.

Nariz eletrônico com IA tem seus obstáculos

  • Entretanto, a trajetória para um nariz eletrônico perfeito enfrenta desafios significativos;
  • Identificar cheiros utilizando IA é uma tarefa muito mais complexa do que a análise de imagens. Fatores ambientais, como a umidade, a dispersão de um odor e a forma como o dispositivo ‘inala’ o cheiro podem afetar a precisão dos resultados obtidos pelo e-nose;
  • Haritosh Patel, pós-doutorando que estuda engenharia biologicamente inspirada na Escola de Engenharia e Ciências Aplicadas de Harvard, disse ao The Wall treet Journal que a subjetividade do cheiro torna difícil a padronização e calibração dos dispositivos, em comparação com imagens que podem ser totalmente quantificadas em graduações objetivas de luz;
  • Um outro ponto crítico é a quantidade limitada de dados disponíveis para treinar esses sistemas. Enquanto imagens visuais, áudios e textos foram acumulados em enormes volumes na internet por décadas, ainda não existe um equivalente em dados de cheiro;
  • Criar um banco de dados de aromas levará tempo e esforço consideráveis. Jack Liu, chefe de desenvolvimento corporativo da Ainos, empresa de tecnologia de IA focada em aromas com sede no Texas (EUA), observa que levaram aproximadamente 30 anos para que a tecnologia de visão computacional amadurecesse. Ele acredita que estamos apenas no início de uma evolução similar para a coleta de dados olfativos.
Novidade pode ajudar, inclusive, na detecção de infecções e outras doenças pelo hálito (Imagem: Orawan Pattarawimonchai/Shutterstock)

Leia mais:

Como a tecnologia pode ajudar no dia a dia

Se você já se perguntou como a tecnologia pode ser aplicada no dia a dia, o nariz eletrônico promete ser mais do que uma curiosidade científica. Imagine um dispositivo que consegue avisar você sobre a presença de substâncias perigosas na sua casa, como gases tóxicos ou mesmo a presença de infecções potencialmente fatais baseado no seu hálito.

A possibilidade de desenvolvimento dessa tecnologia pode transformar diagnósticos médicos, oferecer segurança em ambientes corporativos e até mesmo melhorar experiências sensoriais na perfumaria.

Os próximos passos para a efetivação do nariz eletrônico estarão atrelados ao desenvolvimento de técnicas que minimizem as variáveis que afetam a detecção de odores e à criação de uma base de dados robusta que permita ao sistema aprender de forma eficaz.

À medida que mais pesquisas forem realizadas e mais avanços tecnológicos ocorrerem, a expectativa é que a tecnologia de nariz eletrônico possa, de fato, superar seus desafios e se estabelecer como uma ferramenta indispensável em diversas indústrias.

A IA não está apenas revolucionando a forma como interagimos com o mundo visual e auditivo, mas, agora, também está começando a explorar a dimensão olfativa.

O potencial dos e-noses pode levar a práticas de saúde mais seguras, ambientes mais limpos e à criação de produtos que atendam melhor às nossas percepções sensoriais.

Contudo, há muito a ser feito antes que possamos ver esses dispositivos se tornarem comuns em nossas vidas. O futuro do cheiro artificial parece promissor, mas o caminho até lá requer inovação e tempo.

O post IA aprende a sentir cheiros: conheça o nariz eletrônico apareceu primeiro em Olhar Digital.

IA aprende a sentir cheiros: conheça o nariz eletrônico Read More »

openai logo 1024x681

OpenAI lança GPT-5.4 mini para usuários gratuitos e pagos

No início de março, a OpenAI apresentou o modelo GPT-5.4, criado especialmente para trabalhos profissionais, como programação e análise de dados. Agora, a empresa traz novidades com o lançamento do GPT-5.4 mini e do GPT-5.4 nano.

O destaque é que o modelo GPT-5.4 mini está disponível para usuários gratuitos e do plano Go, permitindo acesso a funcionalidades que se aproximam das capacidades do GPT-5.4 em diversos aspectos.

OpenAI lança GPT-5.4 mini no ChatGPT

  • Os usuários que optarem pelo GPT-5.4 mini podem acessá-lo facilmente por meio da opção “Thinking” no menu Plus do ChatGPT;
  • Para os assinantes, este novo modelo servirá como uma alternativa quando o limite de utilização do GPT-5.4 padrão for atingido;
  • A OpenAI garante que o 5.4 mini apresenta desempenho superior ao do GPT-5.0 mini em áreas essenciais, como raciocínio, compreensão multimodal e uso de ferramentas;
  • Isso significa que o GPT-5.4 mini é mais eficiente na interpretação de entradas não textuais, como imagens e áudio, além de possuir uma compreensão mais elaborada de tarefas como pesquisa na web. E tudo isso é realizado com uma velocidade mais de duas vezes superior à do seu predecessor.
OpenAI liberou novo modelo mini para plano gratuitos e Go (Imagem: JRdes/Shutterstock)

Leia mais:

Por outro lado, o GPT-5.4 nano é voltado para tarefas que exigem eficiência em velocidade e custo, como classificação e extração de dados. No entanto, ao contrário do mini, este modelo não estará disponível diretamente no ChatGPT.

A OpenAI optou por oferecer o 5.4 nano exclusivamente por meio do seu serviço de API, visando facilitar o uso em projetos em que desenvolvedores delegam tarefas a agentes de IA que operam com essa nova versão.

Os custos para acesso ao GPT-5.4 nano começam em US$ 0,20 (R$ 1,04) por milhão de tokens de entrada, refletindo a proposta da OpenAI de tornar a IA mais acessível e útil para diferentes aplicações.

O post OpenAI lança GPT-5.4 mini para usuários gratuitos e pagos apareceu primeiro em Olhar Digital.

OpenAI lança GPT-5.4 mini para usuários gratuitos e pagos Read More »

satya nadella 1024x682

Microsoft reorganiza Copilot e muda liderança da área de IA

A Microsoft anunciou uma reorganização interna nas equipes responsáveis pelas diferentes versões do seu assistente de inteligência artificial, o Copilot. A mudança, comunicada pelo CEO Satya Nadella em um memorando interno, elimina a separação entre as equipes voltadas ao segmento corporativo e ao consumidor comum, que segundo funcionários gerava uma experiência fragmentada e confusa para os usuários.

Com a reestruturação, a empresa passa a adotar uma única experiência de produto que abrange tanto aplicações empresariais quanto de consumo. Nadella afirmou que o novo modelo permitirá entregas mais coerentes e competitivas, com capacidade de evoluir conforme os modelos de IA avançam. O CEO também reforçou que os modelos de inteligência artificial são mais críticos do que nunca para o sucesso da companhia na próxima década. As informações são do Wall Street Journal.

Mudança foi comunicada pelo CEO da companhia, Satya Nadella (Imagem: QubixStudio / Shutterstock.com)

Novos papéis na liderança

A reorganização redefine as responsabilidades de executivos-chave. Jacob Andreou, que até então liderava produto e crescimento da Microsoft AI, assume o cargo de vice-presidente executivo do Copilot, passando a responder pelo design, produto, crescimento e engenharia da solução.

Mustafa Suleyman, CEO da Microsoft AI — contratado em 2024 para liderar o Copilot voltado ao consumidor —, passará a concentrar seus esforços nos modelos de IA proprietários da empresa e na busca pelo que a companhia denomina superinteligência. Os aplicativos do Microsoft 365 ficarão sob responsabilidade de um grupo de executivos que inclui Ryan Roslansky, CEO do LinkedIn e vice-presidente executivo da Microsoft.

Desafios de adoção e concorrência

A reestruturação acontece em um momento de pressão crescente. Em fevereiro, a Microsoft divulgou ter comercializado 15 milhões de assentos do Microsoft 365 Copilot — número modesto diante de uma base total de mais de 450 milhões de assentos pagos do Microsoft 365. No segmento de consumo, a empresa registrou mais de 150 milhões de usuários ativos mensais do Copilot em suas plataformas.

Os concorrentes seguem na frente: o Gemini, do Google, ultrapassa 650 milhões de usuários mensais, enquanto o ChatGPT registra cerca de 900 milhões de usuários ativos semanais. Pesquisas internas da Microsoft apontaram que os usuários se mostram confusos com as múltiplas versões do produto, reflexo direto dos silos organizacionais entre as equipes.

Diferentes Ias 1024x682
Copilot corre atrás de concorrentes como Gemini e ChatGPT (Imagem: jackpress / Shutterstock.com)

O esforço para desenvolver modelos proprietários competitivos também enfrentou obstáculos. Segundo o Wall Street Journal, o processo foi prejudicado por escassez de capacidade computacional, e os modelos da Microsoft ficaram atrás dos concorrentes em testes de benchmark.

Leia mais:

Novos recursos e aposta na monetização

Para ampliar a base de usuários do Copilot voltado ao consumidor, a Microsoft vem investindo em novas funcionalidades. Entre elas, uma ferramenta anunciada recentemente que permite ao chatbot oferecer orientações personalizadas de saúde com base no histórico médico de cada usuário.

No balanço financeiro mais recente, a companhia informou estar destinando mais capacidade computacional para aprimorar seus produtos Copilot, após ganhar maior confiança em sua capacidade de monetizá-los.

O post Microsoft reorganiza Copilot e muda liderança da área de IA apareceu primeiro em Olhar Digital.

Microsoft reorganiza Copilot e muda liderança da área de IA Read More »

Netanyahu ou IA? Usuários especulam se imagens do primeiro-ministro são reais

Teorias da conspiração envolvendo o primeiro-ministro de Israel, Benjamin Netanyahu, têm se espalhado rapidamente nas redes sociais. Após a Guarda Revolucionária do Irã ter afirmado que realizou um ataque com mísseis com alvo no gabinete do político, usuários apontaram que as imagens de Netanyahu divulgadas desde então parecem ter sido geradas por IA.

Os rumores ganharam força após a transmissão ao vivo de uma coletiva de imprensa realizada na última sexta-feira. Um trecho específico passou a circular nas redes, com usuários apontando um suposto “sexto dedo” na mão direita de Netanyahu. A partir disso, surgiram alegações de que o governo israelense estaria utilizando deepfakes para ocultar a morte do líder no suposto ataque.

Análises mais cuidadosas indicaram que o ‘erro’ pode ter uma explicação simples. O The Verge revelou que o sexto dedo pode ser um efeito visual resultado de baixa qualidade da imagem ou de condições de iluminação. Além disso, o vídeo completo tem cerca de 40 minutos, uma duração maior do que modelos atuais de geração de vídeo por IA conseguem produzir. Organizações independentes de checagem já classificaram as alegações como infundadas.

Na tentativa de conter as especulações, Netanyahu publicou um novo vídeo no X no qual aparece em uma cafeteria e pede que a pessoa atrás da câmera conte seus dedos. A iniciativa, porém, não teve o efeito esperado. Usuários passaram a apontar novas “inconsistências”, como o comportamento do líquido na xícara, que parecia estranho, e um anel que pareceria desaparecer e reaparecer.

Outras críticas levantadas incluem elementos do cenário, como a data “2024” exibida em um equipamento ao fundo, e até o fato de o premiê utilizar a mão direita no vídeo, apesar de ser apontado por alguns como canhoto.

Apesar das especulações dos usuários, não há provas concretas de que os vídeos tenham sido gerados por inteligência artificial. No entanto, também não existem mecanismos claros que confirmem sua autenticidade. Nenhum dos conteúdos analisados apresenta metadados de sistemas de verificação de IA. Plataformas que prometem rotular conteúdos artificiais também não acusaram o uso da tecnologia.

Não há evidências de que Netanyahu esteja morto

Os rumores começaram após a Guarda Revolucionária do Irã ter afirmado que realizou um ataque com mísseis contra o gabinete de Benjamin Netanyahu, no início de março. Ele chegou a ficar sem ser visto por alguns dias, o que levantou suspeitas sobre se estaria ferido ou desaparecido.

A coletiva da semana passada e o vídeo publicado no X não tranquilizaram usuários. No entanto, não há indícios de que o primeiro-ministro israelense esteja morto.

O post Netanyahu ou IA? Usuários especulam se imagens do primeiro-ministro são reais apareceu primeiro em Olhar Digital.

Netanyahu ou IA? Usuários especulam se imagens do primeiro-ministro são reais Read More »

corredor data center 1024x576 1

Corrida da IA entra na era da inferência; entenda o que é

Uma mudança relevante começa a redesenhar o cenário da inteligência artificial. Depois de anos em que o foco esteve concentrado no treinamento dos modelos, o mercado passa por uma mudança: a prioridade agora é a chamada inferência, etapa responsável por colocar esses sistemas para funcionar no dia a dia.

Nos últimos cinco anos, o desenvolvimento de IA foi marcado por investimentos massivos no treinamento de grandes modelos de linguagem. Esse processo exige uma infraestrutura robusta, de milhares de chips especializados operando continuamente por semanas ou meses em data centers de grande escala, consumindo grandes volumes de energia para processar bilhões de dados.

Com a popularização das aplicações de IA, o foco passou a ser como executar essas soluções em tempo real. É nesse contexto que a inferência ganhou protagonismo: trata-se da etapa em que modelos já treinados respondem às solicitações dos usuários.

Essa mudança já se reflete nos investimentos. Segundo projeções da consultoria Gartner repercutidos pelo Wall Street Journal, os gastos globais com infraestrutura voltada à inferência devem superar, pela primeira vez, os investimentos em treinamento ainda neste ano. A tendência é de aceleração: até 2029, as empresas devem destinar cerca de US$ 72 bilhões à inferência, quase o dobro dos US$ 37 bilhões previstos para treinamento.

O novo cenário também impacta diretamente o mercado de semicondutores. A Nvidia, que se destacou com GPUs voltadas ao treinamento de IA, enfrenta agora uma demanda crescente por chips mais especializados em inferência. Esses componentes são projetados para otimizar desempenho e eficiência em tarefas específicas. Empresas como Google, Cerebras e SambaNova já avançam nesse segmento.

Inferência passou a ser o foco da indústria (Imagem: Gorodenkoff/Shutterstock)

Inferência x treinamento da IA

Mas o que diferencia a inferência do treinamento? O WSJ fez uma analogia: se o modelo de IA é um chef, o treinamento seria o período em que ele aprende receitas e técnicas. Já a inferência corresponde ao funcionamento do restaurante, quando os pedidos chegam e precisam ser preparados rapidamente.

Esse processo ocorre em duas etapas principais. A primeira, chamada de “pré-preenchimento”, envolve a interpretação da solicitação do usuário – cada palavra, símbolo ou imagem é analisado pelo modelo. Em seguida, vem a “decodificação”, quando o sistema gera a resposta com base no conhecimento adquirido.

Essas fases têm exigências técnicas distintas. O pré-preenchimento demanda maior capacidade de processamento, enquanto a decodificação exige mais memória, já que precisa acessar grandes volumes de informação para construir respostas coerentes.

Nesse contexto, entram os “tokens”, unidades básicas de dados usadas pelos modelos. Em geral, cada token representa uma fração de palavra. Uma pergunta simples pode ser convertida em poucos tokens, que são processados e gerados sequencialmente para formar a resposta final.

Com a expansão do uso comercial da IA, métricas de eficiência ganharam importância. Empresas passaram a avaliar desempenho em termos como “tokens por segundo por watt” ou “tokens por dólar”, refletindo a necessidade de reduzir custos operacionais. Executivos do setor apontam que tornar a inferência mais eficiente é hoje uma das principais prioridades da indústria.

Diferentemente do treinamento, que pode levar semanas e permite certa flexibilidade no uso de recursos, a inferência ocorre sob demanda e precisa entregar resultados em segundos. Isso exige não apenas chips mais rápidos, mas também data centers estrategicamente posicionados, próximos aos usuários, para minimizar atrasos.

Além disso, novas tecnologias começam a ser adotadas para melhorar a eficiência. Algumas empresas já utilizam conexões ópticas dentro dos sistemas, substituindo cabos de cobre para acelerar a transmissão de dados e reduzir a necessidade de resfriamento.

O post Corrida da IA entra na era da inferência; entenda o que é apareceu primeiro em Olhar Digital.

Corrida da IA entra na era da inferência; entenda o que é Read More »

chip ia 300x169

A oportunidade trilionária que o CEO da Nvidia (ainda) enxerga em chips de IA

🔍 Curadoria Studio Mestre Digital: Nossa equipe monitora as principais movimentações de mercado e tecnologia para manter você atualizado.


Chip Ia 300x169

O caminho de crescimento para a gigante de tecnologia Nvidia está no desenvolvimento de modelos avançados de chips de inteligência artificial (IA). Na visão do CEO Jensen Huang, há oportunidade de receita de pelo menos US$ 1 trilhão, até 2027, para a empresa, a partir dos novos produtos. A previsão foi dada nesta segunda-feira, 16 […]

O post A oportunidade trilionária que o CEO da Nvidia (ainda) enxerga em chips de IA apareceu primeiro em NeoFeed.


Insight Studio Mestre: Esta notícia reflete tendências que podem impactar diretamente o seu modelo de negócio digital.

Conteúdo original publicado em: Acesse a fonte oficial

A oportunidade trilionária que o CEO da Nvidia (ainda) enxerga em chips de IA Read More »