IA esta semana
A Microsoft acaba de fazer com que seus assistentes de IA colaborem entre si. A empresa anunciou um novo recurso chamado “Critique” para sua ferramenta Copilot Researcher, que combina o ChatGPT da OpenAI e o Claude da Anthropic em um único fluxo de trabalho. Funciona assim: o GPT gera as respostas iniciais. Em seguida, o Claude as refina. A Microsoft afirma que esse ciclo de feedback oferece resultados mais sólidos em termos de precisão factual e análise. A empresa também apresentou o “Model Council”, que adota uma abordagem diferente. Ele exibe as respostas dos dois modelos de IA lado a lado e gera um relatório destacando onde eles concordam e discordam. Os usuários podem escolher qualquer um dos métodos. Ambos os recursos já estão disponíveis por meio do programa de acesso antecipado Frontier do Microsoft 365 Copilot. A Microsoft afirma que a atualização supera os modelos Deep Research da Perplexity em benchmarks de precisão e completude.
Um erro na gestão de dados expôs os segredos mais bem guardados da Anthropic. Quase 3.000 recursos internos vazaram para a internet após a empresa ter deixado de marcar os arquivos como privados em seu sistema de gerenciamento de conteúdo.
Os materiais vazados revelam o “Claude Mythos”, que a Anthropic descreve como “de longe o modelo de IA mais poderoso que já desenvolvemos”. A empresa confirmou o vazamento e afirma que o modelo representa uma “mudança radical” no desempenho da IA. Atualmente, ele está em fase de testes com alguns clientes selecionados que têm acesso antecipado.
O vazamento também revelou um novo nível de modelo ainda não lançado, chamado "Capybara", projetado para ficar acima do nível Opus já existente da Anthropic. O mais impressionante: documentos internos alertam que o Claude Mythos representa sérios riscos à segurança cibernética e poderia ajudar hackers a realizar ataques cibernéticos que "superariam em muito os esforços dos defensores".
A atualização do iOS 27 da Apple permitirá, segundo relatos, que os usuários escolham qual chatbot de IA se conecta à Siri, indo além da integração atual com o ChatGPT. Uma reportagem citando Mark Gurman, da Bloomberg, afirma que assistentes de terceiros baixados da App Store — incluindo o Gemini, do Google, e o Claude, da Anthropic — poderão fornecer respostas por meio da Siri no iPhone, iPad e Mac. O sistema, que supostamente se chamará “Extensions”, permitiria aos usuários ativar ou desativar chatbots específicos. As mesmas integrações também podem oferecer suporte a um aplicativo independente para uma Siri aprimorada por IA, capaz de realizar ações em diferentes aplicativos em nome do usuário. Após alguns contratempos, a Apple anunciou em janeiro que está trabalhando com o Google na reformulação da Siri.
O Reddit está implementando novas verificações de “autenticidade humana” voltadas para contas que parecem automatizadas, ao mesmo tempo em que identifica contas automatizadas do tipo “serviço” com a etiqueta “APP”. A medida não será aplicada em todo o site. A empresa afirma que a verificação será acionada apenas quando padrões de atividade ou sinais técnicos sugerirem a presença de um bot, como publicações com velocidade incomum. As contas que não passarem na verificação poderão sofrer restrições. O Reddit planeja usar opções de terceiros, incluindo chaves de acesso da Apple, Google e YubiKey, ferramentas biométricas como Face ID e World ID e, em algumas regiões, documentos de identidade oficiais devido às regras de verificação de idade. O CEO Steve Huffman disse que o Reddit quer uma prova da existência da pessoa, não de sua identidade, para manter o anonimato intacto. O Reddit também remove cerca de 100.000 contas de bots ou spam diariamente.
A OpenAI encerrará seu aplicativo de vídeo com IA, o Sora, poucos meses após o lançamento, informando aos usuários que divulgará os cronogramas para o aplicativo e a API e explicará como os criadores podem preservar seus trabalhos. A medida também põe fim a uma importante parceria com Hollywood. Uma fonte familiarizada com o assunto afirma que a Disney está rescindindo seu acordo com a OpenAI, um pacto anunciado no ano passado que incluía um investimento planejado de US$ 1 bilhão e o licenciamento de personagens da Disney para o Sora, com vistas a uma eventual integração com o Disney+. A estreia do Sora no outono passado surpreendeu o setor, levando a uma rápida reestruturação para dar aos estúdios e aos talentos mais controle sobre a propriedade intelectual e as imagens. A OpenAI afirma que continuará trabalhando com vídeo de IA em outros produtos.
A Anthropic anunciou que suas ferramentas Claude Code e Claude Cowork estão sendo atualizadas para realizar tarefas no computador, com esses recursos de IA passando a ser capazes de abrir arquivos, usar o navegador e executar ferramentas de desenvolvimento. Quando ativado, o chatbot de IA Claude dará prioridade, em primeiro lugar, aos conectores para serviços compatíveis, como o pacote Google Workspace ou o Slack; mas, se um conector não estiver disponível, ele ainda poderá executar uma tarefa atribuída. O Claude deve solicitar permissão antes de realizar essas ações, mas a Anthropic ainda recomenda não usar esse recurso para lidar com informações confidenciais como medida de precaução. O uso do computador pelo Claude estará inicialmente disponível para assinantes do Claude Pro e do Claude Max no macOS, com esse recurso ainda em uma versão de pré-visualização de pesquisa que continuará sendo ajustada com base no feedback dos usuários da Anthropic.
Elon Musk lançou a TeraFab, uma joint venture de US$ 25 bilhões entre a Tesla, a SpaceX e a xAI para a fabricação de chips, com a meta de atingir um terawatt de capacidade computacional de IA por ano. Subindo ao palco na antiga Usina Seaholm, em Austin, Musk chamou o projeto de “de longe, o maior empreendimento de fabricação de chips da história”. A instalação reunirá todas as etapas da produção de semicondutores sob o mesmo teto, incluindo projeto de chips, litografia, fabricação, produção de memória, embalagem avançada e testes. Espera-se que os chips sejam fabricados com um processo de 2 nm, uma das tecnologias de fabricação mais avançadas. A TeraFab produzirá chips de inferência para veículos da Tesla e robôs Optimus, além de chips D3 projetados sob medida para satélites de IA orbitais. Musk afirmou que 80% da capacidade computacional da TeraFab seria direcionada para satélites de IA orbitais espaciais. Nem a Tesla nem a SpaceX têm experiência prévia na operação de uma instalação de fabricação de semicondutores.
A OpenAI unificará seu navegador web, o aplicativo ChatGPT e o aplicativo de programação Codex em um único superaplicativo para desktop, com Fidji Simo, CEO de Aplicativos da OpenAI, supervisionando a mudança com o apoio do presidente da OpenAI, Greg Brockman. O novo aplicativo tem como objetivo ajudar a OpenAI a otimizar a experiência do usuário e reduzir a fragmentação. A iniciativa de unificar os produtos da OpenAI em um único aplicativo surge após Simo ter realizado uma reunião com toda a equipe no início deste mês, dizendo a eles que “o que realmente importa para nós neste momento é manter o foco e executar com extrema eficiência”. A empresa lançou uma série de novos produtos e experiências nos últimos meses, incluindo seu aplicativo Codex e seu navegador, enquanto corre para manter uma vantagem sobre rivais como o Google e a Anthropic.
O Google redesenhou completamente sua ferramenta de design Stitch AI, introduzindo uma “tela infinita nativa de IA” que permite aos usuários criar protótipos de interface do usuário por meio de comandos de voz e linguagem natural. O novo recurso de voz permite que o agente de IA ofereça críticas de design em tempo real, entreviste usuários para projetar páginas de destino e faça atualizações instantâneas com base em comandos falados, como “mostre-me três opções diferentes de menu” ou “mostre-me esta tela em diferentes paletas de cores”. O Google criou um SDK e um servidor MCP para o Stitch, permitindo que os usuários o conectem a assistentes de codificação como Antigravity, Gemini CLI, Claude Code ou Cursor, combinando codificação e design intuitivos. De acordo com o Google, a ferramenta pode ajudar designers profissionais a explorar dezenas de variações ou auxiliar fundadores a concretizar sua primeira ideia de software, concluindo o trabalho “em minutos, em vez de dias”.
A OpenAI está mudando sua estratégia, deixando de distribuir recursos por várias linhas de produtos para concentrar-se em ferramentas de programação e clientes corporativos. O CEO de Aplicações, Fidji Simo, apresentou a nova direção em uma reunião com toda a equipe, enquanto Sam Altman e o chefe de pesquisa, Mark Chen, avaliam quais iniciativas devem ser reduzidas. A mudança estratégica surge como resposta direta ao crescente domínio da Anthropic no mercado de IA empresarial, onde seus produtos Claude Code e Cowork a tornaram a fornecedora preferida das empresas. A OpenAI acredita agora que sua estratégia de lançar o maior número possível de produtos ao mesmo tempo deixou a empresa vulnerável. Funcionários atuais e ex-funcionários relatam que o grande número de projetos paralelos levou a uma falta de foco, e os recursos de computação eram frequentemente transferidos entre equipes em curto prazo. A OpenAI agora planeja, segundo relatos, integrar a geração de vídeo ao aplicativo principal do ChatGPT.