Claude Opus agora pode encerrar conversas prejudiciais

Automatize experiências conversacionais com IA

Descubra o poder de uma plataforma que lhe oferece controle e flexibilidade para proporcionar experiências valiosas aos clientes em grande escala.

Agende uma demonstração

A Anthropic introduziu um novo recurso no Claude Opus 4 e 4.1, permitindo que a IA encerre conversas em casos raros e extremos de interações prejudiciais ou abusivas. Essa decisão decorre de um trabalho exploratório sobre o bem-estar da IA e de esforços mais amplos para melhorar o alinhamento do modelo e as salvaguardas do usuário. Durante os testes, Claude demonstrou uma forte aversão a tarefas prejudiciais e sinais de angústia quando confrontado com solicitações relacionadas a violência, exploração ou abuso. O recurso é ativado apenas como último recurso, após várias redirecionamentos falharem ou quando explicitamente solicitado por um usuário. Embora raras, essas intervenções destacam o compromisso em mitigar riscos sem comprometer a experiência do usuário. As conversas ainda podem ser reiniciadas ou revisadas por meio de edições.

Leia mais

Explore a IA da Inbenta

Postagens relacionadas da AI This Week

A Mistral AI levanta US$ 830 milhões para construir centros de dados equipados com tecnologia da Nvidia em toda a Europa

Leia mais

A Anthropic vaza acidentalmente o código-fonte do Claude em um grave erro de segurança

Leia mais

A OpenAI fecha rodada de financiamento recorde de US$ 122 bilhões com avaliação de US$ 852 bilhões

Leia mais

Claude Opus agora pode desligar conversas prejudiciais

Por que Inbenta

Postagens relacionadas da AI This Week