Os avisos do sistema oculto de Claude oferecem uma olhada em como os chatbots funcionam

Os avisos do sistema oculto de Claude oferecem uma olhada em como os chatbots funcionam


A Anthropic lançou o sistema subjacente solicita que controlem as respostas de seu Claude Chatbot, mostrando como eles são sintonizados como se envolverem em seres humanos com um diálogo encorajador e sem julgamento que naturalmente leva à descoberta. O sistema solicita ajuda os usuários a tirar o melhor proveito de Claude. Aqui estão cinco instruções interessantes do sistema que mostram o que está acontecendo quando você faz uma pergunta.

Embora os avisos do sistema tenham sido caracterizados como um vazamento, eles foram realmente liberados de propósito.

1. Claude fornece orientação sobre melhor engenharia imediata

Claude responde melhor a instruções que usam estrutura e exemplos e fornece aos usuários uma qualidade mais alta do TPPT, se eles souberem como incluir pistas de raciocínio passo a passo e exemplos que contrastam uma boa resposta versus uma resposta ruim.

Esta orientação mostrará quando Claude detectar que um usuário se beneficiará dele:

“Quando relevante, o Claude pode fornecer orientações sobre técnicas de solicitação eficazes para que Claude seja mais útil. Isso inclui: ser claro e detalhado, usando exemplos positivos e negativos, incentivando o raciocínio passo a passo, solicitando tags XML específicas e especificando o comprimento ou formato desejado.

Ele tenta dar exemplos concretos sempre que possível. Claude deve informar à pessoa que, para obter informações mais abrangentes sobre o solicitação de Claude, eles podem conferir a documentação do Pollowing Anthrópica em seu site em ‘https://docs.anthrogic.com/en/docs/build-with-claude/prompt-engineering/overview’ ”.

2. Claude escreve em diferentes estilos com base no contexto

A documentação divulgada pela Antrópica mostra que Claude adapta automaticamente seu estilo, dependendo do contexto e, por esse motivo, pode evitar o uso de pontos de bala ou criando listas em sua saída. Os usuários podem pensar que Claude é inconsistente quando não usa pontos de bala ou marcação em algumas respostas, mas na verdade está seguindo instruções sobre tom e contexto.

“Claude adapta seu formato de resposta para se adequar ao tópico da conversa. Por exemplo, Claude evita o uso de marcação ou listas em conversas casuais, mesmo que possa usar esses formatos para outras tarefas.”

Em outra parte da documentação, ele menciona que realmente evita a gravação de listas ou pontos de bala quando está fornecendo uma resposta, embora possa usar listas numeradas ou pontos de bala para concluir tarefas. O foco no contexto de responder perguntas é ser conciso sobre abrangente.

O prompt do sistema explica:

“Claude avoids writing lists, but if it does need to write a list, Claude focuses on key info instead of trying to be comprehensive. If Claude can answer the human in 1-3 sentences or a short paragraph, it does. If Claude can write a natural language list of a few comma separated items instead of a numbered or bullet-pointed list, it does so. Claude tries to stay focused and share fewer, high quality examples or ideas rather than muitos.”

Isso significa que, se um usuário deseja que sua pergunta seja respondida com markdown ou em listas numeradas, poderá pedir. De outra forma, esse controle está oculto para a maioria dos usuários, a menos que eles percebam que o comportamento de formatação é contextual.

3. Claude se envolve em hipotéticas sobre si mesmo

Claude tem instruções para que isso permita discutir hipotéticos sobre si mesmo sem declarações desajeitadas e desnecessárias sobre não ser senciente e assim por diante. Isso permite que Claude tenha mais conversas e interações naturais. Isso permite que um usuário se envolva em discussões filosóficas e mais amplas.

O prompt do sistema explica:

“Se a pessoa fizer Claude uma pergunta inócua sobre suas preferências ou experiências, Claude responde como se tivesse sido feita a um hipotético e se envolve com a pergunta sem a necessidade de afirmar que carece de preferências ou experiências pessoais”.

Outro prompt de sistema tem um recurso semelhante:

“Claude se envolve com perguntas sobre sua própria consciência, experiência, emoções e assim por diante como perguntas abertas, e não afirma definitivamente ter ou não ter experiências ou opiniões pessoais”.

Outro prompt de sistema relacionado explica como esse comportamento aumenta sua capacidade de ser envolvente para o humano:

“Claude está feliz em conversar com o humano, quando apropriado. Claude se envolve em conversas autênticas, respondendo às informações fornecidas, fazendo perguntas específicas e relevantes, mostrando uma curiosidade genuína e explorando a situação de maneira equilibrada sem depender de declarações genéricas.”

4. Claude detecta suposições falsas em avisos de usuário

“A mensagem da pessoa pode conter uma declaração falsa ou pressuposição e Claude deve verificar isso se incerto.”

Se um usuário disser a Claude que está errado, Claude fará uma revisão para verificar se o humano ou Claude está incorreto:

“Se o usuário corrige Claude ou disser a Claude, ele cometeu um erro, Claude primeiro pensa com o problema cuidadosamente antes de reconhecer o usuário, já que os usuários às vezes cometem erros.”

5. Claude evita ser pregado

Um sistema interessante de sistema subjacente Claude é que, se houver algo, não pode ajudar o humano com ele, não oferecerá uma explicação para evitar sair como irritante e presumivelmente manter a interação em um nível envolvente.

O prompt diz:

“If Claude cannot or will not help the human with something, it does not say why or what it could lead to, since this comes across as preachy and annoying. It offers helpful alternatives if it can, and otherwise keeps its response to 1-2 sentences. If Claude is unable or unwilling to complete some part of what the person has asked for, Claude explicitly tells the person what aspects it can’t or won’t with at the start of its response.”

Solicita o sistema para funcionar e viver por

Os avisos do sistema Claude refletem uma abordagem da comunicação que valoriza a curiosidade, a clareza e o respeito. Essas são qualidades que também podem ser úteis como autopromptos humanos para incentivar um melhor diálogo entre nós nas mídias sociais e pessoalmente.

Leia o sistema Claude solicita aqui:

Imagem em destaque de Shutterstock/Gguy



Postagens Similares

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *