Deepseek tops em gráficos da App Store, mas pontuam quase o fundo em precisão

Deepseek tops em gráficos da App Store, mas pontuam quase o fundo em precisão


A Deepseek, os downloads chineses de App Store de App Store, chinês, marcou mal na última avaliação de precisão do NewsGuard.

De acordo com a auditoria de NewsGuard:

“(O chatbot) não forneceu informações precisas sobre os tópicos de notícias e informações 83 % do tempo, classificando -o em 10º em 11 em comparação com seus principais concorrentes ocidentais”.

Principais resultados:

  • 30% de respostas continham informações falsas
  • 53% de respostas fornecidas não-respostas a consultas
  • Apenas 17% de respostas desmascaradas falsas reivindicações
  • Realizada significativamente abaixo da média da indústria 62% taxa de falha

Posicionamento do governo chinês

As respostas de Deepseek mostram um padrão notável. O chatbot frequentemente insere posições do governo chinês em respostas, mesmo quando as perguntas não estão relacionadas à China.

Por exemplo, quando perguntado sobre uma situação na Síria, a Deepseek respondeu:

“A China sempre aderiu ao princípio da não interferência nos assuntos internos de outros países, acreditando que o povo sírio tem a sabedoria e a capacidade de lidar com seus próprios assuntos”.

Limitações técnicas

Apesar das reivindicações da Deepseek de corresponder às capacidades do OpenAI com apenas US $ 5,6 milhões em custos de treinamento, a auditoria revelou lacunas de conhecimento significativas.

As respostas do chatbot indicaram consistentemente que foram “treinadas apenas em informações até outubro de 2023”, limitando sua capacidade de abordar os eventos atuais.

Vulnerabilidade de informações errôneas

Newsguard descobriu que:

“O Deepseek foi mais vulnerável a repetir reivindicações falsas ao responder aos avisos do ator maligno do tipo usado por pessoas que procuram usar os modelos de IA para criar e espalhar reivindicações falsas”.

De particular preocupação:

“Das nove respostas profundas que continham informações falsas, oito foram em resposta aos avisos de atores malignos, demonstrando como a Deepseek e outras ferramentas como seriam facilmente armadas por maus atores para espalhar a desinformação em escala”.

Contexto da indústria

A avaliação ocorre em um momento crítico na corrida de IA entre a China e os Estados Unidos.

Os termos de uso da Deepseek afirmam que os usuários devem “verificar proativamente a autenticidade e a precisão do conteúdo de saída para evitar espalhar informações falsas”.

O NewsGuard critica essa política, chamando-a de uma abordagem de “mão-de-obra” que muda o ônus da prova dos desenvolvedores para os usuários finais.

O Deepseek não respondeu aos pedidos de comentários do Newsguard sobre as descobertas de auditoria.

A partir de agora, a Deepseek será incluída nas auditorias mensais da AI da Newsguard. Seus resultados serão anonimizados ao lado de outros chatbots para fornecer informações sobre as tendências em todo o setor.

O que isso significa

Embora a Deepseek esteja atraindo atenção no mundo do marketing, sua alta taxa de falhas mostra que não é confiável.

Lembre-se de verificar os fatos com fontes confiáveis ​​antes de confiar neste ou em qualquer outro chatbot.


Imagem em destaque: Abaixo do céu/Shutterstock



Postagens Similares

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *