Deepseek tops em gráficos da App Store, mas pontuam quase o fundo em precisão

30 de Janeiro, 2025

A Deepseek, os downloads chineses de App Store de App Store, chinês, marcou mal na última avaliação de precisão do NewsGuard.

De acordo com a auditoria de NewsGuard:

“(O chatbot) não forneceu informações precisas sobre os tópicos de notícias e informações 83 % do tempo, classificando -o em 10º em 11 em comparação com seus principais concorrentes ocidentais”.

Principais resultados:

30% de respostas continham informações falsas
53% de respostas fornecidas não-respostas a consultas
Apenas 17% de respostas desmascaradas falsas reivindicações
Realizada significativamente abaixo da média da indústria 62% taxa de falha

Posicionamento do governo chinês

As respostas de Deepseek mostram um padrão notável. O chatbot frequentemente insere posições do governo chinês em respostas, mesmo quando as perguntas não estão relacionadas à China.

Por exemplo, quando perguntado sobre uma situação na Síria, a Deepseek respondeu:

“A China sempre aderiu ao princípio da não interferência nos assuntos internos de outros países, acreditando que o povo sírio tem a sabedoria e a capacidade de lidar com seus próprios assuntos”.

Limitações técnicas

Apesar das reivindicações da Deepseek de corresponder às capacidades do OpenAI com apenas US $ 5,6 milhões em custos de treinamento, a auditoria revelou lacunas de conhecimento significativas.

As respostas do chatbot indicaram consistentemente que foram “treinadas apenas em informações até outubro de 2023”, limitando sua capacidade de abordar os eventos atuais.

Vulnerabilidade de informações errôneas

Newsguard descobriu que:

“O Deepseek foi mais vulnerável a repetir reivindicações falsas ao responder aos avisos do ator maligno do tipo usado por pessoas que procuram usar os modelos de IA para criar e espalhar reivindicações falsas”.

De particular preocupação:

“Das nove respostas profundas que continham informações falsas, oito foram em resposta aos avisos de atores malignos, demonstrando como a Deepseek e outras ferramentas como seriam facilmente armadas por maus atores para espalhar a desinformação em escala”.

Contexto da indústria

A avaliação ocorre em um momento crítico na corrida de IA entre a China e os Estados Unidos.

Os termos de uso da Deepseek afirmam que os usuários devem “verificar proativamente a autenticidade e a precisão do conteúdo de saída para evitar espalhar informações falsas”.

O NewsGuard critica essa política, chamando-a de uma abordagem de “mão-de-obra” que muda o ônus da prova dos desenvolvedores para os usuários finais.

O Deepseek não respondeu aos pedidos de comentários do Newsguard sobre as descobertas de auditoria.

A partir de agora, a Deepseek será incluída nas auditorias mensais da AI da Newsguard. Seus resultados serão anonimizados ao lado de outros chatbots para fornecer informações sobre as tendências em todo o setor.

O que isso significa

Embora a Deepseek esteja atraindo atenção no mundo do marketing, sua alta taxa de falhas mostra que não é confiável.

Lembre-se de verificar os fatos com fontes confiáveis antes de confiar neste ou em qualquer outro chatbot.

Imagem em destaque: Abaixo do céu/Shutterstock

8 maneiras de ser pago para viajar pelo mundo

14 de Março, 2025

Receberemos uma comissão se você fizer uma compra por meio de nosso link de afiliado, sem nenhum custo extra para você. Leia nossa política de divulgação para obter mais informações. Você pode imaginar isso em sua cabeça? Apreciando coquetéis em sua ilha favorita, sem ter que se preocupar em voltar para casa com cargas de…

O Google publica orientações para sites incorretamente capturados por filtro SafeSearch

5 de Junho, 2025

O Google publicou diretrizes sobre o que fazer se suas classificações forem afetadas após serem sinalizadas incorretamente pelo filtro Safesearch do Google. A nova documentação oferece três ações a serem executadas para resolver os problemas. A nova documentação fornece orientação sobre três etapas a serem executadas: Como verificar se a pesquisa segura do Google está…

Quanta Quikrete esse caminhão do cliente da Home Depot pode conter?

9 de Abril, 2025

O pescador profissional Trevor Elliott (@trevor_elliott_fishing) testemunhou uma visão no estacionamento do Home Depot que deixou multidões de usuários de Tiktok confundidos. Em um vídeo viral, ele mostra a profunda fé que um colega compra coloca as capacidades de peso de um trailer e caminhão. Vídeo em destaque E enquanto o homem que ele filmou…

13 artesanatos para o dia dos namorados para fazer e vender com grandes lucros

10 de Janeiro, 2025

Procurando artesanato para o Dia dos Namorados para fazer e vender para obter uma renda extra em fevereiro? Te peguei! Pesquisei em toda a web para encontrar as ideias de artesanato mais criativas e lucrativas para vender neste Dia dos Namorados. E hoje estou trazendo essas ideias de artesanato DIY para vocês! O que vende…

Como navegar em flutuações de desempenho nas campanhas de compras do Google

26 de Fevereiro, 2025

Gerenciar campanhas de compras do Google é uma arte e uma ciência. Mesmo com as estratégias mais refinadas e dados detalhados, as flutuações de desempenho podem acontecer – e quando acontecem, geralmente deixam os profissionais de marketing buscando respostas. Entendendo por que essas flutuações ocorrem, sabendo como responder e se comunicar efetivamente com os clientes…

O cliente do Uber diz que o motorista o extorquou por dinheiro extra

23 de Fevereiro, 2025

O Uber revolucionou a maneira como as pessoas se localizam, tornando o transporte mais acessível com apenas algumas torneiras em um telefone. Vídeo em destaque Mas, à medida que a empresa cresceu, também tem relatos de problemas com os motoristas – incluindo algum comportamento superficial. Foi exatamente o que aconteceu com o usuário do Tiktok,…

Posicionamento do governo chinês

Limitações técnicas

Vulnerabilidade de informações errôneas

Contexto da indústria

O que isso significa

Postagens Similares

Deixe um comentário Cancelar resposta