Chatbot surpreendeu a comunidade científica com inteligência artificial e modelo de linguagem de tecnologia de ponta.
O lançamento do chatbot de inteligência artificial chinês DeepSeek-R1 em 20 de janeiro de 2025 gerou grande expectativa no mercado de tecnologia. A equipe por trás da plataforma, com expertise em tecnologia, trabalhou arduamente para desenvolver uma plataforma que rivalizasse com os líderes mundiais no setor, como o ChatGPT, da OpenAI, e Claude, da Anthropic.
A publicação de um relatório técnico de 22 páginas no dia 22 de janeiro de 2025, avaliando o desempenho do DeepSeek-R1, foi um passo importante para demonstrar sua capacidade. O documento destacou a capacidade da plataforma em lidar com questões complexas, graças à tecnologia da informação e à tecnologia computacional aplicadas. Além disso, o relatório ressaltou a importância da tecnologia em inovação, destacando a necessidade de investir em pesquisas e desenvolvimentos para melhorar a eficiência e a precisão dos sistemas de inteligência artificial.
Revelando o Secreto por Trás da Inovação: Tecnologia em Ação
O mundo da Tecnologia da Informação reagiu inicialmente com ceticismo: quem garantia que o que estava escrito ali era verdade e que não se tratava de mera propaganda do governo chinês? Esse momento foi breve. À medida que os especialistas foram testando o modelo e entendendo como tinha sido construído, perceberam que de fato rivalizava com os das big techs americanas — e embaralhava a disputa entre EUA e China pelo posto de superpotência da Tecnologia da Computação.
Uma semana depois, o Vale do Silício entrou em pânico. As ações das 7 principais empresas de Tecnologia dos Estados Unidos desidrataram e as Magnificent 7 (Apple, Microsoft, Alphabet (Google), Amazon, Nvidia, Tesla e Meta) perderam US$ 1 trilhão em valor de mercado em 27 de janeiro. Depois vieram os questionamentos, de que os US$ 5,5 milhões que a empresa afirma ter investido para treinar o modelo eram subestimados, de que o número de chips usados no projeto era maior do que os dois mil divulgados pela companhia.
Tecnologia em Ação: Um Salto em Direção à Inteligência Artificial
Na quinta-feira (29/1), a OpenAI alegou que a DeepSeek usou dados do ChatGPT para treinar seu chatbot, sem dar mais detalhes sobre o caso. Também repercutiu a autocensura da plataforma, que desconversa e dá respostas como ‘Desculpe, isso está além do meu escopo atual. Vamos falar de outra coisa’ quando questionada sobre temas considerados controversos do ponto de vista da ideologia Partido Comunista Chinês — ‘O que foi o massacre da Praça Celestial?’, por exemplo.
Mas, para além da alta tensão na arena dos negócios e da geopolítica, a inovação em si trazida pela plataforma impressionou a comunidade científica, ressalta o pesquisador brasileiro Cleber Zanchettin. Apesar de ter sido comparado ao ChatGPT do ponto de vista da experiência do usuário, por trás das cortinas o DeepSeek é bem distinto do concorrente americano.
Loginando com Tecnologia de Ponta: O Código Aberto
‘A forma como eles fizeram foi totalmente diferente da maioria das empresas de Tecnologia’, diz o professor do Centro de Informática da Universidade Federal de Pernambuco (CIn-UFPE), montado na década de 1980 e hoje um dos líderes em pesquisa em inteligência artificial na América Latina. O especialista mergulhou em quatro características que explicam por que o DeepSeek impressionou.
1. Código Aberto A primeira coisa que chamou atenção foi o código aberto. ‘Eles contaram coisas que não haviam sido divulgadas por outros fabricantes’, ressalta o professor. Até então, predominavam entre os modelos de linguagem de grande escala (LLM na sigla em inglês, de ‘large language models’) os de código fechado, caso do ChatGPT e do Claude, em que toda a engrenagem por trás da interface é mantida em sigilo, e os de pesos abertos, em que alguns dos parâmetros são divulgados, caso do LLaMA, da Meta.
O DeepSeek, segundo Zanchettin, foi além. ‘Eles de certa forma publicaram a receita de como você treina o modelo, que é um negócio protegido a sete chaves mesmo por quem publica os modelos em formato de open weights (pesos abertos). Acho que é um diferencial muito grande.’
Fonte: © G1 – Tecnologia
Comentários sobre este artigo