RN 24 Horas

A Noticias Vidrada 24 Horas. Veja toda notícia do Rio Grande do Norte e Região.
China acelera inteligência artificial para enfrentar ChatGPT

São inteligências artificiais focadas em conteúdo textual — Foto: Reprodução

No terreno fértil encontrado pela inteligência artificial (IA) do tipo geradora de conteúdo nos últimos meses, as empresas chinesas foram praticamente as únicas a fazer algo sobre o domínio da big tech dos EUA. Uma série de anúncios de sistemas chineses orientados ao idioma marca uma resposta na corrida que ganhou destaque com o lançamento do ChatGPT no final do ano passado.

Por mais que existam nomes de destaque em outras localidades, é do setor privado desses dois países que surgiram a maior parte das principais inovações recentes. Publicamente, as empresas chinesas apertaram o ritmo desde março, e nomes como Alibaba, Baidu, Huawei e Tencent divulgaram perspectivas de lançamentos ou melhorias em suas versões dos chamados grandes modelos de linguagem – rivais do GPT, motor da americana OpenAI sistema.

São inteligências artificiais focadas em conteúdo textual: podem processar a comunicação escrita, responder perguntas, montar sequências de frases que parecem ter sido feitas por humanos, traduzir e gerar códigos de programação. Apesar das nuances na arquitetura dos algoritmos, as versões apresentadas por essas empresas chinesas têm estrutura semelhante a de nomes como Google, Meta (Facebook) e Microsoft, e as tarefas executadas são, em essência, as mesmas.

Um relatório encabeçado pela Universidade de Stanford (EUA) divulgado no início de abril destaca a participação dos dois países no setor.
E não apenas competir. Segundo o documento, a ponte entre a China e os Estados Unidos tem sido líder em colaborações entre nações para a produção de artigos científicos sobre IA na última década, ainda que o crescimento anual da parceria venha desacelerando.

“Embora os EUA e a China continuem a dominar a área de pesquisa e desenvolvimento de IA, os esforços estão se diversificando geograficamente”, destaca o relatório, que contou com o apoio de empresas como Google, OpenAI, Linkedin e Github, as três últimas vinculadas à Microsoft. A participação da Índia em estudos especializados, por exemplo, vem crescendo. O documento, porém, destaca a liderança chinesa em produções acadêmicas sobre IA, enquanto os EUA lideram em termos de investimentos com US$ 47,4 bilhões (cerca de R$ 234 bilhões) em 2022, ante US$ 13,4 bilhões (R$ 66 bilhões) da segunda colocada China.

A comparação entre os resultados práticos desse dinheiro gasto não é uma tarefa simples, primeiro pela disponibilidade: apesar de anunciadas, as versões mais atuais desses sistemas não são facilmente acessíveis ao público. Além dos comunicados oficiais das empresas, só é possível analisar documentos que acompanham algumas dessas tecnologias, com informações técnicas sobre sua estrutura e atuação.
O alvoroço causado pelo ChatGPT, que atingiu a marca recorde de 100 milhões de usuários dois meses após seu lançamento, exigiu uma resposta rápida de concorrentes que não necessariamente tinham produtos com o mesmo nível de maturidade, como o Ernie Bot, considerado um dos mais avançado na China.

O robô da Baidu, empresa especializada em buscas, tem um formato de conversação à la Bing (Microsoft), que tem o GPT sob o capô. A ferramenta propõe funcionalidades semelhantes, além de gerar imagens e fala, conforme demonstrado em vídeos. Hoje ele só pode ser acessado por meio de convites selecionados.
Ernie também mostra que o valor gasto não conta toda a história. O relatório de Stanford coloca a produção de sua versão 3.0, lançada em 2021 e um dos alicerces do Bot, como cerca de cinco vezes mais barata que a do GPT-2, de 2019, e 180 vezes mais barata que a do GPT-3, de 2020 No geral, os gastos aumentaram ao longo do tempo. Para redução de custos, os artigos técnicos do Baidu citam um conjunto de técnicas propostas por pesquisadores da Universidade de Tsinghua, com sede em Pequim
.
A imposição de limites ao comportamento da IA ​​é uma dificuldade enfrentada pela indústria como um todo. A principal diferença está no rigor da linha traçada, mais rígida no caso chinês.
Os termos de uso do GLM-130B, modelo especializado em inglês e chinês lançado pela Universidade de Tsinghua em 2022, incluem restrições a aplicativos que prejudicam o governo do país. “Você não usará este software para nenhuma ação que possa minar a segurança ou a unidade nacional da China, prejudicar o interesse público da sociedade ou infringir os direitos e interesses dos seres humanos”, diz um trecho da licença.
Nos EUA, os termos de uso não fazem referência à segurança nacional ou aos interesses do país, mas para sistemas criados por empresas como Google e Microsoft, o desafio de limitar as respostas surge ao tentar impedir que ferramentas falem besteiras ou forneçam, por exemplo, por exemplo, diretrizes para a criação de armas químicas. A China também responsabiliza os criadores dos algoritmos, que devem fornecer os detalhes de seus sistemas a um registro estadual, por qualquer conteúdo inapropriado gerado.

A dificuldade de manter o conteúdo dentro dos limites impostos pelo regime chinês já levou à suspensão de outras tecnologias semelhantes, mesmo aquelas concebidas no próprio país, onde são barrados conteúdos de internet com temas considerados sensíveis pelo governo. O ChatGPT também não funciona lá.

Como os grandes modelos de linguagem são gerados pela análise de bilhões de textos, nos quais a IA detecta padrões e passa a reproduzi-los, uma alternativa pode ser limitar as informações que alimentam os robôs, embora essa filtragem traga desafios. Como o conteúdo é volumoso, fica difícil descartar tudo o que pode ser problemático, e adotar um conjunto previamente censurado, por outro lado, pode diminuir demais a quantidade de entradas do modelo, diminuindo seu desempenho.

Como o OpenAI, o Baidu não esclarece quais dados usou para construir seu software mais moderno. A revista Wired especula que o conteúdo veio da internet chinesa, ou seja, com limitações devido à censura.

Nesses sistemas, a princípio, tudo o que é absorvido está em disputa, incluindo conteúdos perigosos, imprecisos ou eticamente questionáveis. Em seguida, outro processo de treinamento começa com humanos para definir o que o robô pode e não pode dizer. Nada disso é 100% eficaz.

Na prática, depois de testar Ernie, jornais como The Washington Post e Nikkei Asia relataram uma experiência menos fluida do que com o GPT. Em parte, devido às restrições impostas pelo governo chinês. Questionado sobre o líder do país, Xi Jinping, o sistema afirma ser um robô que ainda está a aprender e, na sequência, força o reinício da conversa, noticia a publicação norte-americana.

Além da orientação fornecida por humanos, os pesquisadores do Baidu dizem que também alcançaram melhorias na qualidade da informação adicionando uma camada de “conhecimento” factual ao robô. Assim, Ernie alcançou resultados impressionantes em testes de benchmark.

Mas ele não está sozinho. Nesses testes, as ferramentas são submetidas a tarefas padronizadas para medir seu desempenho. Um robô que classifica imagens, por exemplo, analisa um conjunto de fotos catalogadas por humanos para ver o quanto acerta – na prática, as missões são bem mais complexas.

É o que possibilita algum tipo de comparação entre os sistemas, mas isso só vai até a página dois. Segundo os pesquisadores de Stanford, esses benchmarks estão ficando saturados: depois dos avanços galopantes registrados ano a ano até recentemente, agora há muito pouca melhora no desempenho a cada lançamento porque as medidas não foram feitas para suportar as tecnologias atuais.

No final, muitas dessas ferramentas podem apresentar resultados impressionantes em algumas das principais referências usadas hoje. E fica em aberto onde exatamente estão os defeitos de cada um. O Ernie 3.0 até liderou o SuperGLUE, um conjunto de testes para robôs com foco em linguagem criado em 2019 por pesquisadores das universidades de Nova York e Washington, Facebook, Deepmind e Samsung.

Agora, o modelo Baidu é o quarto colocado na lista liderada pela Vega, da varejista chinesa JD.

Não é, no entanto, uma métrica geral dos melhores AIs. É uma medida dentre várias disponíveis, e alguns concorrentes fortes, inclusive o GPT-4, ainda nem foram medidos oficialmente nesta régua. Sem falar que os sistemas podem ter versões otimizadas para se sair melhor em determinados testes.

A ferramenta da OpenAI se destaca em vários outros testes. Leva um muito popular no setor, o MMLU. Em comparação direta, um estudo de pesquisadores da Universidade de Hainan (China) -ainda não publicado oficialmente e sem revisão por pares- analisa GPT-4, Ernie e Tongyi Qianwen (Alibaba). Com uma bateria de tarefas feitas para entender o desempenho dos sistemas extraindo e interpretando informações, a conclusão é que o modelo OpenAI é o mais maduro.

RAFAEL HERNANDES
SÃO PAULO, SP (FOLHAPRESS)

Deixe comentário

Seu endereço de e-mail não será publicado. Os campos necessários são marcados com *.