Como de costume, para lançar adequadamente seu produto, o Google mudou sutilmente o nome de Bard para Gemini (pois passou de Google Apps para GSuite e depois Workspace, ou de Google Local para Places para MyBusiness para Business Profile, ou Google Hangouts para Chat, etc. ) ao mesmo tempo que oferece novos recursos.
Deve-se reconhecer que o mecanismo de inteligência artificial do Google é poderoso.
As próximas semanas sem dúvida nos permitirão explorar em detalhes o que ele tem por trás, mas já sabemos, por exemplo, que o Gemini agora tem um pop-up de um milhão de tokens. Essa janela pop-up é o que permite ao agente lembrar as trocas de uma pergunta para outra. Em comparação, ChatGPT 3.5 (a versão gratuita) tem uma janela de cerca de 16.000 tokens e a versão 4 permite até 128.000 tokens e para dar uma ordem de grandeza, este último número representa aproximadamente o equivalente a um livro de bolso, onde Gêmeos pode se lembrar uma obra completa de 1.500 páginas…
Ou um filme de cerca de uma hora e meia: Gemini permite ao usuário fornecer imagens ou vídeos como entrada contextual para basear suas respostas; para resumir rapidamente um vídeo, isto pode ser particularmente interessante num futuro próximo.
Mas a par destes inegáveis avanços técnicos e de um poder verdadeiramente interessante, Gemini destacou-se sobretudo pela muito rápida identificação de um problema que era bastante embaraçoso para a firma de Mountain View, na Califórnia: querer sem dúvida recuperar o atraso em termos de produção de imagens a partir de um texto textual. descrição – A OpenAI tem de fato permitido que seus clientes produzam imagens há vários meses diretamente do ChatGPT – Gemini estava equipado com essa possibilidade, mas em uso, rapidamente ficou claro que certas solicitações simplesmente não eram aceitas ou a lacuna entre as solicitações e os resultados era tão grande que, muito rapidamente, as redes sociais tomaram conta do assunto.
Sem dúvida: quando se pede a Gêmeos que produza imagens com conteúdo histórico ou que representem determinados grupos étnicos, este último interpreta o pedido de maneira um tanto específica.
Assim, obter a imagem de um cavaleiro medieval ou de um papa resulta na produção de imagens sistematicamente em flagrante desacordo com a realidade: a inteligência artificial do Google gosta de criar, com entusiasmo suspeito, cavaleiros medievais de todas as etnias possíveis, mas o cavaleiro loiro de olhos azuis é estranhamente ausente; as imagens de papas produzidas alegremente recorrem a mulheres, possivelmente indianas ou negras; quanto aos imperadores romanos, todos são surpreendentemente muito africanos.
O marco foi alcançado quando confrontado com o pedido para representar os soldados alemães em 1943, Gemini achou por bem produzir uma série de imagens decididamente inclusivas, incluindo orgulhosos representantes negros da Wehrmacht... Quem ainda duvidava que a realidade histórica pudesse dobrar-se tão facilmente ao mais restrições modernas?