;(function() { window.createMeasureObserver = (measureName) => { var markPrefix = `_uol-measure-${measureName}-${new Date().getTime()}`; performance.mark(`${markPrefix}-start`); return { end: function() { performance.mark(`${markPrefix}-end`); performance.measure(`uol-measure-${measureName}`, `${markPrefix}-start`, `${markPrefix}-end`); performance.clearMarks(`${markPrefix}-start`); performance.clearMarks(`${markPrefix}-end`); } } }; /** * Gerenciador de eventos */ window.gevent = { stack: [], RUN_ONCE: true, on: function(name, callback, once) { this.stack.push([name, callback, !!once]); }, emit: function(name, args) { for (var i = this.stack.length, item; i--;) { item = this.stack[i]; if (item[0] === name) { item[1](args); if (item[2]) { this.stack.splice(i, 1); } } } } }; var runningSearch = false; var hadAnEvent = true; var elementsToWatch = window.elementsToWatch = new Map(); var innerHeight = window.innerHeight; // timestamp da última rodada do requestAnimationFrame // É usado para limitar a procura por elementos visíveis. var lastAnimationTS = 0; // verifica se elemento está no viewport do usuário var isElementInViewport = function(el) { var rect = el.getBoundingClientRect(); var clientHeight = window.innerHeight || document.documentElement.clientHeight; // renderizando antes, evitando troca de conteúdo visível no chartbeat-related-content if(el.className.includes('related-content-front')) return true; // garante que usa ao mínimo 280px de margem para fazer o lazyload var margin = clientHeight + Math.max(280, clientHeight * 0.2); // se a base do componente está acima da altura da tela do usuário, está oculto if(rect.bottom < 0 && rect.bottom > margin * -1) { return false; } // se o topo do elemento está abaixo da altura da tela do usuário, está oculto if(rect.top > margin) { return false; } // se a posição do topo é negativa, verifica se a altura dele ainda // compensa o que já foi scrollado if(rect.top < 0 && rect.height + rect.top < 0) { return false; } return true; }; var asynxNextFreeTime = () => { return new Promise((resolve) => { if(window.requestIdleCallback) { window.requestIdleCallback(resolve, { timeout: 5000, }); } else { window.requestAnimationFrame(resolve); } }); }; var asyncValidateIfElIsInViewPort = function(promise, el) { return promise.then(() => { if(el) { if(isElementInViewport(el) == true) { const cb = elementsToWatch.get(el); // remove da lista para não ser disparado novamente elementsToWatch.delete(el); cb(); } } }).then(asynxNextFreeTime); }; // inicia o fluxo de procura de elementos procurados var look = function() { if(window.requestIdleCallback) { window.requestIdleCallback(findByVisibleElements, { timeout: 5000, }); } else { window.requestAnimationFrame(findByVisibleElements); } }; var findByVisibleElements = function(ts) { var elapsedSinceLast = ts - lastAnimationTS; // se não teve nenhum evento que possa alterar a página if(hadAnEvent == false) { return look(); } if(elementsToWatch.size == 0) { return look(); } if(runningSearch == true) { return look(); } // procura por elementos visíveis apenas 5x/seg if(elapsedSinceLast < 1000/5) { return look(); } // atualiza o último ts lastAnimationTS = ts; // reseta status de scroll para não entrar novamente aqui hadAnEvent = false; // indica que está rodando a procura por elementos no viewport runningSearch = true; const done = Array.from(elementsToWatch.keys()).reduce(asyncValidateIfElIsInViewPort, Promise.resolve()); // obtém todos os elementos que podem ter view contabilizados //elementsToWatch.forEach(function(cb, el) { // if(isElementInViewport(el) == true) { // // remove da lista para não ser disparado novamente // elementsToWatch.delete(el); // cb(el); // } //}); done.then(function() { runningSearch = false; }); // reinicia o fluxo de procura look(); }; /** * Quando o elemento `el` entrar no viewport (-20%), cb será disparado. */ window.lazyload = function(el, cb) { if(el.nodeType != Node.ELEMENT_NODE) { throw new Error("element parameter should be a Element Node"); } if(typeof cb !== 'function') { throw new Error("callback parameter should be a Function"); } elementsToWatch.set(el, cb); } var setEvent = function() { hadAnEvent = true; }; window.addEventListener('scroll', setEvent, { capture: true, ive: true }); window.addEventListener('click', setEvent, { ive: true }); window.addEventListener('resize', setEvent, { ive: true }); window.addEventListener('load', setEvent, { once: true, ive: true }); window.addEventListener('DOMContentLoaded', setEvent, { once: true, ive: true }); window.gevent.on('allJSLoadedAndCreated', setEvent, window.gevent.RUN_ONCE); // inicia a validação look(); })();
  • AssineUOL
Topo

Milagre? Como o Facebook usou a Bíblia para ensinar IA a falar 1000 línguas

Julia Moióli

Colaboração para Tilt, de São Paulo

25/05/2023 04h00

Além de ajudar no diagnóstico de doenças, combater fraudes, melhorar sistemas de segurança e bater papo como se fosse gente, a inteligência artificial agora é capaz de salvar idiomas que correm o risco de sumir do mapa.

É isso que faz o sistema de IA da Meta que transforma texto em fala e fala em texto. Como em um "milagre da multiplicação", a empresa dona do Facebook, WhatsApp e Instagram anunciou ainda que o número de línguas compreendidas por seu robô saltou de 100 para 1.100. Tudo graças a uma renomada "professora": a Bíblia.

A Big Tech usou os textos religiosos para treinar seus modelos de AI e torná-los mais inclusivos, além de abrir espaço para interação de mais pessoas no futuro.

Muitas das línguas do mundo correm o risco de desaparecer, e as limitações do reconhecimento de fala atual e da tecnologia generativa só vão acelerar essa tendência. Queremos tornar mais fácil para as pessoas ar informações e usar dispositivos em seu idioma preferido, e hoje estamos anunciando uma série de modelos de inteligência artificial (IA) que podem ajudá-los a fazer exatamente isso Facebook

Por que a Bíblia foi escolhida

A estratégia de recorrer ao livro mais editado do mundo foi o jeito encontrado pela Meta para superar um grande problema: a falta de variedade linguística dos atuais bancos de dados de fala. Hoje, eles concentram apenas uma centena de idiomas (de um total de cerca de 7 mil existentes no mundo, de acordo com a Sociedade Linguística da América).

A grande vantagem da Bíblia é que ela já foi, ao menos em parte, publicada em mais de 3,5 mil idiomas, segundo a Wycliffe Global Alliance, um grupo de associações que busca levar o livro sagrado a todo mundo. Além disso, o livro pe traduzido para diversas línguas e seus textos são amplamente usados em pesquisas. Tudo isso faz com que os textos bíblicos sejam bastante registrados em áudio.

O resultado é ainda mais promissor: além de ampliar sua tecnologia "texto-fala" e "fala-texto" de aproximadamente 100 idiomas para mais de 1.100, a Meta aumentou a capacidade de sua IA a tal ponto que ela é capaz de identificar mais de 4 mil línguas.

Hoje, os modelos de linguagem mais utilizados coletam textos e os pareiam com suas traduções — para se ter uma ideia, nos melhores tradutores de inglês para alemão, há cerca de 500 milhões de pares. Ter como base a Bíblia, que é utilizada no mundo todo, dá a garantia de se saber exatamente o significado do texto Fabio Cozman, professor e diretor do centro de inteligência artificial da USP

IA católica e masculina?

O desenvolvimento de IAs já desperta críticas porque esses robôs reproduzem os preconceitos racial e de gênero de seus criadores. Após o anúncio da Meta, especialistas questionaram se a escolha de textos religiosos, com áudios majoritariamente gravados por vozes masculinas, poderia levar a mais vieses. Para os pesquisadores consultados por Tilt, isso não deve acontecer, porque:

  • A Bíblia não foi a única fonte utilizada, apesar de ser a principal. A Meta fala em "textos religiosos".
  • Embora o conteúdo tenha sido religioso, os áudios não influenciaram o modelo a adotar uma linguagem religiosa -- e funciona igualmente bem para vozes masculinas e femininas.

A IA da Meta foca principalmente em reconhecer o discurso, transcrever e gerar fala e, ao contrário do ChatGPT, não se baseia no entendimento da língua nem responde perguntas ou cria conteúdos. Portanto, é um modelo mais controlado, que não corre o risco de replicar uma única visão de mundo, comprometendo a pluralidade e a liberdade cultural e religiosa Diogo Cortiz, especialista em IA, professor da PUC-SP e pesquisador no NIC.br (Núcleo de Informação e Coordenação do Ponto BR)

"Talvez o sistema escolha palavras que tenham estilo bíblico, mas isso não significa que ele terá uma religião", completa Cozman.