O Google está melhorando 10% das pesquisas ao entender o contexto da linguagem

[ad_1]

  

O Google está atualmente implementando uma alteração em seu algoritmo de pesquisa principal que, segundo ele, pode alterar a classificação dos resultados para até uma em cada dez consultas. Baseia-se nas técnicas avançadas de processamento de linguagem natural (PNL) desenvolvidas pelos pesquisadores do Google e aplicadas ao seu produto de pesquisa nos últimos 10 meses.

Em essência, o Google alega que está melhorando os resultados ao entender melhor como as palavras se relacionam em uma frase. Em um exemplo que o Google discutiu em um briefing com jornalistas ontem, seu algoritmo de pesquisa conseguiu analisar o significado da seguinte frase: "Você pode comprar remédios para farmácias de alguém?"

O antigo algoritmo de pesquisa do Google tratava essa frase como um "pacote de palavras", de acordo com Pandu Nayak, pesquisador do Google e vice-presidente de pesquisa. Por isso, analisou as palavras importantes, remédio e farmácia, e simplesmente retornou os resultados locais. O novo algoritmo foi capaz de entender o contexto das palavras "para alguém" e perceber que era uma pergunta sobre se você poderia pegar a receita de outra pessoa – e retornou os resultados certos.

O algoritmo ajustado é baseado em BERT que significa "Representações de codificadores bidirecionais de transformadores". Cada palavra desse acrônimo é um termo de arte na PNL, mas a essência é que, em vez de tratar um sentença como um conjunto de palavras, o BERT analisa todas as palavras da sentença como um todo. Isso permite perceber que as palavras "para alguém" não devem ser jogadas fora, mas são essenciais para o significado da frase.

A maneira como o BERT reconhece que deveria prestar atenção a essas palavras é basicamente aprendendo sozinho em um jogo titânico de Mad Libs. O Google pega um corpus de frases em inglês e remove aleatoriamente 15% das palavras, e o BERT tem a tarefa de descobrir o que essas palavras devem ser. Com o tempo, esse tipo de treinamento acaba sendo extraordinariamente eficaz para fazer um modelo de PNL “entender” o contexto, de acordo com Jeff Dean, pesquisador sênior do Google e vice-presidente sênior de pesquisa.

Outro exemplo citado pelo Google foi "estacionar em uma colina sem lancil". A palavra "não" é essencial para essa consulta e, antes da implementação do BERT na pesquisa, os algoritmos do Google não atendem.
  


    
      
        

    
  

  

O Google diz que está implementando a alteração do algoritmo nos últimos dois dias e que, novamente, deve afetar cerca de 10% das consultas de pesquisa feitas em inglês nos EUA. Outros idiomas e países serão abordados posteriormente.

Todas as alterações na pesquisa são executadas em uma série de testes para garantir que eles estão realmente melhorando os resultados. Um desses testes envolve o uso de quadros de revisores humanos do Google que treinam os algoritmos da empresa, classificando a qualidade dos resultados da pesquisa – o Google também realiza testes A / B ao vivo.

Nem todas as consultas serão afetadas pelo BERT, é apenas a mais recente das muitas ferramentas diferentes que o Google usa para classificar os resultados da pesquisa. Como exatamente tudo isso funciona em conjunto é um pouco misterioso. Parte desse processo é mantida intencionalmente misteriosa pelo Google para impedir que os spammers joguem seus sistemas. Mas também é misterioso por outro motivo importante: quando um computador usa técnicas de aprendizado de máquina para tomar uma decisão, pode ser difícil saber por que ele fez essas escolhas.

A chamada "caixa preta" do aprendizado de máquina é um problema porque, se os resultados estão errados de alguma maneira, pode ser difícil diagnosticar o porquê. O Google diz que trabalhou para garantir que a adição do BERT ao seu algoritmo de pesquisa não aumente o viés – um problema comum no aprendizado de máquina cujos modelos de treinamento são tendenciosos. Como o BERT é treinado em um corpus gigante de frases em inglês, que também são inerentemente tendenciosas, é um problema manter-se atento.

A empresa também afirma que não antecipa mudanças significativas em quanto ou para onde seu algoritmo direcionará o tráfego, pelo menos quando se trata de grandes editores. Sempre que o Google sinaliza uma alteração em seu algoritmo de pesquisa, a Web inteira fica sentada e percebe. As empresas viveram e morreram devido às alterações na classificação da pesquisa do Google.

Todo mundo que ganha dinheiro com tráfego na Web deve prestar atenção. Quando se trata da qualidade de seus resultados de pesquisa, Payak diz que "esta é a maior e mais … mudança mais positiva que tivemos nos últimos cinco anos e talvez uma das maiores desde o início".

[ad_2]

Source link



Os comentários estão desativados.