Whoooaaa duuuuude: Por que esticamos palavras em tweets e textos

20

Paul Linse Getty Images

No Twitter, quando um simples ha não vai fazer, sempre tem hahahaaaa, haaaahaaaaou mesmo hahahahahahahahahahahahaha, indicando que você acabou de ler a coisa mais engraçada que já viu. (Ou que você é um guaxinim falando sarcástico.) Elas são conhecidas como palavras extensíveis ou extensíveis, e agora pesquisadores da Universidade de Vermont descobriram o quão difundidas elas são no Twitter, descobrindo padrões fascinantes sobre seu uso.

A elasticidade é um poderoso dispositivo lingüístico que visualiza uma palavra escrita, transmitindo uma ampla gama de emoções. Isso vale para o gooooooaaaaaaal de um locutor de futebol, um adolescente está exasperado finalmentee de um surfista aweeeeeesome. E booooyeles são populares no Twitter. Escrevendo hoje no diário PLOS One, os pesquisadores detalham como eles vasculharam 100 bilhões de tweets, mapeando com que frequência essas palavras são ampliadas e até que ponto elas são alongadas –haha versus hahahahaaaa, por exemplo.

Considerar cara e suas muitas formulações. "Isso pode transmitir basicamente qualquer coisa, como"Duuuuude, isso é horrível", Diz o matemático Peter Sheridan Dodds, da Universidade de Vermont, um dos co-autores do estudo. Por outro lado, "Cara! ” é diferente. “Pode ser emoção; poderia ser alegria ”, diz Dodds.

Mas nem todo mundo gosta de usar pontos de exclamação para dar ênfase ou emoção, inclusive a sua de verdade. "Eu odeio usar pontos de exclamação porque eles simplesmente não se encaixam na minha personalidade", digo a Dodds e seu co-autor, Chris Danforth, também matemático aplicado na Universidade de Vermont. Mas exprimo palavras: "Eu me encontrei recentemente em textos para amigos ou mensagens para colegas de trabalho thaaanks com três As, para significar algum tipo de excitação e apreciação sem precisar usar um ponto de exclamação estúpido. ”

"Apenas três?" pergunta Danforth. “Isso é restrição. Porque dois não funcionariam. Dois é como, essa pessoa não sabe soletrar. Eles cometeram um erro. ”

Tudo bem, muuuito, usamos palavras extensíveis o tempo todo para transmitir um significado extra – tristeza, raiva, excitação. E isso pode ser particularmente poderoso em uma plataforma como o Twitter, cuja brevidade inerente não incentiva exatamente a comunicação diferenciada. Essas cartas extras acrescentam um pouco de força a uma breve mensagem, tornando-a mais atraente. "Você considera o texto do dicionário como texto do dicionário e o transforma em algo visual", diz Danforth. "Não pode ser ignorado quando você vê 20 como seguidas."

Para quantificar isso, Dodds, Danforth e o principal autor do artigo, o linguista computacional da Universidade de Vermont, Tyler Gray, selecionaram aleatoriamente 10% de todos os tweets enviados entre 2008 e 2016, cerca de 100 bilhões no total. (Eles têm um acordo com o Twitter para obter esses dados.) Gray escreveu um programa que pesquisava os dados em busca de palavras esticadas, procurando especificamente por letras repetidas.

Primeiro, eles queriam quantificar quais letras foram repetidas e com que frequência. Então pegue gooooaaaaal por exemplo. O programa "vê um G e depois vê um O", diz Dodds. Também conta o As e o Ls. Mesmo se contar apenas um G, verá que o restante das letras é altamente repetitivo – talvez haja 20 Os e 20 As. "Portanto, isso parece um candidato a uma palavra elástica", continua Dodds.

O sistema então representa esses candidatos elencáveis ​​com uma notação simples. Se o G e o L em gooooaaaal não for repetida, a fórmula será semelhante a g (o) (a) l. Gggooooaaaallll, por outro lado, seria semelhante a (g) (o) (a) (l), porque cada letra é repetida.

Isso quantifica o que os pesquisadores chamam de "equilíbrio" de uma palavra elástica. Goooooaaaalnão é muito equilibrado, porque as quatro letras diferentes se repetem em taxas diferentes. Hahahahaha, por outro lado, é altamente equilibrado, porque H e A se repetem na mesma frequência. Haaaaa, porém, é desequilibrado.

Tyler J. Gray, Christopher M. Danforth, Peter Sheridan Dobbs

Os pesquisadores puderam visualizar o número médio de repetições por caractere, como no gráfico acima. Com as várias grafias esticadas da palavra objetivo no Twitter, o G repete talvez uma ou duas vezes. (Pense em um locutor de futebol gritando guh-guh-guh-guh-guh-oal e com que rapidez eles seriam disparados.) Então, neste gráfico, você pode ver o número de caracteres como o eixo vertical e a repetição de caracteres específicos como o eixo horizontal. Movendo-se da parte superior do gráfico para a parte inferior, a palavra se estende. Mas se você olhar para G, sua frequência não aumenta muito à medida que a palavra aumenta. Você pode ver que O, A e L, por outro lado, se repetem mais à medida que a palavra se estende.

Isso ocorre porque o som G é plosivo, uma consoante falada ao interromper o fluxo de ar na boca. Você não pode arrastá-lo como pode aaaaah ou ooooh. Portanto, no caso da palavra meta, são as vogais que aumentam, e elas tendem a se alongar mais uma com a outra. "O que não sabíamos de antemão é que essas linhas são bastante lineares", diz Dodds. "Então, se você faz 140 caracteres ou 80 caracteres, o saldo de O, A e L é praticamente o mesmo." O que está de acordo com o clássico locutor de futebol clama por "Gooooooaaaaaaaaalllllll”- é leve para os Gs e pesado para o resto da palavra.

Tyler J. Gray, Christopher M. Danforth, Peter Sheridan Dobbs

Agora considere ha. Chato, sem uso, mas extensível em uma galáxia de diferentes formas, visualizada na imagem acima – chame de Árvore do Riso. Esse H no topo é o local onde qualquer tweet "ha começa. Ramificar para a esquerda é o que acontece se o tweeter, por algum motivo, adicionar outro H em vez de um A. Alguns tweeters finalmente adicionam um A para fazer hha, ramificando para a direita, mas na extrema esquerda você pode ver o que acontece se eles continuarem adicionando Hs no início.

Voltando ao topo da imagem, se passarmos do H inicial, os tweeters adicionam um A para começar a criar hahahaha ao invés de hhhhaaaa. Esse é o caminho mais popular; portanto, as barras que conectam as letras aqui são mais grossas. Indo de ha para hah, por exemplo, é mais popular do que ir de ha para haa. O caminho predominante, como poderíamos esperar, é um bom, limpo, altamente equilibrado hahahahahaha. O aberrante haaha ou hahhah provavelmente é apenas um erro de digitação.

Em geral, as palavras de duas letras se estendem além das palavras comuns, como finalmente. As palavras nas árvores acima também se desenrolam como poderíamos esperar. Fuuuuuu é uma expressão popular disso raiva lingüística particular. "As pessoas começam com F e depois ficam nos EUA", diz Danforth. O mesmo para awwwwwww.

Como as palavras esticadas podem ser incorporadas com muito significado extra além das próprias palavras, entendê-las é essencial para inteligências artificiais que analisam texto, como chatbots. No momento, uma palavra esticada pode ser tão desconcertante para uma IA que o programa simplesmente a ignora completamente. Não queremos ter que colocar em negrito ou itálico as palavras para enfatizá-las para o chatbot analisar – e mesmo assim, essa formatação não pode replicar a gama de emoções que as palavras esticadas transmitem.

"Se algum dia chegarmos a um ponto em que uma IA possa entender o alcance da comunicação que as pessoas realmente usam no dia-a-dia, este é um dos lugares onde está", diz Sam Brody, que Publicados sua própria pesquisa no Twitter, que aumentou em 2011, antes de ingressar no grupo de IA da Bloomberg como pesquisador sênior. Essa nova pesquisa, na qual Brody não estava envolvido, é um passo para quantificar e traduzir palavras esticadas em regras linguísticas sutis que as máquinas podem entender.

Quem, afinal, ajudará a salvar Justin Bieber de fãs famintos por atenção? Um truque que os pesquisadores notaram foi que, quando os usuários do Twitter estavam tentando ser super-enfáticos, gostam de atrair a atenção de uma celebridade, eles alongaram tudo. "Havia um segundo tipo de palavra", diz Dodds, "como: 'fffffooooolllllllloooooowwwwwmmmmmmeeeeee, Justin Bieber.' As pessoas esticavam o F, o O, o L, ou simplesmente esticavam a coisa toda. Porque havia uma sensação de que isso seria emocionante para Justin. ”

Provavelmente não funciona. Mas nenhum dano tttttrrrrrryyyyyiiiiiinnnnggggg.

Esta história apareceu originalmente em wired.com.

Fonte: Ars Technica