! Entenda o big data e sua relação com o Facebook e a Cambridge Analytica

Não tem volta

Está na hora de você se preocupar com o que fazem com seus dados, eis o motivo...

Bruna Souza Cruz, Fabiana Uchinaka e Gabriel Francisco Ribeiro Do UOL Tecnologia, em São Paulo
Getty Images

Big data, algoritmo, aprendizado de máquina. Tudo isso pode soar muito complexo e futurístico, mas os efeitos da tecnologia da informação estão aí, dominando a sua vida de formas que você nem imagina.

Quer um exemplo? Você é eleitor do Lula, mas suas curtidas no Facebook podem ser usadas para eleger Bolsonaro presidente do Brasil. Sem você saber. E vice-versa, claro. Que tal?

Foi o que aconteceu nos Estados Unidos.

Dado não é roubado

A Cambridge Analytica, consultoria britânica de marketing político conhecida por seus métodos questionáveis (leia-se: suborno, espiões, prostitutas e fake news), usou testes de personalidade e curtidas no Facebook para coletar dados e formar o perfil psicológico de 87 milhões de pessoas.

Divididos em cinco tipos (mente aberta, conscientes, extrovertidos, amáveis e neuróticos, palavras cujas iniciais em inglês formam a sigla Ocean), os eleitores indecisos sobre Donald Trump passaram a receber propaganda eleitoral altamente personalizada. Ou seja, cada grupo de pessoas foi influenciado por um tipo de discurso, que explorava medos e tendências.

E, dada a vitória do republicano, a tática parece ter funcionado direitinho.

A mesma coisa foi feita no Brexit (plebiscito que fez o Reino Unido sair da União Europeia) e possivelmente em eleições de Quênia, Nigéria, República Tcheca, Ucrânia, Malásia e México. Sim, a consultoria se preparava para atuar nas eleições deste ano no Brasil.

Aí você pensa: "Mas eu nunca votaria no Trump, não sei nem o que é Brexit, não faço testes de Facebook, protejo meus dados... Não tenho nada a ver com isso, certo?"

Errado. A chance de os seus dados estarem por aí, sendo usados sem seu conhecimento, é enorme (dá para checar aqui). 

O app instalado no Facebook e usado pela Cambridge Analytica funcionava como todos os outros apps, joguinhos e testes na linha "veja como você seria no gênero oposto": você autoriza (provavelmente sem ler os termos) e o programa coleta dados do seu perfil --a menos que você tenha configurações de privacidade muito rígidas.

O que ninguém imaginava é que o aplicativo gravava não só os resultados de cada quiz e os dados da conta do Facebook envolvida, mas as "curtidas" de todos os amigos e amigos dos amigos com quem os participantes do teste interagiam.

Pior: com o consentimento do Facebook, que até 2015 liberava estes dados para fins não-comerciais e não controlava direito como eles eram usados (se é que hoje controla).

Arte/UOL

Além de os seus dados serem usados para traçar perfis que depois serão usados para influenciar outras pessoas --e essas sim podem ser convencidas a votar em quem você não gosta--, há uma preocupação real de que a consultoria obteve dados de conversas privadas via Messenger.

Em sabatina no Congresso dos EUA, o chefão do Facebook, Mark Zuckerberg, confirmou que coleta informações até de quem está deslogado, segundo ele, para fins de segurança. Mas sabemos que nome, apelido, rosto, fotos, telefones e outras informações dos chamados shadow profiles (perfis de sombra) podem ser usados para oferecer publicidade e recomendar amigos, por exemplo.

Onde meus dados foram parar?

No caso da Cambridge Analytica, 300 mil pessoas foram pagas para fazer o teste de personalidade e fornecer seus dados. Só que elas foram usadas para coletar dados de outros, e isso virou um banco de 87 milhões de pessoas, que não faziam ideia de que seriam envolvidas em campanhas políticas e afins.

E aqui está um ponto crucial do escândalo: a maioria dos usuários não se importa de ver anúncios em troca de usufruir das redes sociais, mas não aceita que seus dados sejam usados para vender mensagens com as quais não concordam.

Agora multiplique este caso pelas dezenas de apps obscuros que você já liberou para acessar dados do seu Facebook. Quantas vezes você ficou com preguiça de criar um login novo e usou sua conta na rede social para fazer o cadastro? (Clique aqui para checar)

A Cambridge Analytica dizia ser capaz de "ler a mente de cerca de 200 milhões de americanos". Já a rival Acxiom não esconde que seu banco contém dados de 700 milhões de pessoas ao redor do mundo. A presença de ambas no Facebook foi limitada depois do escândalo.

Esse tipo de persuasão, de pessoas que parecem deixar você ter uma opinião livre, é extremamente eficaz. Publicidade, você pode ignorar. Ter pessoas parecidas com você tendo a mesma opinião é como as modas, as bolhas e os pânicos começam

Alex Pentland

Alex Pentland, cientista da computação e professor do MIT

Você se dirigir a uma pessoa que você sabe que é mais suscetível de cair em teorias conspiratórias, porque você obteve o perfil dela, e a conduzir numa espiral de notícias falsas, é diferente de bater numa porta indeterminada se identificando como parte de uma campanha

Christopher Wylie

Christopher Wylie, ex-diretor da Cambridge Analytica

É tudo uma questão de volume

  • Me dê um like...

    Ok, um like não entrega muita coisa. Mas o modelo Ocean, desenvolvido na Universidade Cambridge e aplicado pela consultoria britânica, diz que curtidas do Facebook traçam o perfil psicológico de um indivíduo. Ao analisar 70 curtidas, o algoritmo consegue te conhecer melhor que seus amigos. Com 150, melhor que seus pais. Com 300, melhor que seu cônjuge. E acima disso, melhor que você mesmo. A ciência por trás disso é a psicometria (ramo da psicologia que usa estatística).

  • ... que te direi quem és

    Com 68 likes é possível prever sua raça (95% de precisão), orientação sexual (88%) e filiação a um partido (85%). Curtidas revelam ainda gênero, religião, tendência à depressão, uso de drogas, QI, se os pais são casados e muito mais. Todas as interações são guardadas e cruzadas com outras informações, usando aprendizado de máquina e algoritmos, e disso saem relações inusitadas como: quem curte batata frita é mais mente aberta, quem gosta de Harley Davidson tem QI mais baixo.

O Facebook me conhece mesmo?

Arte/UOL

Então vou apagar meu Facebook e está tudo resolvido

Só que não. Qualquer passeio seu pela internet gera rastros

Bilhões de pessoas navegando diariamente por horas e horas criam um gigantesco banco de dados de registros. Quando falamos em big data (nome dado a essas informações cruzadas), estamos falando de volume, variedade, veracidade, valor e velocidade. Por isso, é importante entender como esses cinco Vs estão determinando as suas escolhas.

  • Ajudinha amiga...

    Aquela série sugerida pela Netflix, a playlist feita sob medida no Spotify, a promoção de passagem aérea que surge quando você começa a pensar nas férias, os matchs do Tinder, a organização precisa do Google Fotos, o melhor caminho dado pelo Waze. Tudo isso é o algoritmo comportamental se aproveitando de traços da sua personalidade para direcionar o seu consumo e te colocar em grupos (a bolha, saca?).

  • Ou bola de cristal?

    Por trás do que você consome existe uma mãozinha imaginária (e bem discreta) que trabalha combinando uma enxurrada de dados online para antecipar desejos, orientar decisões, guiar escolhas e compras. Há quem diga que o big data preveja o futuro, o que não deixa de ser verdade. Ele pode prever acidentes, temporais e epidemias. Mas, vai muito além.

Por exemplo...

Voto manipulado

Uma das táticas da campanha de Trump foi incitar a paranoia em grupos com tendência a acreditar em teorias conspiratórias ou que eram pró-armas e temiam perder o direito de portá-las se a democrata Hillary Clinton vencesse.

Planos de saúde

Você dá o CPF na farmácia e participa de um grupo online sobre uma doença. Pronto, o cruzamento de dados aponta que você tem algo que talvez nem a sua família saiba, mas o seguro de saúde pode descobrir --e cobrar um valor diferenciado por doença pré-existente.

Big Brother do RH

Antes de ser chamado para entrevista, o RH sabe sua personalidade, gostos e atividades. Sem você contar, sabe se é gay, tem filhos, mora longe ou tem alguma deficiência. E, claro, as informações também podem ser usadas para te demitir.

Visto para os EUA

Para obter visto, Trump quer que você entregue 5 anos de histórico de redes sociais. Facebook, Twitter e Instagram passariam por escrutínio do governo, que teria em mãos dados de 14 milhões de pessoas. Já cogitaram inclusive exigir login e senha dos solicitantes.

  • Combate o perigo...

    Um homem foi preso na China após ser identificado por câmeras de segurança com sistema de reconhecimento facial e inteligência artificial. Ele estava no meio de uma multidão que assistia a um show. Na China, se você está em público, uma câmera consegue te rastrear em tempo real e coletar dados sobre a sua atividade. Multas afetam sua pontuação social.

  • ... em diversos campos

    O algoritmo também pode ser amplamente usado na medicina, para prever doenças cardíacas, identificar um câncer, saber quem tem mais chance de morrer em 5 anos ou apontar grupos de risco. A inteligência artificial já é usada para identificar doenças raras por foto ou organizar a prioridade de um pronto-socorro de acordo com a "cara de dor" dos pacientes.

Mina de ouro

A base de tudo é a mineração de enormes quantidades de dados, mas não qualquer dado. Um perfil preciso vem de bons dados brutos. E adivinha: os melhores são aqueles obtidos por empresas com as quais temos interações profundas.

São elas: Facebook (dona de Instagram e WhatsApp), Google (dona de Gmail, YouTube, Maps, Waze, Photos, Android), Microsoft (Skype), Amazon (Kindle, Alexa), Apple (Shazam), Netflix e Twitter.

As informações que revelamos no Facebook são suficientes para que um programa de computador infira nossa personalidade com maior precisão do que nosso cônjuge. Por isso empresas como a Cambridge Analytica estariam tão ansiosas para acessar esses dados

Stephan Lewandowsky

Stephan Lewandowsky, professor de psicologia cognitiva da Universidade de Bristol

reddit.com reddit.com

Cavalo dado não se olha os dentes?

Não é à toa que tem muita gente pagando fortunas por essas suas informações, que (não sei se notou) você está entregando de graça.

A Acxiom, por exemplo, ganha mais de US$ 800 milhões por ano vendendo perfis de consumidores para as maiores companhias do mundo. A Cambridge Analytica cobrou US$ 6 milhões de Trump.

E essa riqueza de dados também é o que mantém o Facebook lucrativo. Você usa a linha do tempo, as curtidas e o Messenger em troca de fornecer seus dados para a plataforma usar em publicidade. 

Nós somos o produto

Essas plataformas dizem que são de graça, mas nós somos o produto. Precisamos que nossos dados não estejam à venda para a melhor proposta de um demagogo ou autoritário.

Zeynep Tufekci

Zeynep Tufekci, tecnosociologista, Universidade Carolina do Norte

A gente cede os dados, porque alguém compra. Quanto mais o site te conhece e monta uma base segmentada, mais tem valor. Quanto mais você dá informação, mais ele consegue monetizar

Andre Miceli

Andre Miceli, coordenador do MBA de marketing digital, FGV

Hoje, os dados são uma commodity como o petróleo. Ainda estamos descobrindo o potencial deles e o que pode ser feito a partir dessa matéria-prima

Anderson Ramos

Anderson Ramos, sócio-fundador da empresa de segurança Flipside

Quanto vale seu perfil?

  • País

    Americanos e europeus valem mais que asiáticos e latinos. Usuário dos EUA vale o dobro do usuário da Espanha

  • Gênero

    Custo por clique dos usuários do sexo masculino é mais caro

  • Idade

    Jovens millennials (1980-2000) normalmente valem mais. Mas pessoas mais velhas valem mais em mercados de Inglaterra e França

  • Calcule...

    No site da pesquisa (fdvt.org), há uma extensão que diz em tempo real quanto dinheiro você dá ao Facebook com base nos anúncios que aparecem na sua timeline.

O problema é quando as empresas são más administradoras de seus dados. Quando pedem mais e mais sem avisar, sem contar o que estão fazendo com eles...

O objetivo aparente da coleta de informações é alimentar o elaborado maquinário de cruzamento de dados, vender publicidade e personalizar nossa experiência de navegação.

Mas há outras consequências, sempre há.

Está preparado para o fim do anonimato?

Sabe aquela sua foto...

Facebook e Google identificam automaticamente rostos em fotos, mesmo com a cabeça coberta. A Google Brain sabe quem está numa foto pixelada. Penteado, roupa, pose, físico e jeito de andar te entregam. Sua digital pode ser clonada de uma foto do seu dedo. O GPS do celular mostra onde você esteve, mas não só ele: um ponto de referência na foto do Instagram, uma placa na foto guardada na nuvem, um cardápio enviado por mensageiro. O tamanho da sombra revela a hora.

...ela entrega dados...

Anos atrás, a Jetpac categorizou 150 milhões de fotos do Instagram e criou um app capaz de dizer, por exemplo, se um restaurante é chique pelo número de mulheres usando batom ou se é "gay friendly" pelo número de homens no local. Como a maioria das fotos vinha com geolocalização, era possível combinar o reconhecimento facial com o endereço. Ou seja, era fácil achar os bares gays em Teerã, no Irã, onde os chamados "desviados" são punidos com pena de morte.

e o resultado é este:

Serviço ou desserviço? É uma boa para um iraniano que quer uma indicação de lugar sem correr o risco de perguntar para a pessoa errada. "Mas as consequências poderiam ser terríveis para a comunidade gay se a lista de bares ou usuários caísse nas mãos dos mulás. Se a Jetpac foi capaz de desenvolver essa capacidade, o que impediria outra empresa ou governo de fazer o mesmo?", escreveu Andreas Wiegend em artigo para a Slate. A Jetpac foi comprada pelo Google em 2014.

O big data é uma bomba-relógio prestes a explodir em nossos colos

É o que defende o promotor Frederico Meinberg, da Comissão de Proteção dos Dados do Ministério Público do Distrito Federal, que investiga implicações do vazamento de dados do Facebook no Brasil.

"Perseguições que seriam digitais vão desaguar no mundo real. Teremos pessoas alijadas da sociedade sem saber o motivo, com base em big data", diz. "É uma bomba-relógio fazendo tique-taque no ombro das pessoas. Não precisa nem ser minoria para ser prejudicado".

As minorias, porém, certamente serão as primeiras sofrer as consequências.

iStock/Getty iStock/Getty

Leia os termos

A pedido do UOL Tecnologia, a advogada Cristina Sleiman, especialista em direito digital, analisou os termos de uso do Facebook. Lá, entre centenas de palavras que não lemos, está bem claro que a empresa tem controle sobre as informações que você posta e compartilha.

"Tudo o que usuário faz é utilizado: o que ele curtiu, por quais páginas passou... A partir do momento em que ele aceitou o termo de uso, o Facebook está autorizado", diz Sleiman:

Eles não publicam esses dados, mas compartilham com parceiros. Ou aceita ou não faz parte da rede social

A plataforma ainda não diferencia "dados sensíveis" (orientação política, preferências sexuais, religião, etnia, origem, etc), embora a União Europeia tenha adotado uma nova regulamentação que proíbe a exploração deste tipo de dados por conta do risco óbvio. Nos EUA e Brasil, não existe uma lei sobre o assunto.

Transparência é fundamental. Se você está acessando os dados de alguém, acho que funciona melhor quando eles sabem por que e que valor você está tirando disso

Patrick Ambron, da BrandYourself, ao Mashable

É fundamental ter uma lei de proteção, uma autoridade de dados pessoais no Brasil, mas também podemos nos proteger com o que já temos, que é robusto [Constituição, Marco Civil, direitos do consumidor]

Frederico Meinberg, promotor do MP-DF

Não podemos ser offline, que seria a maneira mais prática de fazer essa privacidade voltar a ser como antes. Então precisamos achar um meio-termo, um ponto de equilíbrio

Gisele Truzzi, advogada especialista em direito digital

Ou seja, "se quer privacidade, então não pode navegar em um monte de site. Abre mão da liberdade", resume Andre Miceli, coordenador do MBA de marketing digital da Fundação Getúlio Vargas.

Para os defensores da privacidade, é injusto colocar tudo na mão do usuário, porque ele não pode negociar individualmente condições de uso e acaba refém de entregar dados às plataformas para se conectarem à vida moderna.

O Facebook até te lembra regularmente que você deve usar as configurações de privacidade, mas 40% dos internautas autorizam a coleta de dados sem pensar e se arrependem. Quer dizer, se a opção é sair da internet ou passar metade da vida lendo termos de privacidade que ninguém entende, então é o modelo que está errado.

Quem poderá nos defender?

Muitos dos algoritmos melhoram (e melhorarão) nossas vidas e nossas decisões. Ao expor para o mundo o que a Cambridge Analytica fazia com as curtidas de Facebook, o delator Charlie Wylie faz uma comparação: “os dados são nossa nova eletricidade”. E, por isso mesmo, devem ser regulados como um serviço público, tal qual água, luz e gás.

Mas, antes de condenar, vale lembrar que toda transformação provocada pela tecnologia veio acompanhada de preocupações.

"Das primeiras ferramentas pré-históricas até a invenção da escrita, da mecanização da impressão até a digitalização da informação, seria ingênuo acreditar que a longa história das tecnologias intelectuais não tenha transformado em profundidade aquilo que somos”, observa o sociólogo francês Dominique Cardon, da Universidade de Marne-la-Vallée.

Se há uma faca na mesa, você pode fazer uma comida com estrelas Michelin ou usá-la como arma para um assassinato. Mas é o mesmo objeto

Christopher Wylie

Dados são ferramentas que podem ser usadas para o bem ou para o mal, mas não é suficiente dizer: "não tínhamos intenção de que elas fossem usadas assim".

Sempre nos apoiamos no "direito à privacidade", mas esta parece ser uma ideia datada. O fato de que nada (ou muito pouco) houve de ilegal no escândalo do Facebook mostra que chegou a hora de pensar em formas de lidar com um novo cenário: talvez não dê mais para se esconder.

Talvez também não dê para esperar que apenas os governos achem soluções, já que eles também têm grande interesse em dados de seus cidadãos.

O que todos parecem concordar é que estamos entrando numa era de regulações. Sabendo que dados pessoais viraram parte integral da digitalização da sociedade, resta perguntar quais são os riscos e como garantir que sejam usados de modo seguro.

Os dados em si não são o problema. Há coisas incríveis que podemos fazer com eles. Mas o que a Cambridge Analytica expôs é o fracasso, não só de nossos legisladores, mas de nós mesmos como sociedade, de impor os limites. É importante que as pessoas vejam que não é algo abstrato, mas que tem impactos tangíveis

Christopher Wylie

Curtiu? Compartilhe.

Topo