sexta-feira, 10 de agosto de 2018

COBAIAS INVOLUNTÁRIAS OU VOLUNTÁRIAS?



(Ainda a questão do Facebook e da vulnerabilidade em que a rede nos coloca, agora sob a informação atenta e sempre perspicaz da apelativa Gillian Tett. Oportunidade também para uma reflexão em torno dos BIG DATA.)

Os mais perspicazes já perceberam que tenho um fraquinho pela cronista Gillian Tett do Financial Times (não sei se ter um fraquinho é linguagem apropriada para estes tempos do politicamente correto em tudo que envolve a mulher, por mais profissional ela o seja, é este o caso). Gillian é daquelas jornalistas especializadas que tudo que escreve é apelativo, suscita imensa reflexão e coloca-nos perante pistas de análise e de busca de temas que não é frequente.

Desta vez, Gillian Tett traz-nos uma novidade (link aqui), que era de certa maneira esperada. Depois da grande argolada do Facebook em termos de cedência para utilização fraudulenta de dados à Cambridge Analytica, a sua administração para ajudar a limpar a imagem anunciou que disponibilizaria o seu manancial de dados a um organismo de investigação independente, a Social Science Research Council, organização americana sem fins lucrativos que apoia a investigação na área das ciências sociais. O SSRC, em conjugação com um centro de investigação independente designado de Social Science One, iniciou esta semana o processo de acreditação e autorização dos projetos de investigação que diferentes grupos irão submeter num processo que se pressupõe rigoroso e de absoluto controlo do uso da imensa informação produzida pelos cerca de dois milhares de milhões de utilizadores do Facebook. Tett esclarece-nos que o tema inicial que vai assumir a centralidade da investigação é o estudo dos efeitos dos media sobre a democracia e as eleições, estando previstos temas adicionais como o da relação dos media com a economia e a medicina.

Quer isto simplesmente dizer que seremos cobaias da análise dos big data produzidos através das complexas interações do Facebook e das suas múltiplas utilizações. A minha dúvida é se seremos cobaias involuntárias ou voluntárias e isso desagrada-me, dados os riscos da falta de transparência da investigação que vai ser realizada.

Há coincidências estranhas e a leitura do artigo de Gillian Tett apanhou-ne no início de uma obra sobre causalidade que ou muito me engano será um marco incontornável na discussão desse tema central na investigação científica e em particular nas ciências sociais, incluindo a economia, o problema da causalidade.

A obra descobria-a por um registo do sempre atento Brad DeLong e chama-se The Book of Why – The New Science of Cause and Effect. O autor principal é Judea Pearl, um cientista de computação e filósofo israelita-americano e tem a particularidade de provir da inteligência artificial e da computação que lhe está associada. Pelas primeiras 40 páginas que já tive oportunidade de ler é uma obra fascinante que deveria ser considerada leitura obrigatória para qualquer jovem que esteja a iniciar trabalhos de investigação. Pearl mostra que o tema da causalidade transcende em muito os contributos da estatística e da econometria e certamente voltarei ao tema quando terminar a sua leitura. Para além de desmistificar significativamente os pretensos avanços da inteligência artificial, Pearl mostra que as tão valorizadas máquinas de aprendizagem, com os seus programas associados, se encontram ainda na fase inicial de um processo de busca de causalidades. Essa primeira fase consiste em procurar, com meios mais ou menos sofisticados, associações e padrões de observação e comportamento nos dados que for possível coligir, dos mais simples até às vastidões de informação como aquela que será trabalhada a partir do Facebook.

Deixo-vos com esta surpreendente observação:

Tal como o faziam há trinta anos, os programas das máquinas aprendentes (incluindo as que integram redes neuronais aprofundadas) operam inteiramente em modo associativo. São conduzidas por uma massa de informações às quais tentam adaptar uma função, em grande medida da mesma maneira que um homem da estatística aplica uma linha a um conjunto de pontos. As redes neuronais profundas adicionaram muitos mais níveis à complexidade da função ensaiada, mas os dados em bruto ainda comandam o processo de adaptação (fitting process).”

Voltando ao Facebook e às cobaias, o que Peral nos diz é que os nossos comportamentos no Facebook irão materializar-se em regularidades ou padrões descritos por uma função qualquer. Mas a ciência só começará quando os investigadores escolhidos construírem modelos causais para tentar ir mais além do que as associações que irão agora encontrar. Ou seja, a recordação de um princípio básico que muito investigador ignora. Muito mais importante do que a reta ou a curva de correlação ou regressão que um conjunto simples de dados nos proporciona é a tentativa de explicação da causalidade que está por detrás desses padrões observados. E isso não se consegue a partir de uma simples associação de dados, por mais sofisticada que se apresente a técnica para a determinar. É por isso que o The Book of Why ou muito me engano ou vai revolucionar a ciência e as ciências sociais em particular. Mera intuição que provavelmente já não confirmarei em vida.

Sem comentários:

Enviar um comentário