(Ainda a questão do Facebook e da vulnerabilidade em que a
rede nos coloca, agora sob a informação atenta e sempre perspicaz da apelativa
Gillian Tett. Oportunidade também para uma reflexão em torno dos BIG
DATA.)
Os mais perspicazes
já perceberam que tenho um fraquinho pela cronista Gillian Tett do Financial Times
(não sei se ter um fraquinho é linguagem apropriada para estes tempos do politicamente
correto em tudo que envolve a mulher, por mais profissional ela o seja, é este
o caso). Gillian é daquelas jornalistas especializadas que tudo que escreve é
apelativo, suscita imensa reflexão e coloca-nos perante pistas de análise e de
busca de temas que não é frequente.
Desta vez, Gillian Tett
traz-nos uma novidade (link aqui), que era de certa maneira esperada. Depois da grande
argolada do Facebook em termos de cedência para utilização fraudulenta de dados
à Cambridge Analytica, a sua administração para ajudar a limpar a imagem
anunciou que disponibilizaria o seu manancial de dados a um organismo de
investigação independente, a Social Science Research Council, organização
americana sem fins lucrativos que apoia a investigação na área das ciências
sociais. O SSRC, em conjugação com um centro de investigação independente
designado de Social Science One, iniciou esta semana o processo de acreditação
e autorização dos projetos de investigação que diferentes grupos irão submeter
num processo que se pressupõe rigoroso e de absoluto controlo do uso da imensa
informação produzida pelos cerca de dois milhares de milhões de utilizadores do
Facebook. Tett esclarece-nos que o tema inicial que vai assumir a centralidade
da investigação é o estudo dos efeitos dos media sobre a democracia e as eleições,
estando previstos temas adicionais como o da relação dos media com a economia e
a medicina.
Quer isto simplesmente
dizer que seremos cobaias da análise dos big data produzidos através das
complexas interações do Facebook e das suas múltiplas utilizações. A minha dúvida
é se seremos cobaias involuntárias ou voluntárias e isso desagrada-me, dados os
riscos da falta de transparência da investigação que vai ser realizada.
Há coincidências
estranhas e a leitura do artigo de Gillian Tett apanhou-ne no início de uma obra
sobre causalidade que ou muito me engano será um marco incontornável na discussão
desse tema central na investigação científica e em particular nas ciências
sociais, incluindo a economia, o problema da causalidade.
A obra descobria-a por
um registo do sempre atento Brad DeLong e chama-se The Book of Why – The New Science
of Cause and Effect. O autor principal é Judea Pearl, um cientista de computação
e filósofo israelita-americano e tem a particularidade de provir da inteligência
artificial e da computação que lhe está associada. Pelas primeiras 40 páginas
que já tive oportunidade de ler é uma obra fascinante que deveria ser
considerada leitura obrigatória para qualquer jovem que esteja a iniciar
trabalhos de investigação. Pearl mostra que o tema da causalidade transcende em
muito os contributos da estatística e da econometria e certamente voltarei ao
tema quando terminar a sua leitura. Para além de desmistificar significativamente
os pretensos avanços da inteligência artificial, Pearl mostra que as tão valorizadas
máquinas de aprendizagem, com os seus programas associados, se encontram ainda
na fase inicial de um processo de busca de causalidades. Essa primeira fase
consiste em procurar, com meios mais ou menos sofisticados, associações e padrões
de observação e comportamento nos dados que for possível coligir, dos mais simples
até às vastidões de informação como aquela que será trabalhada a partir do Facebook.
Deixo-vos com esta surpreendente
observação:
“Tal como o
faziam há trinta anos, os programas das máquinas aprendentes (incluindo as que
integram redes neuronais aprofundadas) operam inteiramente em modo associativo.
São conduzidas por uma massa de informações às quais tentam adaptar uma função,
em grande medida da mesma maneira que um homem da estatística aplica uma linha
a um conjunto de pontos. As redes neuronais profundas adicionaram muitos mais níveis
à complexidade da função ensaiada, mas os dados em bruto ainda comandam o
processo de adaptação (fitting process).”
Voltando ao Facebook e às
cobaias, o que Peral nos diz é que os nossos comportamentos no Facebook irão
materializar-se em regularidades ou padrões descritos por uma função qualquer. Mas
a ciência só começará quando os investigadores escolhidos construírem modelos causais
para tentar ir mais além do que as associações que irão agora encontrar. Ou
seja, a recordação de um princípio básico que muito investigador ignora. Muito
mais importante do que a reta ou a curva de correlação ou regressão que um conjunto
simples de dados nos proporciona é a tentativa de explicação da causalidade que
está por detrás desses padrões observados. E isso não se consegue a partir de
uma simples associação de dados, por mais sofisticada que se apresente a técnica
para a determinar. É por isso que o The Book of Why ou muito me engano ou vai
revolucionar a ciência e as ciências sociais em particular. Mera intuição que
provavelmente já não confirmarei em vida.
Sem comentários:
Enviar um comentário