Regras estatísticas simples costumam ser mais eficazes do que análises elaboradas
Especialistas podem se deixar levar por modelos complexos e ignorar abordagens mais diretas
Para um pesquisador acadêmico que primeiro se formou em filosofia e depois em psicologia, Robyn Dawes era um sujeito prático. Ele costumava contar uma história de quando trabalhou em uma ala psiquiátrica no final dos anos 1950. "Havia um paciente que tinha um delírio, e o delírio era que ele estava desenvolvendo seios."
O homem foi internado em uma ala de segurança enquanto os psiquiatras ponderavam a razão desse delírio fascinante; eles suspeitavam que provavelmente era o impacto traumático da morte recente e chocante de um dos pais.
Seis semanas depois, alguém pediu ao homem que tirasse a camisa. Ele tinha uma condição genética, não um delírio. "Era de fato verdade: ele estava desenvolvendo seios".
A história deixou uma lição: até mesmo especialistas —especialmente especialistas— podem se deixar levar por ideias elaboradas, ignorando a abordagem simples e direta. Não é surpresa, então, que Dawes viria a se fascinar pela pesquisa de Ted Sarbin e Paul Meehl, psicólogos que haviam estudado o surpreendente poder de previsões estatísticas simples em áreas como diagnósticos clínicos ou desempenho acadêmico.
Sarbin, por exemplo, usou uma regressão linear —quase a regra estatística mais simples que se pode imaginar— para prever as notas universitárias (GPA, na sigla em inglês) de estudantes formandos com base em sua classificação no ensino médio e sua pontuação no vestibular. Esse método era mais preciso do que a opinião de psicólogos clínicos munidos dos mesmos dados e muito mais além.
Meehl encontrou muitos outros exemplos de casos em que regras estatísticas simples superavam o diagnóstico ou as previsões dos especialistas.
Mas quão simples essas regras poderiam ser? Uma regressão linear padrão prevê um resultado com base em uma combinação de variáveis. Por exemplo, a probabilidade de um infrator ser preso novamente poderia ser uma função de sua idade, sexo, número de condenações anteriores e gravidade das condenações anteriores. Uma fórmula matemática determina quanto peso cada fator recebe para se ajustar o mais próximo possível aos dados históricos.
Em vez disso, Dawes sugeriu o que chamou de regressão linear "imprópria", em que os pesos não eram otimizados, mas escolhidos arbitrariamente —talvez igualmente ponderados, ou até escolhidos aleatoriamente.
Para escolher um exemplo adequado ao Financial Times, pense na escolha de uma carteira de investimentos ideal. O resultado é o retorno da carteira; com a alocação certa entre diferentes ativos, poderíamos maximizar o retorno previsto para qualquer nível de risco. Harry Markowitz, que dividiu um Prêmio Nobel em 1990, mostrou nos anos 1950 como escolher os pesos em uma carteira perfeita.
A escola de pensamento de Robyn Dawes diz para não se preocupar com isso. Em vez disso, siga uma regra como "Simplesmente invista seu dinheiro igualmente nas 50 maiores empresas de capital aberto" —ou talvez até "metade em ações, metade em títulos".
Isso não pode funcionar, pode? Bem, no primeiro emprego que Markowitz conseguiu após publicar sua teoria, ele teve que decidir como alocar suas contribuições de aposentadoria. Optou por metade em ações, metade em títulos. Isso é um peso impróprio para você. Mas não está claro que Markowitz estava errado, mesmo sendo contraditório: um artigo de 2009 de Victor DeMiguel, Lorenzo Garlappi e Raman Uppal descobriu que a estratégia simples de investir igualmente em um conjunto de ativos é surpreendentemente eficaz.
Durante drinks após uma discussão em conferência acadêmica, um colega de painel desafiou Dawes: "Você poderia... usar um de seus modelos lineares impróprios para prever quão bem minha esposa e eu nos damos?"
Dawes achou que poderia. Ele tinha colegas que vinham coletando dados sobre sexo e relacionamentos, e propôs o seguinte preditor com pesos impróprios: que casais provavelmente descreveriam seu relacionamento como "feliz" se fizessem sexo com mais frequência do que brigavam, e "infeliz" se a frequência de brigas excedesse a frequência de sexo.
Duas variáveis, igualmente ponderadas —certamente existe um modelo mais preciso do que esse? No entanto, a teoria absurdamente simples se encaixava nas evidências. Um colega tinha dados sobre 12 casais infelizes; todos eles brigavam com mais frequência do que faziam sexo. De 30 casais felizes, 28 faziam sexo com mais frequência do que tinham discussões. Estudos pequenos subsequentes chegaram à mesma conclusão.
(Uma ressalva importante: pergunte aos casais sobre a qualidade do relacionamento primeiro, e a quantidade de sexo e discussões depois, caso contrário a contagem pode provocar uma crise. Uma mulher contou o sexo e as brigas e decidiu que era hora de pedir o divórcio.)
"A conclusão é que se amamos mais do que odiamos, somos felizes; se odiamos mais do que amamos, somos miseráveis", escreveu Dawes em um artigo de 1979, "A Beleza Robusta dos Modelos Lineares Impróprios na Tomada de Decisão", acrescentando: "Essa conclusão não é muito profunda, psicológica ou estatisticamente. O ponto é que esse modelo linear impróprio muito rudimentar prevê uma variável muito importante."
Por que esses modelos quase ridiculamente simples funcionam? Uma resposta é que, embora os pesos sejam arbitrários, já existe alguma especialização embutida na escolha das variáveis a serem incluídas na mistura. Dawes poderia ter afirmado que a felicidade conjugal era uma função da precipitação mensal média na Nigéria; outro modelo simples, mas não muito bom.
Resultados aparentemente complicados costumam refletir combinações bastante diretas de variáveis. É quase sempre um mau sinal se um infrator tem uma série de condenações anteriores, não importa o que mais possa ser verdade. E independentemente dos psicodramas em torno do relacionamento de um casal, provavelmente é um bom sinal que eles estejam fazendo bastante sexo.
Mas um terceiro fator é que o conjunto de dados captura apenas uma fatia do que realmente está acontecendo. A felicidade conjugal é difícil de medir com precisão. O risco é difícil de medir com precisão. Até mesmo a frequência de sexo é mais difícil de medir do que pode parecer —quem está contando, e o que eles acham que conta? Com todo esse ruído está o fato de que tudo muda.
Como resultado, a estimativa aparentemente ideal pode se mostrar excessivamente confiante à medida que o tempo passa e mais dados chegam. Um método mais simples e rudimentar pode ser um pouco mais robusto. Victor DeMiguel e seus colegas calcularam que, para que as estimativas ideais superassem de forma confiável a regra simples de partes iguais para uma carteira de 50 ativos, o analista precisaria de um conjunto de dados de cinco séculos.
O ponto não é que a análise simples seja sempre a melhor, mas que ela é sólida. Ela não enrola nem reivindica demais. Pode ser feita em um guardanapo em um bar, ou rabiscada no bloco de notas de um médico. Antes de desenrolar um grande edifício analítico, às vezes vale a pena pedir para verificar debaixo da camisa.