quinta-feira, março 22, 2012

Finalizando

Mais uma última revisada e fechamos a primeira versão completa do artigo sobre testes de desempenho de fundos. Era para ser uma nota, mas foi crescendo e virou um artigo completo. Uma adição relevante foi comparar os resultados com métodos de comparações múltiplas controlando para Familywise Error Rate e False Discovery Rate. Também foi interessante trabalhar mais diretamente com propriedades de testes de hipóteses, já que normalmente meu foco é mais em procedimentos de inferẽncia. Muitas e muitas leituras do clássico Testing Statistical Hypothesis, Lehmann and Romano para essa versão final.

10 Comments:

Blogger Pedro H. C. Sant'Anna said...

Excelente livro!!

Utilizamso ele para a parte de teste de hipoteses aqui do curso de Econometria.

=)

8:46 AM  
Anonymous Carlos said...

Mas teste de hipótese é justamente um dos procedimentos de inferência. Você quis dizer estimação?

Abraços

Carlos

11:58 PM  
Blogger Márcio Laurini said...

Carlos

Sim, inferência como procedimento de estimação pontual ou por intervalos.

[]s

12:05 AM  
Anonymous Carlos said...

Você vai testar se os fundos tiveram desempenho similares?

Talvez além de controlar para um possível erro decorrente de múltiplas hipóteses, seria interessante colocar o problema no arcabouço de teoria de decisão.

Qual o nível de significância que você vai usar?

abs

9:31 AM  
Blogger Márcio Laurini said...

Carlos

O working paper já está pronto. Já deveria estar listado no Repec mas deve ter dado algum problema. Mas é possível acessar diretamente no endereço:
http://professores.ibmecrj.br/erg/dp/papers/dp201203.pdf

A idéia é testar se n fundos de investimento tem a mesma performance, usando comparações em pares e comparações multiplas. A idéia é obter os p-valores para essas hipóteses usando estimadores robustos.

[]s

10:04 AM  
Anonymous Carlos said...

Dei uma olhada, parece muito bacana, vou ler.

Por alto tenho algumas perguntas:

(i) se eu quero saber se os fundos tem mesmo desempenho, eu teria dee ter uma medida de diferença significativa de desempenho. O quão diferente teria de ser o "sharpe ratio" para dois fundos não serem considerados iguais?

(ii) os p-valores indicam que H0 é uma hipótese consistente. Mas você consegue rejeitar que discrepâncias conforme determinada em (i) sejam igualmente prováveis?

Porque, stricto sensu, os dados podem ser consistentes com "heard behavior", mas podem ser consistentes com outras hipóteses também.


abs

10:45 AM  
Blogger Márcio Laurini said...

Carlos

O ponto do artigo é exatamente esse - obter a distribuição da diferença entre o sharpe ratios de fundos, e verificar se essa diferença é significante, controlando para heterocedasticidade, autocorrelação e não normalidade.

Não sentendi o ponto ii. Mas de forma indireta o procedimento de bootstrap obtem a distribuição da diferença, que pode ser analisada para verificar simetria, etc.

herd é uma das explicações consistentes com o resultado, mas não é a única.

11:13 AM  
Anonymous Carlos said...

No ponto (i) devia ter usado outra palavra hehehe digo diferença "relevante" para uma hipótese de "herd behavior", para uma hipótese de eles terem performance iguais. Não quis dizer diferença estatisticamente significativa a um nível arbitrário de significância. Por exemplo, qual seria uma magnitude "grande" de diferença entre dois "sharpe ratios" para que essa fosse considerada relevante do ponto de vista econômico?


O ponto (ii) seria olhar a distribuição e ver se as diferenças consideradas relevantes são rejeitadas ou não. Porque se eu não consigo rejeitar que não há diferença, mas também não consigo rejeitar que existem diferenças relevantes, então meio que não daria para concluir muita coisa, certo!?

Valeu

abs

11:31 AM  
Anonymous carlos said...

Márcio, li o working paper, gostei de ver como fazer as correções para tornar os testes robustos!

Alguns pontos:

Quanto à própria hipótese estatística de igualdade, a única coisa que foi controlada foi o nível de significância do teste, não se sabe qual o poder para detectar diferenças razoáveis nos sharpe ratios. Supondo que o poder dos testes em alternativas relevantes fossem apenas pouco maior do que o nível de significância, as rejeições da tabela 1 seriam nominalmente próximas ao poder do teste. Então da mesma forma que elas foram interpretadas como evidência a favor de H0, poderiam ser interpretadas como evidências a favor de H1. Talvez valesse aqui tentar excluir esta segunda possibilidade. Já com relação aos p-valores, eles sozinhos não nos dizem muita coisa...

Quanto à extrapolar uma hipótese estatística (igualdade de sharpe-ratios) a uma teoria (herding), não vi como esta ponte pode ser feita.

Por exemplo, a questão de frisar o comportamento de manada. A igualdade dos fundos é condição necessária ou suficiente para comportamento de manada? A princípio, me parece que não é nenhum dos dois. Não me parece condição necessária porque pode haver comportamento de manada com diferenças reais nos sharpe ratios, isto é, pode existir a tendência de os fundos se imitarem, mas podem haver líderes que agem primeiro e outros que copiam em seguida, resultado em sharpe ratio diferentes e mesmo assim caracterizando comportamento de manada. Neste caso, por exemplo, se você encontrasse uma diferença estatisticamente significativa no sharpe ratio, mas "com o tamanho previsto pela teoria de herding", isso ainda poderia ser consistente com comportamento de manada, em que a informação vaza e o "lucro econômico" do líder não é tão grande, mas é real. O que me parece aqui é que as decisões de compra e venda seriam correlacionadas, os retornos correlacionados, mas não necessariamente os sharpe ratios iguais.

Também não me parece ser condição suficiente. Pois, mesmo supondo que as performances fossem todas iguais, isso pode implicar em um monte de coisa, tanto herding quanto não herding. Pode ser fruto da regulação, da eficiência de mercado, ou de sei lá o quê mais... e, poderia até ser uma evidência contra o herding, dependendo de como este fosse definido.

Assim, se não for condição necessária nem condição suficiente, é difícil ver isso como evidência a favor da teoria. Talvez a evidência maior seja a figura 4.3 de correlação, e não os testes de hipóteses.

Bom, não sei se fui claro, valeu!

Abs!

Carlos

10:16 AM  
Blogger Márcio Laurini said...

Carlos

Seus pontos fazem sentido sim. A idéia das correções é obter testes com o tamanho nomimal correto, conforme o framework usual de Neyman-Person, fixando o erro tipo I.


O segundo ponto é mais delicado - o resultado é apenas uma evidência a favor dessa hipótese, não um teste completo que exigiria conhecer as alocações de cada fundo em cada período de tempo. O foco do artigo não é esse, e sim a metododologia de correção.
No caso uma forma de interpretar estes resultados é como uma medida não condicional de desempenho, já que não estamos olhando cada alocação no tempo e só o desempenho no período todo. Mas olhando as correlações e as distribuições de retornos existe uma grande similaridade nos retornos, o que poderia ser explicada por uma escolha de carteiras similares.

11:56 AM  

Postar um comentário

<< Home