quarta-feira, 6 de julho de 2011

Conferência ISSI 2011 - anotações do quarto dia

 Mais um dia de conferência, mais um dia de vários toques interessantes.

O dia começou com uma apresentação de Olle Persson sobre técnicas de mapeamento e melhorias metodológicas em visualização de grafos de redes. A preocupação básica da apresentação, e de várias outras que transcorreram ao longo do dia, foi como criar maior relevância/reputação a determinadas conexões como forma de deixar menos poluídas as imagens de redes que são geradas. O fundo dessa conversa, ao meu ver, não pode ser só focada em como resolvemos nosso problema como pesquisadores, mas sim como entendemos melhor e reconhecemos as estruturas de relevância que produzimos ao atuar em rede.

Logo depois, começaram as sessões de apresentação dos poster, na qual meu trabalho e da Sueli Mara, minha orientadora do doutorado, estavam alocados.



A primeira vez que participo desse tipo de encontro, utilizando o formato de posters para divulgar pesquisas em estágio ainda iniciais. Gostei do formato, na real, dá para analisar aquilo que te interessa, conversar com quem está por ali apresentando o trabalho, trocar contatos, enfim, conhecer um pouco mais o que cada um está fazendo. Clima bom, boas conversas. A pesquisa que trouxemos para apresentar foi uma revisão dos principais artigos publicados no Brasil sobre questões relacionadas a "redes sociais" e "informação", onde mostramos que tipo de recursos de análise os pesquisadores têm utilizado, a dificuldade de trabalhar com grandes massas de dados e problemas ainda metodológicos no uso de novas técnicas de análise. Sem dúvida, esse é um campo ainda muito no início no Brasil, ainda mais por tudo o que tenho visto aqui. Há muito a experimentar, pois temos características, focos de análise que passam longe das preocupações que circulam num fórum como esse. Por exemplo, nesses dias todos não vi ninguém apresentar nada relacionado a produção cultural, a apropriação de tecnologia, a produção independente, gambiarra, software livre, etc, etc. Apesar disso, o tipo de metodologia e estrutura de análise que o povo daqui tá utilizando também está bem a frente do que usamos em outros tipos de estudos, como mencionei acima. Uma boa junção.

Depois da sessão de posters, fui para as mesas de trabalho do dia. Segue uma síntese por aqui:
  1. Sessão Networks 1 - a mesma tendência de como criar novas estruturas de produção de relevância para melhorar a análise de grafos estava presente na mesa como um todo. Algumas propostas caminhavam no sentido de utilizar não só a conexão, mas seu conteúdo como um espaço relacional a ser caracterizado a partir de critérios determinados. Outros pesquisadores têm trabalho com a ideia de que pedaços de documentos podem ser vistos como genes que são passados para outras produção, derivando mutações e transformações. Ideia interessante, Dawkins já falava isso nos memes, mas a aplicação não interessou muito. Outra pesquisa falava sobre como considerar a formação de "cartéis" de citação entre pesquisadores de uma área científica. Para isso, ele propunha estudar não só apenas o efeito da auto-citação, mas os efeitos e movimentos das redes de pesquisadores próximos no grafo de forma conjunta a partir dos indicadores de proximidade. Ideia interessante. Ele separou e analisou como evolui no tempo os diferentes níveis de atuação desses pesquisadores em camadas distintas de rede. Gostei da forma como isso foi apresentado. No meu caso, faria sentido entender como evolui no tempo as diferentes camadas de colaboração num espaço de produção científica: instituições, departamentos, grupos, etc. 
  2. Sessão Data Sources 1 - Foi uma sessão de vários trabalhos em andamento, com menos tempo de apresentação para cada um. Marcou a presença de pesquisas brasileiras, mostrando como o país está se fortalecendo para dentro, ao contrário do que outros estudos apontavam. Em tese, os movimentos brasileiros têm fortalecido a atuação nos jornais do país, consolidando espaços internos de publicação da produção. Interessante entender como isso se relaciona com as políticas públicas na C & T. 
  3. Sessão Key address - Apresentou uma fala o Ricardo Baeza Yates, um dos líderes na europa do Yahoo Lab. A fala se concentrou em analisar quais são as limitações atuais de algoritmos de busca da informação na Web - como o Pagerank - e quais estão sendo algumas das tendências futuras na área e para onde o Yahoo está olhando. Em termos de limitações dos algoritmos, o ponto mais forte que foi mencionado é o que ele chama de relevância negativa, ou seja, como tratar movimentos de spam que produzem centanas/milhares de sites, redirecionam links e articulam conjuntos de estratégia para "enganar" a estrutura dos atuais algoritmos. O ponto chave está em identificar isso e as experiências que estão fazendo é usar mais e mais dados gerados em redes sociais como acoplamento a indexação tradicional de links. Algumas experiências foram mostradas, alguns resultados potenciais e melhores significativas aos atuais algoritmos. A checar melhor! No entanto, a visão da Yahoo é que a pesquisa na web não deve mudar significativamente em termos de algoritmos de busca, mas sim na experiência do usuário ao realizar buscas. Um outro recurso que ele mostrou foi o WebScope da Yahoo, que é uma plataforma que fornece dados livres estruturados para estudantes, grupos de pesquisa e interessados de forma geral. Por exemplo, dados de usuários que votaram em suas músicas preferidas no sistema do Yahoo, dados de linguagem natural, relações sociais e por aí vai. Bem útil para experimentações quando não temos os dados que precisamos.
  4. Sessão Webometrics 2 -  A mesa tratou de análises do Google Scholar e Google Books, mostrando como os dois podem servir de plataformas para pesquisas em webmetria e cienciometria. Um ponto alto da apresentação foi a ferramenta Publish or Perish, que coleta os primeiros 1000 resultados do Google Scholar e sistematiza de uma forma delícia de ver. Acabei de baixar a ferramenta e já fiz com uma experiência com a Rede MetaReciclagem, o que já me surpreendeu logo de cara. Foi interessante também observar como os resultados do Scholar desequilibram totalmente o que é esperado como resultado tradicional de produção científica. Por exemplo, por ele, o Brasil é o terceiro país com mais conteúdo publicado. Isso se deve ao tipo de recurso que o Brasil está utilizando para divulgar sua produção científica, no caso o Scielo, ou seja, deixando os dados mais acessíveis para indexadores desse tipo. Enfim, ocupando espaços. Vale a pena conferir mais trabalhos do Statistical Cybermetrics Research Group.
  5. Sessão Networks and Visualization - Essa sessão foi sem grandes novidades, apresentando um pouco mais daquilo que já falei acima.
Dia bom! Experiência boa de estar em contato com esse universo de coisas legais que, sem dúvida, já estão potencializando muito aquilo que venho fazendo.

Um comentário:

Sibele disse...

O Publish or Perish é sensacional! Viva Anne-Will Harzing!