quarta-feira, 16 de dezembro de 2009

Quase tudo

No exercício diário de meu cargo de redator, constantemente preciso recorrer a materiais internos de onde trabalho. Não obstante, precisei fazer uma nota sobre o maestro Villa Lobos (não sei se o tempo já alterou a grafia do nome dele). Me surpreendo ao buscar por uma foto dele e encontrar dentro do banco de imagens da Folha de São Paulo uma imagem tirada por um fotógrafo da empresa datada da época em que o compositor ainda era vivo.

Este exemplo é um dos casos de migração de mídia que vem ocorrendo com o decorrer dos tempos. Do arquivo de papel para o digital, houve um ganho de agilidade e de espaço consideráveis. É algo similar à pessoa que grava cinco CDs antigos em um único DVD para não ter que lidar com várias mídias. Em menos de um ano, muitos farão o mesmo processo, só que com o Blu-ray.

A digitalização de materiais jornalísticos dá uma falsa impressão sobre uma espécie de "teoria do tudo" informacional. No nível de apenas arquivado, o material não passa de dados, não chegam a constituir uma informação em si, embora estejam repletos delas em seus conteúdos. Categorizar este volume todo, além de gerar um nível muito maior de informações, pode causar um drama com a indexação das informações: o que é realmente relevante?

Um exemplo: Em uma busca por "Lula", Poderíamos organizar por data, mas o retorno seria imenso. Sem contar a ambiguação. Imagine cada termo ter que ser desambiguado? E a cada nova confusão, termos que refazer em tudo que foi publicado uma nova categorização? O trabalho seria enorme. O logaritmo usado pelo Google até hoje também não se mostra eficas ao todo. Se em uma matéria escrevermos "Lula, Lula, Lula, Lula, Lula, Lula, Lula, Lula..." ela terá mais importância que uma onde esteja escrito "O presidente Lula morreu".

Talvez, cada área do conhecimento deva ter seu próprio mecanismo de indexação e características de "tagueamento" comuns a vários mecanismos. Mas a busca deve respeitar cada idiossincrasia. E estas peculiaridades, esta "epistemologia diária" muda constantemente. Ainda sobre o exemplo do Lula, o Banco de Dados da Folha de S. Paulo vê com maior relevância dados sobre a trajetória política do Lula após este ter se tornado presidente. Já os repórteres tem maior interesse nos últimos passos deste. Os redatores se preocupam muito mais com os termos relacionados ao líder e às imagens vinculadas à sua figura.

Como último exemplo, cito um caso referente ao problema em se gerenciar toda esta quantidade de informação. Recentemente, uma grande biblioteca central européia (uso estes termos por não lembrar o local nem o nome) adotou sistemas robotizados para catalogar seus livros. Anteriormente, cada bibliotecário tinha que ir pessoalmente e buscar um volume na biblioteca. Este processo demorava até duas semanas devido ao grande volume de materiais ali presentes e à impossibilidade em várias pessoas circularem pelo mesmo local ao mesmo tempo. Os livros são colocados dentro de caixas plásticas que mais lembram Tupperwares e são endereçados eletronicamente. Ao se digitar a busca, um sistema robotizado de carrinhos, como pontes rolantes, busca esta caixa e a traz até o bibliotecário. Porém, com todo o material ali presente, se o profissional colocar um livro em uma caixa errada, este pode demorar anos, e até mesmo décadas para ser novamente localizado, segundo estimativas de especialistas.

No jornalismo não estamos muito longe disto. Até lá, creio que possíveis soluções para isto encontram-se nas organizações diárias e na divulgação de micro-centros de informações. Todos em rede, e não um só. Talvez um projeto enciclopedista de toda produção existente peque por isso, muito mais do que por capacidade.

Nenhum comentário:

Postar um comentário