segunda-feira, 22 de outubro de 2007

Multidimensionalidade


A representação da realidade tem sido uma preocupação do Homem desde o início dos tempos, sendo a Arte um óptimo exemplo disso mesmo. As pinturas rupestres do Paleolítico (40.000 A.C.) serão porventura as mais antigas representações da realidade conhecidas e com elas percebemos que a tarefa de Descrever nos acompanha desde os primórdios. Graças ao desejo de expressão inerente ao Homem, chegaram até aos dias de hoje descrições de caçadas que são verdadeiros documentos históricos para os historiadores e antropólogos. Nesta altura, o Homem era caçador-recolector e um dos grandes problemas com que se debatia era o da subsistência – curioso como era esse também o grande tema das suas representações.




Hoje em dia descrevemos processos de negócio, na época descreviam-se as caçadas - os objectos descritos eram as presas, os instrumentos utilizados, os predadores. Através de representações simplificadas, ficámos a conhecer os atributos desses objectos – por exemplo, no que respeita às presas preferenciais: qual o seu porte, se andavam em manada, se tinham ou não chifres … E estas representações bidimensionais duram até hoje (não existiam tapes), sendo aquilo que considero a primeira representação no plano (enfim, não obstante tratar-se da parede de uma gruta) de um problema real da vida do Homem. Teoria da Evolução à parte, e assumindo a impossibilidade de converter o QI que o Homem tinha nessa época para as medidas que conhecemos hoje, será que essa representação teria como objectivo apoiar o aperfeiçoamento das tácticas empregues nas caçadas? Se os nossos antepassados possuíam Inteligência para a expressão artística, não me parece completamente descabido que possuíssem um outro tipo de Inteligência mais Lógica empregue na análise de Problemas.


O que se pretende com este post é uma reflexão sobre a origem da abordagem multidimensional no contexto do Data Warehousing. Foi afirmado na aula que o Kimball estaria na origem da terminologia, tendo a veracidade dessa afirmação sido imediatamente questionada pela Profª. De facto, no seu livro “The Data Warehouse Toolkit”, Kimball refere que não foi ele quem inventou essa terminologia (pp. 16). Os termos “Dimensão” e “Factos” terão tido origem num projecto de investigação conjunta conduzido por General Mills e a Universidade de Dartmouth nos anos 60. As Dimensões são tabelas que contêm os atributos de um negócio (sim, já há muito que deixámos de ser caçadores-recolectores, pelo menos neste hemisfério do globo), pelo que são em si bidimensionais- têm uma estrutura organizadas em linhas e colunas. Contudo, cada objecto que encontramos em linha tem uma tradução multidimensional. Num determinado contexto de negócio, se considerarmos uma Dimensão Cliente como uma tabela que guarda n atributos de Cliente, conseguimos imaginar uma projecção no espaço de 3 atributos em simultâneo. Até aí conseguimos uma visualização da realidade. A introdução de um 4º atributo faz com que já não seja possível visualizar esse objecto no espaço. A leitura combinada de várias Dimensões para explicar um determinado Facto de negócio é, da mesma forma, impossível de visualizar no espaço. Conseguimos, contudo, olhar para uma linha de uma tabela, composta por n atributos e responder à pergunta “O que caracteriza o Cliente A?”, descrevendo os seus atributos. O Cliente A é um vector, que se traduz num ponto do espaço, independentemente da nossa capacidade de o visualizar.

Se invocarmos a definição matemática (simplista) de Dimensão de um espaço, recordamos que é o número de parâmetros necessários para identificar um ponto desse espaço. No mundo de Kimball, a Dimensão continua a respeitar essa definição, se considerarmos que uma Dimensão tem os atributos necessários para a correcta descrição de um processo de negócio. E que a combinação em linha dos diversos atributos se pode traduzir num ponto num espaço.

Entramos no mundo dos Espaços Vectoriais e das Matrizes. Uma matriz é uma tabela rectangular de elementos (ou objectos), que obedecem a propriedades de adição e multiplicação bem definidas. Não entrando em demasiado detalhe sobre as propriedades a que as matrizes devem obedecer, o conceito de organização de dados em linhas e colunas está lá, nos princípios de Álgebra Linear.
Historicamente, o estudo de matrizes surge na literatura Chinesa de 650 AC, no âmbito da resolução do problema do quadrado-mágico (um Sudoku, para ser mais perceptível).
A designação matriz ganha afirmação no século XIX, com o trabalho de matemáticos como J. J. Sylvester. Cayley, Hamilton, Grassmann, Frobenius and von Neumann. Incrível, estamos a falar de mais de 1000 anos de distância entre as duas ocorrências, e não referimos os trabalhos de Descartes no âmbito da Geometria Analítica (séc. XVII) ou de Newton (sec. XVIII).

O conhecimento dos Investigadores não é uma tábua rasa. A sabedoria suporta-se de descobertas anteriores e do questionar continuo dos paradigmas estabelecidos. Kimball teve honestidade intelectual suficiente para referir que “It is probably accurate to say that a single person did not invent the dimensional approach”. O nosso trabalho de pesquisa pode levar-nos a concluir que o princípio por trás da abordagem dimensional remonta aos primórdios da História e da Ciência e das diversas tentativas que o Homem tem feito desde sempre para representar a Realidade que o rodeia.

Sem comentários: