• contato@labci.online
  • revista.divulgaci@gmail.com
  • Universidade Federal de Rondônia, Porto Velho - RO
v. 1, n. 1, mar. 2023
Inovação: O desenvolvimento do The Coupler, uma aplicação online para análise de citação, cocitação, acoplamento bibliográfico e métricas em informação, por Rafael Castanha

Inovação: O desenvolvimento do The Coupler, uma aplicação online para análise de citação, cocitação, acoplamento bibliográfico e métricas em informação, por Rafael Castanha

Abrir versão para impressão

Inovação: O desenvolvimento do The Coupler, uma aplicação online para análise de citação, cocitação, acoplamento bibliográfico e métricas em informação

Rafael Gutierres Castanha
rafael.castanha@unesp.br

Dentro dos Estudos Métricos da Informação existem inúmeros softwares que apresentam soluções para análises bibliométricas, sobretudo aqueles voltados a análises relacionais de citação, dos quais destaco dois: VosViewer e Bibliometrix. Ambos ganharam destaque pela amigável interface e pelo processamento de arquivos oriundos de famosas bases de dados como a Web of Science, a Scopus ou a Dimensions, sem a necessidade de um pré-processamento prévio dos arquivos.

Estes softwares são capazes de construir redes bibliométricas de citação, cocitação e acoplamento bibliográfico, mas não fornecem, de forma direta, alguns resultados que eram fundamentais para as minhas pesquisas: as matrizes de citação, cocitação e acoplamento bibliográfico; os elementos responsáveis por acoplar duas unidades; e a possibilidade de processar qualquer tipo de dados, e não somente aqueles provenientes destas bases de dados. Nesse contexto, surgiu o The Coupler, uma ferramenta desenvolvida para solucionar esta demanda.

Antes de adentrar nas motivações e no processo de criação do The Coupler, relembro os conceitos envolvidos na criação da ferramenta:1) Análise de citação: relação entre citante e citado, por exemplo, verifica-se quantas vezes um determinado autor citou outro. 2) Acoplamento bibliográfico: relação entre citante e citante. Ou seja, são analisadas quantas referências dois artigos ou autores citam em comum (chamamos esta quantidade de referências em comum de frequência de acoplamento); 3) Cocitação: relação entre citado e citado. Neste caso, são analisadas quantas vezes duas referências são citadas ao mesmo tempo (analisa-se a coocorrência de referências). Estes três conceitos são conhecidos como análises relacionais de citação

Todas estas análises podem ser representadas fundamentalmente de duas maneiras, em formato de redes ou de matrizes. Ambos são extremamente úteis para averiguar a relação, as influências e a estrutura intelectual entre autores, documentos, instituições, países, entre outros. Assim, foi construído o The Coupler.

Desde que comecei meus estudos em Ciência da Informação, me dediquei, muito por influência de minha orientadora, em estudar as análises relacionais, sobretudo o acoplamento bibliográfico. Durante a elaboração de minha tese, me deparei com um problema que demandaria muito tempo para resolver, era necessário realizar o acoplamento de uma grande quantidade de pesquisadores, além da necessidade de averiguar quantos e quais autores acoplavam estes pesquisadores. Ou seja, tinha diversas listas de referências de pesquisadores em mãos e precisava acoplá-los identificando qual era a frequência de acoplamento entre eles e qual eram os autores acopladores.

Os demais softwares não resolviam meu problema, pois, as listas de referências dos pesquisadores (a serem acoplados) deveriam passar por um critério prévio estabelecido na metodologia. Num primeiro momento, iniciei os cálculos no Excel, porém, percebi que dessa forma haveria um custo de tempo excessivo, visto que, as listas deveriam ser comparadas par a par. Então imagine, se eu fosse acoplar 10 artigos entre si, necessitaria realizar 45 comparações artigo à artigo no Excel, se fossem 20, teria 190 cálculos, se fossem 200, teria 19900 comparações. Sob essa perspectiva a programação pareceu a melhor saída.

Nunca fui um pesquisador com grande familiaridade com programação, mesmo tendo trabalhado com vários softwares estatísticos e de visualização de dados como SPSS, Excel, jamovi, VosViewer, Pajek, Ucinet, entre outros. No entanto, diante da situação, vi uma clara motivação para contribuir com o campo e poder solucionar meu problema. Alguns anos atrás, tive contato com a linguagem de programação R e com isso, comecei os testes para que eu conseguisse comparar diversas listas de referências automaticamente de uma só vez. Assim, comecei do mais básico, realizando a intersecção entre dois conjuntos (base do acoplamento bibliográfico), tarefa possível de se fazer com duas ou três linhas de programação. A partir daí, pensei: se consigo fazer para dois conjuntos, por que não tentar para quantos eu quiser? E como isso iniciei toda programação do The Coupler.

Diante da minha necessidade, logo encontrei uma função no R que realizava a intersecção entre diversos conjuntos de uma só vez e isso já resolvia um dos meus problemas: identificar quem eram as unidades responsáveis por acoplar os pesquisadores. A partir daí, bastava contar quantos elementos estavam presentes em cada intersecção (em cada acoplamento). Esse processo durou poucos dias. Porém, a partir daí, pensei em dar um passo a mais para apresentar os resultados. Pensei em criar uma lista contendo todas unidades de acoplamento, e outra contendo todos os cálculos de acoplamento juntamente com o tamanho das listas de referências e valores normalizados para os cálculos de acoplamento.

Após aproximadamente dois meses, estava pronto o código do The Coupler e funcionava como esperado (inclusive tem um vídeo meu explicando o código: youtube.com/watch?v=f95I_gc6vi8&). Isso já bastou para resolver o problema de minha tese. Então comecei a me dedicar a visualização dos dados e com isso retornei as premissas das análises de citação: representação em forma de redes e matrizes. Assim, me dediquei a conhecer os pacotes do R para construção de redes sociais (grafos) e operação de matrizes. Desde o início do trabalho, já haviam se passado sete meses.

Ao fim desse período, tinha uma ferramenta pronta, capaz de calcular o acoplamento entre unidades diversas, criar redes, identificar as unidades de acoplamento e com acesso a todas as matrizes de citação, cocitação e acoplamento. E mais, como a organização das listas de referências deveria ser feita manualmente, o que poderia ser algo problemático e trabalhoso inicialmente, se tornou uma solução, pois, era possível processar qualquer tipo de dados com o código do The Coupler e não somente dados bibliométricos. Inclusive, um dos testes foi feito com seguidores do Twitter, o código analisava quantos seguidores diversas contas tinham em comum. Ou seja, a ferramenta apresentava-se extremamente versátil.

Mesmo depois de satisfazer minha necessidade inicial, inspirado no Bibliometrix, decidi dar uma interface gráfica ao The Coupler, pois até então, para utilizar todas funcionalidades, o usuário deveria ter o R instalado em seu computador e rodar todo código, algo não muito amigável. Após pesquisar bastante conheci o pacote shiny, cuja funcionalidade era criar aplicações web no estilo dashboards construídas em html, o que possibilita a utilização da ferramenta por meio do navegador de internet do usuário, similar a funcionalidade do Bibliometrix, que também utiliza desse mesmo pacote. Assim tinha uma excelente solução: uma ferramenta que atenderia todas as demandas e disponível de maneira online para toda comunidade.

Com isso, após 8 meses do início da programação, em Junho de 2021, o código que até então só funcionava dentro do R, ganhou uma interface, uma logo marca (elaborada por um colega designer) e um web site que pode ser acessado por computador ou dispositivos móveis: rafaelcastanha.shinyapps.io/thecoupler.

Assim, qualquer pessoa poderia utilizar o The Coupler com qualquer tipo de dado.

Atualmente a ferramenta está atualizada e em processo de registro junto ao INPI (Instituto Nacional da Propriedade Industrial) por intermédio da AUIN (Agência de Inovação da Unesp). É esperado que futuramente o The Coupler torne-se um software executável nos diversos sistemas operacionais, que tenha funcionalidades de processamentos de dados oriundos diretamente das bases de dados Web Of Science e Scopus, além de fornecer arquivos para elaboração de redes em softwares externos como o pajek, ucinet ou gephi.

Junto com o desafio de tornar-se doutor em Ciência da Informação, a construção do The Coupler, foi sem dúvidas, a mais desafiadora e satisfatória. Poder contribuir para o campo com uma nova ferramenta é algo muito gratificante e marcante em minha trajetória enquanto pesquisador. Há quase um ano e meio trabalho no The Coupler quase que diariamente para que ele esteja sempre em pleno funcionamento livre de erros e sempre buscando oferecer o melhor ao usuário. Desde sua primeira versão online, já disponibilizei uma nova visualização da rede de acoplamento e o ajuste de erros que ocorriam em processamentos de textos, como por exemplo, bugs com caracteres especiais.

Por fim, me despeço convidando a todos a conhecerem o The Coupler!

Sobre o autor

Rafael Gutierres Castanha

Professor de Estatística Aplicada à Educação na UNESP (campus Marília) no curso de Pedagogia e na Faculdade Católica Paulista e membro do grupo de pesquisa de Estudos Métricos da Informação – GPEMI (UNESP). Pesquisa métodos quantitativos aplicados à produção e organização da informação científica (Bibliometria e Cientometria).
Doutor em pela Universidade Estadual Paulista, Mestre em Ciência da Informação e graduado em Licenciatura em Matemática pela Universidade Estadual Paulista.


Redação e foto: Rafael Gutierres Castanha
Diagramação: Pedro Ivo Silveira Andretta

0

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Translate »
Pular para o conteúdo