OpenAlex
OpenAlex, nomeada em referência à Biblioteca de Alexandria, é uma base de dados bibliométricos - um catálogo aberto de artigos científicos, autores, fontes e instituições - mantida pela organização sem fins lucrativos OurResearch.[1] Lançada em janeiro de 2022, sucedeu o Microsoft Academic e foi inicialmente semeada com o conjunto final de dados abertos disponibilizado pela Microsoft em 2021 [2]; desde então, passou a agregar e enriquecer metadados de múltiplas fontes.[3][4][5]. O serviço é frequentemente comparado a produtos comerciais como o Web of Science (WoS da Clarivate) e o Scopus (Elsevier).[6]
Segundo a própria documentação, a OpenAlex se apresenta nos eixos: Grande (Big), Fácil (Easy) e Aberta (Open). Em Big, os mantenedores afirmam ter cobertura ampla - chegando a “cerca do dobro” de outros serviços - com atenção particular a obras não anglófonas e ao Sul Global;[7] em Easy, a plataforma destaca oferecer API rápida e bem documentada; e, em Open, distribui o conjunto completo de dados sob a licença Creative Commons, permitindo transparência e ampla reutilização.[8]
História
[editar | editar código]Em maio de 2021, a Microsoft anunciou o encerramento do Microsoft Academic/Microsoft Academic Graph (MAG), com término das atualizações em 31 de dezembro de 2021.[9] Em resposta, a organização sem fins lucrativos OurResearch informou que construiria um sucessor aberto e, em 1 de janeiro de 2022, lançou o OpenAlex com API pública e instantâneo completo dos dados sob licença CC0; o lançamento foi noticiado pela revista Nature em 24 de janeiro de 2022.[10][11][12]
Após o foco inicial na API e no snapshot, o projeto passou a oferecer também uma interface web para busca e exploração dos dados, lançada em versão beta em outubro de 2023.[13] Em paralelo, a equipe introduziu melhorias estruturais, como a adoção de um novo sistema de desambiguação de autores (com substituição dos IDs de autor em julho de 2023) e a transição, a partir de 2024, da taxonomia de Concepts (descontinuada) para Topics.[14][15][16]
Em 30 de janeiro de 2024, o Centro de Estudos de Ciência e Tecnologia de Leiden (CWTS) lançou a Leiden Ranking Open Edition, baseada exclusivamente em dados do OpenAlex, como alternativa transparente e reproduzível ao ranking tradicional (que usa Web of Science).[17][18] No mesmo período, instituições anunciaram a adoção de ferramentas abertas; por exemplo, a Universidade de Sorbonne comunicou a descontinuação do uso do Web of Science e a opção por soluções abertas “em particular usando o OpenAlex”.[19]
Conteúdo
[editar | editar código]O OpenAlex reúne metadados de produção científica em um grafo de conhecimento. O primeiro grande carregamento derivou do Microsoft Academic/MAG, descontinuado em 2021, e o índice passou a ser continuamente enriquecido com registros vindos de múltiplas fontes, como Crossref, PubMed, repositórios disciplinares e repositórios institucionais, além de sites de editoras.[20][21]
As entidades principais incluem Works (trabalhos), Authors (autores), Sources (periódicos/repositórios), Institutions (instituições) e a classificação temática de Topics (desde 2024, em substituição aos antigos Concepts). Para instituições, o identificador canônico externo é o ROR; para autores, o identificador canônico externo é o ORCID, quando disponível; e os antigos Concepts adotavam o Wikidata como identificador canônico.[22][23][24][25]
O acesso é feito principalmente por API REST (gratuita, sem autenticação obrigatória), com limites usuais de 100.000 chamadas/dia e 10 requisições/segundo;[26] o conteúdo completo é distribuído em snapshots (atualização aproximadamente mensal) sob licença Creative Commons CC0, hospedados na Amazon S3.[27][28]. Além disso, a plataforma fornece uma interface web para busca e exploração dos dados, lançada em versão beta em outubro de 2023.[29]
Em 2025, o site oficial informa a indexação de mais de 250 milhões de trabalhos provenientes de 250 mil fontes, vinculados a cerca de 90 milhões de autores desambiguados e 100 mil instituições; a documentação técnica registra “mais de 240 milhões” de trabalhos, cerca de 249 mil fontes e aproximadamente 109 mil instituições.[30][31][32][33]
O projeto declara operar com código-fonte aberto (100% open-source), com repositórios públicos no GitHub cobrindo o website, a API e componentes de processamento/ML (p.ex., modelos de afiliação institucional e de classificação de Topics).[34][35][36][37] Os Tópicos são inferidos em etapas: (i) agrupamento do grafo global de citações usando o algoritmo de Leiden (abordagem de citação direta estendida, em colaboração com o CWTS/Leiden); (ii) rotulagem automática dos agrupamentos; e (iii) um modelo supervisionado que atribui tópicos a cada obra mesmo quando há dados faltantes. A taxonomia resultante organiza-se em quatro níveis (domínio → campo → subcampo → tópico) alinhados às categorias ASJC usadas pela Scopus e estendidos com um nível adicional de granularidade no nível de “tópico” (aplicado a obras, não apenas a periódicos).[38][39][40]
Diversas avaliações independentes apontam que a cobertura do OpenAlex é comparável (e por vezes superior) à de bases comerciais em determinados recortes temáticos ou linguísticos, embora existam diferenças de metadados e classificações que recomendam uso crítico dos dados.[41][42]
Referências
[editar | editar código]- ↑ «Welcome to the OpenAlex help center». OpenAlex Help. Consultado em 26 de agosto de 2025
- ↑ Scheidsteger, Thomas; Haunschild, Robin (4 de março de 2023). «Which of the metadata with relevance for bibliometrics are the same and which are different when switching from Microsoft Academic Graph to OpenAlex?». Profesional de la información (em inglês) (2). ISSN 1699-2407. doi:10.3145/epi.2023.mar.09. Consultado em 14 de maio de 2024
- ↑ Dalmeet Singh Chawla (24 de janeiro de 2022). «Massive open index of scholarly papers launches». Nature. Consultado em 26 de agosto de 2025
- ↑ «Where do works in OpenAlex come from?». OpenAlex Help. Consultado em 26 de agosto de 2025
- ↑ «Next Steps for Microsoft Academic: Expanding into New Horizons with a Community-Driven Approach». Microsoft Research. 4 de maio de 2021. Consultado em 26 de agosto de 2025
- ↑ «OpenAlex technical documentation – Overview». OpenAlex Docs. 13 de janeiro de 2025. Consultado em 26 de agosto de 2025
- ↑ Simard, Marc-André; Basson, Isabel; Hare, Madelaine; Larivière, Vincent; Mongeon, Philippe (2024). «The open access coverage of OpenAlex, Scopus and Web of Science». arXiv. Consultado em 26 de agosto de 2025
- ↑ «OpenAlex technical documentation – Overview». OpenAlex Docs. 13 de janeiro de 2025. Consultado em 26 de agosto de 2025
- ↑ «Next Steps for Microsoft Academic: Expanding into New Horizons with a Community-Driven Approach». Microsoft Research. 4 de maio de 2021. Consultado em 26 de agosto de 2025
- ↑ «We're building a replacement for Microsoft Academic Graph». OurResearch Blog. 8 de maio de 2021. Consultado em 26 de agosto de 2025
- ↑ «OpenAlex launch!». OurResearch Blog. 6 de janeiro de 2022. Consultado em 26 de agosto de 2025
- ↑ Dalmeet Singh Chawla (24 de janeiro de 2022). «Massive open index of scholarly papers launches». Nature. Consultado em 26 de agosto de 2025
- ↑ «About us». OpenAlex Help. Consultado em 26 de agosto de 2025
- ↑ «FAQ – Author IDs change (July 2023)». OpenAlex Docs. 24 de dezembro de 2024. Consultado em 26 de agosto de 2025
- ↑ «Concepts (deprecated)». OpenAlex Docs. 11 de julho de 2024. Consultado em 26 de agosto de 2025
- ↑ «Topics». OpenAlex Docs. 4 de agosto de 2025. Consultado em 26 de agosto de 2025
- ↑ «Introducing the Leiden Ranking Open Edition». Leiden Madtrics (CWTS). 30 de janeiro de 2024. Consultado em 26 de agosto de 2025
- ↑ «Leiden Ranking Open Edition 2024 – Release». CWTS Leiden Ranking. 9 de outubro de 2024. Consultado em 26 de agosto de 2025
- ↑ «Sorbonne University unsubscribes from the Web of Science». Sorbonne Université. 11 de janeiro de 2024. Consultado em 26 de agosto de 2025
- ↑ «Works». OpenAlex Docs. 29 de maio de 2025. Consultado em 26 de agosto de 2025
- ↑ «Where do works in OpenAlex come from?». OpenAlex Help. Consultado em 26 de agosto de 2025
- ↑ «Institutions». OpenAlex Docs. 22 de novembro de 2024. Consultado em 26 de agosto de 2025
- ↑ «Authors». OpenAlex Docs. 24 de dezembro de 2024. Consultado em 26 de agosto de 2025
- ↑ «Concepts (deprecated)». OpenAlex Docs. 11 de julho de 2024. Consultado em 26 de agosto de 2025
- ↑ «Topics». OpenAlex Docs. 4 de agosto de 2025. Consultado em 26 de agosto de 2025
- ↑ «Rate limits and authentication». OpenAlex Docs. 21 de fevereiro de 2025. Consultado em 26 de agosto de 2025
- ↑ «OpenAlex snapshot». OpenAlex Docs. 8 de fevereiro de 2024. Consultado em 26 de agosto de 2025
- ↑ «OpenAlex dataset – Registry of Open Data on AWS». AWS Registry of Open Data. Consultado em 26 de agosto de 2025
- ↑ «About us». OpenAlex Help. Consultado em 26 de agosto de 2025
- ↑ «OpenAlex – homepage». OpenAlex.org. Consultado em 26 de agosto de 2025
- ↑ «Works». OpenAlex Docs. 29 de maio de 2025. Consultado em 26 de agosto de 2025
- ↑ «Sources». OpenAlex Docs. 19 de dezembro de 2023. Consultado em 26 de agosto de 2025
- ↑ «Institutions». OpenAlex Docs. 22 de novembro de 2024. Consultado em 26 de agosto de 2025
- ↑ «OpenAlex – homepage». OpenAlex.org. Consultado em 26 de agosto de 2025
- ↑ «OpenAlex – index of open-source repos». GitHub. Consultado em 26 de agosto de 2025
- ↑ «openalex-institution-parsing». GitHub. Consultado em 26 de agosto de 2025
- ↑ «Topics (code and model)». OpenAlex Docs. 4 de agosto de 2025. Consultado em 26 de agosto de 2025
- ↑ «An open approach for classifying research publications». Leiden Madtrics (CWTS). 24 de janeiro de 2024. Consultado em 26 de agosto de 2025
- ↑ «Topics». OpenAlex Help. Consultado em 26 de agosto de 2025
- ↑ Traag, Vincent A.; Waltman, L.; Van Eck, N. J. (2019). «From Louvain to Leiden: guaranteeing well-connected communities». Scientific Reports. Consultado em 26 de agosto de 2025
- ↑ «A Comparison of OpenAlex With Scopus and Web of Science for Tracking Scholarly Nursing Literature». PLOS ONE. 2025. Consultado em 26 de agosto de 2025
- ↑ «Reference coverage analysis of OpenAlex compared to Web of Science and Scopus». Scientometrics. 2025. Consultado em 26 de agosto de 2025