Direkt zum Inhalt wechseln
Bibiliothek Panter virtual7

PANTER: Die Zukunft der Transparenz im Wissenschaftsbetrieb

Julia Wall

Link kopieren

Link kopiert

Wie KI und IT den Open-Access-Markt revolutionieren

Bibliotheken und Forschungseinrichtungen stehen heute vor einer gewaltigen Herausforderung: In der ständig wachsenden Publikationslandschaft den Überblick zu behalten, ist alles andere als einfach. Preise, Finanzierungsmodelle und Open-Access-Optionen erscheinen unübersichtlich und schwer miteinander vergleichbar. Was, wenn diese Komplexität mit modernster IT und Künstlicher Intelligenz (KI) durchdrungen und neu strukturiert werden könnte? Genau hier setzt der Publishing Analytics Tracker (PANTER) an. Eine Lösung, die den Open-Access-Markt auf eine neue Ebene hebt. Im Auftrag des Sachsen-Konsortiums, einer Kooperation sächsischer Hochschulbibliotheken, hat virtual7 ein Digitalisierungsprojekt umgesetzt, das es ermöglicht, Preisentwicklungen und Finanzierungsmodelle von Open-Access-Zeitschriften transparent und strukturiert zu analysieren. PANTER ist ein öffentlich zugänglicher Preis-Monitor, der es Bibliotheken und Forschungseinrichtungen ermöglicht, fundierte Entscheidungen zu treffen und gleichzeitig wissenschaftliche Arbeiten transparenter und zugänglicher zu machen.

Wissen für alle zugänglich machen


Eine der größten Herausforderungen im wissenschaftlichen Publikationsmarkt ist die Vielfalt an Datenquellen – von HTML-Seiten über PDFs bis hin zu Excel-Dateien. Doch wie lassen sich diese unterschiedlichen Daten effizient erfassen, transformieren und harmonisieren? virtual7 löst dieses Problem mit einer innovativen Kombination aus einem Large Language Model (LLM) von OpenAI und einer eigens entwickelten, hochflexiblen ETL-Pipeline (Extract, Transform, Load). So werden selbst komplexe, unstrukturierte Datenmengen in verwertbare, leicht verständliche Insights umgewandelt. Der Kern der Lösung ist eine datengetriebene Architektur, die auf maximale Flexibilität und Anpassungsfähigkeit setzt. Dank der JSON-konfigurierbaren Pipeline lassen sich neue Datenquellen problemlos integrieren oder bestehende Workflows modifizieren, ganz ohne tiefgreifende Programmierkenntnisse. Dies ermöglicht eine schnelle Anpassung an sich ständig ändernde Anforderungen im Open-Access-Markt.

KI trifft auf Datenmanagement


PANTER demonstriert eindrucksvoll, wie moderne IT-Technologien zusammenarbeiten, um Herausforderungen zu meistern, die ohne diese Werkzeuge kaum lösbar wären. Die Verwendung von Docker-Compose sorgt für eine effiziente Containerisierung der Prozesse, MongoDB Atlas ermöglicht eine skalierbare Datenspeicherung, und Tools wie Selenium und Tesseract OCR garantieren, dass auch komplexe Datenquellen wie Tabellen aus PDFs zuverlässig verarbeitet werden. Ein wichtiges Element von PANTER ist der Einsatz von KI: Das Large Language Model (LLM) übernimmt nicht nur die Analyse der Daten, sondern sorgt auch für deren Harmonisierung und Standardisierung. Es extrahiert relevante Informationen aus einer Vielzahl von zum Teil sehr unstrukturierten Datenquellen und strukturiert sie so, dass sie für wissenschaftliche Auswertungen genutzt werden können. Dadurch werden selbst komplexe Informationen greifbar und vergleichbar – all das in einer Geschwindigkeit, die manuell nicht möglich wäre.

Mehr Transparenz für die Wissenschaft


PANTER ist mehr als nur ein technisches Tool – es ist ein entscheidender Schritt in Richtung einer datengetriebenen Zukunft im Wissenschaftsbetrieb. Für Bibliotheken bietet die Plattform die Möglichkeit, fundierte Entscheidungen über Lizenzverträge zu treffen und ihre Budgets gezielt einzusetzen. Forschungseinrichtungen wiederum erhalten eine solide Grundlage für faire Verhandlungen mit Verlagen. Doch auch die Forschenden profitieren, da ihnen bessere und transparentere Publikationsoptionen zur Verfügung stehen. Durch die Bereitstellung der Ergebnisse als Open-Access-Datenbank schafft PANTER Transparenz, die weit über die Grenzen von Bibliotheken und Forschungseinrichtungen hinausreicht. Es ist ein Leuchtturmprojekt, das zeigt, wie IT und KI nicht nur Effizienz schaffen, sondern auch einen wertvollen gesellschaftlichen Beitrag leisten: die Förderung des freien Zugangs zu Wissen und der transparenten Wissenschaft.

Erfolg in Rekordzeit


Was in nur etwas mehr als zwei Monaten erreicht wurde, ist mehr als bemerkenswert: Vom ersten Konzept bis zur erfolgreichen Umsetzung hat virtual7 für das Sachsen-Konsortium eine Lösung geschaffen, die den Wissenschaftsbetrieb revolutionieren könnte. PANTER ist nicht nur ein Digitalisierungsprojekt, sondern auch ein Beispiel dafür, wie moderne IT und KI Hand in Hand eine transparentere, gerechtere Wissenschaftslandschaft schaffen können. PANTER erzählt die Geschichte von Daten, die zu Erkenntnissen werden, von KI, die Ordnung ins Chaos bringt und von einer Vision, die zeigt, wie IT und Wissenschaft zusammenarbeiten können, um eine transparentere Zukunft zu gestalten. Es ist ein weiteres Beispiel dafür, wie durch den Einsatz neuester Technologie der Weg zu mehr Transparenz und Vergleichbarkeit im wissenschaftlichen Publikationsmarkt geebnet wird – zum Nutzen von Bibliotheken, Forschungseinrichtungen und der gesamten Gesellschaft.


KI

Interessant?

Noch mehr aus unserem Blog