WortschatzISBN

ISBN-Abgleich und Cover-Download fuer Antiquariat Wortschatz

1 Projektuebersicht

94.403
Buchtitel
~24.500
Verwertbare Bilder
15,364
Cover-Dateien
~50%
Trefferquote ab 1970
InfoDetails
KundeAntiquariat Wortschatz (office@wortschatz.eu)
ProjektordnerK:\WebstormProjects\WortschatzISBN
Excel-Dateibuecher_TF__26_03_29.xlsx (94.403 Zeilen, 36 Spalten)
Cover-Ordnercover_images/ (Dateien als BUCHID.png)
Buchtitel gesamt94.403
Davon ab 1970 (ISBN relevant)63.817 (67,6%)
Verwertbare ISBN + Bilddaten~24.500 (~50% der ab-1970)
Weitere ISBN ohne Bild~6.700

2 Zugangsdaten

ISBNdb API

FeldWert
Plattformhttps://isbndb.com/
Usernameoffice@wortschatz.eu
API-Key67503_f72999c86e99375d4e99f9349355c3b8
Tageslimit15.000 Abfragen (Premium)
Rate-Limit3 Requests/Sekunde (180/Min)

DNB (Deutsche Nationalbibliothek)

FeldWert
APISRU API: https://services.dnb.de/sru/dnb
API-KeyNicht noetig (oeffentlich)
SchemaMARC21-xml

Weitere Quellen (kein Key noetig)

QuelleAPIVerwendung
Open Librarycovers.openlibrary.org/b/isbn/ISBN-L.jpgCover-Bilder
Google Booksgoogleapis.com/books/v1/volumesCover-Bilder + Metadaten

3 Bewertungssystem

Jedes Buch wird nach 7 Kriterien gegen die API-Ergebnisse bewertet:

Primaere Kriterien (alle 4 muessen zutreffen)

NrKriteriumAbgleich
P1SpracheExakter Abgleich ueber Aequivalenztabelle
P2TitelMind. 1 Wort (4+ Buchstaben) stimmt ueberein
P3AutorenMind. 1 Wort (4+ Buchstaben) stimmt ueberein
P4VerlagMind. 1 Wort (3+ Buchstaben) stimmt ueberein

Sekundaere Kriterien (verbessern Bewertung)

NrKriteriumAbgleich
S1JahrErscheinungsjahr stimmt
S2EinbandPB/HC Zuordnung
S3AuflageAuflagennummer stimmt

Bewertungstabelle

PrimaerSekundaerBewertungBedeutung
4/43/3WOWNahezu sicher richtig
4/42/3FITSSehr wahrscheinlich richtig
4/41/3RECHECKManuell nachpruefen
4/40/3CAVEVorsicht, nur primaer passt
3/42-3/3COMPAREBVergleichen, 3 ISBNs geladen

4 Scripts und Dateien

ISBN-Abfrage Scripts

ScriptFunktionStarten
isbn_lookup.pyISBNdb API Abfrage (Hauptscript)py isbn_lookup.py --resume
dnb_lookup.pyDNB SRU API Abfrage (2. Quelle)py dnb_lookup.py --resume
image_downloader.pyCover-Download von ISBNdbWird automatisch aufgerufen
dnb_image_downloader.pyCover von Google Books / OpenLibraryWird automatisch aufgerufen

Reparatur und Nachbearbeitung

ScriptFunktion
redownload_missing.py7.978 fehlende Cover nachlagen (OpenLibrary + Google Books)
download_url_covers.py2.962 vorhandene URLs herunterladen (Datei fehlte)
fix_placeholder_covers.pyPlaceholder-Bilder erkennen und entfernen
redownload_images.pyFehlgeschlagene Downloads erneut versuchen

Konfiguration

DateiInhalt
config.pyISBNdb API-Key, Spalten-Mapping, Matching-Parameter
dnb_config.pyDNB SRU Konfiguration, Spalten-Mapping
language_map.pySprach-Aequivalenztabelle (de=German=deu=ger=Deutsch)
matcher.pyMatching-Logik und Scoring-Algorithmus

Ergebnis-Dateien

DateiInhalt
output/*.xlsxErgebnis-Excel mit 54 neuen Spalten
cover_images/*.png15,364 Cover-Bilder als BUCHID.png
progress.jsonFortschritt fuer Resume-Funktion
fix_bildlinks_import.csv1.639 nicht zugeordnete Cover (fuer Excel-Import)
download_results.jsonErgebnisse ISBN-Download (live)
download_urls_results.jsonErgebnisse URL-Download (live)

5 Kommandozeilen-Referenz

ISBNdb Abfrage starten

cd K:\WebstormProjects\WortschatzISBN set ISBNDB_API_KEY=67503_f72999c86e99375d4e99f9349355c3b8 py isbn_lookup.py --test # Testlauf (50 Buecher) py isbn_lookup.py --test --test-limit 200 # Test mit 200 py isbn_lookup.py # Volllauf py isbn_lookup.py --resume # Fortsetzen

DNB Abfrage starten

py dnb_lookup.py --resume

Fehlende Cover nachladen

python3 redownload_missing.py # ISBN-Suche (OpenLibrary + Google) python3 download_url_covers.py # Vorhandene URLs herunterladen

Abbrechen

Strg+C (beendet sauber, speichert Fortschritt)

6 Excel-Spalten (buecher_TF__26_03_29.xlsx)

SpalteNameBedeutung
ABUCHIDEindeutige Buch-ID (= Cover-Dateiname)
EISBNISBN aus Wortschatz-DB
FSPRACHESprache des Buches
GTITELBuchtitel
HAUTORAutor(en)
IVERLAGVerlag
JJAHRErscheinungsjahr
AERECHSTRecherche-Status (Zusammenfassung)
AFBILDLINKURL zum Cover-Bild
AGBILDDNRDateiname des Covers (BUCHID.png oder Y0_/E0_)

BILDDNR Prefixe

PrefixBedeutungAnzahl
BUCHID.pngCover heruntergeladen und zugeordnet~24.600
Y0_Nicht abgefragt / kein Ergebnis60.781
E0_Vom Kunden revidiert / ausgeschieden8.990
N0_DNB-Abfrage ohne Bild~158

7 Aktueller Download-Status

15,364
Cover-Dateien aktuell
711
Neue Downloads
99,99%
Dateien gueltig
2
Placeholder entfernt
DownloadFortschrittOKFehlerStatus
ISBN-Suche (ergaenze)1800/7978111789Laeuft
URL-Download (vorhandene)700/29627000Laeuft

8 Datenquellen (rechtlich)

QuelleBetreiberAPI-KeyBewertung
ISBNdbISBNdb.com (kommerziell)BezahltLegal (Lizenz)
DNBDeutsche NationalbibliothekKostenlosLegal (staatlich)
OpenLibraryInternet Archive (Non-Profit)KeinerLegal (oeffentlich)
Google BooksGoogle LLCKeinerLegal (API ToS)

Cover-Abbildungen fuer den Buchverkauf sind branchenueblich und rechtlich unbedenklich (Zitatrecht, Handelspraxis).

9 Offene Aufgaben

NrAufgabeStatus
1fix_bildlinks_import.csv in Excel importieren (1.639 nicht zugeordnete Cover)Offen
2Download-Ergebnisse in Excel uebernehmenOffen
3Cloud/Hosting fuer Cover-Bilder einrichtenOffen
4Eigene Fotos fuer aeltere Buecher erstellenOffen
5Plattform-Upload (ZVAB, Booklooker etc.)Offen
WortschatzISBN Projektinfo · 03.04.2026 05:54