ISBN-Abgleich und Cover-Download fuer Antiquariat Wortschatz
| Info | Details |
|---|---|
| Kunde | Antiquariat Wortschatz (office@wortschatz.eu) |
| Projektordner | K:\WebstormProjects\WortschatzISBN |
| Excel-Datei | buecher_TF__26_03_29.xlsx (94.403 Zeilen, 36 Spalten) |
| Cover-Ordner | cover_images/ (Dateien als BUCHID.png) |
| Buchtitel gesamt | 94.403 |
| Davon ab 1970 (ISBN relevant) | 63.817 (67,6%) |
| Verwertbare ISBN + Bilddaten | ~24.500 (~50% der ab-1970) |
| Weitere ISBN ohne Bild | ~6.700 |
| Feld | Wert |
|---|---|
| Plattform | https://isbndb.com/ |
| Username | office@wortschatz.eu |
| API-Key | 67503_f72999c86e99375d4e99f9349355c3b8 |
| Tageslimit | 15.000 Abfragen (Premium) |
| Rate-Limit | 3 Requests/Sekunde (180/Min) |
| Feld | Wert |
|---|---|
| API | SRU API: https://services.dnb.de/sru/dnb |
| API-Key | Nicht noetig (oeffentlich) |
| Schema | MARC21-xml |
| Quelle | API | Verwendung |
|---|---|---|
| Open Library | covers.openlibrary.org/b/isbn/ISBN-L.jpg | Cover-Bilder |
| Google Books | googleapis.com/books/v1/volumes | Cover-Bilder + Metadaten |
Jedes Buch wird nach 7 Kriterien gegen die API-Ergebnisse bewertet:
| Nr | Kriterium | Abgleich |
|---|---|---|
| P1 | Sprache | Exakter Abgleich ueber Aequivalenztabelle |
| P2 | Titel | Mind. 1 Wort (4+ Buchstaben) stimmt ueberein |
| P3 | Autoren | Mind. 1 Wort (4+ Buchstaben) stimmt ueberein |
| P4 | Verlag | Mind. 1 Wort (3+ Buchstaben) stimmt ueberein |
| Nr | Kriterium | Abgleich |
|---|---|---|
| S1 | Jahr | Erscheinungsjahr stimmt |
| S2 | Einband | PB/HC Zuordnung |
| S3 | Auflage | Auflagennummer stimmt |
| Primaer | Sekundaer | Bewertung | Bedeutung |
|---|---|---|---|
| 4/4 | 3/3 | WOW | Nahezu sicher richtig |
| 4/4 | 2/3 | FITS | Sehr wahrscheinlich richtig |
| 4/4 | 1/3 | RECHECK | Manuell nachpruefen |
| 4/4 | 0/3 | CAVE | Vorsicht, nur primaer passt |
| 3/4 | 2-3/3 | COMPAREB | Vergleichen, 3 ISBNs geladen |
| Script | Funktion | Starten |
|---|---|---|
isbn_lookup.py | ISBNdb API Abfrage (Hauptscript) | py isbn_lookup.py --resume |
dnb_lookup.py | DNB SRU API Abfrage (2. Quelle) | py dnb_lookup.py --resume |
image_downloader.py | Cover-Download von ISBNdb | Wird automatisch aufgerufen |
dnb_image_downloader.py | Cover von Google Books / OpenLibrary | Wird automatisch aufgerufen |
| Script | Funktion |
|---|---|
redownload_missing.py | 7.978 fehlende Cover nachlagen (OpenLibrary + Google Books) |
download_url_covers.py | 2.962 vorhandene URLs herunterladen (Datei fehlte) |
fix_placeholder_covers.py | Placeholder-Bilder erkennen und entfernen |
redownload_images.py | Fehlgeschlagene Downloads erneut versuchen |
| Datei | Inhalt |
|---|---|
config.py | ISBNdb API-Key, Spalten-Mapping, Matching-Parameter |
dnb_config.py | DNB SRU Konfiguration, Spalten-Mapping |
language_map.py | Sprach-Aequivalenztabelle (de=German=deu=ger=Deutsch) |
matcher.py | Matching-Logik und Scoring-Algorithmus |
| Datei | Inhalt |
|---|---|
output/*.xlsx | Ergebnis-Excel mit 54 neuen Spalten |
cover_images/*.png | 15,364 Cover-Bilder als BUCHID.png |
progress.json | Fortschritt fuer Resume-Funktion |
fix_bildlinks_import.csv | 1.639 nicht zugeordnete Cover (fuer Excel-Import) |
download_results.json | Ergebnisse ISBN-Download (live) |
download_urls_results.json | Ergebnisse URL-Download (live) |
| Spalte | Name | Bedeutung |
|---|---|---|
| A | BUCHID | Eindeutige Buch-ID (= Cover-Dateiname) |
| E | ISBN | ISBN aus Wortschatz-DB |
| F | SPRACHE | Sprache des Buches |
| G | TITEL | Buchtitel |
| H | AUTOR | Autor(en) |
| I | VERLAG | Verlag |
| J | JAHR | Erscheinungsjahr |
| AE | RECHST | Recherche-Status (Zusammenfassung) |
| AF | BILDLINK | URL zum Cover-Bild |
| AG | BILDDNR | Dateiname des Covers (BUCHID.png oder Y0_/E0_) |
| Prefix | Bedeutung | Anzahl |
|---|---|---|
BUCHID.png | Cover heruntergeladen und zugeordnet | ~24.600 |
Y0_ | Nicht abgefragt / kein Ergebnis | 60.781 |
E0_ | Vom Kunden revidiert / ausgeschieden | 8.990 |
N0_ | DNB-Abfrage ohne Bild | ~158 |
| Download | Fortschritt | OK | Fehler | Status |
|---|---|---|---|---|
| ISBN-Suche (ergaenze) | 1800/7978 | 11 | 1789 | Laeuft |
| URL-Download (vorhandene) | 700/2962 | 700 | 0 | Laeuft |
| Quelle | Betreiber | API-Key | Bewertung |
|---|---|---|---|
| ISBNdb | ISBNdb.com (kommerziell) | Bezahlt | Legal (Lizenz) |
| DNB | Deutsche Nationalbibliothek | Kostenlos | Legal (staatlich) |
| OpenLibrary | Internet Archive (Non-Profit) | Keiner | Legal (oeffentlich) |
| Google Books | Google LLC | Keiner | Legal (API ToS) |
Cover-Abbildungen fuer den Buchverkauf sind branchenueblich und rechtlich unbedenklich (Zitatrecht, Handelspraxis).
| Nr | Aufgabe | Status |
|---|---|---|
| 1 | fix_bildlinks_import.csv in Excel importieren (1.639 nicht zugeordnete Cover) | Offen |
| 2 | Download-Ergebnisse in Excel uebernehmen | Offen |
| 3 | Cloud/Hosting fuer Cover-Bilder einrichten | Offen |
| 4 | Eigene Fotos fuer aeltere Buecher erstellen | Offen |
| 5 | Plattform-Upload (ZVAB, Booklooker etc.) | Offen |