Google Bücher - Google Books

Aus Wikipedia, der freien Enzyklopädie
Google Bücher
Google Books-Logo 2015.svg
Bildschirmfoto
Google Bücher screenhot.png
Art der Website
Digitale Bibliothek
Inhaber Google
URL Bücher .google .com
Gestartet Oktober 2004 ; Vor 16 Jahren (als Google Print)  ( 2004-10 )
Aktueller Status Aktiv

Google Books (früher bekannt als Google Book Search und Google Print und unter dem Codenamen Project Ocean ) ist ein Dienst von Google Inc. , der den vollständigen Text von Büchern und Zeitschriften durchsucht, die Google gescannt und mithilfe der optischen Zeichenerkennung in Text konvertiert hat ( OCR) und in seiner digitalen Datenbank gespeichert. Bücher werden entweder von Verlagen und Autoren über das Google Books-Partnerprogramm oder von den Bibliothekspartnern von Google über das Bibliotheksprojekt bereitgestellt. Darüber hinaus hat Google mit einer Reihe von Zeitschriftenverlagen zusammengearbeitet, um ihre Archive zu digitalisieren.

Das Publisher-Programm wurde erstmals als Google Print bekannt, als es auf der Frankfurter Buchmesse im Oktober 2004 vorgestellt wurde. Das Google Books Library Project, das Werke in den Sammlungen von Bibliothekspartnern scannt und dem digitalen Inventar hinzufügt, wurde im Dezember 2004 angekündigt .

Die Google Books-Initiative wurde für ihr Potenzial gefeiert, einen beispiellosen Zugang zu dem möglicherweise größten Online-Bestand an menschlichem Wissen zu bieten und die Demokratisierung von Wissen zu fördern . Es wurde jedoch auch wegen möglicher Urheberrechtsverletzungen und mangelnder Bearbeitung kritisiert, um die vielen Fehler zu korrigieren, die durch den OCR-Prozess in die gescannten Texte eingeführt wurden.

Bis Oktober 2015 betrug die Anzahl der gescannten Buchtitel über 25 Millionen, aber der Scanvorgang in amerikanischen wissenschaftlichen Bibliotheken hat sich verlangsamt. Google schätzte 2010, dass es weltweit etwa 130 Millionen verschiedene Titel gibt, und gab an, dass alle von ihnen gescannt werden sollen. Ab Oktober 2019 feierte Google 15 Jahre Google Books und gab die Anzahl der gescannten Bücher als mehr als 40 Millionen Titel an.

Einzelheiten

Die Ergebnisse von Google Books werden sowohl in der universellen Google-Suche als auch auf der speziellen Google Books-Suchwebsite ( books.google.com ) angezeigt .

Als Antwort auf Suchanfragen können Nutzer mit Google Books ganze Seiten von Büchern anzeigen, in denen die Suchbegriffe angezeigt werden, wenn das Buch nicht urheberrechtlich geschützt ist oder wenn der Inhaber des Urheberrechts die Erlaubnis erteilt hat. Wenn Google der Ansicht ist, dass das Buch noch urheberrechtlich geschützt ist, sieht ein Nutzer "Textausschnitte" um die abgefragten Suchbegriffe. Alle Instanzen der Suchbegriffe im Buchtext werden mit einer gelben Markierung angezeigt.

Die vier in Google Books verwendeten Zugriffsebenen sind:

  • Vollansicht : Bücher im öffentlichen Bereich sind für die "Vollansicht" verfügbar und können kostenlos heruntergeladen werden. Im Rahmen des Partnerprogramms erworbene gedruckte Bücher können ebenfalls vollständig angezeigt werden, wenn der Verlag die Erlaubnis erteilt hat, obwohl dies selten der Fall ist.
  • Vorschau : Bei gedruckten Büchern, für die eine Berechtigung erteilt wurde, ist die Anzahl der sichtbaren Seiten auf eine "Vorschau" beschränkt, die durch verschiedene Zugriffsbeschränkungen und Sicherheitsmaßnahmen festgelegt wird, von denen einige auf der Benutzerverfolgung basieren. Normalerweise kann der Verlag den Prozentsatz des Buches festlegen, der für die Vorschau verfügbar ist. Benutzer dürfen keine Buchvorschau kopieren, herunterladen oder drucken. Am unteren Rand der Seiten wird ein Wasserzeichen mit der Aufschrift "Urheberrechtlich geschütztes Material" angezeigt. Alle über das Partnerprogramm erworbenen Bücher stehen zur Vorschau zur Verfügung.
  • Snippet-Ansicht : Eine "Snippet-Ansicht" - zwei bis drei Textzeilen, die den abgefragten Suchbegriff umgeben - wird angezeigt, wenn Google nicht über die Erlaubnis des Copyright-Inhabers verfügt, eine Vorschau anzuzeigen. Dies kann daran liegen, dass Google den Eigentümer nicht identifizieren kann oder der Eigentümer die Berechtigung abgelehnt hat. Wenn ein Suchbegriff in einem Buch mehrmals vorkommt, zeigt Google nicht mehr als drei Ausschnitte an, sodass der Nutzer nicht zu viel von dem Buch anzeigen kann. Außerdem zeigt Google keine Snippets für bestimmte Nachschlagewerke an, z. B. Wörterbücher, bei denen die Anzeige von sogar Snippets den Markt für die Arbeit schädigen kann. Google behauptet, dass nach dem Urheberrecht keine Erlaubnis erforderlich ist, um die Snippet-Ansicht anzuzeigen.
  • Keine Vorschau : Google zeigt auch Suchergebnisse für Bücher an, die nicht digitalisiert wurden. Da diese Bücher nicht gescannt wurden, ist ihr Text nicht durchsuchbar und nur die Metadaten wie Titel, Autor, Herausgeber, Anzahl der Seiten, ISBN, Betreff und Copyright-Informationen sowie in einigen Fällen ein Inhaltsverzeichnis und eine Buchzusammenfassung verfügbar. Tatsächlich ähnelt dies einem Online-Bibliotheksausweiskatalog.

Als Reaktion auf die Kritik von Gruppen wie der American Association of Publishers und der Authors Guild kündigte Google im August 2005 eine Opt-out- Richtlinie an, mit der Urheberrechtsinhaber eine Liste von Titeln bereitstellen können, die nicht gescannt werden sollen, und die Anfrage würde dies tun respektiert sein. Das Unternehmen gab außerdem an, dass es zwischen August und dem 1. November 2005 keine urheberrechtlich geschützten Bücher scannen werde, um den Eigentümern die Möglichkeit zu geben, zu entscheiden, welche Bücher vom Projekt ausgeschlossen werden sollen. Somit haben Urheberrechtsinhaber in Bezug auf jedes Werk drei Möglichkeiten:

  1. Es kann am Partnerprogramm teilnehmen, um ein Buch für die Vorschau oder die vollständige Ansicht verfügbar zu machen. In diesem Fall werden die Einnahmen aus der Anzeige von Seiten aus der Arbeit als Antwort auf Benutzeranfragen geteilt.
  2. Damit kann Google das Buch unter dem Bibliotheksprojekt scannen und als Antwort auf Benutzeranfragen Ausschnitte anzeigen.
  3. Das Bibliotheksprojekt kann deaktiviert werden. In diesem Fall scannt Google das Buch nicht. Wenn das Buch bereits gescannt wurde, setzt Google seine Zugriffsebene auf "Keine Vorschau" zurück.

Die meisten gescannten Werke sind nicht mehr gedruckt oder im Handel erhältlich.

Neben der Beschaffung von Büchern aus Bibliotheken erhält Google über das "Partnerprogramm" auch Bücher von seinen Verlagspartnern, mit denen Verlage und Autoren für ihre Bücher werben können. Verleger und Autoren senden entweder eine digitale Kopie ihres Buches im EPUB- oder PDF- Format oder eine Druckversion an Google, die in Google Books zur Vorschau zur Verfügung gestellt wird. Der Verlag kann den Prozentsatz des Buches steuern, der für die Vorschau verfügbar ist, wobei der Mindestwert 20% beträgt. Sie können das Buch auch vollständig anzeigen und Benutzern sogar das Herunterladen einer PDF-Kopie ermöglichen. Bücher können auch bei Google Play zum Verkauf angeboten werden. Im Gegensatz zum Bibliotheksprojekt wirft dies keine urheberrechtlichen Bedenken auf, da es gemäß einer Vereinbarung mit dem Verlag durchgeführt wird. Der Verlag kann jederzeit vom Vertrag zurücktreten.

Bei vielen Büchern zeigt Google Books die ursprünglichen Seitenzahlen an. Doch Tim Parks , in schriftlicher Form The New York Review of Books im Jahr 2014 festgestellt , dass Google hatte für viele aktuellen Publikationen Bereitstellung von Seitenzahlen gestoppt (wahrscheinlich die durch das Partner - Programm erworben sind) „vermutlich in Verbindung mit den Verlagen, um der Kraft diejenigen von uns, die Fußnoten vorbereiten müssen, um Papierausgaben zu kaufen. "

Scannen von Büchern

Das Projekt begann im Jahr 2002 unter dem Codenamen Project Ocean. Google-Mitbegründer Larry Page hatte schon immer Interesse an der Digitalisierung von Büchern. Als er und Marissa Mayer 2002 anfingen, mit dem Scannen von Büchern zu experimentieren , brauchten sie 40 Minuten, um ein 300-seitiges Buch zu digitalisieren. Aber kurz nachdem die Technologie so weit entwickelt worden war, dass Scan-Bediener bis zu 6000 Seiten pro Stunde scannen konnten.

Google richtete ausgewiesene Scan-Zentren ein, zu denen Bücher mit Lastwagen transportiert wurden. Die Sender konnten mit einer Geschwindigkeit von 1.000 Seiten pro Stunde digitalisieren. Die Bücher wurden in eine speziell angefertigte mechanische Halterung gelegt, die den Buchrücken für das Scannen in Position brachte. Es wurde eine Reihe von Lichtern und optischen Instrumenten verwendet - darunter vier Kameras, von denen zwei auf jede Hälfte des Buches gerichtet waren, und ein Entfernungsmesser LIDAR , der ein dreidimensionales Lasergitter auf der Buchoberfläche überlagerte, um die Krümmung des Papiers zu erfassen. Ein menschlicher Bediener würde die Seiten von Hand umblättern und die Kameras über ein Fußpedal bedienen. Das System wurde effizient gestaltet, da die Buchseiten nicht abgeflacht oder perfekt ausgerichtet werden mussten. Die Rohbilder wurden mit De-Warping-Algorithmen bearbeitet, die die LIDAR-Daten zur Verarbeitung verwendeten. Die optische Zeichenerkennungssoftware (OCR) wurde entwickelt, um die Rohbilder zu Text zu verarbeiten. Es wurden auch Algorithmen erstellt, um Seitenzahlen, Fußnoten, Abbildungen und Diagramme zu extrahieren.

Viele der Bücher werden mit einer angepassten Elphel 323-Kamera mit einer Geschwindigkeit von 1.000 Seiten pro Stunde gescannt . Ein 2009 an Google erteiltes Patent ergab, dass Google ein innovatives System zum Scannen von Büchern entwickelt hat, bei dem zwei Kameras und Infrarotlicht verwendet werden, um die Krümmung der Seiten in einem Buch automatisch zu korrigieren. Durch das Erstellen eines 3D-Modells für jede Seite und das anschließende "De-Warping" dieser Seite kann Google flach aussehende Seiten präsentieren, ohne die Seiten wirklich flach machen zu müssen, was die Verwendung destruktiver Methoden wie Entbinden oder Glasplatten erfordert Reduzieren Sie jede Seite, was für das Scannen in großem Maßstab ineffizient ist.

Website-Funktionalität

Jedes Buch in Google Books verfügt über eine Übersichtsseite, auf der analytische Informationen wie eine Wortkarte der am häufigsten verwendeten Wörter und Phrasen, eine Liste wissenschaftlicher Artikel und andere Bücher, in denen das Buch zitiert wird, Inhaltsverzeichnisse usw. angezeigt werden. Diese werden mithilfe automatisierter Methoden zusammengestellt Manchmal werden jedoch Daten aus Quellen von Drittanbietern verwendet. In einigen Fällen kann auch eine Buchzusammenfassung angezeigt werden. Außerdem werden bibliografische Informationen angezeigt, die als Zitate in Standardformaten exportiert werden können . Registrierte Nutzer, die mit ihren Google-Konten angemeldet sind, können Rezensionen für Bücher veröffentlichen. In Google Books werden neben diesen Bewertungen auch Bewertungen von Goodreads angezeigt .

Der Dienst ermöglicht die Anbindung an Büchern , die mit ISBN , LCCN oder OCLC Rekordzahlen. Die Übersichtsseite eines Buches mit der ISBN 123456789X kann als https://books.google.com/books?vid=ISBN123456789X verlinkt werden . Bei einigen Büchern ist es auch möglich, mithilfe eines geeigneten Parameters direkt auf die Titelseite, die Titelseite, die Copyright-Seite, das Inhaltsverzeichnis, den Index und die Rückseite zu verlinken. Beispielsweise kann die Titelseite eines Buches mit der OCLC-Nummer 17546826 als https://books.google.com/books?vid=OCLC17546826&printsec=frontcover verlinkt werden .

Benutzer, die mit einem Google-Konto signiert sind, können eine personalisierte "Bibliothek" von Büchern erstellen, die mithilfe von "Bücherregalen" organisiert ist und auch öffentlich sichtbar gemacht werden kann.

Ngram Viewer

Der Ngram Viewer ist ein mit Google Books verbundener Dienst, der die Häufigkeit der Wortverwendung in der gesamten Buchsammlung grafisch darstellt. Der Dienst ist für Historiker und Linguisten wichtig, da er durch den Gebrauch von Wörtern über Zeiträume hinweg einen Einblick in die menschliche Kultur geben kann. Dieses Programm wurde wegen Fehlern in den im Programm verwendeten Metadaten kritisiert.

Inhaltliche Fragen und Kritik

Das Projekt wurde kritisiert, dass sein erklärtes Ziel, verwaiste und vergriffene Werke zu erhalten, gefährdet ist, weil gescannte Daten fehlerhaft sind und solche Probleme nicht gelöst werden.

Benutzer können Fehler in von Google gescannten Büchern unter support.google.com/books/partner/troubleshooter/2983879 melden .

Scanfehler

Eine Hand, die in einem Google-Buch gescannt wurde

Der Scanvorgang ist fehlerbehaftet. Beispielsweise sind einige Seiten möglicherweise nicht lesbar, verkehrt herum oder in der falschen Reihenfolge. Wissenschaftler haben sogar über zerknitterte Seiten berichtet, Daumen und Finger verdeckt und Bilder verschmiert oder verschwommen. Zu diesem Thema heißt es in einer Erklärung von Google am Ende der gescannten Bücher:

Die Digitalisierung auf der grundlegendsten Ebene basiert auf Seitenbildern der physischen Bücher. Um dieses Buch als ePub-formatierte Datei verfügbar zu machen, haben wir diese Seitenbilder aufgenommen und den Text mithilfe der Optical Character Recognition (kurz OCR) -Technologie extrahiert. Das Extrahieren von Text aus Seitenbildern ist eine schwierige technische Aufgabe. Verschmutzungen auf den Seiten der physischen Bücher, ausgefallene Schriftarten, alte Schriftarten, zerrissene Seiten usw. können zu Fehlern im extrahierten Text führen. Unvollkommene OCR ist nur die erste Herausforderung für das ultimative Ziel, von Sammlungen von Seitenbildern zu Büchern mit extrahiertem Text überzugehen. Unsere Computeralgorithmen müssen auch automatisch die Struktur des Buches bestimmen (was sind die Kopf- und Fußzeilen, wo Bilder platziert werden, ob Text Vers oder Prosa ist und so weiter). Wenn wir dies richtig machen, können wir das Buch so rendern, dass es dem Format des Originalbuchs entspricht. Trotz unserer Bemühungen können in diesem Buch Rechtschreibfehler, Müllzeichen, überflüssige Bilder oder fehlende Seiten auftreten. Nach unseren Schätzungen sollten diese Fehler Sie nicht daran hindern, den Inhalt des Buches zu genießen. Die technischen Herausforderungen bei der automatischen Erstellung eines perfekten Buches sind gewaltig, aber wir verbessern weiterhin unsere OCR- und Buchstruktur-Extraktionstechnologien.

Ab 2009 gab Google bekannt, dass ReCAPTCHA zur Behebung der in Google Book-Scans gefundenen Fehler eingesetzt werden soll. Diese Methode würde nur gescannte Wörter verbessern, die aufgrund des Scanvorgangs schwer zu erkennen sind und Fehler wie umgedrehte Seiten oder blockierte Wörter nicht beheben können.

Fehler in Metadaten

Wissenschaftler haben häufig weit verbreitete Fehler in den Metadateninformationen in Google Books gemeldet - einschließlich falsch zugeschriebener Autoren und fehlerhafter Veröffentlichungsdaten. Geoffrey Nunberg , ein Linguist, der die Veränderungen im Wortgebrauch im Laufe der Zeit untersuchte, stellte fest, dass eine Suche nach Büchern, die vor 1950 veröffentlicht wurden und das Wort "Internet" enthielten, zu unwahrscheinlichen 527 Ergebnissen führte. Woody Allen wird in 325 Büchern erwähnt, die angeblich vor seiner Geburt veröffentlicht wurden. Google reagierte auf Nunberg, indem es den externen Auftragnehmern die Schuld an den meisten Fehlern gab.

Weitere gemeldete Metadatenfehler sind Veröffentlichungsdaten vor der Geburt des Autors (z. B. 182 Werke von Charles Dickens vor seiner Geburt im Jahr 1812); falsche Fachklassifikationen (eine Ausgabe von Moby Dick unter "Computer", eine Biographie von Mae West unter "Religion"), widersprüchliche Klassifikationen (10 Ausgaben von Whitmans Grasblättern, alle als "Fiktion" und "Sachbuch" klassifiziert), falsch geschriebene Titel, Autoren und Verleger ( Moby Dick: oder die weiße "Mauer" ) und Metadaten für ein Buch, die fälschlicherweise an ein völlig anderes Buch angehängt wurden (die Metadaten für ein mathematisches Werk von 1818 führen zu einem Liebesroman von 1963).

Es wurde eine Überprüfung der Metadatenelemente für Autor, Titel, Herausgeber und Veröffentlichungsjahr für 400 zufällig ausgewählte Google Books-Datensätze durchgeführt. Die Ergebnisse zeigen, dass 36% der im Digitalisierungsprojekt untersuchten Bücher Metadatenfehler enthielten. Diese Fehlerrate ist höher als in einem typischen Online-Bibliothekskatalog zu erwarten.

Die in dieser Studie festgestellte Gesamtfehlerrate von 36,75% legt nahe, dass die Metadaten von Google Books eine hohe Fehlerrate aufweisen. Während "große" und "kleine" Fehler eine subjektive Unterscheidung sind, die auf dem etwas unbestimmten Konzept der "Auffindbarkeit" basiert, sollten die Fehler, die in den vier in dieser Studie untersuchten Metadatenelementen gefunden wurden, alle als schwerwiegend angesehen werden.

Metadatenfehler aufgrund falscher gescannter Daten erschweren die Recherche mithilfe der Google Books Project-Datenbank. Google hat nur begrenztes Interesse an der Bereinigung dieser Fehler gezeigt.

Sprachprobleme

Einige europäische Politiker und Intellektuelle haben Googles Bemühungen aus Gründen des sprachlichen Imperialismus kritisiert . Sie argumentieren, dass die überwiegende Mehrheit der Bücher, die gescannt werden sollen, auf Englisch ist, was zu einer unverhältnismäßigen Darstellung natürlicher Sprachen in der digitalen Welt führen wird. Deutsch, Russisch, Französisch und Spanisch sind beispielsweise beliebte Sprachen in der Wissenschaft. Die unverhältnismäßige Online-Betonung des Englischen könnte jedoch den Zugang zur historischen Wissenschaft und letztendlich das Wachstum und die Richtung der zukünftigen Wissenschaft beeinflussen. Zu diesen Kritikern gehört Jean-Noël Jeanneney , der frühere Präsident der Bibliothèque nationale de France .

Google Books versus Google Scholar

Während Google Books eine große Anzahl früherer Zeitschriftenausgaben digitalisiert hat, enthalten die Scans nicht die Metadaten, die zur Identifizierung bestimmter Artikel in bestimmten Ausgaben erforderlich sind. Dies hat die Macher von Google Scholar dazu veranlasst, ein eigenes Programm zur Digitalisierung und zum Hosting älterer Zeitschriftenartikel zu starten (in Übereinstimmung mit ihren Herausgebern).

Bibliothekspartner

Die Google Books Library Project ist auf das Scannen gerichtet und machen durchsuchbare die Sammlungen mehrerer großer Forschungsbibliotheken . Neben bibliografischen Informationen können häufig Textausschnitte aus einem Buch angezeigt werden. Wenn ein Buch nicht urheberrechtlich geschützt und gemeinfrei ist, kann es vollständig gelesen oder heruntergeladen werden .

Durch das Bibliotheksprojekt gescannte urheberrechtlich geschützte Bücher werden in Google Books für die Snippet-Ansicht zur Verfügung gestellt. In Bezug auf die Qualität von Scans erkennt Google an, dass sie "nicht immer von ausreichend hoher Qualität" sind, um bei Google Play zum Verkauf angeboten zu werden. Aufgrund angeblicher technischer Einschränkungen ersetzt Google Scans nicht durch höherwertige Versionen, die möglicherweise von den Herausgebern bereitgestellt werden.

Das Projekt ist Gegenstand der Klage von Authors Guild gegen Google , die 2005 eingereicht und 2013 zugunsten von Google und 2015 im Berufungsverfahren entschieden wurde.

Urheberrechtsinhaber können die Rechte für ein gescanntes Buch beanspruchen und es für die Vorschau oder Vollansicht verfügbar machen (indem sie es auf ihr Partnerprogrammkonto "übertragen") oder Google auffordern, die Suche nach dem Buchtext zu verhindern.

Die Zahl der am Bibliotheksprojekt teilnehmenden Institutionen ist seit seiner Gründung gestiegen.

Erste Partner

Hinweis zum Projekt in der Michigan University Library
  • Harvard University , Harvard University Library
    Die Harvard University Library und Google führten 2005 ein Pilotprojekt durch. Das Projekt wurde mit dem Ziel fortgesetzt, den Online-Zugang zu den Beständen der Harvard University Library zu verbessern, die mehr als 15,8 Millionen Bände umfasst. Während der physische Zugang zu Harvards Bibliotheksmaterialien im Allgemeinen auf aktuelle Harvard-Studenten, Fakultäten und Forscher oder auf Wissenschaftler beschränkt ist, die nach Cambridge kommen können, wurde das Harvard-Google-Projekt so konzipiert, dass sowohl Mitglieder der Harvard-Community als auch Benutzer überall etwas entdecken können arbeitet in der Harvard-Sammlung.
  • Universität von Michigan , Bibliothek der Universität von Michigan
Bis März 2012 wurden 5,5 Millionen Bände gescannt.

Zusätzliche Partner

Andere institutionelle Partner haben sich dem Projekt angeschlossen, seit die Partnerschaft erstmals bekannt gegeben wurde:

Die Partnerschaft bestand darin, die lateinamerikanische Sammlung der Bibliothek zu digitalisieren - etwa eine halbe Million Bände.
Bis März 2012 wurden rund 600.000 Bände gescannt.

Geschichte

2002 : Eine Gruppe von Teammitgliedern bei Google startet offiziell das "geheime" Buchprojekt ". Die Google-Gründer Sergey Brin und Larry Page kamen auf die Idee, die 1996 zu Google Books wurde, als sie noch Studenten in Stanford waren. Die Verlaufsseite auf der Google Books-Website beschreibt ihre ursprüngliche Vision für dieses Projekt: "In einer zukünftigen Welt, in der es riesig ist." Büchersammlungen werden digitalisiert. Die Benutzer verwenden einen " Webcrawler ", um den Inhalt der Bücher zu indizieren und die Verbindungen zwischen ihnen zu analysieren. Dabei wird die Relevanz und Nützlichkeit eines bestimmten Buches ermittelt, indem die Anzahl und Qualität der Zitate aus anderen Büchern verfolgt wird. " Dieses Team besuchte die Standorte einiger der zu dieser Zeit größeren Digitalisierungsbemühungen, darunter das American Memory Project der Library of Congress , Project Gutenberg , und die Universal Library, um herauszufinden, wie sie funktionieren, sowie die University of Michigan, die Alma Mater von Page. und die Basis für Digitalisierungsprojekte wie JSTOR und Making of America. In einem Gespräch mit der damaligen Universitätspräsidentin Mary Sue Coleman , als Page herausfand, dass die derzeitige Schätzung der Universität für das Scannen aller Bibliotheksbände 1.000 Jahre betrug, sagte Page Coleman Berichten zufolge, dass er "glaubt, dass Google dazu beitragen kann, dies in sechs Jahren zu erreichen." ""

2003 : Das Team arbeitet an der Entwicklung eines Hochgeschwindigkeits-Scanprozesses sowie einer Software zur Lösung von Problemen mit ungeraden Schriftgrößen, ungewöhnlichen Schriftarten und "anderen unerwarteten Besonderheiten".

Dezember 2004 : Google signalisiert eine Erweiterung seiner Google Print-Initiative, die als Google Print Library Project bekannt ist. Google kündigte Partnerschaften mit mehreren hochkarätigen Universitäts- und öffentlichen Bibliotheken an, darunter der University of Michigan , Harvard ( Harvard University Library ), Stanford ( Green Library ), Oxford ( Bodleian Library ) und der New York Public Library . Laut Pressemitteilungen und Universitätsbibliothekaren plante Google, innerhalb eines Jahrzehnts rund 15 Millionen Bände über seinen Google Books-Dienst zu digitalisieren und verfügbar zu machen. Die Ankündigung löste bald Kontroversen aus, als Verlags- und Autorenverbände Googles Pläne zur Digitalisierung in Frage stellten, nicht nur öffentlich zugängliche Bücher, sondern auch noch urheberrechtlich geschützte Titel.

September - Oktober 2005 : In zwei Gerichtsverfahren gegen Google wird angeklagt, dass das Unternehmen die Urheberrechte nicht respektiert und Autoren und Herausgeber nicht angemessen entschädigt hat. Eine ist eine Sammelklage im Namen von Autoren (Authors Guild gegen Google, 20. September 2005) und die andere ist eine Zivilklage von fünf großen Verlagen und der Association of American Publishers . ( McGraw Hill gegen Google , 19. Oktober 2005)

November 2005 : Google hat den Namen dieses Dienstes von Google Print in Google Buchsuche geändert. Das Programm, mit dem Verlage und Autoren ihre Bücher in den Dienst aufnehmen können, wurde in Google Books Partner Program umbenannt, und die Partnerschaft mit Bibliotheken wurde zu Google Books Library Project .

2006 : Google hat allen nicht urheberrechtlich geschützten, gemeinfreien Büchern einen "PDF herunterladen" -Button hinzugefügt. Es wurde auch eine neue Browsing-Oberfläche zusammen mit neuen "Über dieses Buch" -Seiten hinzugefügt.

August 2006 : Das System der University of California gibt bekannt, dass es sich dem Digitalisierungsprojekt Books anschließen wird. Dies umfasst einen Teil der 34 Millionen Volumes in den ungefähr 100 vom System verwalteten Bibliotheken.

September 2006 : Die Complutense-Universität von Madrid ist die erste spanischsprachige Bibliothek, die sich dem Google Books Library Project anschließt.

Oktober 2006 : Die University of Wisconsin - Madison gibt bekannt, dass sie sich zusammen mit der Wisconsin Historical Society Library dem Digitalisierungsprojekt Book Search anschließen wird . Zusammen haben die Bibliotheken 7,2 Millionen Bestände.

November 2006 : Die University of Virginia tritt dem Projekt bei. Die Bibliotheken enthalten mehr als fünf Millionen Bände und mehr als 17 Millionen Manuskripte, seltene Bücher und Archive.

Januar 2007 : Die University of Texas in Austin gibt bekannt, dass sie dem Digitalisierungsprojekt Book Search beitreten wird. Von den 13 Bibliotheksstandorten der Universität würden mindestens eine Million Bände digitalisiert.

März 2007 : Die Bayerische Staatsbibliothek gibt eine Partnerschaft mit Google bekannt, um mehr als eine Million gemeinfreie und vergriffene Werke in Deutsch sowie Englisch, Französisch, Italienisch, Latein und Spanisch zu scannen.

Mai 2007 : Eine Projektpartnerschaft zur Digitalisierung von Büchern wurde gemeinsam von Google und der Kantons- und Universitätsbibliothek von Lausanne angekündigt .

Mai 2007 : Die Boekentoren- Bibliothek der Universität Gent gibt bekannt, dass sie sich mit Google an der Digitalisierung und Online- Bereitstellung digitalisierter Versionen von Büchern des 19. Jahrhunderts in französischer und niederländischer Sprache beteiligen wird.

Mai 2007: Die Mysore University gibt bekannt, dass Google über 800.000 Bücher und Manuskripte digitalisieren wird - darunter rund 100.000 Manuskripte, die in Sanskrit oder Kannada sowohl auf Papier als auch auf Palmblättern geschrieben sind.

Juni 2007 : Der Ausschuss für institutionelle Zusammenarbeit ( 2016 in Big Ten Academic Alliance umbenannt) gab bekannt, dass seine zwölf Mitgliedsbibliotheken im Laufe der nächsten sechs Jahre am Scannen von 10 Millionen Büchern teilnehmen werden.

Juli 2007 : Die Keio University wird Googles erster Bibliothekspartner in Japan mit der Ankündigung, mindestens 120.000 gemeinfreie Bücher zu digitalisieren.

August 2007 : Google hat angekündigt, bis zu 500.000 urheberrechtlich geschützte und gemeinfreie Objekte aus der Cornell University Library zu digitalisieren . Google würde auch eine digitale Kopie aller gescannten Werke bereitstellen, die in das Bibliothekssystem der Universität aufgenommen werden sollen.

September 2007 : Google hat eine Funktion hinzugefügt, mit der Nutzer Ausschnitte von Büchern freigeben können, die gemeinfrei sind. Die Schnipsel werden möglicherweise genau so angezeigt wie beim Scannen des Buches oder als einfacher Text.

September 2007 : Google hat eine neue Funktion namens "Meine Bibliothek" eingeführt, mit der Benutzer persönliche benutzerdefinierte Bibliotheken, eine Auswahl von Büchern erstellen können, die sie beschriften, überprüfen, bewerten oder im Volltext suchen können.

Dezember 2007 : Die Columbia University wurde als Partner für die Digitalisierung gemeinfreier Werke hinzugefügt.

Mai 2008 : Microsoft hat sich verjüngt und plant, sein Scan-Projekt zu beenden , das 750.000 Bücher und 80 Millionen Zeitschriftenartikel erreicht hat.

Oktober 2008 : Nach zweijähriger Verhandlung wurde eine Einigung zwischen der Verlagsbranche und Google erzielt. Google erklärte sich bereit, Autoren und Verleger im Austausch für das Recht zu entschädigen, Millionen von Büchern der Öffentlichkeit zugänglich zu machen.

November 2008 : Google hat die Marke von 7 Millionen Büchern für Artikel erreicht, die von Google und seinen Verlagspartnern gescannt wurden. 1 Million befanden sich im vollständigen Vorschaumodus und 1 Million waren vollständig sichtbare und herunterladbare gemeinfreie Werke. Ungefähr fünf Millionen waren vergriffen .

Dezember 2008 : Google gibt die Aufnahme von Zeitschriften in Google Books bekannt. Zu den Titeln gehören New York Magazine , Ebony und Popular Mechanics

Februar 2009 : Google hat eine mobile Version der Google Buchsuche eingeführt, mit der iPhone- und Android-Nutzer über 1,5 Millionen gemeinfreie Werke in den USA (und über 500.000 außerhalb der USA) mit einem mobilen Browser lesen können. Anstelle von Seitenbildern wird der Klartext des Buches angezeigt.

Mai 2009 : Auf der jährlichen BookExpo in New York gab Google seine Absicht bekannt, ein Programm einzuführen, mit dem Verlage digitale Versionen ihrer neuesten Bücher über Google direkt an Verbraucher verkaufen können.

Dezember 2009 : Ein französisches Gericht hat das Scannen von in Frankreich veröffentlichten urheberrechtlich geschützten Büchern eingestellt und erklärt, dies verstoße gegen das Urheberrecht. Es war der erste große rechtliche Verlust für das Scanprojekt.

April 2010 : Bildende Künstler wurden nicht in die vorherige Klage und Einigung einbezogen, sind die Klägergruppen in einer anderen Klage und beabsichtigen, mehr als nur Google Books unter die Lupe zu nehmen. "Die neue Sammelklage", heißt es in der Erklärung, "geht über das Bibliotheksprojekt von Google hinaus und umfasst die anderen systematischen und allgegenwärtigen Verstöße von Google gegen die Rechte von Fotografen, Illustratoren und anderen bildenden Künstlern."

Mai 2010 : Es wurde berichtet, dass Google einen digitalen Buchladen namens Google Editions eröffnen würde . Es würde mit Amazon, Barnes & Noble, Apple und anderen elektronischen Buchhändlern mit einem eigenen E-Book-Shop konkurrieren. Im Gegensatz zu anderen ist Google Editions vollständig online und erfordert kein bestimmtes Gerät (z. B. Kindle, Nook oder iPad).

Juni 2010 : Google hat 12 Millionen gescannte Bücher übergeben.

August 2010 : Es wurde bekannt gegeben, dass Google beabsichtigt, alle bekannten 129.864.880 Bücher innerhalb eines Jahrzehnts zu scannen, was insgesamt über 4 Milliarden digitalen Seiten und 2 Billionen Wörtern entspricht.

Dezember 2010 : Google eBooks (Google Editions) wurden in den USA eingeführt.

Dezember 2010 : Google hat den Ngram Viewer eingeführt, der Daten zur Wortverwendung in seiner Büchersammlung sammelt und grafisch darstellt.

März 2011 : Ein Bundesrichter lehnte die zwischen der Verlagsbranche und Google erzielte Einigung ab .

März 2012 : Google hat 20 Millionen gescannte Bücher übergeben.

März 2012 : Google hat eine Einigung mit Publishern erzielt.

Januar 2013 : Der Dokumentarfilm Google and the World Brain wurde auf dem Sundance Film Festival gezeigt .

November 2013 : Entscheidung in der Authors Guild gegen Google , US-Bezirksrichter Denny Chin, tritt unter Berufung auf eine faire Verwendung für Google ein. Die Autoren sagten, sie würden Berufung einlegen.

Oktober 2015 : Das Berufungsgericht hat sich auf die Seite von Google gestellt und erklärt, dass Google nicht gegen das Urheberrecht verstoßen hat. Laut der New York Times hat Google mehr als 25 Millionen Bücher gescannt.

April 2016 : Der Oberste Gerichtshof der USA lehnte es ab, die Berufung der Authors Guild zu hören, was bedeutet, dass die Entscheidung des Untergerichts stand. Google darf Bibliotheksbücher scannen und Ausschnitte in Suchergebnissen anzeigen, ohne gegen das Gesetz zu verstoßen.

Status

Google hat seine Pläne für die Zukunft des Google Books-Projekts ziemlich geheim gehalten. Die Scanvorgänge haben sich seit mindestens 2012 verlangsamt, wie die Bibliothekare mehrerer Partnerinstitutionen von Google bestätigten. An der Universität von Wisconsin hatte sich die Geschwindigkeit auf weniger als die Hälfte des Wertes von 2006 verringert. Die Bibliothekare sagten jedoch, dass das abnehmende Tempo ein natürliches Ergebnis der Reifung des Projekts sein könnte - zunächst wurden Stapel von Büchern vollständig in Anspruch genommen Scannen, während jetzt nur die Titel berücksichtigt werden mussten, die noch nicht gescannt wurden. Auf der firmeneigenen Google Books-Timeline-Seite wurde nach 2007 auch 2017 nichts erwähnt, und das Google Books-Blog wurde 2012 in das Google Search-Blog integriert.

Trotz des Gewinns des jahrzehntelangen Rechtsstreits im Jahr 2017 hat The Atlantic erklärt , dass Google "seinen Scanvorgang so gut wie eingestellt hat". Im April 2017 berichtete Wired , dass nur wenige Google-Mitarbeiter an dem Projekt arbeiteten und neue Bücher noch gescannt wurden, jedoch mit einer deutlich geringeren Rate. Der jahrzehntelange Rechtsstreit habe dazu geführt, dass Google seinen Ehrgeiz verloren habe.

Rechtsfragen

Während des Projekts wurden Bibliotheksbücher unabhängig vom Urheberrechtsstatus etwas wahllos digitalisiert, was zu einer Reihe von Klagen gegen Google führte. Bis Ende 2008 hatte Google Berichten zufolge über sieben Millionen Bücher digitalisiert, von denen nur etwa eine Million gemeinfrei waren. Von den übrigen waren eine Million urheberrechtlich und in gedruckter Form und fünf Millionen urheberrechtlich geschützt, jedoch vergriffen. Im Jahr 2005 erhob eine Gruppe von Autoren und Verlegern eine Sammelklage gegen Google wegen Verletzung der urheberrechtlich geschützten Werke. Google argumentierte, dass es "verwaiste Werke" bewahrt - Bücher, die noch urheberrechtlich geschützt sind, deren Urheberrechtsinhaber jedoch nicht gefunden werden konnten.

Die Authors Guild und die Association of American Publishers verklagten Google 2005 separat wegen ihres Buchprojekts unter Berufung auf "massive Urheberrechtsverletzung ". Google konterte, dass sein Projekt eine faire Verwendung darstelle und das digitale Zeitalter eines Kartenkatalogs sei, wobei jedes Wort in der Publikation indexiert sei. Die Klagen wurden konsolidiert und schließlich eine Einigung vorgeschlagen . Der Vergleich erhielt erhebliche Kritik aus einer Vielzahl von Gründen, einschließlich Kartellrecht, Datenschutz und Unzulänglichkeit der vorgeschlagenen Klassen von Autoren und Verlegern. Die Einigung wurde schließlich abgelehnt, und die Verlage siedelten sich bald darauf mit Google an. Die Authors Guild setzte ihren Fall fort und im Jahr 2011 wurde ihre vorgeschlagene Klasse zertifiziert . Google legte gegen diese Entscheidung Berufung ein, wobei eine Reihe von Amici die Unzulänglichkeit der Klasse geltend machten. Der Second Circuit lehnte die Klassenzertifizierung im Juli 2013 ab und verwies den Fall an das Bezirksgericht, um die Verteidigung gegen den fairen Gebrauch von Google zu prüfen .

Im Jahr 2015 legte die Authors Guild eine weitere Beschwerde gegen Google ein, die vom 2. US-Berufungsgericht in New York geprüft werden sollte. Google gewann den Fall einstimmig mit dem Argument, dass sie den Menschen nicht die Volltexte, sondern Ausschnitte zeigten und es den Menschen nicht erlaubten, das Buch illegal zu lesen. In einem Bericht erklärten die Gerichte, dass sie nicht gegen das Urheberrecht verstoßen, da sie durch die Fair-Use-Klausel geschützt sind.

Die Authors Guild versuchte 2016 erneut, gegen die Entscheidung Berufung einzulegen, und diesmal wurde ihr Fall vom Obersten Gerichtshof geprüft. Der Fall wurde abgelehnt, wobei die Entscheidung des Second Circuit über den Fall intakt blieb, was bedeutet, dass Google nicht gegen das Urheberrecht verstoßen hat. Dieser Fall stellte auch einen Präzedenzfall für einen anderen Fall dar, der in Bezug auf Fair-Use-Gesetze ähnlich ist, da er das Gesetz weiter präzisiert und erweitert. Eine solche Klarstellung ist im neuen digitalen Zeitalter wichtig, da sie andere Scan-Projekte betrifft, die Google ähneln.

Andere Klagen folgten der Führung der Authors Guild. Im Jahr 2006 wurde eine zuvor eingereichte deutsche Klage zurückgezogen. Im Juni 2006 gab Hervé de la Martinière, ein französischer Verlag namens La Martinière und Éditions du Seuil , seine Absicht bekannt, Google Frankreich zu verklagen. Im Jahr 2009 gewährte das Pariser Zivilgericht Schadensersatz und Zinsen in Höhe von 300.000 EUR (ca. 430.000 USD ) und forderte Google auf, 10.000 EUR pro Tag zu zahlen, bis die Bücher des Herausgebers aus seiner Datenbank entfernt wurden. Das Gericht schrieb: "Google hat gegen das Urheberrecht des Autors verstoßen, indem es Bücher, die Seuil ohne seine Erlaubnis besitzt, vollständig reproduziert und zugänglich gemacht hat." Google hat "Urheberrechtsverletzungen begangen, die den Herausgebern schaden". Google sagte, es wird ansprechen. Laut Syndicat National de l'Edition, das sich der Klage angeschlossen hat, hat Google etwa 100.000 urheberrechtlich geschützte französische Werke gescannt.

Im Dezember 2009 reichte die chinesische Autorin Mian Mian eine Zivilklage gegen Google in Höhe von 8.900 US-Dollar ein, weil sie ihren Roman Acid Lovers gescannt hatte . Dies ist die erste Klage dieser Art gegen Google in China. Im November dieses Jahres beschuldigte die China Written Works Copyright Society (CWWCS) Google, 18.000 Bücher von 570 chinesischen Schriftstellern ohne Genehmigung gescannt zu haben. Google erklärte sich am 20. November damit einverstanden, eine Liste der gescannten chinesischen Bücher bereitzustellen, doch das Unternehmen gab nicht zu, dass es gegen das Urheberrecht "verstoßen" hatte.

Im März 2007 beschuldigte Thomas Rubin, Associate General Counsel für Urheber-, Marken- und Geschäftsgeheimnisse bei Microsoft, Google, mit seinem Buchsuchdienst gegen das Urheberrecht verstoßen zu haben. Rubin kritisierte ausdrücklich die Politik von Google, Werke frei zu kopieren, bis der Inhaber des Urheberrechts mitteilt, dass sie aufhören sollen.

Die Google-Lizenzierung von gemeinfreien Werken ist aufgrund der Verwendung digitaler Wasserzeichentechniken in den Büchern ebenfalls ein Problem . Einige veröffentlichte Werke, die gemeinfrei sind, wie alle von der US-Bundesregierung geschaffenen Werke , werden weiterhin wie andere urheberrechtlich geschützte Werke behandelt und daher nach 1922 gesperrt.

Ähnliche Projekte

  • Das Projekt Gutenberg ist eine freiwillige Initiative zur Digitalisierung und Archivierung kultureller Werke, um "die Erstellung und Verbreitung von eBooks zu fördern". Es wurde 1971 von Michael S. Hart gegründet und ist die älteste digitale Bibliothek. Zum 3. Oktober 2015 erreichte das Projekt Gutenberg 50.000 Objekte in seiner Sammlung.
  • Internet Archive ist eine gemeinnützige Organisation, die täglich über 1000 Bücher digitalisiert und Bücher aus Google Books und anderen Quellen widerspiegelt. Im Mai 2011 wurden mehr als 2,8 Millionen gemeinfreie Bücher gehostet, mehr als ungefähr 1 Million gemeinfreie Bücher bei Google Books. Open Library , ein Schwesterprojekt von Internet Archive, verleiht den Besuchern von 150 Bibliotheken 80.000 gescannte und gekaufte kommerzielle E-Books.
  • HathiTrust unterhält seit dem 13. Oktober 2008 die HathiTrust Digital Library, in der von Google gescanntes Material, einige der Bücher des Internetarchivs und andere lokal von Partnerinstitutionen gescannt werden. Bis Mai 2010 umfasste es etwa 6 Millionen Bände, von denen über 1 Million gemeinfrei sind (zumindest in den USA).
  • ACLS Humanities E-Book , eine Online-Sammlung von über 5.400 Büchern von hoher Qualität in den Geistes- und verwandten Sozialwissenschaften, die über ein institutionelles Abonnement zugänglich sind.
  • Microsoft finanzierte Ende 2006 das Scannen von 300.000 Büchern, um Live Search- Bücher zu erstellen . Es lief bis Mai 2008, als das Projekt abgebrochen und die Bücher im Internetarchiv frei verfügbar gemacht wurden.
  • Die National Digital Library of India (NDLI) ist ein Projekt des indischen Ministeriums für Personalentwicklung. Ziel ist es, mehrere nationale und internationale digitale Bibliotheken in einem einzigen Webportal zu integrieren. Das NDLI bietet kostenlosen Zugang zu vielen Büchern in englischer und indischer Sprache.
  • Europeana verlinkt ab 2010 auf rund 10 Millionen digitale Objekte, darunter Videos, Fotos, Gemälde, Audio, Karten, Manuskripte, gedruckte Bücher und Zeitungen aus den letzten 2000 Jahren europäischer Geschichte aus über 1.000 Archiven in der Europäischen Union.
  • Gallica aus der Französischen Nationalbibliothek enthält Links zu etwa 4.000.000 digitalisierten Büchern, Zeitungen, Manuskripten, Karten und Zeichnungen usw. Die 1997 gegründete digitale Bibliothek wird mit einer Rate von etwa 5000 neuen Dokumenten pro Monat weiter ausgebaut. Seit Ende 2008 sind die meisten neuen gescannten Dokumente in Bild- und Textformaten verfügbar. Die meisten dieser Dokumente sind in französischer Sprache verfasst.
  • Wikisource
  • Läufer

Siehe auch

Verweise

Weiterführende Literatur

  • Hoffmann, Anna Lauren (2016). "Google Bücher, Bibliotheken und Selbstachtung: Informationsgerechtigkeit jenseits von Verteilungen". Bibliothek vierteljährlich . 86 : 76–92. doi : 10.1086 / 684141 . S2CID   146482065 .
  • Jeanneney, Jean-Noël (2008). Google und der Mythos des universellen Wissens: Ein Blick aus Europa . Chicago, IL: University of Chicago Press.

Externe Links