Praktische Aspekte der E-Book Produktion

Nach der Buchmesse in Frankfurt 2008 beschäftigt sich die Branche noch intensiver mit den Risiken und Möglichkeiten des neuen Mediums eBook. Diese werden sowohl von Programm- und Vertriebsseite als auch von Seiten der Produktion abgewogen. Dieser Artikel beschäftigt sich in erster Linie mit den praktischen Aspekten der eBook-Produktion und reißt die theoretischen Aspekte nur an. 

Welche eBook-Formate sollen produziert werden? 

Grundsätzlich gibt es verschiedene Ansätze, sich dem Thema eBook zu nähern. Als technischer Dienstleister werden wir oft gefragt: Müssen wir MOBIPOCKET, EPUB oder PDF bereitstellen? 

Wer diese Frage beantworten will, sollte alles Technische erstmal ausblenden und sich fragen: welchen Kunden will ich erreichen, wo wird dieser meine Bücher lesen und welche Lesegeräte wird er benutzen? 

Nicht umsonst stelle ich diese Fragen in der Zukunftsform. Denn wer diese Fragen mit dem jetzigen Wissen um seine Zielgruppen beantwortet, greift sehr wahrscheinlich zu kurz. 

Bei der Annahme, dass mein Kunde die Inhalte in der Regel am Schreibtisch liest und dort einen PC mit großem Farbdisplay stehen hat, kann ich diesem Kunden sehr wahrscheinlich ein PDF anbieten. Das Erstellen entsprechender PDFs aus den Druckdaten ist in der Regel relativ unaufregend und wird von vielen Verlagen auch selbstverständlich praktiziert.

Schwieriger wird die Frage zu beantworten sein, wenn festgestellt wird, dass für Kunden und Inhalte in Zukunft mobile Lesegeräte interessant sein werden. Dann ist es sicher sinnvoll, reflowable eBook-Formate zur Verfügung zu stellen. »Reflowable« nennt man diese Formate, weil sie keinen festen Zeilenumbruch besitzen. Dieser passt sich dem Display (oder der Fenstergröße am PC) und der gewählten Schriftgröße an. Es gibt also keine Seiten und demzufolge auch keine Seitengestaltung mehr. Ein eBook ist hier also nicht mehr die digitale Kopie eines gedruckten Buches, sondern ein neues Medium mit buchtypischen Eigenschaften. Spannend ist die Frage, wie weit es sich vom Buch entfernt und die Vorteile seines Mediums wirklich nutzen wird.

Reflowable eBooks 

Es gibt im Moment zwei konkurrierende Formate für reflowable eBooks: MOBIPOCKET und EPUB.

MOBIPOCKET 

MOBIPOCKET ist ein proprietäres Format der Firma MOBIPOCKET S.A. aus Frankreich, einer Amazon-Tochter. Das Format kann relativ einfach aus verschiedenen Inputdaten (PDF, doc, HTML etc.) mit Hilfe des Programms MOBIPOCKET Creator erstellt werden. Die Qualität des eBooks ist hier aber stark von den Input-Daten abhängig. Mit verschiedenen PDF-Daten, sowie auch stärker strukturierten Word-Daten habe ich hier eher schlechte Erfahrungen gemacht. Am besten sind die Ergebnisse, wenn der Input HTML ist. Da XHTML auch die meistverwandte DTD für die Inhalte bei der Erstellung von EPUB ist, ist eine parallele Erstellung beider Formate ein naheliegender Gedanke. Ein echter Nachteil beim MOBIPOCKET-Format ist, dass die Möglichkeiten in die Darstellung der Inhalte einzugreifen relativ begrenzt sind. Der Creator ist eine Blackbox. Ein echter Vorteil ist, dass der MOBIPOCKET Reader auf vielen verschiedenen Plattformen läuft. Für den Produzenten kann dies natürlich auch ein Nachteil sein, da es nicht sicher ist, wie der Inhalt auf unterschiedlichen Endgeräten dargestellt wird, weshalb dies auf verschiedenen Geräten getestet werden sollte. 

IDPF EPUB 

Das Format EPUB ist ein offener Standard, der im International Digital Publication Forum (IDPF) entwickelt wird. Hier sind verschiedene Verlage, aber auch technische Dienstleister, sowie Softwareanbieter vertreten. Ein bedeutendes Mitglied, das stark an und mit diesem Standard arbeitet, ist Adobe. 

Die EPUB-Datei, die Sie als eBook auf Ihrem PC oder Lesegerät laden, ist nichts anderes als ein ZIP-File. Dieser enthält die Buchinhalte in XML. Hier gibt es zwei zugelassene DTDs: XHTML und DT-Book. Im Moment werden die meisten EPUBs mit XHTML erstellt. Zum XHTML gesellt sich eine andere Technologie, die Sie aus der Web-Welt kennen: CSS. Hiermit erlaubt dieser Standard Ihre Inhalte zu gestalten. Oft wird von Verlagen verlangt, dass sich die Gestaltung an dem Print-Buch orientieren soll. Auf der anderen Seite gibt es aber auch Verlage, die über eine einheitliche Verlagsgestaltung für Ihre eBibliothek nachdenken. 

Weiterhin befinden sich neben den XHTML- (oder DT-Book-) und der CSS-Datei die Abbildungen als JPEG, GIF, PNG oder SVG in dem EPUB-Container, sowie Steuerfiles wie der OPF-File oder der NCX-File. 

Adobe unterstützt die Erstellung von EPUBs mit seiner Layout- und Satzsoftware InDesign. Bei einem gut ausgezeichneten InDesign-Dokument sind die Ergebnisse gut. Allerdings oft auch nicht ganz fehlerfrei. Häufig muss hier noch einmal in die Daten eingegriffen werden. 

Gerade bei älterem, nicht zwingend konsistent ausgezeichnetem Datenbestand ist es oft sinnvoll, statt den direkten EPUB-Export zu wählen, nach XHTML zu exportieren oder den IDML-Export in CS4 zu nutzen und die Daten dann weiterzuverarbeiten. 

Bei der Erstellung von EPUB aus QuarkXpress gehen wir in der Regel den Weg, dass wir die Quark-Daten zunächst in InDesign öffnen, diese hier überprüfen und dann wie oben beschrieben weiter arbeiten. Im Moment müssen viele EPUBs aus PDF-Daten erstellt werden. Die Schwierigkeit ist hier, dass aus physischen Formatierungen logische Strukturen für XHTML gemacht werden müssen. Ein Weg ist hier natürlich die HTML-Export-Funktion. Die Interpretation der Inhalte ist hier leider nicht immer fehlerfrei. Der HTML-Code muss aber auch gesäubert werden, damit es nach der XHTML-DTD valide ist. 

In der Produktion von le-tex wird in der Regel PDF2-Text eingesetzt, wobei auch hier Textinformationen ausgewertet und interpretiert werden. Da wir hier das Ergebnis aus der Konvertierung leichter beeinflussen können, als aus dem Acrobat-Export, ist hier eine automatische Weiterverarbeitung leichter gegeben.

Aus Word-Daten gehen wir den Weg über das Format docx aus der Word-Version 2007. Die Word-Daten sollten standardisiert ausgezeichnet sein. In der Praxis ist das natürlich oft nicht gegeben. Hier arbeiten wir aktuell an Heuristiken, die auch weniger gut ausgezeichnete Word-Daten entsprechend interpretieren.

Zusätzlich zu den Standards, welche unter www.idpf.org einzusehen sind, gibt es verschiedene Einschränkungen bei der Erstellung von EPUBs, die in der Regel von der Lesesoftware oder den Endgeräten abhängig sind. 

Die im Moment wohl am weitesten verbreitete Software ist die Digital Edition von Adobe. Diese wird u.a. auch von den Sony-Lesegeräten eingesetzt. Adobe hat Hinweise zum Erstellen von EPUB-Daten für seine Lesesoftware in einem Best Practice Dokument zusammengefasst. Ein sehr nützliches Tool ist auch der EPUB-Checker, der frei von Google zur Verfügung gestellt wird. Dieser validiert den EPUB-File auf die Einhaltung der Regeln des IDPF. 

Hinsichtlich der Gestaltung gibt es natürlich Einschränkungen. Sie beziehen sich zum einen auf die Lesegeräte. Diese können Inhalte oft nicht farbig darstellen oder haben nur sehr kleine Displays oder ähnliche Einschränkungen, die bei der Produktion berücksichtigt werden müssen. Die Gestaltung wird wie schon beschrieben durch CSS erreicht. Dies wird von unterschiedlicher Readersoftware leider unterschiedlich interpretiert. 

Bei der Produktion für das Web sollte man Browsertests machen, bei der Produktion für das EPUB sind Software- und Readertests unerlässlich. Grundsätzlich muss man wie bei der Gestaltung eines PDFs oder gedruckten Buches über die Gestaltung einzelner Elemente des Buches im EPUB unter Berücksichtigung der Lesegeräte nachdenken. Hintergrundabbildungen sind oft nicht hilfreich und erschweren nur die Lesbarkeit. Elemente in den Marginalspalten sollten auf Ihre Notwendigkeit geprüft werden und wenn notwendig umflossen dargestellt werden. Bei umfangreichen Tabellen ist es oft sinnvoll darüber nachzudenken, wie diese geteilt werden können. Verzeichnisse sind oft nur sinnvoll, wenn diese im Dokument verlinkt sind. Diese Liste ließe sich noch viel weiter fortführen. Ein guter eBook-Auftrag sollte nicht weniger umfangreich und gut ausgearbeitet sein, als ein Satzauftrag. Nur dann kann man sicher gehen, dass die Qualität der Produktion auch den Erwartungen der Auftraggeber entspricht. 

Workflow-Einbindung der eBook-Produktion 

Im Moment werden viele eBooks nachträglich aus Satz- oder PDF-Daten erstellt. Bei einer Neuproduktion sollte aber von Anfang an das eBook selbstverständlich mit dem Print-PDF mitgedacht werden. Das heißt, die Daten sollten logisch gut ausgezeichnet sein. Anker für die Abbildungen sollten in den Daten vorhanden sein, Index-Einträge in den Textdaten kodiert usw. Die physische Darstellung der Elemente sollte von Anfang an für alle Ausgabemedien definiert sein. 

Dann ist der Weg zu strukturierten Daten in einem XML-Format und damit auch in XHTML nur noch recht kurz. Bei der Erstellung entsprechender Workflows sollte die Produktion unterschiedlicher Ausgabemedien kaum teurer sein als der Satz für das Printprodukt. Und bei einer strukturierten Datenhaltung haben Sie Ihre Inhalte auch schon für zukünftige Formatrevolutionen gesichert.