loader

Warum sind PDF-Dateien von Microsoft Word so groß?

Anonim

Wenn es sich bei Ihren Dokumenten hauptsächlich um Text handelt, scheinen die Dateigrößen für .docx- und .pdf-Versionen beim Speichern ziemlich ähnlich zu sein. Dies ist jedoch nicht immer der Fall. Der heutige Q & A-Beitrag von SuperUser hat die Antwort auf die Fragen eines neugierigen Lesers bezüglich des großen Unterschieds bei den Dateigrößen.

Die heutige Question & Answer-Sitzung wird von SuperUser zur Verfügung gestellt - einer Unterteilung von Stack Exchange, einer Community-basierten Gruppierung von Q & A-Websites.

Boxhandschuhe ClipArt mit freundlicher Genehmigung von Clker.com.

Die Frage

SuperUser-Leser Borek möchte wissen, warum von Microsoft Word generierte PDF-Dateien so groß sind:

Ich habe ein einfaches Microsoft Word-Dokument erstellt, das nur diesen Satz enthält, sonst nichts:

  • Dies ist ein kleines Dokument.

Dann habe ich das Dokument als .docx- und .pdf-Dateien gespeichert. Hier sind die Dateigrößen:

  • .docx: 12 kB
  • .pdf: 89 kB

Der Unterschied zwischen den beiden Dateien ist (technisch gesehen) riesig und es stört mich wirklich, wenn Dokumente, die zumeist textlicher Natur sind, nur einige zehn KB im .docx-Format sind, bei der Konvertierung in PDF-Dateien jedoch Hunderte von kB groß sind. Was ist so ineffizient am PDF-Format? Ist es nur Microsoft Word, das einen schrecklichen Ausgabealgorithmus verwendet?

Übrigens werden die PDF-Ausgabeeinstellungen in meiner Microsoft Office-Installation so eingestellt, dass möglichst kleine Dateien erstellt werden:

Warum sind PDF-Dateien von Microsoft Word so groß?

Die Antwort

SuperUser-Mitwirkender Rene hat die Antwort für uns:

Wenn Sie die PDF-Datei in Notepad ++ öffnen, finden Sie Folgendes:

Und dieses Objekt wird hier am Ende in der Anweisung / FontFile2 referenziert:

Die von einem Microsoft Word-Dokument verwendeten Schriftarten werden in PDF-Dateien eingebettet, so dass sie in sich geschlossen sind. Ich habe dieses Slide-Deck von Adobe verwendet, um die PDF-Anweisungen zu entschlüsseln.

Wenn Sie verhindern möchten, dass Schriftarten in eine PDF-Datei eingebettet werden, müssen Sie sicherstellen, dass Ihre Microsoft Word-Dokumente eine der 14 Standardschriftarten verwenden, die in PDF-Viewern verfügbar sind (Quelle: Wikipedia).

  • Times New Roman> Times (v3) (regelmäßig, kursiv, fett und fett kursiv)
  • Kurier Neu> Kurier (normal, schräg, fett und schräg)
  • Arial> Helvetica (v3) (normal, schräg, fett und schräg)
  • Symbol> Symbol
  • Wingdings> Zapf Dingbats


Haben Sie der Erklärung etwas hinzuzufügen? Sound off in den Kommentaren. Möchten Sie mehr Antworten von anderen technisch versierten Stack Exchange-Benutzern lesen? Hier geht es zum vollständigen Diskussionsthread.