bjoerna.dk     Kultursociolog Bjørn Andersen    post@bjoerna.dk


Ludvig Holberg: Digitale Heltehistorier

Et eksperiment


Version 3.5 - 07.02.2006 [mindre justering 08.03.2010]

Det er omkring 2008/2009 lykkedes at etablere et Dansk-Norsk konsortium der vil digitalisere hele Holberg. Se nærmere her: http://holberg.nu/Bjerget.htm  

Klik evt. på billederne på denne side for at få dem frem i større format. Se note om portrættet nederst på siden.Ludvig Holberg (d. 1754) udgav i 1739 sin »Sammenlignede Historier«. Den fulde titel var noget længere - se billedet ovenfor: »Adskillige store Heltes og berømmelige Mænds, sær Orientaliske og Indianske sammenlignede Historier og Bedrifter efter Plutarchii Maade«.

Værket er genudgivet senere og indgår i bind 11 i Carl S. Petersen's udgave af Holberg's »Samlede Skrifter« (1931). Der er dét særlige ved dén udgave at teksten er sat nogenlunde som på Holbergs tid, dvs. med gotiske bogstaver (i fraktur), men at sidestørrelsen er meget anderledes. Oplaget var ikke stort - 430 eksemplarer - til gengæld er det trykt på 'fornemt papir'. Jeg har fundet bindet i magasinet på Gladsaxe Hovedbibliotek. »Det er ikke en bog vi låner ud hver dag«, sagde man.

Billeskov Jansen har taget én dobbelthistorie med i sin »Ludvig Holberg: Værker i tolv bind« der udkom på Rosenkilde og Bagger omkring 1970.

Og endelig har Henrik Stangerup foretaget en gendigtning af alle 'Heltehistorier' (og af de efterfølgende 'Heltindehistorier') - der udkom på Lindhardt og Ringhof i 1990 (i en udvidet og forbedret udgave ift en lidt ældre udgave på Peter Asschenfeldt's Forlag).Holberg og Skanderbeg

Holberg's heltehistorier er spændende læsning i sig selv - men de blev aktuelle i forbindelse med Peter Pentz' 'opdagelse' af Skanderbeg's segl på Nationalmuseet (se: http://bjoerna.dk/albansk-historie/Skanderbegs segl.htm). Grunden er at én af Holberg's historier omhandler Skanderbeg.

Jeg har transkriberet Skanderbeg-historien til 'normale' latinske bogstaver og lagt den på nettet - se: http://bjoerna.dk/albansk-historie/Holberg.htm. Samtidig har jeg - specielt med henblik på albanske læsere - skrevet en kort introduktion til Holberg på engelsk, se: http://bjoerna.dk/Holberg/Scanderbeg.htm.

Senere på året vil jeg skrive en hvor jeg går dybere med Holberg's Skanderbeg-artikel - og i dén forbindelse vil jeg også se nærmere på de andre portrætter i 'Heltehistorier' - og på Holberg's litterære forbillede: Plutark.


En digital Holberg?

Der findes allerede en del Holberg i digital form. Man kan f.eks. finde »Moralske Tanker«, nogle komedier og »Niels Klim« - men Heltehistorierne er (bortset fra dobbelkthistorien om Akebar og Zar Peter) ikke tilgængelige, og det samme gælder mange andre af Holberg's værker.

ADL - Arkiv for Dansk Litteratur har en særlig Holberg-side. [Klik på: ADL, hvis du vil læse om hvordan man har grebet digitaliseringen an i ADL]. ADL har udlagt en række Holberg-tekster - se nærmere på: Holberg tekster på nettet.

Under min søgning på nettet opdagede jeg at »Holberg-samfundet« har forskellige projekter på bedding. Man forbereder en Holberg Encyclopædi, og i fortsættelse af dén vil man - over en periode på ca. 10 år - udgive hele Holberg på basis af Carl S. Petersen's udgave.Carl S. Petersen's udgave kom, som allerede nævnt, i et meget lille oplag, og den er derfor ikke så tilgængelig som ønskeligt - men det er dog ikke sandsynligt at 'nogen' skulle finde på at genudgive Petersen - som 'han' er.

Man kunne, teoretisk set, 'nøjes' med at lægge Holberg ud på nettet som 'fotografiske aftryk', men det ville fylde meget - og det ville kræve en del serverkapacitet og båndbredde hvis man ville transmittere større tekster. Alternativt kunne man derfor gøre tekstmassen tilgængelig på CD'er der blev produceret efter on-demand-princippet. En sådan udgivelse kunne utvivlsomt have en vis nytte, men behovet ville dog være til at overse, for nutidens læsere er ikke begejstrede for fraktur, selv om den ikke er svær at læse.

Kunne man digitalisere Holberg, ville man få mange fordele med i købet ud over at gøre ham læsbar, for tekstmassen ville så også blive tilgængelig for elektronisk søgning og for elektronisk bearbejdelse - f.eks. i forbindelse med produktion af 'lokale' antologier til undervisnings- og studiebrug. Med andre ord ville man kunne tage et spring fra læsbarhed til en højere grad af brugbarhed.

Men forudsætningen for at digitalisere Holberg er - med mindre man vil indskrive hele tekstmassen - at man kan finde et OCR-program der kan omsætte fra fraktur til latinske bogstaver. (Et OCR-program omsætter billedet af en tekstside til noget der kan håndteres af tekstbehandlingsprogrammer. OCR står for Optical Character Recognition).Et eksperiment?

Som så mange andre har jeg en scanner, og derfor har jeg scannet 'Heltehistorier' (i alt ca. 500 sider), således at jeg ikke behøver at beslaglægge bibliotekets eksemplar længere end det er nødvendigt.

Jeg har gjort et par foreløbige forsøg på at OCR-behandle teksten, men de to små programmer jeg brugte gav for mange fejl - hvortil kom at begge programmer lider af dén skavank at de ikke kan 'lære' af de korrektioner man indtaster. Derfor er jeg gået ud på nettet for at se hvad der var - og for at se om der var 'nogen' der havde arbejdet med tilsvarende opgaver.

Så vidt jeg kan se, kan man ikke i dag (marts / april 2003) købe et program der passer perfekt til opgaven. Men noget tyder på at man kan komme et stykke ad vejen ved at bruge ABBYY FineReader 6.0 Pro. Det fremgår desuden af en pressemeddelelse fra ABBYY at man er involveret i et samarbejde med EU om at udvikle et modul som kan håndtere fraktur. ABBYY's danske agent oplyser at dette modul ikke er udbudt til salg endnu. [Tilføjelse: ABBYY har udbudt en Frakturfortolker februar 2005, se nedenfor].

Der er dét ved Petersen-udgaven at den fremstår meget smukt og regelmæssigt, og at den derfor kunne tænkes at volde mindre problemer end så mange andre fraktur-tekster, så derfor har jeg besluttet mig for at anskaffe FineReader og at eksperimentere med det hen over foråret og sommeren 2003 - dvs. når jeg har lidt ledig tid engang imellem. Jeg vil løbende fortælle om eksperimenterne her på siden.

Nedenfor min arbejdsplan og en foreløbig sammenligning af forskellige 'Helte'-udgaver:

Spørgsmål og kommentarer modtages meget gerne: skriv e-mail [dit alm. postprogram aktiveres, når du klikker].


Bjørn Andersen, 1. april 2003

Løbende erfaringer


Slutningen af marts: Indscanning af Heltehistorier: Der lagres i BMP i høj opløsning (som derefter zip'es for at begrænse pladsforbruget). BMP (til forskel fra JPG og GIF) fordi der ikke sker informationstab (kvalitetstab), når et billede genlagres efter bearbejdning - og aht produktion af 'fotokopier' senerehen; desuden kan der editeres i BMP pixel for pixel (hvis der nogensinde skulle blive brug for dét). ... Man kan altid sætte 'kvaliteten' ned på et senere tidspunkt, men det er noget nær umuligt at gå den anden vej.


3. april 2003: De første forsøg med FineReader. Når man bruger faciliteterne - Train User Pattern og Use User Pattern - kan man lære programmet at læse fraktur (i 'Petersen's udgave'). Det må formodes at der (til at begynde med) skal bruges temmelig meget tid med at 'træne', men at OCR-behandlingen samtidig vil blive mere og mere træfsikker.

Det er svært at spå om tidsforbruget. På den ene side vil OCR-behandlingen gå langsommere og langsommere (fordi 'træningsfilen' - indtil træningen indstilles - bliver større og større), på den anden side skal der bruges noget mindre tid til efterbehandlingen.

Teknisk journal påbegyndt.


4. april 2003: Tilretning af BMP-billeder af Ziska-afsnittet: Sider der stod en smule skævt er rettet op (med en såkaldt 'fine rotation'-funktion), derefter er siderne beskåret og nedsamplet. Fortsat lagring som BMP (+ zip). Sikkerhedskopiering til anden maskine + brænding af CD (som er placeret på anden adresse).


5. april 2003: OCR-behandling af afsnittet om Ziska. 'Træning' af FineReader i at læse fraktur. Træningsfilen kom op på 1.8 MB. Træningsfilen kan editeres. FineReader lagrer BMP-billeder (der 'hentes ind') i TIFF-format; originalerne 'røres' ikke.

Produktionskørsel på Ziska-afsnittet (hvilket tog meget kort tid). TIFF-billederne, 'læsningerne' og nogle 'redaktionsfiler' gemt (aht evt senere rekapitulation og justering). Det lykkedes nogenlunde at overføre forskellige elementer i typografien ('oversættelse' af almindelig fraktur, af spatieret & fed fraktur og af latinsk skrift). Udlæsning til HTML. Justering af forskellige HTML-koder.

Korrektion og tillempning af layoutet (tilføjelse af ekstra afsnit osv. for at gøre teksten lettere at læse). NB der er til det konkrete formål valgt et andet 'design' end dét der (formentlig) bør bruges, når hele bogen evt. skal publiceres.

Der var nogle fejl, men korrektionsarbejdet var til at overkomme. Til sammenligning gav en batchscanning & OCR-behandling af Henrik Stangerup's udgave af Ziska & Skanderbeg-historien i gennemsnit mindre end én fortolkningsfejl pr. trykside!Én (ventet) vanskelighed drejer sig om at skelne mellem ikke-finalt-s og f (der er derimod - som i moderne danske skrift - tydelig forskel på finalt-s og f) . Desuden står nogle frakturtegn meget tæt på hinanden (eller rækker ind over hinanden - se fx s og a yderst tv på billedet) - men her har man en mulighed for at definere 'ligaturer'.

Der findes en 'elektronisk' font der ligner dén fraktur Petersen har brugt: 'Cloister Black', men her har man sløjftet det ikke-finale-s, og derfor er der tydelig forskel på s og f. Den samme tekst som på billedet ser således ud:I princippet kan der nu køres OCR-produktionskørsel på hele bogen, men helst må der foretages yderligere 'oplæring' før dette sker.

Uploading til server af: http://bjoerna.dk/albansk-historie/Holberg.htm.

Teknisk journal er ajourført; der er taget 'billeder' [screendumps] af forskellige faser. Næste fase er - jf. Arbejdsplan - at fastlægge forskellige standarder; det bliver efter Påske.


6. april 2003. Installation af FineReader ServicePack. Når man har registreret programmet, kan man bede om at blive holdt a jour. Der kom kort efter besked om at der var udgivet en servicepakke; denne er nedtaget (godt 40 MB i zip'et form) og installeret. Der er sket visse tekniske forbedringer (håndtering af pdf). Det er desuden blevet muligt at vælge svensk som kommunikationssprog (norsk og dansk er ikke muligt), men da jeg normalt bruger engelsk til dette formål - og da der muligvis skal kommunikeres med ABBYY-firmaet - fortsætter jeg med det.


8. april 2003. Valg af grundformat til publicering. Jeg har (foreløbigt) besluttet mig for at anvende HTML. Se nærmere på: http://bjoerna.dk/Holberg/format.htm
8.-9. april 2003. Indscanning og OCR-behandling af Holberg's Naturret. For at lære FineReader godt at kende (og fordi jeg skulle bruge teksten til et projekt om ret og uret blandt albanerne) har jeg indscannet og OCR-behandlet Naturretten (»Naturens og Folke=Rettens Kundskab«) efter Billeskov Jansen's udgave fra 1969 (Naturretten er hovedstykket i bind 1 i »Ludvig Holberg Værker i tolv bind«). Naturretten er dermed gjort elektronisk søgbar. Den samlede fil - incl. Billeskov's kommentarer - fylder under 1 MB.

Bogen foreligger i HTML, og det er lykkedes at overføre de forskellige typografiske 'former' (almindelig skrift, kursiv, fed, sideskift osv). Indtil videre bevares forlæggets linie- og sideskift, men fuld søgbarhed forudsætter at orddelingerne opgives. Når jeg gennemarbejder teksten i løbet af 2003/2004 retter jeg de OCR-'fortolkningsfejl' der er - og derefter etablerer jeg to forskellige udgaver: Én der svarer til forlægget og én uden orddelinger.

Det er muligt at denne HTML-udgave kan gøres tilgængelig for andre på et senere tidspunkt, men det forudsætter dels at fil'en er blevet rettet igennem, dels at evt. ophavsretlige problemer ved at bruge den pågældende udgave som forlæg kan klares.

Et uddrag fra 'Naturretten' (om Skanderbeg) kan findes på: http://bjoerna.dk/Holberg/Naturret-357.htm

ADL - se: Holberg tekster på nettet - har lagt den samme udgave af 'Naturretten' på nettet (den kan nedtages fra: http://www.adl.dk/adl_pub/pg/cv/AsciiPgVaerk2.xsql?nnoc=adl_pub&p_udg_id=30&p_vaerk_id=9990), men i en temmelig rå udgave - dvs. uden fremhævelser og sidetal, men (hvad der er en betydelig fordel) også uden orddelinger. Den pgl. tekst kan udmærket bruges til at foretage elektroniske søgninger i - og til at kopiere passager fra, men det vil være en fordel at have den trykte udgave ved hånden. ADL har også lagt en faksimile-udgave af den trykte udgave på nettet (dvs. en udgave hvor man kan se siderne som 'billeder'), men den skal hentes side for side - og det er en rimelig besværlig øvelse.

Se bemærkning 21. juni 2003 og 1. august 2003 (»Naturretten« er lagt på nettet)


14. april 2003. Resten af 'billederne' af 'Heltehistorier' er finpudset. Derefter blev der genereret to pdf-filer, én af bd. 1 og én af bd. 2 - og foretaget udskrivning på papir.

Der er gjort eksperimenter med forskellige formater til OCR-behandling og format til pdf-udskrivning. Til OCR-formål bruges BMP (i rel. høj opløsning). Til pdf-formål blev brugt GIF (i lavere opløsning og i S/H - som ved 'forstørrelser' ser grovere ud end tilsvarende BMP). Der er taget 'screendumps' af de forskellige faser i processen.


26. april 2003. Scanning af Carl S. Petersen's 'Fortale' til 'Samlede Skrifter', bd. I og af forskellige afsnit fra 'Samlede Skrifter', bd. XVIII: Udgivernes fortale, varianter til 'Heltehistorier' og 'Tekstkritisk Tillæg' til samme. Læsning af Carl S. Petersen's 'Fortale' der drejer sig om udgivelsesprincipperne, Holberg's sprog og om trykkeriernes håndtering af hans manuskripter. Se: http://bjoerna.dk/Holberg/sprog-og-typografi-hos-Holberg.htm

Standarder fastlagt for scanning, efterbehandling af scanning og elektronisk lagring af materiale.


10. maj 2003. Scanne og uploade Leiv Amundsen's artikel: »Om manuskriptet til Holbergs Helte-Historier 1739« (1923), se: Manuskriptet til Heltehistorier. I artiklen fortælles om hvordan manuskriptet er kommet til Oslo, om Holberg's brug af kopister (i dette tilfælde to) og om Holberg's rettelser til manuskriptet. Amundsen fremkommer også med en hypotese om hvad Holberg er startet med.


14. maj 2003. Foreløbig afslutning af Register over den Digitale Holberg med udgangspunkt i ADLs indholdsfortegnelse. Der blev konstateret forskellige problemer (epistlerne var f.eks. - hvad der forekom temmelig barokt - anført i alfabetisk orden efter romertallene). ADL har efterkommet kritikken og er overgået til arabertal. Desuden ser det ud som om at nogle tekster - der er tilgængelige - er »usynlige« i ADLs oversigt. Episteloversigten er suppleret med 'autoriserede' overskrifter.


15. maj 2003. Fotografisk aftryk af manuskriptside til historien om Skanderbeg modtaget fra Nasjonalbiblioteket i Oslo. Billedet er uploaded til Heltehistorier-manuskriptet og til det relevante sted i historien om Skanderbeg.


20. maj 2003. Tiltrådt som ODP-redaktør for Holberg. ODP = Open Directory Project. ODP's formål er at opbygge et redigeret internetkatolog. Redigeret omtale af vigtige Holberg-sider.

Carl S. Petersen - Biografiske noter om overbibliotekar Carl S. Petersen der forestod udgivelsen af "Samlede Skrifter"
Heltehistorier - manuskriptet - Billede af én af siderne og optryk af Leiv Amundsens artikel fra 1923
Holberg i Sorø - Slagelse Biblioteks side om Holberg i Sorø. Link til Sorø Akademi
Holberg om Skanderbeg - Holbergs beskrivelse af Skanderbeg i Heltehistorier (Gjerg Kastrioti fra Albanien)
Holberg paa nettet - Links til alle Holberg-tekster på nettet (Det Kongelige Bibliotek / Arkiv for Dansk litteratur, Gutenberg og andetsteds)
Holbergsamfundet - Historie og planer. Man vil udgive en Holberg Encyclopædi og digitalisere "Samlede Skrifter"
Det Kongelige Bibliotek - Elektronisk udgave af forskellige værker
Ludvig Holberg - Arkiv for Dansk Litteratur: Ludvig Holberg's værker efter Billeskov Jansen's 12 binds-udgave
Ludvig Holberg Digitale Heltehistorier - Forsøg på at digitalisere værket Heltehistorier fra frakturudgaven i "Samlede Skrifter"
Tersloesegaard - Uofficiel side for Holberg-museet på Tersløsegård. Billeder og litteraturhenvisning
Tersløsegård - Holberg museet på Tersløsegård ved Dianalund. Officiel side

-

[BA's Holberg-sider kan findes på: http://bjoerna.dk/Holberg/links.htm]31. maj 2003. Artikel om F.J. Billeskov Jansen skrevet og uploadet (foreløbig udgave)


21. juni 2003. Naturretten (efter Billeskov Jansen's udgave): OCR-behandling er sket tidligere (fed, kursiv, græske tegn m.v. er bevaret): Korrekturlæsning påbegyndt. Forventes afsluttet pr. 31.7.2003. Naturretten skal bruges i et projekt om ret og uret, men også som baggrundslitteratur til en artikel om Heltehistorier.


1. august 2003. Naturretten: Korrekturlæsning afsluttet. Artikel skrevet. Begge dele lagt på nettet, se: http://bjoerna.dk/Holberg/Om-Holbergs-Naturret.htm


9. september 2003. Danske Lov: Scanning og en »rå« OCR-behandling af Danske Lov er gennemført. Gennemarbejdning er påbegyndt og vil vare 2003 ud og muligvis lidt længere. Se nærmere på: http://bjoerna.dk/DanskeLov.


15. december 2003. Danske Lov: Præsentationsartikel plus CD-udgave af lovteksten er udgivet. Se nærmere på: http://bjoerna.dk/DanskeLov.


Juni 2004. Deltagelse i Holberg Symposium i Sorø.


August 2004. Anmeldelse af: »Ind i Holbergs fjerde århundrede«. Heri kommentar om digitalisering.


Februar 2005. ABBYY - der har udviklet OCR-fortolkeren 'Fine Reader' - har udsendt meddelelse om at man nu markedsfører en frakturfortolker (i tilknytning til 'Fine Reader' 7). Man kan få en gratis prøveudgave (maks. 100 siders fortolkning) ved henvendelse til ABBYY. En sådan prøveudgave har jeg downloadet (knap 150 MB som zip-fil) og testet på et enkelt opslag af Holberg's »Samlede Skrifter« (Petersen's udgave: Helte-Historier / Sammenligningen af Zoroaster og Mahomed). Resultatet er ganske lovende - selv om frakturfortolkeren ikke umiddelbart er beregnet på dansksprogede tekster - for OCR-fortolkningen går væsentligt hurtigere og nemmere, end hvis man selv skulle træne sin 'Fine Reader' op. Der er dog en del fortolkningsfejl, men mange af dem vil givetvis kunne tackles med forskellige former for »optræning« og resten må klares med elektronisk og »manuel« korrekturlæsning. Konklusion: En digitalisering af Holberg's »Samlede Skrifter« (i Petersen's udgave) er blevet langt mere overkommelig.


26.06.2005. Dobbelthistorien om Zenobia og Catharina Alexiewna er OCR-behandlet og der er læst en hurtig 1' korrektur. Historien vil blive trykt i »Et åbent sind« (2006).


14.07.2005. Dobbelthistorien om Zoroaster og Mahomed er OCR-behandlet og der er læst en hurtig 1' korrektur. Historien vil blive trykt i »Et åbent sind« (2006).


08.03.2010. Dobbelthistorien om Zenobia og Catharina af Rusland er gennemgået, forsynet med indledning og kommentarer og uploadet til: http://holberg.nu/heltinder.htm

Arbejdsplan

Scanne 'Heltehistorier' (meget bedre løsning end at tage en fotokopi - og ca. lige så hurtig). Generere 12 zip-filer (én for hver dobbelthistorie). Afsluttet 02.04.2003
Finpudse 'billederne' af Ziska-afsnittet i Skanderbeg-kapitlet Afsluttet 04.04.2003
Forsøge OCR på Ziska-afsnittet i Skanderbeg-kapitlet Afsluttet 05.04.2003
Publicere Ziska-afsnittet på: http://bjoerna.dk/albansk-historie/Holberg.htm Afsluttet 05.04.2003
Indscanne og OCR-behandle Naturretten. Korrekturlæsning foretages i løbet af 2003. Derefter etablering af to udgaver ... Se nærmere nedenfor Afsluttet 09.04.2003
Finpudse resten af 'billederne'. Generere pdf-filer af 'Heltehistorier' bd. 1 og bd. 2 - og trykke et eksemplar til eget brug Afsluttet 14.04.2003
Scanning af Carl S. Petersen's 'Fortale' til 'Samlede Skrifter', bd. I og af forskellige afsnit fra 'Samlede Skrifter', bd. XVIII: Udgivernes fortale, varianter til 'Heltehistorier' og 'Tekstkritisk Tillæg' til samme. Afsluttet 26.04.2003
Fastlægge forskellige standarder: scanning, efterbehandling af scanning og elektronisk lagring af materiale. Afsluttet 26.04.2003
Besøge Tersløsegaard (og oprette internetside om samme). Gennemgå Arkiv for Dansk Litteratur: Holberg-siderne (og skrive kommentar herom). Afsluttet 01.05.2003
Scanne og uploade Leiv Amundsen's artikel: »Om manuskriptet til Holbergs Helte-Historier 1739« (1923), se: Manuskriptet til Heltehistorier Afsluttet 10.05.2003
Foreløbig afslutning af Register over den Digitale Holberg med udgangspunkt i ADLs indholdsfortegnelse Afsluttet 14.05.2003
Fremskaffe fotografisk aftryk af manuskriptside til historien om Skanderbeg fra Nasjonalbiblioteket i Oslo. Uploade billedet til Heltehistorier-manuskriptet. Afsluttet 15.05.2003
ODP-redaktør for Holberg. Henvisninger til vigtige Holberg-sider Tiltrådt 20.05.2003
Artikel om F.J. Billeskov Jansen skrevet og uploadet (foreløbig udgave) Afsluttet 31.05.2003
Naturretten: Korrekturlæsning påbegyndt 21.6.2003. Forventes afsluttet pr. 31.7.2003. ... Korrekturlæsning afsluttet. Artikel skrevet. Begge dele lagt på nettet Afsluttet 01.08.2003
Fastlægge forskellige standarder: Opsætning af FineReader. Udskrivningsprogram: HTML? Udskrivningsstandarder (Layout? Hvordan skal de enkelte 'elementer' i Petersen's typografi - overskrifter, almindelig fraktur, tekst i latinsk skrift, udhævninger af forskellig art, margintekst osv. - overføres?) osv. Efteråret 2003
Danske Lov: Scanning og OCR-behandling af Danske Lov. Gennemarbejdning og udgivelse på CD. Se nærmere på: http://bjoerna.dk/DanskeLov Afsluttet 15.12.2003
Gennemgå 'Heltehistorier', Plutark m.v.; afsluttes ca. december 2005 I gang: 2004-2005
OCR-behandling af dobbelthistorien om Zenobia og Catharina Alexiewna Afsluttet 08.03.2010 (uploadet til: http://holberg.nu/heltinder.htm)
OCR-behandling af dobbelthistorien om Zoroaster og Mahomed Afsluttet 14.07.2005 (2' korrekturlæsning mangler)
Overveje det videre forløb: OCR-behandling af 'Heltehistorier'. Publicering på nettet eller på anden måde? Evt. løbende publicering - 'sammenligning' for 'sammenligning'? Hvordan kan projektet finansieres? 2004/2005/2006
Skrive artikel om Holberg som historiker og biograf (med henblik på Skanderbeg og andre personer der spiller en rolle for Balkan-historien). Publiceres i bogform i første del af 2006. 2004/2005/2006
Overveje det videre forløb: OCR-behandling af 'Heltehistorier'. Publicering på nettet eller på anden måde? Evt. løbende publicering - 'sammenligning' for 'sammenligning'? Hvordan kan projektet finansieres? 2004/2005/2006Indholdsmæssig sammenligning af forskellige udgaver

Carl S. Petersen's udgave Billeskov Jansen's udgave Henrik Stangerup's udgave
Første Tome:
Fortale til Læseren
- Fortale til læseren
Cingiskan og Tamerlan - Djengis Khan og Tamerlan
Oran Zeb og Saladin - Aurangzeb og Saladin
Akebar og Petrus Alexiovitz Akebar, Petrus Alexiovitz Akbar og Peter den Store
Ziska og Skanderbeg - Zizka og Skanderbeg
Schach Abas og Soliman - Shah Abbas og Soliman
Montezuma og Atapabila - Montezuma og Atahuallpa
Anden Tome:
Zoroaster og Mahomed
- Zarathustra og Muhammed
Zenobia og Catharina Alexiewna - Zenobia og Katharina Aleksejevna [placeret under 'Heltindehistorier']
Myrr-Weis og Myrr-Maghmud - Mir Vais og Mir Mahmud
Mahobed-Kan og Emir-Jemla - Mahobed Khan og Emir Jemla
Lucius Sylla og Cajus Julius Cæsar - Lucius Sulla og Gajus Julius Cæsar
Socrates og Epaminondas - Sokrates og Epaminondas
Note om Holberg-portrættet øverst på siden: Portrættet er malet af Jørgen Roed i 1847 som kopi af Johan Roselius' maleri (muligvis fra 1752). Man kan læse nærmere om portrættet i Stig Fjord Nielsen's bog: »Ludvig Holberg - en godsejer på Vestsjælland«, Vestsjællands Amt 2004, s. 40 f.