Het .lex-formaat

Bestanden van het type .lex (Lexicon), te vinden in /data/lexicon/xml van de annotatie-DVD die deel uitmaakt van versie 1.0, bevatten het CGN-lexicon in XML-tekstformaat. Voor een uitgebreide beschrijving van dit formaat wordt verwezen naar /doc_Dutch/topics/lexicon/lexicon.htm, lex.dtd en mlex.dtd die te vinden zijn op de annotatie-DVD die deel uitmaakt van versie 1.0.

Alle in dit formaat gebruikte tekens uit de ISO-8859.1-tekenset die buiten het 7-bits bereik vallen, zijn vertaald volgens de Character entity references for ISO 8859-1 characters. De gebruikte subset van deze speciale tekens is te vinden in bovengenoemde DTD's. In entities.htm vindt men een overzicht van de verschillende standaarden voor deze teken(sub)set.