Het accent van de werkzaamheden gedurende de eerste fase van het project zal liggen op de acquisitie van tekstmateriaal. Belangrijk hierbij is dat er voor alle teksten een adequate regeling getroffen wordt met de auteursrechthebbenden. Een dergelijke regeling moet garanderen dat de teksten beschikbaar zijn voor onderzoeksdoeleinden, terwijl tegelijkertijd wordt vastgelegd dat teksten niet opnieuw worden gepubliceerd. Toegang tot de tekst als tekst is een essentiële voorwaarde: alleen dan is het mogelijk de noodzakelijke taalmodellen te kunnen trainen en allerlei afgeleide informatie (o.a. gegevens over het gebruik en de frequentie van voorkomen van bepaalde woorden of constructies) systematisch te kunnen verzamelen. Dergelijke informatie kan vervolgens worden gebruikt om taal- en/of spraaktechnologische applicaties te ontwikkelen. Voorbeelden van dergelijke toepassingen zijn onder meer zoeksystemen, spelling- en grammaticacheckers en dicteersystemen.