Datorlingvistik utvecklar formaliserade modeller och algoritmer för naturligt språk samt implementeringar av dessa för att kunna behandla text eller tal. Under de senaste två decennierna har detta tvärvetenskapliga fält utvecklats starkt som följd av a) den enorma ökningen av mängden elektroniskt tillgängliga data; b) ständigt ökande datorkraft; c) metoder som är datadrivna, dvs som kombinerar lingvistik med statistik och/eller maskininlärning. Området ger nya möjligheter att konfrontera deskriptiv och teoretisk lingvistik med empirisk evidens och ny teori, samtidigt som det bidrar med språkteknologiska tillämpningar som maskinöversättning, dialogsystem, informationsåtkomst och studier av webben i realtid.
Våra forskningsområden omfattar projekt som sträcker sig från mycket små datamängder (som förälder—barn-interaktion), via medelstora datamängder (som Strindbergs romaner) till stora datamängder (till exempel internettexter).