Datorlingvistik utvecklar formaliserade modeller av naturligt språk, realiserade som system för behandling av text eller tal. Utvecklingen inom detta tvärvetenskapliga fält är snabb på grund av a) den enorma ökningen av mängden elektroniskt tillgängliga data; b) ständigt ökande beräkningskapacitet; c) metoder som är datadrivna, dvs som utnyttjar maskininlärning och statistik för att automatiskt inducera modeller från data, oftast i kombination med traditionella lingvistiska regler och representationer. Datorlingvistik ger nya möjligheter att konfrontera deskriptiv och teoretisk lingvistik med empirisk evidens, ökad utväxling inom områden där naturligt språk utgör primärdata (såsom humaniora, samhällsvetenskaper, medicin och kulturarv), samt språkteknologiska tillämpningar alltfrån maskinöversättning till dialogsystem.