Türkçe doğal dil işleme alanında var olan çalışmalardan en bilinen iki tanesi Zemberek ve İTÜ Doğal Dil İşleme Yazılım Zinciri’dir. Bu çalışmalardan Zemberek açık kaynak kodlu olup çes ̧itli doğall dil işleme bileşenlerinden oluşan bir yazılım kütüphanesidir. İTÜ Doğal Dil İşleme Yazılım Zinciri ise, çevrimiçi bir kullanıcı arayüzü sunmasına rağmen, açık kaynak kodlu değildir. Bu çalışmada, yine bir Türkçe doğal dil işleme aracı olan Türkçe Nlptoolkit için bir çevrimiçi arayüz sunuyoruz.
Bu arayüz sayesinde, Nlptoolkit’teki yazım denetleyici, Türkçe karakter dönüştürücü, birimlendirici, cümle bölücü, biçimbirimsel çözümleyici ve belirsizlik giderici bileşenlerini çevrimiçi olarak kullanmak mümkündür.
Sunduğumuz Nlptoolkit, hem açık kaynaklı olup hem de çevrimiçi bir kullanıcı arayüzüne sahiptir, böylece bir yandan geliştiricilere, bu araçları geliştirme ya da kendi projelerinde kullanma imkanı verirken öte yandan arayüzü ile yazılım alt yapısı olmayan kullancıların bu araçlardan faydalanmasına imkan tanımaktadır.
Türkçe karakter dönüştürücü (asciifier/deasciifier), birimlendirici/cümle bölücü (tokenizer/sentence splitter), yazım denetleyici (spell checker) ve biçimbilimsel çözümleyici/belirsizlik giderici (morphological analyzer/disambiguator).
Şu ana kadar geliştirilmiş olan Türkçe DDİ araçlarına açık kaynak kodlu ve çevrimiçi arayüze sahip bir yazılım paketi ekledik.