WordNet (kelime ağı), bir dilin tüm kelimelerini, bu kelimelerin tanımlarını ve aralarındaki anlambilimsel ilişkileri içeren bir veritabanıdır. İlk olarak 1985 yılında Princeton Üniversitesinde İngilizce için oluşturulmuş olsa da, günümüzde 200’den fazla dili kapsar hale gelmiştir. Farklı dillerdeki versiyonlarına örnek olarak 1997 yılında oluşturulmaya başlanan GermaNet (Almanca), 2006 yılında oluşturulmaya başlanan Arabic Wordnet (Arapça) ve FinnWordnet (Fince) sayılabilir.
WordNet bazı açılardan bir sözlüğü andırsa da aslında çok daha fazlasıdır. İsimler, sıfatlar, fiiller ve zarflar ayrı olarak gruplanır ve eş anlamlı kelimeler synset adı verilen öbekler haline getirilir. WordNet’i sözlükten farklı kılan özelliklerinden bir diğeri de kelimelerin hiyerarşik bir yapı altında dizilmesidir. Synset denilen eş anlamlı öbekler oluşturulduktan sonra bunlar anlamsal kapsamlarına göre sıralanırlar. Anlamsal kapsamı daha geniş olan terimler hypernym, daha spesifik olanlar ise hyponym olarak adlandırılır. Bir kelime, anlamı daha geniş olan bir terimin hyponym’i olabilirken, aynı zamanda daha dar anlamlı bir kelimenin hypernym’i olabilir.
Örneğin, Türkçe Wordnet’te “hayvan” kelimesi “canlı” teriminin altında listelenirken, kendi altında “kedi” kelimesini içerir. Bu durumda, “kedi” kelimesi, “hayvan” kelimesinin hyponym’i, “canlı” kelimesi de “hayvan” kelimesinin hypernym’i olur. Tabii ki, “canlı” terimi, altında “insan” ve “bitki” gruplarını da içermelidir.
WordNet’in ana uygulama alanı doğal dil işlemeyi kapsar. Metin analizi, makine çevirisi, anlam belirsizliği giderme bu uygulamalardan bazılarıdır.
Türkçe üzerine yapılmış en büyük çalışmalarından biri KeNet’tir. KeNet, Işık Üniversitesi bünyesinde oluşturulmuş, 80.000’den fazla synset içeren bir veritabanıdır. Türkçe üzerine çalışmalar aynı zamanda BalkaNet kapsamında Sabancı Üniversitesinde yürütülmektedir.
Starlang Yazılım olarak Işık üniversitesi bünyesinde geliştirdiğimiz Türkçe WordNet KeNet‘e açık kaynak ve ücretsiz ulaşabilirsiniz.