Dillerde cümlenin yapısı ve anlamına karar veren en önemli ögelerden biri fiillerdir. Her fiilin de kendisine özgü bir yapısı, bu yapıya nelerin dâhil olacağını belirten bir çerçevesi vardır. İşte bu çerçeve hem sözdizimsel ögeler (örneğin özne ve nesne) hem de anlamsal ögeler (örneğin etkileyen ve etkilenen) barındırır. Bu ögelerin birbiriyle nasıl etkileştiğine, hangilerinin eşleştiğine dair bilgi o dili konuşan kişinin zihninde hazır halde bulunur.
İşte tam bu noktada devreye giren çözümlerden biri PropBank’tır. PropBank, herhangi bir dildeki fiillerin hangi ögelerle birleştiği hakkında bilgileri barındıran bir derlemdir.
Örneğin “göndermek” eyleminin üç ana ögesi vardır: gönderen (özne), gönderilen (nesne), ve alıcı (dolaylı nesne). PropBank bu fiilin aldığı üç ögeyi belirtir, sözdizimsel çeşitlerini seçer ve anlamsal olarak neyi ifade ettiklerini işaretler. Bu sayede bilgisayarın doğal dili işlerken başvuracağı kapsamlı bir veri kaynağı oluşturulur.
Starlang Yazılım ekibi olarak geliştirdiğimiz TRopBank, daha önce birçok dilde yapılmış PropBank çalışmalarına Türkçenin de eklenmesini sağlamıştır. TRopBank, yaklaşık 17.000 Türkçe fiilin sözdizimsel ve anlamsal ögelerini ve ikisi arasındaki eşleşmeleri barındırmaktadır. Bu derlemde fiiller anlamlarına göre sıralanıp ortak olanlar kümelendirilmiş, mümkün olan her kullanım göz önünde bulundurulmuştur. TRopBank’ın oluşturulma sürecinde hem temel hem mecaz anlamlı fiiller, hem tek kelimelik hem de çok kelimeli birleşik fiiller elle işaretlenmiş, hatalar ve eksikler işaretleyiciler tarafından tek tek kontrol edilip düzeltilmiştir.
TRopBank’ı oluşturan veriler, Türkçe kelime ağı KeNet’ten gelmektedir. Bu kelime ağının içeriği, aynı anlama gelen kelimeleri kümeler halinde bulundurup, farklı bağlamlarda ortaya çıkan bütün kelime anlamlarını ayrı girdiler olarak barındırmaktadır. Buradan alınan veriler öncelikle ayıklanmış, PropBank oluşturmaya uygun olan veriler ekibimiz tarafından önce sözdizimsel yapıları açısından incelenmiş, sonra da sözdizimsel ögeleri anlamsal ögeleri ile eşleştirilmiştir.
Örnek vermek gerekirse, koşmak ve yaşlanmak fiillerinin ikisi de bir özneye sahip olmalıdır. Ancak koşmanın öznesi kasıtlı bir “yapıcı” iken, yaşlanmanın öznesi kasıtsız, değişikliğe uğrayan bir “etkilenen”dir. Bu gibi birçok farklılık derlemde işaretlidir. Derlemde “Eylemi yapan kim?”, “Eylemden ne etkileniyor?”, “Eylem nerede gerçekleşiyor?”, “Eylem ne zaman gerçekleşip ne kadar sürüyor?” gibi soruların cevabı bulunmakta, bu sayede yazılımsal olarak doğal dil verisinde geçen fiiller kolaylıkla işlenebilmektedir.
Starlang Yazılım olarak geliştirdiğimiz açık kaynak ve ücretsiz ulaşabileceğiniz Türkçe PropBank kütüphanesi TRopbank ile fiilleri işleyebilirsiniz.