blog image

Morfolojik Analiz (Morphological Analysis) Nedir?

Morfolojik Analiz (Morphological Analysis), doğal dil işleme (natural language processing – NLP) aşamalarından biridir. Cümlelerin veri havuzundan çekilmesi ve kelimelerine ayrıştırılması aşamalarından hemen sonra yapılır. Kelimeler, eklerine ve köklerine ayrılarak incelenir. Morfolojik Analiz, Türkçe gibi biçimbilimsel açıdan zengin diller için oldukça önemlidir.

Morfem ile Hece Arasındaki Fark Nedir?

Morfoloji, kelimelerin iç yapısını ifade eder. Morfem ise dilin anlamlı en küçük birimidir. Her kelime en az bir morfemden oluşur. Morfem, hece ile karıştırılmamalıdır çünkü heceler anlam taşımazken morfemler anlam taşır. Kelimelerin eklerine ve köklerine ayrılması, aslında morfemlerine ayrılması ve her bir morfemin anlamının işaretlenmesidir.

Kelimeler sadece tek bir kökten oluşabileceği gibi, iki köklü, ya da birden fazla ek almış karmaşık formlarda da olabilir. Bu durumda, ilk önce kelime bir bütün olarak ele alınarak kategorisi belirlenir. Yani morfolojik analizi yapılacak olan kelimenin kategorisi (isim, sıfat veya fiil gibi) etiketlenir. 

Örneğin “satıcılar” kelimesi önce bir isim olarak etiketlenir. Kökün “satıcı” olarak belirlenmesi için ikinci aşamaya geçilir. Köklere gelen ekler ise, yapım eki ve çekim olarak ikiye ayrılır. Yapım ekleri “satıcı” örneğindeki “-(ı)cı” eki gibi, kelimenin anlamını değiştiren eklerdir. Bu ekler Türkçede ve diğer çoğu dilde köke çekim eklerinden daha yakın bir pozisyonda bulunur ve morfolojik analiz yaparken genellikle köke dahil edilir. Çekim ekleri ise, yapım eklerinden sonra gelir ve köke dahil edilmez. Bu eklerin, anlamlarından ziyade işlevleri vardır. Örneğin, “satıcılar” kelimesindeki “-lar” ekinin işlevi kelimeleri çoğul yapmaktır. Çekim ekleri, işlevleri ve “-lar” ekininin eklendiği kelimenin kökündeki son sesli harfinin özelliklerine göre bazen “-ler” bazen “-lar” olması gibi, kurallı olarak uğradıkları fonolojik değişimler göz önünde bulundurularak işaretlenir. Kelimenin kökü bundan sonra belirlenir. 

Morfolojik Analiz Yapılırken Kelime Havuzundaki Kelimeler Nasıl Olmalıdır?

Köklerin ve eklerin sağlıklı bir şekilde işaretlenebilmesi için oldukça geniş bir kelime havuzu gereklidir. Bu kelime havuzunda kelimeler yalın halleriyle bulundurulur. Fiillere gelen ekler mastar ekini düşürdüğünden, fiiller havuzda mastar eki olmadan bulundurulmalıdır. Birleşik kelimeler ise, sahip oldukları aitlik ekleri silinmeden bulundurulmalıdır.

Örneğin “at kestanesi” “at kestane” şeklinde değil, “at kestanesi” olarak bir bütün halinde havuzda bulunmalıdır. 

Morfolojik analiz yapılarak kelimenin ek ve kök ayrımlarının ve bunların kategorilerinin tüm ihtimalleri listelendikten sonra sıra morfolojik belirsizlik giderme aşamasına gelir. 

Starlang Yazılım olarak geliştirdiğimiz açık kaynak ve ücretsiz ulaşabileceğiniz Türkçe Morfolojik Analiz kütüphanesi ile Türkçe metinsel verilerinizin morfolojik analizini yapabilirsiniz.