Makale Özeti:
|
Verili bir metnin yazarını tespit etmek ve birkaç metnin arasından yazarı aynı olanları
bulmak, adli dilbilimin önemli uygulama alanlarından biridir. Günümüze dek yapılan
çalışmaların çoğu, gazetelerin köşe yazıları gibi uzun ve nispeten fazla miktarda dilsel
veri içeren bütünce ile gerçekleştirildiğinden, kısa metinlerde yazar tanımaya ilişkin
herhangi bir yöntem sunmamaktadır. Zira adli dilbilim kapsamında yapılan
çalışmalarda, incelemelere konu edilen metinler oldukça kısadır. Bununla birlikte,
mikro-blog siteleri de dâhil olmak üzere, sosyal medya üzerinde yapılan paylaşımlar
da çoğu kez ceza veya hukuk davalarının konusu olabilmektedir. Dolayısıyla kısa
metinler üzerinde yazar tanımaya ilişkin birtakım yöntem ve yaklaşımlara ihtiyaç
duyulmaktadır. Bu çalışma, özellikle karakter kısıtı gözetilerek seçilen Twitter adlı
mikro-blog sitesinden toplanan çeşitli metinlerin; dilbilgisi, noktalama, sözcük ve
bağlam özellikleri kullanılarak yazarlarının tespitine ilişkin bir yöntem önermeyi
amaçlamaktadır. Ayırt edici olduğu veya olabileceği görülen özellikler paylaşılmakta
ve çoğunlukla bütünceye göre biçimlendirilmesi gereken yöntemler, genel
başlıklarıyla birlikte sunulmaktadır.
|