public void kelimeBicimlendir(Kelime kelime) { Kok kok = kelime.kok(); HarfDizisi olusan = kelime.icerik(); if (kok.tip().Equals(KelimeTipi.KISALTMA)) { //cozumleme sirasinda eklenmis harf varsa onlari sil. int silinecek = kok.icerik().Length; if (kok.ozelDurumIceriyormu(TurkceKokOzelDurumTipi.KISALTMA_SON_SESSIZ)) { silinecek += 2; } if (kok.ozelDurumIceriyormu(TurkceKokOzelDurumTipi.KISALTMA_SON_SESLI)) { silinecek++; } //kelimenin olusan kismindan kokun icereigini sil. olusan.harfSil(0, silinecek); //simdi kokun orjinal halini ekle. olusan.ekle(0, new HarfDizisi(kok.asil(), alfabe)); if (olusan.Length == kok.asil().Length) { return; } //eger gerekiyorsa kesme isareti koy. if (!olusan.harf(kok.asil().Length - 1).Equals(alfabe.harf('.'))) { olusan.ekle(kok.asil().Length, alfabe.harf('\'')); } } else if (kok.tip() == KelimeTipi.OZEL) { olusan.harfDegistir(0, alfabe.buyukHarf(olusan.ilkHarf())); if (kok.ozelDurumIceriyormu(TurkceKokOzelDurumTipi.KESMESIZ)) { return; } List <Ek> ekler = kelime.ekler(); if (ekler.Count > 1) { Ek ek = (Ek)ekler[1]; if (ek.iyelikEkiMi() || ek.halEkiMi()) { int kesmePozisyonu = kok.icerik().Length; olusan.ekle(kesmePozisyonu, alfabe.harf('\'')); } } } // ozel ic karakter iceren kokler icin bicimleme /* if (kok.ozelDurumlar().contains(TurkceKokOzelDurumlari.OZEL_IC_KARAKTER)) { * //olusan ksimdan koku sil * int silinecek = kok.icerik().length(); * olusan.harfSil(0, silinecek); * //simdi kokun orjinal halini ekle. * olusan.ekle(0, new HarfDizisi(kok.asil())); * }*/ }
private String getDuzMetinSozlukForm(Kok kok) { //icerik olarak icerigin varsa asil halini yoksa normal kok icerigini al. String icerik = kok.icerik(); if (kok.asil() != null) { icerik = kok.asil(); } StringBuilder res = new StringBuilder(icerik); res.Append(" "); // Tipi ekleyelim. if (kok.tip() == KelimeTipi.YOK) { logger.Warn("tipsiz kok:" + kok); return(res.ToString()); } res.Append(kok.tip().ToString()); res.Append(" "); res.Append(getOzellikString(kok.ozelDurumDizisi())); return(res.ToString()); }
public bool kelimeBicimiDenetle(Kelime kelime, String giris) { if (giris.Length == 0) { return(false); } Kok kok = kelime.kok(); if (kok.tip().Equals(KelimeTipi.KISALTMA)) { // eger giriskokun orjinal hali ile baslamiyorsa hatali demektir. String _asil = kok.asil(); if (!giris.StartsWith(_asil)) { return(false); } if (giris.Equals(_asil)) { return(true); } //burada farkli kisaltma turleri icin kesme ve nokta isaretlerinin // dogru olup olmadigina bakiliyor. String kalan = giris.Substring(_asil.Length); if (_asil[_asil.Length - 1] == '.') { return(kalan[0] != '\''); } return(kalan[0] == '\''); } else if (kelime.kok().tip() == KelimeTipi.OZEL) { if (Char.IsLower(giris[0])) { return(false); } if (kelime.kok().ozelDurumIceriyormu(TurkceKokOzelDurumTipi.KESMESIZ)) { return(true); } List <Ek> ekler = kelime.ekler(); if (ekler.Count > 1) { Ek ek = (Ek)ekler[1]; if (ek.iyelikEkiMi() || ek.halEkiMi()) { int kesmePozisyonu = kelime.kok().icerik().Length; return(kesmePozisyonu <= giris.Length && giris[kesmePozisyonu] == '\''); } } } // ozel ic karakter iceren kokler icin bicimleme /* if (kok.ozelDurumlar().contains(TurkceKokOzelDurumlari.OZEL_IC_KARAKTER)) {& * //olusan ksimdan koku sil * String _asil = kok.asil(); * if (!giris.startsWith(_asil)) * return false; * }*/ return(true); }
public void duzyaziOzelDurumOku(Kok kok, String okunanIcerik, String[] parcalar) { for (int i = 2; i < parcalar.Length; i++) { String _ozelDurum = parcalar[i]; //kisaltma ozel durumunun analizi burada yapiliyor. if (_ozelDurum.StartsWith(TurkceKokOzelDurumTipi.KISALTMA_SON_SESLI.KisaAd)) { int loc = _ozelDurum.IndexOf(':'); if (loc > 0) { String parca = _ozelDurum.Substring(loc + 1); char sonSesli = parca[0]; if (!alfabe.harf(sonSesli).sesliMi()) { logger.Warn("Hatali kisaltma harfi.. Sesli bekleniyordu." + _ozelDurum); } kok.KisaltmaSonSeslisi = sonSesli; if (parca.Length > 1) { kok.ozelDurumEkle(ozelDurumlar[TurkceKokOzelDurumTipi.KISALTMA_SON_SESSIZ]); } else { kok.ozelDurumCikar(TurkceKokOzelDurumTipi.KISALTMA_SON_SESLI); } } else { char sonHarf = kok.icerik()[kok.icerik().Length - 1]; if (!alfabe.harf(sonHarf).sesliMi()) { kok.KisaltmaSonSeslisi = 'e'; kok.ozelDurumEkle(ozelDurumlar[TurkceKokOzelDurumTipi.KISALTMA_SON_SESLI]); } } continue; } //diger ozel durumlarin elde edilmesi.. KokOzelDurumu oz = ozelDurum(_ozelDurum); if (oz != null) { kok.ozelDurumEkle(oz); } else { logger.Warn("Hatali kok bileseni" + kok.icerik() + " Token: " + _ozelDurum); } } //kisaltmalari ve ozel karakter iceren kokleri asil icerik olarak ata. if (kok.tip() == KelimeTipi.KISALTMA || kok.ozelDurumIceriyormu(TurkceKokOzelDurumTipi.OZEL_IC_KARAKTER)) { kok.Asil = okunanIcerik; } }
/** * Kok nesnesinin tipine gore gelebilecek ilk ek'i dondurur. * Baslangic ekleri bilgisi dil tarafindan belirlenir. * * @param kok * @return ilk Ek, eger kok tipi baslangic ekleri <baslangicEkleri> * haritasinda belirtilmemisse BOS_EK doner. */ public Ek ilkEkBelirle(Kok kok) { Ek baslangicEki = baslangicEkleri[kok.tip()]; if (baslangicEki != null) { return(baslangicEki); } else { return(BOS_EK); } }
public void ozelDurumBelirle(Kok kok) { // eger bir fiilin son harfi sesli ise bu dogrudan simdiki zaman ozel durumu olarak ele alinir. // bu ozel durum bilgi tabaninda ayrica belirtilmedigi icin burada kok'e eklenir. aramak -> ar(a)Iyor char sonChar = kok.icerik()[kok.icerik().Length - 1]; if (kok.tip() == KelimeTipi.FIIL && alfabe.harf(sonChar).sesliMi()) { //demek-yemek fiilleri icin bu uygulama yapilamaz. if (!kok.ozelDurumIceriyormu(TurkceKokOzelDurumTipi.FIIL_KOK_BOZULMASI)) { kok.ozelDurumEkle(ozelDurumlar[TurkceKokOzelDurumTipi.SIMDIKI_ZAMAN]); } } }
public bool kokGirisDegismiVarsaUygula(Kok kok, HarfDizisi kokDizi, HarfDizisi girisDizi) { //turkce'de sadece kisaltmalarda bu metoda ihtiyacimiz var. char c = kok.KisaltmaSonSeslisi; if (girisDizi.Length == 0) { return(false); } if (kok.tip().Equals(KelimeTipi.KISALTMA) && c != 0) { TurkceHarf h = alfabe.harf(c); //toleransli cozumleyicide kok giristen daha uzun olabiliyor. // o nedenle asagidaki kontrolun yapilmasi gerekiyor. int kokBoyu = kok.icerik().Length; if (kokBoyu <= girisDizi.Length) { girisDizi.ekle(kokBoyu, h); } else { girisDizi.ekle(h); } kokDizi.ekle(h); if (kok.ozelDurumIceriyormu(TurkceKokOzelDurumTipi.KISALTMA_SON_SESSIZ)) { //gene toleransli cozumleyicinin hata vermemesi icin asagidaki kontrole ihtiyacimiz var if (kokBoyu < girisDizi.Length) { girisDizi.ekle(kokBoyu + 1, alfabe.harf('b')); } else { girisDizi.ekle(alfabe.harf('b')); } kokDizi.ekle(alfabe.harf('b')); } return(true); } return(false); }
public void testCozumle3() { //zemberek = new Zemberek(new TurkiyeTurkcesi()); string str = "getirttirebilirsiniz"; Assert.IsTrue(zemberek.kelimeDenetle(str)); Kelime[] sonuc = zemberek.kelimeCozumle(str); Assert.AreEqual(1, sonuc.Length); Kok kok = sonuc[0].kok(); Assert.AreEqual("getir", kok.icerik()); Assert.AreEqual(KelimeTipi.FIIL, kok.tip()); List <Ek> ekler = sonuc[0].ekler(); Assert.AreEqual(6, ekler.Count); Assert.AreEqual("FIIL_KOK", ekler[0].ad()); Assert.AreEqual("FIIL_OLDURGAN_T", ekler[1].ad()); Assert.AreEqual("FIIL_ETTIRGEN_TIR", ekler[2].ad()); Assert.AreEqual("FIIL_YETENEK_EBIL", ekler[3].ad()); Assert.AreEqual("FIIL_GENISZAMAN_IR", ekler[4].ad()); Assert.AreEqual("FIIL_KISI_SIZ", ekler[5].ad()); }
/** * Kok nesnesinin tipine gore gelebilecek ilk ek'i dondurur. * Baslangic ekleri bilgisi dil tarafindan belirlenir. * * @param kok * @return ilk Ek, eger kok tipi baslangic ekleri <baslangicEkleri> * haritasinda belirtilmemisse BOS_EK doner. */ public Ek ilkEkBelirle(Kok kok) { Ek baslangicEki = baslangicEkleri[kok.tip()]; if (baslangicEki != null) return baslangicEki; else return BOS_EK; }