Esempio n. 1
0
        public void kelimeBicimlendir(Kelime kelime)
        {
            Kok        kok    = kelime.kok();
            HarfDizisi olusan = kelime.icerik();

            if (kok.tip().Equals(KelimeTipi.KISALTMA))
            {
                //cozumleme sirasinda eklenmis harf varsa onlari sil.
                int silinecek = kok.icerik().Length;
                if (kok.ozelDurumIceriyormu(TurkceKokOzelDurumTipi.KISALTMA_SON_SESSIZ))
                {
                    silinecek += 2;
                }
                if (kok.ozelDurumIceriyormu(TurkceKokOzelDurumTipi.KISALTMA_SON_SESLI))
                {
                    silinecek++;
                }
                //kelimenin olusan kismindan kokun icereigini sil.
                olusan.harfSil(0, silinecek);
                //simdi kokun orjinal halini ekle.
                olusan.ekle(0, new HarfDizisi(kok.asil(), alfabe));

                if (olusan.Length == kok.asil().Length)
                {
                    return;
                }
                //eger gerekiyorsa kesme isareti koy.
                if (!olusan.harf(kok.asil().Length - 1).Equals(alfabe.harf('.')))
                {
                    olusan.ekle(kok.asil().Length, alfabe.harf('\''));
                }
            }
            else if (kok.tip() == KelimeTipi.OZEL)
            {
                olusan.harfDegistir(0, alfabe.buyukHarf(olusan.ilkHarf()));
                if (kok.ozelDurumIceriyormu(TurkceKokOzelDurumTipi.KESMESIZ))
                {
                    return;
                }
                List <Ek> ekler = kelime.ekler();
                if (ekler.Count > 1)
                {
                    Ek ek = (Ek)ekler[1];
                    if (ek.iyelikEkiMi() || ek.halEkiMi())
                    {
                        int kesmePozisyonu = kok.icerik().Length;
                        olusan.ekle(kesmePozisyonu, alfabe.harf('\''));
                    }
                }
            }
            // ozel ic karakter iceren kokler icin bicimleme

/*        if (kok.ozelDurumlar().contains(TurkceKokOzelDurumlari.OZEL_IC_KARAKTER)) {
 *          //olusan ksimdan koku sil
 *          int silinecek = kok.icerik().length();
 *          olusan.harfSil(0, silinecek);
 *          //simdi kokun orjinal halini ekle.
 *          olusan.ekle(0, new HarfDizisi(kok.asil()));
 *      }*/
        }
Esempio n. 2
0
        private String getDuzMetinSozlukForm(Kok kok)
        {
            //icerik olarak icerigin varsa asil halini yoksa normal kok icerigini al.
            String icerik = kok.icerik();

            if (kok.asil() != null)
            {
                icerik = kok.asil();
            }

            StringBuilder res = new StringBuilder(icerik);

            res.Append(" ");
            // Tipi ekleyelim.
            if (kok.tip() == KelimeTipi.YOK)
            {
                logger.Warn("tipsiz kok:" + kok);
                return(res.ToString());
            }

            res.Append(kok.tip().ToString());
            res.Append(" ");
            res.Append(getOzellikString(kok.ozelDurumDizisi()));
            return(res.ToString());
        }
Esempio n. 3
0
        public bool kelimeBicimiDenetle(Kelime kelime, String giris)
        {
            if (giris.Length == 0)
            {
                return(false);
            }
            Kok kok = kelime.kok();

            if (kok.tip().Equals(KelimeTipi.KISALTMA))
            {
                // eger giriskokun orjinal hali ile baslamiyorsa hatali demektir.
                String _asil = kok.asil();
                if (!giris.StartsWith(_asil))
                {
                    return(false);
                }
                if (giris.Equals(_asil))
                {
                    return(true);
                }
                //burada farkli kisaltma turleri icin kesme ve nokta isaretlerinin
                // dogru olup olmadigina bakiliyor.
                String kalan = giris.Substring(_asil.Length);
                if (_asil[_asil.Length - 1] == '.')
                {
                    return(kalan[0] != '\'');
                }
                return(kalan[0] == '\'');
            }
            else if (kelime.kok().tip() == KelimeTipi.OZEL)
            {
                if (Char.IsLower(giris[0]))
                {
                    return(false);
                }
                if (kelime.kok().ozelDurumIceriyormu(TurkceKokOzelDurumTipi.KESMESIZ))
                {
                    return(true);
                }
                List <Ek> ekler = kelime.ekler();
                if (ekler.Count > 1)
                {
                    Ek ek = (Ek)ekler[1];
                    if (ek.iyelikEkiMi() || ek.halEkiMi())
                    {
                        int kesmePozisyonu = kelime.kok().icerik().Length;
                        return(kesmePozisyonu <= giris.Length && giris[kesmePozisyonu] == '\'');
                    }
                }
            }
            // ozel ic karakter iceren kokler icin bicimleme

/*        if (kok.ozelDurumlar().contains(TurkceKokOzelDurumlari.OZEL_IC_KARAKTER)) {&
 *          //olusan ksimdan koku sil
 *          String _asil = kok.asil();
 *          if (!giris.startsWith(_asil))
 *            return false;
 *      }*/
            return(true);
        }
        public void duzyaziOzelDurumOku(Kok kok, String okunanIcerik, String[] parcalar)
        {
            for (int i = 2; i < parcalar.Length; i++)
            {
                String _ozelDurum = parcalar[i];

                //kisaltma ozel durumunun analizi burada yapiliyor.
                if (_ozelDurum.StartsWith(TurkceKokOzelDurumTipi.KISALTMA_SON_SESLI.KisaAd))
                {
                    int loc = _ozelDurum.IndexOf(':');
                    if (loc > 0)
                    {
                        String parca    = _ozelDurum.Substring(loc + 1);
                        char   sonSesli = parca[0];
                        if (!alfabe.harf(sonSesli).sesliMi())
                        {
                            logger.Warn("Hatali kisaltma harfi.. Sesli bekleniyordu." + _ozelDurum);
                        }
                        kok.KisaltmaSonSeslisi = sonSesli;
                        if (parca.Length > 1)
                        {
                            kok.ozelDurumEkle(ozelDurumlar[TurkceKokOzelDurumTipi.KISALTMA_SON_SESSIZ]);
                        }
                        else
                        {
                            kok.ozelDurumCikar(TurkceKokOzelDurumTipi.KISALTMA_SON_SESLI);
                        }
                    }
                    else
                    {
                        char sonHarf = kok.icerik()[kok.icerik().Length - 1];
                        if (!alfabe.harf(sonHarf).sesliMi())
                        {
                            kok.KisaltmaSonSeslisi = 'e';
                            kok.ozelDurumEkle(ozelDurumlar[TurkceKokOzelDurumTipi.KISALTMA_SON_SESLI]);
                        }
                    }
                    continue;
                }

                //diger ozel durumlarin elde edilmesi..
                KokOzelDurumu oz = ozelDurum(_ozelDurum);
                if (oz != null)
                {
                    kok.ozelDurumEkle(oz);
                }
                else
                {
                    logger.Warn("Hatali kok bileseni" + kok.icerik() + " Token: " + _ozelDurum);
                }
            }

            //kisaltmalari ve ozel karakter iceren kokleri asil icerik olarak ata.
            if (kok.tip() == KelimeTipi.KISALTMA || kok.ozelDurumIceriyormu(TurkceKokOzelDurumTipi.OZEL_IC_KARAKTER))
            {
                kok.Asil = okunanIcerik;
            }
        }
Esempio n. 5
0
        /**
         * Kok nesnesinin tipine gore gelebilecek ilk ek'i dondurur.
         * Baslangic ekleri bilgisi dil tarafindan belirlenir.
         *
         * @param kok
         * @return ilk Ek, eger kok tipi baslangic ekleri <baslangicEkleri>
         *         haritasinda belirtilmemisse BOS_EK doner.
         */
        public Ek ilkEkBelirle(Kok kok)
        {
            Ek baslangicEki = baslangicEkleri[kok.tip()];

            if (baslangicEki != null)
            {
                return(baslangicEki);
            }
            else
            {
                return(BOS_EK);
            }
        }
        public void ozelDurumBelirle(Kok kok)
        {
            // eger bir fiilin son harfi sesli ise bu dogrudan simdiki zaman ozel durumu olarak ele alinir.
            // bu ozel durum bilgi tabaninda ayrica belirtilmedigi icin burada kok'e eklenir.  aramak -> ar(a)Iyor
            char sonChar = kok.icerik()[kok.icerik().Length - 1];

            if (kok.tip() == KelimeTipi.FIIL && alfabe.harf(sonChar).sesliMi())
            {
                //demek-yemek fiilleri icin bu uygulama yapilamaz.
                if (!kok.ozelDurumIceriyormu(TurkceKokOzelDurumTipi.FIIL_KOK_BOZULMASI))
                {
                    kok.ozelDurumEkle(ozelDurumlar[TurkceKokOzelDurumTipi.SIMDIKI_ZAMAN]);
                }
            }
        }
Esempio n. 7
0
        public bool kokGirisDegismiVarsaUygula(Kok kok, HarfDizisi kokDizi, HarfDizisi girisDizi)
        {
            //turkce'de sadece kisaltmalarda bu metoda ihtiyacimiz var.
            char c = kok.KisaltmaSonSeslisi;

            if (girisDizi.Length == 0)
            {
                return(false);
            }
            if (kok.tip().Equals(KelimeTipi.KISALTMA) && c != 0)
            {
                TurkceHarf h = alfabe.harf(c);
                //toleransli cozumleyicide kok giristen daha uzun olabiliyor.
                // o nedenle asagidaki kontrolun yapilmasi gerekiyor.
                int kokBoyu = kok.icerik().Length;
                if (kokBoyu <= girisDizi.Length)
                {
                    girisDizi.ekle(kokBoyu, h);
                }
                else
                {
                    girisDizi.ekle(h);
                }
                kokDizi.ekle(h);
                if (kok.ozelDurumIceriyormu(TurkceKokOzelDurumTipi.KISALTMA_SON_SESSIZ))
                {
                    //gene toleransli cozumleyicinin hata vermemesi icin asagidaki kontrole ihtiyacimiz var
                    if (kokBoyu < girisDizi.Length)
                    {
                        girisDizi.ekle(kokBoyu + 1, alfabe.harf('b'));
                    }
                    else
                    {
                        girisDizi.ekle(alfabe.harf('b'));
                    }
                    kokDizi.ekle(alfabe.harf('b'));
                }
                return(true);
            }
            return(false);
        }
Esempio n. 8
0
        public void testCozumle3()
        {
            //zemberek = new Zemberek(new TurkiyeTurkcesi());
            string str = "getirttirebilirsiniz";

            Assert.IsTrue(zemberek.kelimeDenetle(str));
            Kelime[] sonuc = zemberek.kelimeCozumle(str);
            Assert.AreEqual(1, sonuc.Length);

            Kok kok = sonuc[0].kok();

            Assert.AreEqual("getir", kok.icerik());
            Assert.AreEqual(KelimeTipi.FIIL, kok.tip());
            List <Ek> ekler = sonuc[0].ekler();

            Assert.AreEqual(6, ekler.Count);
            Assert.AreEqual("FIIL_KOK", ekler[0].ad());
            Assert.AreEqual("FIIL_OLDURGAN_T", ekler[1].ad());
            Assert.AreEqual("FIIL_ETTIRGEN_TIR", ekler[2].ad());
            Assert.AreEqual("FIIL_YETENEK_EBIL", ekler[3].ad());
            Assert.AreEqual("FIIL_GENISZAMAN_IR", ekler[4].ad());
            Assert.AreEqual("FIIL_KISI_SIZ", ekler[5].ad());
        }
Esempio n. 9
0
 /**
  * Kok nesnesinin tipine gore gelebilecek ilk ek'i dondurur.
  * Baslangic ekleri bilgisi dil tarafindan belirlenir.
  *
  * @param kok
  * @return ilk Ek, eger kok tipi baslangic ekleri <baslangicEkleri>
  *         haritasinda belirtilmemisse BOS_EK doner.
  */
 public Ek ilkEkBelirle(Kok kok) {
     Ek baslangicEki = baslangicEkleri[kok.tip()];
     if (baslangicEki != null)
         return baslangicEki;
     else
         return BOS_EK;
 }