예제 #1
0
        static void Main(string[] args)
        {
            CroatianStemmer stemmer = CroatianStemmerFactory.CreateStemmer();

            Analyzer a = new CroAnalyzer(Version.LUCENE_29, stemmer);

            TextReader reader = new StringReader("Ideja koja je navodno proizašla iz svlačionice Dinama, kako su igrači spremni s milijun kuna nagraditi jednog sretnog navijača u zamjenu za pun stadion protiv PSG-a, zgrozila je hrvatski nogometni puk. Zgrozio se i Mario Stanić koji je jasno rekao što misli o novom potezu Modre uprave.");

            TokenStream ts = a.TokenStream("text", reader);
            TermAttribute ta = (TermAttribute)ts.GetAttribute(typeof(TermAttribute));

            while (ts.IncrementToken())
            {
                Console.WriteLine(ta.Term());
            }

            while (true)
            {
                String line = Console.ReadLine().Trim();
                Console.WriteLine(stemmer.Stem(line));
            }

            Console.Read();
        }
예제 #2
0
        private void InitLanguages(Version version)
        {
            langs = new HashSet<int>(new int[] { 1, 2 });
            langSuffix = new Dictionary<int, string>();
            langAnalyzer = new Dictionary<int, Analyzer>();

            // Croatian
            langSuffix[1] = @"hr";
            langAnalyzer[1] = new CroAnalyzer(version);

            // English
            langSuffix[2] = @"en";
            langAnalyzer[2] = new StandardAnalyzer(version);
            /*
            // German
            langSuffix[3] = @"de";
            langAnalyzer[3] = new GermanAnalyzer(version);

            // Italian
            //langSuffix[4] = @"it";
            //langAnalyzer[4] = ???;

            // Czech
            langSuffix[5] = @"cz";
            langAnalyzer[5] = new CzechAnalyzer(version);
             * */
        }