static void Main(string[] args) { CroatianStemmer stemmer = CroatianStemmerFactory.CreateStemmer(); Analyzer a = new CroAnalyzer(Version.LUCENE_29, stemmer); TextReader reader = new StringReader("Ideja koja je navodno proizašla iz svlačionice Dinama, kako su igrači spremni s milijun kuna nagraditi jednog sretnog navijača u zamjenu za pun stadion protiv PSG-a, zgrozila je hrvatski nogometni puk. Zgrozio se i Mario Stanić koji je jasno rekao što misli o novom potezu Modre uprave."); TokenStream ts = a.TokenStream("text", reader); TermAttribute ta = (TermAttribute)ts.GetAttribute(typeof(TermAttribute)); while (ts.IncrementToken()) { Console.WriteLine(ta.Term()); } while (true) { String line = Console.ReadLine().Trim(); Console.WriteLine(stemmer.Stem(line)); } Console.Read(); }
private void InitLanguages(Version version) { langs = new HashSet<int>(new int[] { 1, 2 }); langSuffix = new Dictionary<int, string>(); langAnalyzer = new Dictionary<int, Analyzer>(); // Croatian langSuffix[1] = @"hr"; langAnalyzer[1] = new CroAnalyzer(version); // English langSuffix[2] = @"en"; langAnalyzer[2] = new StandardAnalyzer(version); /* // German langSuffix[3] = @"de"; langAnalyzer[3] = new GermanAnalyzer(version); // Italian //langSuffix[4] = @"it"; //langAnalyzer[4] = ???; // Czech langSuffix[5] = @"cz"; langAnalyzer[5] = new CzechAnalyzer(version); * */ }