C# (CSharp) Lucene.Net.Analysis.Th ThaiWordBreaker Exemples

Langage de programmation: C# (CSharp)

Espace de nommage/Pack: Lucene.Net.Analysis.Th

Class/Type: ThaiWordBreaker

Exemples au hotexamples.com: 5

C# (CSharp) Lucene.Net.Analysis.Th ThaiWordBreaker - 5 exemples trouvés. Ce sont les exemples réels les mieux notés de Lucene.Net.Analysis.Th.ThaiWordBreaker extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

SetText(3)

Current(2)

Next(2)

Méthodes fréquemment utilisées

SetText (3)

Current (2)

Next (2)

Associées

TokenPreProcDirective

CheckTools

OpenMetaverse.InventoryNode

AmmoTracker

Bgra32Image

AProducto

IDataConverterService

AvidPathingOptions

UnpaidTimeOffsEditVM

RoundManagement

Related in langs

EnDescrypt (PHP)

util_send_header_internal_server_error (PHP)

xc_dom_seg_to_ptr (C++)

DCDisplaySomeLines (C++)

FeSub (Go)

NewTreeView (Go)

TransportProvider (Java)

UICharacterCreationFrame (Java)

zeros (Python)

keyword_type (Python)

LUCENENET specific class to patch the behavior of the ICU BreakIterator. Corrects the breaking of words by finding transitions between Thai and non-Thai characters. This logic assumes that the Java BreakIterator also breaks up Thai numerals from Arabic numerals (1, 2, 3, etc.). That is, it assumes the first test below passes and the second test fails in Lucene (not attempted). ThaiAnalyzer analyzer = new ThaiAnalyzer(TEST_VERSION_CURRENT, CharArraySet.EMPTY_SET); AssertAnalyzesTo(analyzer, "๑๒๓456", new string[] { "๑๒๓", "456" }); AssertAnalyzesTo(analyzer, "๑๒๓456", new string[] { "๑๒๓456" });

ThaiWordBreaker Class Documentation

Exemple #1

0

Afficher le fichier

/// <summary> /// Creates a new <see cref="ThaiTokenizer"/>, supplying the <see cref="Lucene.Net.Util.AttributeSource.AttributeFactory"/> </summary> public ThaiTokenizer(AttributeFactory factory, TextReader reader) : base(factory, reader, (BreakIterator)sentenceProto.Clone()) { // LUCENENET specific - DBBI_AVAILABLE removed because ICU always has a dictionary-based BreakIterator wordBreaker = new ThaiWordBreaker((BreakIterator)proto.Clone()); termAtt = AddAttribute <ICharTermAttribute>(); offsetAtt = AddAttribute <IOffsetAttribute>(); }

Exemple #2

0

Afficher le fichier

Fichier : ThaiTokenizer.cs Projet : reactxx/rewise

/// <summary> /// Creates a new <see cref="ThaiTokenizer"/>, supplying the <see cref="Lucene.Net.Util.AttributeSource.AttributeFactory"/> </summary> public ThaiTokenizer(AttributeFactory factory, TextReader reader) : base(factory, reader, new IcuBreakIterator(global::Icu.BreakIterator.UBreakIteratorType.SENTENCE, new CultureInfo("th"))) { if (!DBBI_AVAILABLE) { throw new System.NotSupportedException("This JRE does not have support for Thai segmentation"); } wordBreaker = new ThaiWordBreaker(new IcuBreakIterator(global::Icu.BreakIterator.UBreakIteratorType.WORD, CultureInfo.InvariantCulture)); termAtt = AddAttribute <ICharTermAttribute>(); offsetAtt = AddAttribute <IOffsetAttribute>(); }

Exemple #3

0

Afficher le fichier

Fichier : ThaiTokenizer.cs Projet : wwb/lucenenet

/// <summary> /// Creates a new ThaiTokenizer, supplying the AttributeFactory </summary> public ThaiTokenizer(AttributeFactory factory, TextReader reader) : base(factory, reader, BreakIterator.CreateSentenceInstance(Locale.GetUS())) { if (!DBBI_AVAILABLE) { throw new System.NotSupportedException("This JRE does not have support for Thai segmentation"); } wordBreaker = new ThaiWordBreaker(BreakIterator.CreateWordInstance(Locale.GetUS())); termAtt = AddAttribute <ICharTermAttribute>(); offsetAtt = AddAttribute <IOffsetAttribute>(); }

Exemple #4

0

Afficher le fichier

Fichier : ThaiTokenizer.cs Projet : ChristopherHaws/lucenenet

/// <summary> /// Creates a new ThaiTokenizer, supplying the AttributeFactory </summary> public ThaiTokenizer(AttributeFactory factory, TextReader reader) : base(factory, reader, BreakIterator.CreateSentenceInstance(Locale.GetUS())) { if (!DBBI_AVAILABLE) { throw new System.NotSupportedException("This JRE does not have support for Thai segmentation"); } wordBreaker = new ThaiWordBreaker(BreakIterator.CreateWordInstance(Locale.GetUS())); termAtt = AddAttribute<ICharTermAttribute>(); offsetAtt = AddAttribute<IOffsetAttribute>(); }

Exemple #5

0

Afficher le fichier

/// <summary> /// Creates a new <see cref="ThaiTokenizer"/>, supplying the <see cref="Lucene.Net.Util.AttributeSource.AttributeFactory"/> </summary> public ThaiTokenizer(AttributeFactory factory, TextReader reader) : base(factory, reader, CreateSentenceClone()) { // LUCENENET specific - DBBI_AVAILABLE removed because ICU always has a dictionary-based BreakIterator UninterruptableMonitor.Enter(syncLock); try { wordBreaker = new ThaiWordBreaker((BreakIterator)proto.Clone()); } finally { UninterruptableMonitor.Exit(syncLock); } termAtt = AddAttribute <ICharTermAttribute>(); offsetAtt = AddAttribute <IOffsetAttribute>(); }