C# (CSharp) Lucene.Net.Index.IndexReader.GetTermFreqVectorの例

プログラミング言語: C# (CSharp)

メソッド/関数: GetTermFreqVector

hotexamples.comのコード掲載数: 6

C# (CSharp) Lucene.Net.Index.IndexReader.GetTermFreqVector - 6件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたC# (CSharp)のLucene.Net.Index.IndexReader.GetTermFreqVectorの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Close(30)

Terms(30)

MaxDoc(30)

TermDocs(30)

Open(30)

Norms(20)

NumDocs(20)

Dispose(11)

DocFreq(10)

GetFieldCacheKey(6)

TermPositions(6)

HasDeletions(6)

DeleteDocuments(5)

GetDeletesCacheKey(4)

GetTermFreqVector(4)

Delete(4)

IsDeleted(4)

DeleteDocument(4)

GetSequentialSubReaders(3)

Unlock(2)

SetNorm(2)

IndexExists(2)

Document(2)

NumDeletedDocs(1)

Leaves(1)

GetTermFreqVectors(1)

GetCommitUserData(1)

close(1)

コード例 #1

ファイルを表示

        public static TokenStream GetTokenStream(IndexReader reader, int docId, System.String field)
        {
            TermFreqVector tfv = (TermFreqVector)reader.GetTermFreqVector(docId, field);

            if (tfv == null)
            {
                throw new System.ArgumentException(field + " in doc #" + docId + "does not have any term position data stored");
            }
            if (tfv is TermPositionVector)
            {
                TermPositionVector tpv = (TermPositionVector)reader.GetTermFreqVector(docId, field);
                return(GetTokenStream(tpv));
            }
            throw new System.ArgumentException(field + " in doc #" + docId + "does not have any term position data stored");
        }

コード例 #2

ファイルを表示

ファイル: TestMultiThreadTermVectors.cs プロジェクト: stgwilli/ravendb

        private void  TestTermVectors()
        {
            // check:
            int  numDocs = reader.NumDocs();
            long start   = 0L;

            for (int docId = 0; docId < numDocs; docId++)
            {
                start = (DateTime.Now.Ticks / TimeSpan.TicksPerMillisecond);
                TermFreqVector[] vectors = reader.GetTermFreqVectors(docId);
                timeElapsed += (DateTime.Now.Ticks / TimeSpan.TicksPerMillisecond) - start;

                // verify vectors result
                VerifyVectors(vectors, docId);

                start = (DateTime.Now.Ticks / TimeSpan.TicksPerMillisecond);
                TermFreqVector vector = reader.GetTermFreqVector(docId, "field");
                timeElapsed += (DateTime.Now.Ticks / TimeSpan.TicksPerMillisecond) - start;

                vectors    = new TermFreqVector[1];
                vectors[0] = vector;

                VerifyVectors(vectors, docId);
            }
        }

コード例 #3

ファイルを表示

        public void Test_SegmentTermVector_IndexOf()
        {
            Lucene.Net.Store.RAMDirectory directory = new Lucene.Net.Store.RAMDirectory();
            Lucene.Net.Analysis.Analyzer  analyzer  = new Lucene.Net.Analysis.WhitespaceAnalyzer();
            Lucene.Net.Index.IndexWriter  writer    = new Lucene.Net.Index.IndexWriter(directory, analyzer, Lucene.Net.Index.IndexWriter.MaxFieldLength.LIMITED);
            Lucene.Net.Documents.Document document  = new Lucene.Net.Documents.Document();
            document.Add(new Lucene.Net.Documents.Field("contents", new System.IO.StreamReader(new System.IO.MemoryStream(System.Text.Encoding.ASCII.GetBytes("a_ a0"))), Lucene.Net.Documents.Field.TermVector.WITH_OFFSETS));
            writer.AddDocument(document);
            Lucene.Net.Index.IndexReader        reader = writer.GetReader();
            Lucene.Net.Index.TermPositionVector tpv    = reader.GetTermFreqVector(0, "contents") as Lucene.Net.Index.TermPositionVector;
            //Console.WriteLine("tpv: " + tpv);
            int index = tpv.IndexOf("a_");

            Assert.AreEqual(index, 1, "See the issue: LUCENENET-183");
        }

コード例 #4

ファイルを表示

ファイル: TokenSources.cs プロジェクト: usmanghani/Misc

        /// <summary> A convenience method that tries a number of approaches to getting a token stream.
        /// The cost of finding there are no termVectors in the index is minimal (1000 invocations still 
        /// registers 0 ms). So this "lazy" (flexible?) approach to coding is probably acceptable
        /// </summary>
        /// <param name="">reader</param>
        /// <param name="">docId</param>
        /// <param name="">field</param>
        /// <param name="">analyzer</param>
        /// <returns> null if field not stored correctly 
        /// </returns>
        /// <throws>  IOException </throws>
        public static TokenStream GetAnyTokenStream(IndexReader reader, int docId, string field, Analyzer analyzer)
        {
            TokenStream ts = null;

            TermFreqVector tfv = (TermFreqVector) reader.GetTermFreqVector(docId, field);
            if (tfv != null)
            {
                if (tfv is TermPositionVector)
                {
                    ts = GetTokenStream((TermPositionVector) tfv);
                }
            }
            //No token info stored so fall back to analyzing raw content
            if (ts == null)
            {
                ts = GetTokenStream(reader, docId, field, analyzer);
            }
            return ts;
        }

コード例 #5

ファイルを表示

        /// <summary> A convenience method that tries a number of approaches to getting a token stream.
        /// The cost of finding there are no termVectors in the index is minimal (1000 invocations still
        /// registers 0 ms). So this "lazy" (flexible?) approach to coding is probably acceptable
        /// </summary>
        /// <param name="">reader
        /// </param>
        /// <param name="">docId
        /// </param>
        /// <param name="">field
        /// </param>
        /// <param name="">analyzer
        /// </param>
        /// <returns> null if field not stored correctly
        /// </returns>
        /// <throws>  IOException </throws>
        public static TokenStream GetAnyTokenStream(IndexReader reader, int docId, System.String field, Analyzer analyzer)
        {
            TokenStream ts = null;

            TermFreqVector tfv = (TermFreqVector)reader.GetTermFreqVector(docId, field);

            if (tfv != null)
            {
                if (tfv is TermPositionVector)
                {
                    ts = GetTokenStream((TermPositionVector)tfv);
                }
            }
            //No token info stored so fall back to analyzing raw content
            if (ts == null)
            {
                ts = GetTokenStream(reader, docId, field, analyzer);
            }
            return(ts);
        }

コード例 #6

ファイルを表示

ファイル: TokenSources.cs プロジェクト: vikasraz/indexsearchutils

		public static TokenStream GetTokenStream(IndexReader reader, int docId, System.String field)
		{
			TermFreqVector tfv = (TermFreqVector) reader.GetTermFreqVector(docId, field);
			if (tfv == null)
			{
				throw new System.ArgumentException(field + " in doc #" + docId + "does not have any term position data stored");
			}
			if (tfv is TermPositionVector)
			{
				TermPositionVector tpv = (TermPositionVector) reader.GetTermFreqVector(docId, field);
				return GetTokenStream(tpv);
			}
			throw new System.ArgumentException(field + " in doc #" + docId + "does not have any term position data stored");
		}