C# (CSharp) KSR.Model FeatureExtractions.HowManyWordsExtractor示例

编程语言: C# (CSharp)

命名空间/包名称: KSR.Model

方法/功能: HowManyWordsExtractor

hotexamples.com的示例: 2

C# (CSharp) KSR.Model FeatureExtractions.HowManyWordsExtractor - 已找到2个示例。这些是从开源项目中提取的最受好评的KSR.Model.FeatureExtractions.HowManyWordsExtractor现实C# (CSharp)示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

HowManyWordsExtractor(2)

InverseDocumentFrequency(1)

示例#1

显示文件

        //Inverse document frequency
        public static void InverseDocumentFrequency(List <Reuter> reuters, List <Reuter> result)
        {
            double howManyDocumentsContainkeyword = 0;

            result.Clear();
            for (int i = 0; i < reuters.Count; i++)
            {
                if (reuters.ElementAt(i).Places.Count != 1)
                {
                    continue;
                }
                result.Add(new Reuter {
                    Places = reuters.ElementAt(i).Places, TextTemp = reuters.ElementAt(i).TextTemp
                });
                result.Last().TextTemp = result.Last().TextTemp.Replace("    ", " ");
                result.Last().Text     = result.Last().TextTemp.Split(' ', '\n', '\t').ToList();
                FeatureExtractions.HowManyWordsExtractor(result.Last());
            }

            foreach (Reuter r in result)
            {
                r.VectorFeatures = r.VectorFeatures.OrderBy(x => x.Value)
                                   .Take(10)
                                   .ToDictionary(pair => pair.Key, pair => pair.Value);
            }

            for (int i = 0; i < result.Count; ++i)
            {
                for (int j = 0; j < result[i].VectorFeatures.Count; ++j)
                {
                    foreach (Reuter r in result)
                    {
                        if (r.Text.Contains(result[i].VectorFeatures.Keys.ElementAt(j)))
                        {
                            howManyDocumentsContainkeyword++;
                        }
                    }
                    double tempDiff = (double)result.Count / howManyDocumentsContainkeyword;
                    result[i].VectorFeatures[result[i].VectorFeatures.Keys.ElementAt(j)] = Math.Log10(tempDiff);
                    howManyDocumentsContainkeyword = 0;
                }
            }
        }

示例#2

显示文件

文件： Reuter.cs 项目： Bartosz-Banachowski/KSR

 public static void HowManyWords(List <Reuter> result)
 {
     FeatureExtractions.HowManyWordsExtractor(result.Last());
 }