C# (CSharp) LostTech.Gradient.Samples.GPT2 Gpt2Encoder.Encodeの例

プログラミング言語: C# (CSharp)

名前空間/パッケージ名: LostTech.Gradient.Samples.GPT2

クラス/型: Gpt2Encoder

メソッド/関数: Encode

hotexamples.comのコード掲載数: 2

C# (CSharp) LostTech.Gradient.Samples.GPT2 Gpt2Encoder.Encode - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたC# (CSharp)のLostTech.Gradient.Samples.GPT2.Gpt2Encoder.Encodeの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Encode(2)

LoadEncoder(2)

よく使われるメソッド

Encode (2)

LoadEncoder (2)

コード例 #1

ファイルを表示

ファイル: TrainCommand.cs プロジェクト: molekm/Gradient-Samples

        static DataSet Load(Gpt2Encoder encoder, IEnumerable <string> texts)
        {
            var    result           = new DataSet();
            string encodedEndOfText = encoder.EncodedEndOfText;
            var    chunk            = new List <string>();
            int    chunkSize        = 0;

            void AddChunk()
            {
                var tokens = np.stack(chunk);

                chunk.Clear();
                chunkSize = 0;
                result.Add(tokens);
            }

            foreach (string text in texts)
            {
                if (string.IsNullOrWhiteSpace(text))
                {
                    continue;
                }

                if (chunkSize + text.Length + encodedEndOfText.Length >= TrimAfter)
                {
                    AddChunk();
                }
                else
                {
                    chunkSize += text.Length + encodedEndOfText.Length;
                    var encoded = encoder.Encode(text);
                    chunk.AddRange(encoded);
                    chunk.Add(encodedEndOfText);
                }
            }
            if (chunk.Count > 0)
            {
                AddChunk();
            }
            return(result);
        }

コード例 #2

ファイルを表示

ファイル: Gpt2Dataset.cs プロジェクト: molekm/Gradient-Samples

        internal static List <ndarray> LoadDataset(Gpt2Encoder encoder, List <string> fileNames)
        {
            if (encoder is null)
            {
                throw new ArgumentNullException(nameof(encoder));
            }

            var tokenChunks = new List <ndarray>();

            foreach (string file in fileNames)
            {
                Debug.WriteLine($"Reading {file}");
                if (Path.GetExtension(file) == ".npz")
                {
                    // pre-encoded
                    dynamic npzObject = np.load(file);
                    var     npz       = npzObject.__enter__();
                    foreach (var item in npz.files)
                    {
                        tokenChunks.Add(npz[item]);
                    }
                    npzObject.__exit__();
                }
                else
                {
                    string rawText = File.ReadAllText(file);
                    if (String.IsNullOrWhiteSpace(rawText))
                    {
                        continue;
                    }
                    var tokens = np.stack(encoder.Encode(rawText));
                    tokenChunks.Add(tokens);
                }
            }

            return(tokenChunks);
        }