C# (CSharp) Microsoft.Data.Analysis DataFrameColumn.ToArrowArrayの例

プログラミング言語: C# (CSharp)

名前空間/パッケージ名: Microsoft.Data.Analysis

クラス/型: DataFrameColumn

メソッド/関数: ToArrowArray

hotexamples.comのコード掲載数: 1

C# (CSharp) Microsoft.Data.Analysis DataFrameColumn.ToArrowArray - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたC# (CSharp)のMicrosoft.Data.Analysis.DataFrameColumn.ToArrowArrayの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Add(2)

ElementwiseNotEquals(2)

Subtract(2)

Or(2)

Multiply(2)

And(2)

GroupColumnValues(2)

GetGroupedOccurrences(2)

Modulo(2)

ElementwiseLessThanOrEqual(2)

ElementwiseGreaterThan(2)

Clone(2)

ElementwiseEquals(2)

Xor(2)

ElementwiseGreaterThanOrEqual(2)

ElementwiseLessThan(2)

ReverseOr(1)

ToArrowArray(1)

GetDataViewGetter(1)

SetName(1)

RightShift(1)

ReverseXor(1)

ReverseSubtract(1)

ReverseMultiply(1)

LeftShift(1)

ReverseModulo(1)

ReverseDivide(1)

GetArrowField(1)

ReverseAdd(1)

Divide(1)

GetMaxRecordBatchLength(1)

ReverseAnd(1)

コード例 #1

ファイルを表示

ファイル: DataFrame.Arrow.cs プロジェクト: ahsonkhan/corefxlab

        /// <summary>
        /// Returns an <see cref="IEnumerable{RecordBatch}"/> without copying data
        /// </summary>
        public IEnumerable <RecordBatch> ToArrowRecordBatches()
        {
            Apache.Arrow.Schema.Builder schemaBuilder = new Apache.Arrow.Schema.Builder();

            int columnCount = Columns.Count;

            for (int i = 0; i < columnCount; i++)
            {
                DataFrameColumn column = Columns[i];
                Field           field  = column.GetArrowField();
                schemaBuilder.Field(field);
            }

            Schema schema = schemaBuilder.Build();
            List <Apache.Arrow.Array> arrays = new List <Apache.Arrow.Array>();

            int  recordBatchLength             = Int32.MaxValue;
            int  numberOfRowsInThisRecordBatch = (int)Math.Min(recordBatchLength, RowCount);
            long numberOfRowsProcessed         = 0;

            // Sometimes .NET for Spark passes in DataFrames with no rows. In those cases, we just return a RecordBatch with the right Schema and no rows
            do
            {
                for (int i = 0; i < columnCount; i++)
                {
                    DataFrameColumn column = Columns[i];
                    numberOfRowsInThisRecordBatch = (int)Math.Min(numberOfRowsInThisRecordBatch, column.GetMaxRecordBatchLength(numberOfRowsProcessed));
                }
                for (int i = 0; i < columnCount; i++)
                {
                    DataFrameColumn column = Columns[i];
                    arrays.Add(column.ToArrowArray(numberOfRowsProcessed, numberOfRowsInThisRecordBatch));
                }
                numberOfRowsProcessed += numberOfRowsInThisRecordBatch;
                yield return(new RecordBatch(schema, arrays, numberOfRowsInThisRecordBatch));
            } while (numberOfRowsProcessed < RowCount);
        }