Exemplos de KMLib.GPU CudaHelpers.TransformToERTILPFormat em C# (CSharp)

Linguagem de programação: C# (CSharp)

Espaço para nome / nome do pacote: KMLib.GPU

Classe / Tipo: CudaHelpers

Método / Função: TransformToERTILPFormat

Exemplos em hotexamples.com: 2

KMLib.GPU CudaHelpers.TransformToERTILPFormat em C# (CSharp) - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de KMLib.GPU.CudaHelpers.TransformToERTILPFormat em C# (CSharp) extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

FillDenseVector(9)

SetTextureMemory(7)

TransformToCSRFormat(3)

InitBuffer(2)

SetBufferIdx(2)

TransformToERTILPFormat(2)

TransformToEllpackRFormat(2)

TransformToSlicedEllpack(2)

GetNumThreadsAndBlocks(1)

TransformToSERTILP(1)

Métodos Frequentes

FillDenseVector (9)

SetTextureMemory (7)

TransformToCSRFormat (3)

InitBuffer (2)

SetBufferIdx (2)

TransformToERTILPFormat (2)

TransformToEllpackRFormat (2)

TransformToSlicedEllpack (2)

GetNumThreadsAndBlocks (1)

TransformToSERTILP (1)

Relacionados

MIDIHDR

ShoolContext

ProvisionPublicIpv4PoolCidrRequest

SncDTO

JsonWebKey

ACBrECFFormaPagamento

SaveProductRequest

Logica.TiposIva

DanceReviewStatus

BeatListener

Related in langs

Expiry (PHP)

Application (PHP)

stream_it (C++)

ceph_snap (C++)

MakeFileLoader (Go)

Build (Go)

MmsAddressDatabase (Java)

CFSecurityTSecGroupMemberHBuff (Java)

AudioFileMFCC (Python)

manifest_exists (Python)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: CuExpChiERTILPKernel.cs Projeto: endeffects/KMLib

public override void Init() { base.Init(); float[] vecVals; int[] vecColIdx; int[] vecLenght; //change the blocksPerGrid, because we launch many threads per row blocksPerGrid = (int)Math.Ceiling((ThreadsPerRow * problemElements.Length + 0.0) / threadsPerBlock); int align = ThreadsPerRow * Prefetch; CudaHelpers.TransformToERTILPFormat(out vecVals, out vecColIdx, out vecLenght, problemElements, align, ThreadsPerRow); selfSum = problemElements.AsParallel().Select(x => x.Values.Sum()).ToArray(); #region cuda initialization InitCudaModule(); //copy data to device, set cuda function parameters valsPtr = cuda.CopyHostToDevice(vecVals); idxPtr = cuda.CopyHostToDevice(vecColIdx); vecLengthPtr = cuda.CopyHostToDevice(vecLenght); selfSumPtr = cuda.CopyHostToDevice(selfSum); uint memSize = (uint)(problemElements.Length * sizeof(float)); outputIntPtr = cuda.HostAllocate(memSize, CUDADriver.CU_MEMHOSTALLOC_DEVICEMAP); outputPtr = cuda.GetHostDevicePointer(outputIntPtr, 0); //normal memory allocation //outputPtr = cuda.Allocate((uint)(sizeof(float) * problemElements.Length)); #endregion SetCudaFunctionParameters(); //allocate memory for main vector, size of this vector is the same as dimension, so many //indexes will be zero, but cuda computation is faster mainVector = new float[problemElements[0].Dim + 1]; CudaHelpers.FillDenseVector(problemElements[0], mainVector); CudaHelpers.SetTextureMemory(cuda, cuModule, ref cuMainVecTexRef, cudaMainVecTexRefName, mainVector, ref mainVecPtr); CudaHelpers.SetTextureMemory(cuda, cuModule, ref cuLabelsTexRef, cudaLabelsTexRefName, Y, ref labelsPtr); if (MakeDenseVectorOnGPU) { vecBuilder = new EllpackDenseVectorBuilder(cuda, mainVecPtr, valsPtr, idxPtr, vecLengthPtr, problemElements.Length, problemElements[0].Dim); vecBuilder.Init(); } }

Exemplo n.º 2

0

Exibir arquivo

public override void Init() { linKernel.ProblemElements = problemElements; linKernel.Y = Y; linKernel.Init(); base.Init(); float[] vecVals; int[] vecColIdx; int[] vecLenght; //change the blocksPerGrid, because we launch many threads per row blocksPerGrid = (int)Math.Ceiling((ThreadsPerRow * problemElements.Length + 0.0) / threadsPerBlock); int align = ThreadsPerRow * Prefetch; CudaHelpers.TransformToERTILPFormat(out vecVals, out vecColIdx, out vecLenght, problemElements, align, ThreadsPerRow); selfLinDot = linKernel.DiagonalDotCache; #region cuda initialization InitCudaModule(); //copy data to device, set cuda function parameters valsPtr = cuda.CopyHostToDevice(vecVals); idxPtr = cuda.CopyHostToDevice(vecColIdx); vecLengthPtr = cuda.CopyHostToDevice(vecLenght); selfLinDotPtr = cuda.CopyHostToDevice(selfLinDot); uint memSize = (uint)(problemElements.Length * sizeof(float)); //allocate mapped memory for our results //CUDARuntime.cudaSetDeviceFlags(CUDARuntime.cudaDeviceMapHost); // var e= CUDADriver.cuMemHostAlloc(ref outputIntPtr, memSize, 8); //CUDARuntime.cudaHostAlloc(ref outputIntPtr, memSize, CUDARuntime.cudaHostAllocMapped); //var errMsg=CUDARuntime.cudaGetErrorString(e); //cuda.HostRegister(outputIntPtr,memSize, Cuda) outputIntPtr = cuda.HostAllocate(memSize, CUDADriver.CU_MEMHOSTALLOC_DEVICEMAP); outputPtr = cuda.GetHostDevicePointer(outputIntPtr, 0); //normal memory allocation //outputPtr = cuda.Allocate((uint)(sizeof(float) * problemElements.Length)); #endregion SetCudaFunctionParameters(); //allocate memory for main vector, size of this vector is the same as dimension, so many //indexes will be zero, but cuda computation is faster mainVector = new float[problemElements[0].Dim + 1]; CudaHelpers.FillDenseVector(problemElements[0], mainVector); CudaHelpers.SetTextureMemory(cuda, cuModule, ref cuMainVecTexRef, cudaMainVecTexRefName, mainVector, ref mainVecPtr); CudaHelpers.SetTextureMemory(cuda, cuModule, ref cuLabelsTexRef, cudaLabelsTexRefName, Y, ref labelsPtr); if (MakeDenseVectorOnGPU) { vecBuilder = new EllpackDenseVectorBuilder(cuda, mainVecPtr, valsPtr, idxPtr, vecLengthPtr, problemElements.Length, problemElements[0].Dim); vecBuilder.Init(); } }