C# (CSharp) LinearAlgebra SparseMatrix.GetHorizontalUnionSparsePattern примеры использования

Язык программирования: C# (CSharp)

Пространство имен/Пакет: LinearAlgebra

Класс/Тип: SparseMatrix

Метод/Функция: GetHorizontalUnionSparsePattern

Примеров на hotexamples.com: 2

C# (CSharp) LinearAlgebra SparseMatrix.GetHorizontalUnionSparsePattern - 2 примера найдено. Это лучшие примеры C# (CSharp) кода для LinearAlgebra.SparseMatrix.GetHorizontalUnionSparsePattern, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

GetColumns(6)

FillColumn(2)

GetHorizontalUnionSparsePattern(2)

IndexOfVerticalMax(1)

SetAllValuesToZero(1)

SetSparsePatternForAllColumn(1)

GetHorizontalUnionSparsePattern() публичный Метод

public GetHorizontalUnionSparsePattern ( ) : int[]
Результат	int[]

Документация по классу SparseMatrix

Пример #1

Показать файл

Файл: LDA_Learn.cs Проект: jvking/bp-lda

		/*
         * Training: unsupervised learning of feedforward (unfolding) LDA by back propagation
         */
		public static void TrainingBP_LDA(
			SparseMatrix TrainData,
			SparseMatrix TestData,
			paramModel_t paramModel,
			paramTrain_t paramTrain,
			string ModelFile,
			string ResultFile
		)
		{
			// ---- Extract the parameters ----
			// Model parameters
			int nInput = paramModel.nInput;
			int nHid = paramModel.nHid;
			int nHidLayer = paramModel.nHidLayer;
			int nOutput = paramModel.nOutput;
			float eta = paramModel.eta;
			float T_value = paramModel.T_value;
			string OutputType = paramModel.OutputType;
			float beta = paramModel.beta;
			// Training parameters
			int nEpoch = paramTrain.nEpoch;
			float mu_Phi = paramTrain.mu_Phi;
			float mu_U = paramTrain.mu_U;
			int nTrain = paramTrain.nTrain;
			float mu_Phi_ReduceFactor = paramTrain.mu_Phi_ReduceFactor;
			string LearnRateSchedule = paramTrain.LearnRateSchedule;
			int nSamplesPerDisplay = paramTrain.nSamplesPerDisplay;
			int nEpochPerSave = paramTrain.nEpochPerSave;
			int nEpochPerTest = paramTrain.nEpochPerTest;
			int nEpochPerDump = paramTrain.nEpochPerDump;

			// ---- Initialize the model ----
			ModelInit_LDA_Feedforward(paramModel);

			// ---- Initialize the training algorithm ----
			Console.WriteLine("#################################################################");
			Console.WriteLine("jvking version of  BP-LDA: Mirror-Descent Back Propagation");
			Console.WriteLine("#################################################################");
			float TotLoss = 0.0f;
			float TotCE = 0.0f;
			double TotTime = 0.0f;
			double TotTimeThisEpoch = 0.0f;
			int TotSamples = 0;
			int TotSamplesThisEpoch = 0;
			double AvgnHidLayerEffective = 0.0;
			int CntRunningAvg = 0;
			int CntModelUpdate = 0;
			DenseRowVector mu_phi_search = new DenseRowVector(nHid, mu_Phi);
			DenseRowVector TestLoss_pool = new DenseRowVector(nEpoch / nEpochPerTest, 0.0f);
			DenseRowVector TestLoss_epoch = new DenseRowVector(nEpoch / nEpochPerTest, 0.0f);
			DenseRowVector TestLoss_time = new DenseRowVector(nEpoch / nEpochPerTest, 0.0f);
			int CountTest = 0;
			DenseRowVector G_Phi_pool = new DenseRowVector(paramModel.nHidLayer);
			DenseRowVector G_Phi_trunc_pool = new DenseRowVector(paramModel.nHidLayer, 0.0f);
			DenseRowVector AdaGradSum = new DenseRowVector(nHid, 0.0f);
			DenseRowVector TmpDenseRowVec = new DenseRowVector(nHid, 0.0f);
			int[] SparsePatternGradPhi = null;
			float nLearnLineSearch = 0.0f;
			int[] IdxPerm = null;
			int BatchSize_NormalBatch = paramTrain.BatchSize;
			int BatchSize_tmp = paramTrain.BatchSize;
			int nBatch = (int)Math.Ceiling(((float)nTrain) / ((float)BatchSize_NormalBatch));
			DNNRun_t DNNRun_NormalBatch = new DNNRun_t(nHid, BatchSize_NormalBatch, paramModel.nHidLayer, nOutput);
			DNNRun_t DNNRun_EndBatch = new DNNRun_t(nHid, nTrain - (nBatch - 1) * BatchSize_NormalBatch, paramModel.nHidLayer, nOutput);
			DNNRun_t DNNRun = null;
			Grad_t Grad = new Grad_t(nHid, nOutput, nInput, paramModel.nHidLayer, OutputType);
			DenseMatrix TmpGradDense = new DenseMatrix(nInput, nHid);
			DenseMatrix TmpMatDensePhi = new DenseMatrix(nInput, nHid);
			paramModel_t paramModel_avg = new paramModel_t(paramModel);
			Stopwatch stopWatch = new Stopwatch();
			// ---- Compute the schedule of the learning rate
			double[] stepsize_pool = null;
			switch (LearnRateSchedule)
			{
			case "PreCompute":
				stepsize_pool = PrecomputeLearningRateSchedule(nBatch, nEpoch, mu_Phi, mu_Phi / mu_Phi_ReduceFactor, 1e-8f);
				break;
			case "Constant":
				stepsize_pool = new double[nEpoch];
				for (int Idx = 0; Idx < nEpoch; Idx++)
				{
					stepsize_pool[Idx] = mu_Phi;
				}
				break;
			default:
				throw new Exception("Unknown type of LearnRateSchedule");
			}
			// Now start training.........................
			for (int epoch = 0; epoch < nEpoch; epoch++)
			{
				TotSamplesThisEpoch = 0;
				TotTimeThisEpoch = 0.0;
				AvgnHidLayerEffective = 0.0;
				// -- Set the batch size if there is schedule --
				if (paramTrain.flag_BachSizeSchedule)
				{
					if (paramTrain.BachSizeSchedule.TryGetValue(epoch + 1, out BatchSize_tmp))
					{
						BatchSize_NormalBatch = BatchSize_tmp;
						nBatch = (int)Math.Ceiling(((float)nTrain) / ((float)BatchSize_NormalBatch));
						DNNRun_NormalBatch = new DNNRun_t(nHid, BatchSize_NormalBatch, paramModel.nHidLayer, nOutput);
						DNNRun_EndBatch = new DNNRun_t(nHid, nTrain - (nBatch - 1) * BatchSize_NormalBatch, paramModel.nHidLayer, nOutput);
					}
				}

				// -- Shuffle the data (generating shuffled index) --
				IdxPerm = Statistics.RandPerm(nTrain);
				// -- Reset the (MDA) inference step-sizes --
				if (epoch > 0)
				{
					for (int Idx = 0; Idx < paramModel.nHidLayer; Idx++)
					{
						paramModel.T[Idx] = T_value;
					}
				}
				// -- Take the learning rate for the current epoch --
				mu_Phi = (float)stepsize_pool[epoch];
				// -- Start this epoch --
				Console.WriteLine("############## Epoch #{0}. BatchSize: {1} Learning Rate: {2} ##################", epoch + 1, BatchSize_NormalBatch, mu_Phi);
				for (int IdxBatch = 0; IdxBatch < nBatch; IdxBatch++)
				{
					stopWatch.Start();
					// Extract the batch
					int BatchSize = 0;
					if (IdxBatch < nBatch - 1)
					{
						BatchSize = BatchSize_NormalBatch;
						DNNRun = DNNRun_NormalBatch;
					}
					else
					{
						BatchSize = nTrain - IdxBatch * BatchSize_NormalBatch;
						DNNRun = DNNRun_EndBatch;
					}
					SparseMatrix Xt = new SparseMatrix(nInput, BatchSize);
					SparseMatrix Dt = null;
					int[] IdxSample = new int[BatchSize];
					Array.Copy(IdxPerm, IdxBatch * BatchSize_NormalBatch, IdxSample, 0, BatchSize);
					TrainData.GetColumns(Xt, IdxSample);

					// Set the sparse pattern for the gradient
					SparsePatternGradPhi = Xt.GetHorizontalUnionSparsePattern();
					Grad.SetSparsePatternForAllGradPhi(SparsePatternGradPhi);

					// Forward activation
					LDA_Learn.ForwardActivation_LDA(Xt, DNNRun, paramModel, true);

					// Back propagation
					LDA_Learn.BackPropagation_LDA(Xt, Dt, DNNRun, paramModel, Grad);

					// Compute the gradient and update the model (All gradients of Phi are accumulated into Grad.grad_Q_Phi)
					MatrixOperation.ScalarDivideMatrix(Grad.grad_Q_Phi, (-1.0f) * ((beta - 1) / ((float)nTrain)), paramModel.Phi, true);
					MatrixOperation.MatrixAddMatrix(Grad.grad_Q_Phi, Grad.grad_Q_TopPhi);                  
					mu_phi_search.FillValue(mu_Phi);
					// Different learning rate for different columns of Phi: Similar to AdaGrad but does not decay with time
					++CntModelUpdate;
					MatrixOperation.ElementwiseMatrixMultiplyMatrix(TmpMatDensePhi, Grad.grad_Q_Phi, Grad.grad_Q_Phi);
					MatrixOperation.VerticalSumMatrix(TmpDenseRowVec, TmpMatDensePhi);
					MatrixOperation.ScalarMultiplyVector(TmpDenseRowVec, 1.0f / ((float)nInput));
					MatrixOperation.VectorSubtractVector(TmpDenseRowVec, AdaGradSum);
					MatrixOperation.ScalarMultiplyVector(TmpDenseRowVec, 1.0f / CntModelUpdate);
					MatrixOperation.VectorAddVector(AdaGradSum, TmpDenseRowVec);
					MatrixOperation.ElementwiseSquareRoot(TmpDenseRowVec, AdaGradSum);
					MatrixOperation.ScalarAddVector(TmpDenseRowVec, mu_Phi);
					MatrixOperation.ElementwiseVectorDivideVector(mu_phi_search, mu_phi_search, TmpDenseRowVec);
					nLearnLineSearch = SMD_Update(paramModel.Phi, Grad.grad_Q_Phi, mu_phi_search, eta);
					// Running average of the model
					if (paramTrain.flag_RunningAvg && epoch >= (int)Math.Ceiling(((float)nEpoch) / 2.0f))
					{
						++CntRunningAvg;
						MatrixOperation.MatrixSubtractMatrix(TmpMatDensePhi, paramModel.Phi, paramModel_avg.Phi);
						MatrixOperation.ScalarMultiplyMatrix(TmpMatDensePhi, 1.0f / CntRunningAvg);
						MatrixOperation.MatrixAddMatrix(paramModel_avg.Phi, TmpMatDensePhi);
					}


					// Display the result
					TotCE += ComputeCrossEntropy(Xt, paramModel.Phi,DNNRun.theta_pool, DNNRun.nHidLayerEffective);
					TotLoss = TotCE;
					TotSamples += BatchSize;
					TotSamplesThisEpoch += BatchSize;
					AvgnHidLayerEffective = (((float)(TotSamplesThisEpoch-BatchSize))/((float)TotSamplesThisEpoch))*AvgnHidLayerEffective
						+ (1.0/((float)TotSamplesThisEpoch))*( DNNRun.nHidLayerEffective.Sum());
					stopWatch.Stop();
					TimeSpan ts = stopWatch.Elapsed;
					TotTime += ts.TotalSeconds;
					TotTimeThisEpoch += ts.TotalSeconds;
					stopWatch.Reset();
					if (TotSamplesThisEpoch % nSamplesPerDisplay == 0)
					{
						// Display results
						Console.WriteLine(
							"* Ep#{0}/{1} Bat#{2}/{3}. Loss={4:F3}. CE={5:F3}.  Speed={6} Samples/Sec.",
							epoch + 1, nEpoch,
							IdxBatch + 1, nBatch,
							TotLoss / TotSamples, TotCE / TotSamples,
							(int)((double)TotSamplesThisEpoch / TotTimeThisEpoch)
						);
						if (paramTrain.DebugLevel == DebugLevel_t.medium)
						{
							Console.WriteLine(
								"  muPhiMax={0} \n  muPhiMin={1}",
								mu_phi_search.VectorValue.Max(), mu_phi_search.VectorValue.Min()
							);
							Console.WriteLine();
						}
						if (paramTrain.DebugLevel == DebugLevel_t.high)
						{
							Console.WriteLine(
								"  muPhiMax={0} \n  muPhiMin={1}",
								mu_phi_search.VectorValue.Max(), mu_phi_search.VectorValue.Min()
							);
							Console.WriteLine(
								"  AvgnHidLayerEff={0:F1}. G_Phi={1:F3}.",
								AvgnHidLayerEffective,
								Grad.grad_Q_Phi.MaxAbsValue()
							);
							Console.WriteLine();
						}


					}
				}
				// -- Test --
				if ((epoch + 1) % nEpochPerTest == 0)
				{
					TestLoss_epoch.VectorValue[(epoch + 1) / nEpochPerTest - 1] = epoch + 1;
					TestLoss_time.VectorValue[(epoch + 1) / nEpochPerTest - 1] = (float)TotTime;
					if (paramTrain.flag_RunningAvg && epoch >= (int)Math.Ceiling(((float)nEpoch) / 2.0f))
					{
						TestLoss_pool.VectorValue[(epoch + 1) / nEpochPerTest - 1] = Testing_BP_LDA(TestData, paramModel_avg, paramTrain.BatchSize_Test);
					}
					else
					{
						TestLoss_pool.VectorValue[(epoch + 1) / nEpochPerTest - 1] = Testing_BP_LDA(TestData, paramModel, paramTrain.BatchSize_Test);
					}
					CountTest++;
				}

				// -- Save --
				if ((epoch + 1) % nEpochPerSave == 0)
				{
					// Save model
					if (paramTrain.flag_RunningAvg && epoch >= (int)Math.Ceiling(((float)nEpoch) / 2.0f))
					{
						string PhiCol = null;
						(new FileInfo(ResultFile + ".model.Phi")).Directory.Create();
						StreamWriter FileSaveModel = new StreamWriter(ResultFile + ".model.Phi", false);
						for (int IdxCol = 0; IdxCol < paramModel_avg.Phi.nCols; IdxCol++)
						{
							PhiCol = String.Join("\t", paramModel_avg.Phi.DenseMatrixValue[IdxCol].VectorValue);
							FileSaveModel.WriteLine(PhiCol);
						}
						FileSaveModel.Close();
						// Save the final learning curves
						StreamWriter FileSavePerf = new StreamWriter(ResultFile + ".perf", false);
						FileSavePerf.WriteLine(String.Join("\t", TestLoss_epoch.VectorValue));
						FileSavePerf.WriteLine(String.Join("\t", TestLoss_time.VectorValue));
						FileSavePerf.WriteLine(String.Join("\t", TestLoss_pool.VectorValue));
						FileSavePerf.Close();
					}
					{
						string PhiCol = null;
						(new FileInfo(ResultFile + ".model.Phi")).Directory.Create();
						StreamWriter FileSaveModel = new StreamWriter(ResultFile + ".model.Phi", false);
						for (int IdxCol = 0; IdxCol < paramModel.Phi.nCols; IdxCol++)
						{
							PhiCol = String.Join("\t", paramModel.Phi.DenseMatrixValue[IdxCol].VectorValue);
							FileSaveModel.WriteLine(PhiCol);
						}
						FileSaveModel.Close();
						// Save the final learning curves
						StreamWriter FileSavePerf = new StreamWriter(ResultFile + ".perf", false);
						FileSavePerf.WriteLine(String.Join("\t", TestLoss_epoch.VectorValue));
						FileSavePerf.WriteLine(String.Join("\t", TestLoss_time.VectorValue));
						FileSavePerf.WriteLine(String.Join("\t", TestLoss_pool.VectorValue));
						FileSavePerf.Close();
					}
				}

				// -- Dump feature --
				if (paramTrain.flag_DumpFeature && (epoch + 1) % nEpochPerDump == 0)
				{
					if (paramTrain.flag_RunningAvg && epoch >= (int)Math.Ceiling(((float)nEpoch) / 2.0f))
					{
						DumpingFeature_BP_LDA(TrainData, paramModel_avg, paramTrain.BatchSize_Test, ResultFile + ".train.fea", "Train");
						DumpingFeature_BP_LDA(TestData, paramModel_avg, paramTrain.BatchSize_Test, ResultFile + ".test.fea", "Test");
					}
					{
						DumpingFeature_BP_LDA(TrainData, paramModel, paramTrain.BatchSize_Test, ResultFile + ".train.fea", "Train");
						DumpingFeature_BP_LDA(TestData, paramModel, paramTrain.BatchSize_Test, ResultFile + ".test.fea", "Test");
					}
				}


			}
		}

Пример #2

Показать файл

Файл: LDA_Learn.cs Проект: jvking/bp-lda

		/*
         * Back propagation of the unfolded LDA model (Mirror descent approach)
         */
		// Implemented without atomic operation
		public static void BackPropagation_LDA(SparseMatrix Xt, SparseMatrix Dt, DNNRun_t DNNRun, paramModel_t paramModel, Grad_t Grad)
		{
			// -------- Extract parameters --------
			int nHid = paramModel.nHid;
			int nHidLayer = paramModel.nHidLayer;
			int nOutput = paramModel.nOutput;
			float To = paramModel.To;
			string OutputType = paramModel.OutputType;
			int BatchSize = Xt.nCols;
			int nInput = paramModel.nInput;



			// -------- Back propagation --------
			DenseMatrix grad_Q_po = new DenseMatrix(DNNRun.y);
			SparseMatrix TmpSparseMat = new SparseMatrix(Xt);
			SparseMatrix grad_Q_po_Sparse = new SparseMatrix(Xt);
			DenseMatrix xi = new DenseMatrix(nHid, BatchSize);
			DenseMatrix TmpDenseMat = new DenseMatrix(nHid, BatchSize);
			DenseMatrix ThetaRatio = new DenseMatrix(nHid, BatchSize);
			DenseRowVector TmpDenseRowVec = new DenseRowVector(BatchSize);            
			DenseMatrix tmp_theta_xi_b_T_OVER_theta_lm1_2 = new DenseMatrix(nHid, BatchSize);
			SparseMatrix tmp_Xt_OVER_Phitheta = new SparseMatrix(Xt);
			SparseMatrix tmp_Phi_theta_xi = new SparseMatrix(Xt);
			Grad.grad_Q_Phi.ClearValue();
			// ---- Offset of effective number of layers ----
			int[] OffsetEffNumLayer = new int[BatchSize];
			OffsetEffNumLayer[0] = 0;
			int NumTotalLayer = DNNRun.nHidLayerEffective[0];
			for (int IdxSample = 1; IdxSample < BatchSize; ++IdxSample)
			{
				OffsetEffNumLayer[IdxSample] = OffsetEffNumLayer[IdxSample - 1] + DNNRun.nHidLayerEffective[IdxSample-1];
				NumTotalLayer += DNNRun.nHidLayerEffective[IdxSample];
			}
			// ---- Temporary variables that stores the intermediate results for computing the gradients ----
			DenseMatrix tmp_theta_xi_pool = new DenseMatrix(nHid, NumTotalLayer, 0.0f);
			DenseMatrix tmp_theta_xi = new DenseMatrix(nHid, BatchSize, 0.0f);
			DenseMatrix theta_l_minus_one = new DenseMatrix(nHid, NumTotalLayer, 0.0f);
			SparseMatrix tmp_Xt_OVER_Phitheta_pool = new SparseMatrix(nInput, NumTotalLayer);
			SparseMatrix TmpSparseMat_pool = new SparseMatrix(nInput, NumTotalLayer);
			int NumTotalNz = 0;
			for (int IdxSample = 0; IdxSample < BatchSize; ++IdxSample)
			{
				int Layer_begin = OffsetEffNumLayer[IdxSample];
				int Layer_end = Layer_begin + DNNRun.nHidLayerEffective[IdxSample];
				SparseColumnVector[] tmp1 = tmp_Xt_OVER_Phitheta_pool.SparseColumnVectors;
				SparseColumnVector[] tmp2 = TmpSparseMat_pool.SparseColumnVectors;
				SparseColumnVector xt = Xt.SparseColumnVectors[IdxSample];
				NumTotalNz += xt.nNonzero;
				for (int IdxLayer = Layer_begin; IdxLayer < Layer_end; ++IdxLayer)
				{
					tmp1[IdxLayer] = new SparseColumnVector(xt);
					tmp2[IdxLayer] = new SparseColumnVector(xt);
				}
			}
			int[] SparsePatternGradPhi = Xt.GetHorizontalUnionSparsePattern();
			SparseMatrix TmpGrad = new SparseMatrix(nInput, nHid, true);
			TmpGrad.SetSparsePatternForAllColumn(SparsePatternGradPhi);
			// ---- Compute grad Q wrt po if possible ----
			switch (OutputType)
			{
			case "softmaxCE":
				MatrixOperation.MatrixSubtractMatrix(grad_Q_po, Dt);
				MatrixOperation.ScalarMultiplyMatrix(grad_Q_po, To);
				Grad.grad_Q_U.ClearValue();
				break;
			case "linearQuad":
				MatrixOperation.MatrixSubtractMatrix(grad_Q_po, Dt);
				MatrixOperation.ScalarMultiplyMatrix(grad_Q_po, 2.0f);
				Grad.grad_Q_U.ClearValue();
				break;
			case "unsupLDA":
				Grad.grad_Q_TopPhi.SetAllValuesToZero();
				break;
			case "linearCE":
				throw new Exception("linearCE is not implemented.");
			default:
				throw new Exception("Unknown OutputType");
			}
			Parallel.For(0, BatchSize, new ParallelOptions { MaxDegreeOfParallelism = MatrixOperation.MaxMultiThreadDegree }, IdxSample =>
				{
					// ***************************************************************************

					// -------- Back propagation: top layer --------                    
					switch (OutputType)
					{
					case "softmaxCE":
						// ---- grad Q wrt pL (x_L) ----
						MatrixOperation.MatrixTransposeMultiplyVector(
							xi.DenseMatrixValue[IdxSample],
							paramModel.U,
							grad_Q_po.DenseMatrixValue[IdxSample]
						);
						MatrixOperation.ElementwiseVectorMultiplyVector(
							TmpDenseMat.DenseMatrixValue[IdxSample],
							DNNRun.theta_pool[DNNRun.nHidLayerEffective[IdxSample] - 1].DenseMatrixValue[IdxSample],
							xi.DenseMatrixValue[IdxSample]
						);
						TmpDenseRowVec.VectorValue[IdxSample] = TmpDenseMat.DenseMatrixValue[IdxSample].Sum();
						MatrixOperation.ScalarAddVector(
							xi.DenseMatrixValue[IdxSample],
							xi.DenseMatrixValue[IdxSample],
							TmpDenseRowVec.VectorValue[IdxSample] * (-1.0f)
						);
						break;
					case "linearQuad":
						// ---- grad Q wrt pL (x_L) ----
						MatrixOperation.MatrixTransposeMultiplyVector(
							xi.DenseMatrixValue[IdxSample],
							paramModel.U,
							grad_Q_po.DenseMatrixValue[IdxSample]
						);
						MatrixOperation.ElementwiseVectorMultiplyVector(
							TmpDenseMat.DenseMatrixValue[IdxSample],
							DNNRun.theta_pool[DNNRun.nHidLayerEffective[IdxSample] - 1].DenseMatrixValue[IdxSample],
							xi.DenseMatrixValue[IdxSample]
						);
						TmpDenseRowVec.VectorValue[IdxSample] = TmpDenseMat.DenseMatrixValue[IdxSample].Sum();
						MatrixOperation.ScalarAddVector(
							xi.DenseMatrixValue[IdxSample],
							xi.DenseMatrixValue[IdxSample],
							(-1.0f) * TmpDenseRowVec.VectorValue[IdxSample]
						);
						break;
					case "unsupLDA":
						// ---- grad Q wrt po ----
						MatrixOperation.MatrixMultiplyVector(
							grad_Q_po_Sparse.SparseColumnVectors[IdxSample],
							paramModel.Phi,
							DNNRun.theta_pool[DNNRun.nHidLayerEffective[IdxSample] - 1].DenseMatrixValue[IdxSample]
						);
						MatrixOperation.ElementwiseVectorDivideVector(
							grad_Q_po_Sparse.SparseColumnVectors[IdxSample],
							Xt.SparseColumnVectors[IdxSample],
							grad_Q_po_Sparse.SparseColumnVectors[IdxSample]
						);
						// ---- grad Q wrt pL (x_L) ----
						MatrixOperation.MatrixTransposeMultiplyVector(
							xi.DenseMatrixValue[IdxSample],
							paramModel.Phi,
							grad_Q_po_Sparse.SparseColumnVectors[IdxSample]
						);
						MatrixOperation.ScalarMultiplyVector(
							xi.DenseMatrixValue[IdxSample],
							-1.0f
						);
						MatrixOperation.ElementwiseVectorMultiplyVector(
							TmpDenseMat.DenseMatrixValue[IdxSample],
							xi.DenseMatrixValue[IdxSample],
							DNNRun.theta_pool[DNNRun.nHidLayerEffective[IdxSample] - 1].DenseMatrixValue[IdxSample]
						);
						TmpDenseRowVec.VectorValue[IdxSample] = TmpDenseMat.DenseMatrixValue[IdxSample].Sum();
						MatrixOperation.ScalarAddVector(
							xi.DenseMatrixValue[IdxSample],
							xi.DenseMatrixValue[IdxSample],
							(-1.0f) * TmpDenseRowVec.VectorValue[IdxSample]
						);
						break;
					case "linearCE":
						throw new Exception("linearCE is not implemented.");
						//break;
					default:
						throw new Exception("Unknown OutputType");
					}


					// ***************************************************************************

					// -------- Back propagation: hidden layers --------
					for (int IdxLayer = DNNRun.nHidLayerEffective[IdxSample] - 1; IdxLayer >= 0; IdxLayer--)
					{
						// ---- Compute the position in the temporary variable for the current layer at the current sample ----
						int IdxTmpVar = OffsetEffNumLayer[IdxSample] + IdxLayer;
						// ---- grad wrt b ---
						// Not implemented at the moment. (Can be used to update the Dirichlet parameter automatically.)
						// ---- Compute the intermediate variables ----
						MatrixOperation.ElementwiseVectorMultiplyVector(
							tmp_theta_xi_pool.DenseMatrixValue[IdxTmpVar],
							DNNRun.theta_pool[IdxLayer].DenseMatrixValue[IdxSample],
							xi.DenseMatrixValue[IdxSample]
						);
						if (IdxLayer == 0)
						{
							MatrixOperation.ElementwiseVectorDivideVector(
								tmp_theta_xi_b_T_OVER_theta_lm1_2.DenseMatrixValue[IdxSample],
								tmp_theta_xi_pool.DenseMatrixValue[IdxTmpVar],
								DNNRun.theta0.DenseMatrixValue[IdxSample]
							);
						}
						else
						{
							MatrixOperation.ElementwiseVectorDivideVector(
								tmp_theta_xi_b_T_OVER_theta_lm1_2.DenseMatrixValue[IdxSample],
								tmp_theta_xi_pool.DenseMatrixValue[IdxTmpVar],
								DNNRun.theta_pool[IdxLayer - 1].DenseMatrixValue[IdxSample]
							);
						}
						if (IdxLayer == 0)
						{
							MatrixOperation.ElementwiseVectorDivideVector(
								tmp_theta_xi_b_T_OVER_theta_lm1_2.DenseMatrixValue[IdxSample],
								tmp_theta_xi_b_T_OVER_theta_lm1_2.DenseMatrixValue[IdxSample],
								DNNRun.theta0.DenseMatrixValue[IdxSample]
							);
						}
						else
						{
							MatrixOperation.ElementwiseVectorDivideVector(
								tmp_theta_xi_b_T_OVER_theta_lm1_2.DenseMatrixValue[IdxSample],
								tmp_theta_xi_b_T_OVER_theta_lm1_2.DenseMatrixValue[IdxSample],
								DNNRun.theta_pool[IdxLayer - 1].DenseMatrixValue[IdxSample]
							);
						}
						MatrixOperation.ElementwiseVectorMultiplyVector(
							tmp_theta_xi_b_T_OVER_theta_lm1_2.DenseMatrixValue[IdxSample],
							paramModel.b
						);
						MatrixOperation.ScalarMultiplyVector(
							tmp_theta_xi_b_T_OVER_theta_lm1_2.DenseMatrixValue[IdxSample],
							DNNRun.T_pool.DenseMatrixValuePerRow[IdxLayer].VectorValue[IdxSample]
						);
						// Reset the elements to zero if theta_{l-1} is zero at these positions (mainly for alpha<1 case)
						if (IdxLayer > 0)
						{
							MatrixOperation.ResetVectorSparsePattern(
								tmp_theta_xi_b_T_OVER_theta_lm1_2.DenseMatrixValue[IdxSample],
								DNNRun.theta_pool[IdxLayer - 1].DenseMatrixValue[IdxSample]
							);
						}
						// Continue to intermediate variable computation
						if (IdxLayer == 0) // TmpSparseMat is Phitheta_lm1
						{
							MatrixOperation.MatrixMultiplyVector(
								TmpSparseMat.SparseColumnVectors[IdxSample],
								paramModel.Phi,
								DNNRun.theta0.DenseMatrixValue[IdxSample]
							);
						}
						else
						{
							MatrixOperation.MatrixMultiplyVector(
								TmpSparseMat.SparseColumnVectors[IdxSample],
								paramModel.Phi,
								DNNRun.theta_pool[IdxLayer - 1].DenseMatrixValue[IdxSample]
							);
						}
						MatrixOperation.ElementwiseVectorDivideVector(
							tmp_Xt_OVER_Phitheta_pool.SparseColumnVectors[IdxTmpVar],
							Xt.SparseColumnVectors[IdxSample],
							TmpSparseMat.SparseColumnVectors[IdxSample]
						);
						MatrixOperation.ElementwiseVectorDivideVector(
							TmpSparseMat.SparseColumnVectors[IdxSample],
							tmp_Xt_OVER_Phitheta_pool.SparseColumnVectors[IdxTmpVar],
							TmpSparseMat.SparseColumnVectors[IdxSample]
						); // TmpSparseMat is tmp_Xt_OVER_Phitheta2
						MatrixOperation.MatrixMultiplyVector(
							tmp_Phi_theta_xi.SparseColumnVectors[IdxSample],
							paramModel.Phi,
							tmp_theta_xi_pool.DenseMatrixValue[IdxTmpVar]
						);
						MatrixOperation.ElementwiseVectorMultiplyVector(
							TmpSparseMat.SparseColumnVectors[IdxSample],
							tmp_Phi_theta_xi.SparseColumnVectors[IdxSample]
						); // TmpSparseMat is ( tmp_Phi_theta_xi.*tmp_Xt_OVER_Phitheta2 )
						MatrixOperation.MatrixTransposeMultiplyVector(
							TmpDenseMat.DenseMatrixValue[IdxSample],
							paramModel.Phi,
							TmpSparseMat.SparseColumnVectors[IdxSample]
						);
						MatrixOperation.ScalarMultiplyVector(
							TmpDenseMat.DenseMatrixValue[IdxSample],
							DNNRun.T_pool.DenseMatrixValuePerRow[IdxLayer].VectorValue[IdxSample]
						); // TmpDenseMat is tmp_Tl_Phit_xtPhiTheta2_Phi_theta_xi
						// ---- Compute the gradient wrt Phi ----     
						MatrixOperation.ScalarMultiplyVector(
							tmp_Xt_OVER_Phitheta_pool.SparseColumnVectors[IdxTmpVar],
							DNNRun.T_pool.DenseMatrixValuePerRow[IdxLayer].VectorValue[IdxSample]
						);
						MatrixOperation.ScalarMultiplyVector(
							TmpSparseMat_pool.SparseColumnVectors[IdxTmpVar],
							TmpSparseMat.SparseColumnVectors[IdxSample],
							DNNRun.T_pool.DenseMatrixValuePerRow[IdxLayer].VectorValue[IdxSample]*(-1.0f)
						);                      
						if (IdxLayer == 0)
						{
							theta_l_minus_one.DenseMatrixValue[IdxTmpVar] = DNNRun.theta0.DenseMatrixValue[IdxSample];
						}
						else
						{
							theta_l_minus_one.DenseMatrixValue[IdxTmpVar] = DNNRun.theta_pool[IdxLayer - 1].DenseMatrixValue[IdxSample];
						}                    
						// ---- Compute xi_{l-1} via back propagation ----
						if (IdxLayer > 0)
						{
							// Reset the elements to zero if theta_{l-1} is zero at these positions (mainly for alpha<1 case)
							MatrixOperation.ElementwiseVectorDivideVector(
								ThetaRatio.DenseMatrixValue[IdxSample],
								DNNRun.theta_pool[IdxLayer].DenseMatrixValue[IdxSample],
								DNNRun.theta_pool[IdxLayer - 1].DenseMatrixValue[IdxSample]
							);
							MatrixOperation.ResetVectorSparsePattern(
								ThetaRatio.DenseMatrixValue[IdxSample],
								DNNRun.theta_pool[IdxLayer - 1].DenseMatrixValue[IdxSample]
							);
							MatrixOperation.ElementwiseVectorMultiplyVector(
								xi.DenseMatrixValue[IdxSample],
								xi.DenseMatrixValue[IdxSample],
								ThetaRatio.DenseMatrixValue[IdxSample]
							);
							// Compute xi_{l-1} now
							MatrixOperation.VectorSubtractVector(
								TmpDenseMat.DenseMatrixValue[IdxSample],
								xi.DenseMatrixValue[IdxSample],
								TmpDenseMat.DenseMatrixValue[IdxSample]
							);
							MatrixOperation.VectorSubtractVector(
								TmpDenseMat.DenseMatrixValue[IdxSample],
								TmpDenseMat.DenseMatrixValue[IdxSample],
								tmp_theta_xi_b_T_OVER_theta_lm1_2.DenseMatrixValue[IdxSample]
							);
							MatrixOperation.ElementwiseVectorMultiplyVector(
								tmp_theta_xi.DenseMatrixValue[IdxSample],
								DNNRun.theta_pool[IdxLayer - 1].DenseMatrixValue[IdxSample],
								TmpDenseMat.DenseMatrixValue[IdxSample]
							); // tmp_theta_xi is tmp1 in matlab code
							TmpDenseRowVec.VectorValue[IdxSample] = tmp_theta_xi.DenseMatrixValue[IdxSample].Sum();
							MatrixOperation.ScalarAddVector(
								xi.DenseMatrixValue[IdxSample],
								TmpDenseMat.DenseMatrixValue[IdxSample],
								TmpDenseRowVec.VectorValue[IdxSample] * (-1.0f)
							);
						}

					}
				});


			// -------- Compute the gradients --------
			// ---- Gradient with respect to U ----
			DenseMatrix Theta_Top = new DenseMatrix(nHid, BatchSize);
			for (int IdxSample = 0; IdxSample < BatchSize; ++IdxSample )
			{
				Theta_Top.DenseMatrixValue[IdxSample] = DNNRun.theta_pool[DNNRun.nHidLayerEffective[IdxSample] - 1].DenseMatrixValue[IdxSample];
			}
			switch (OutputType)
			{
			case "softmaxCE":
				// ---- grad Q wrt U ----
				MatrixOperation.MatrixMultiplyMatrixTranspose(Grad.grad_Q_U, grad_Q_po, Theta_Top);
				MatrixOperation.ScalarMultiplyMatrix(Grad.grad_Q_U, (1.0f / (float)BatchSize));
				break;
			case "linearQuad":
				// ---- grad Q wrt U ----
				MatrixOperation.MatrixMultiplyMatrixTranspose(Grad.grad_Q_U, grad_Q_po, Theta_Top);
				MatrixOperation.ScalarMultiplyMatrix(Grad.grad_Q_U, (1.0f / (float)BatchSize));
				break;
			case "unsupLDA":
				// ---- grad Q wrt Phi on top ----
				MatrixOperation.MatrixMultiplyMatrixTranspose(Grad.grad_Q_TopPhi, grad_Q_po_Sparse, Theta_Top, false);
				MatrixOperation.ScalarMultiplyMatrix(Grad.grad_Q_TopPhi, Grad.grad_Q_TopPhi, (-1.0f / (float)BatchSize));
				break;
			case "linearCE":
				throw new Exception("linearCE is not implemented.");
				//break;
			default:
				throw new Exception("Unknown OutputType");
			}
			// ---- Gradient with respect to Phi ----
			TmpGrad.SetAllValuesToZero();
			MatrixOperation.MatrixMultiplyMatrixTranspose(TmpGrad, tmp_Xt_OVER_Phitheta_pool, tmp_theta_xi_pool, true);
			MatrixOperation.MatrixMultiplyMatrixTranspose(TmpGrad, TmpSparseMat_pool, theta_l_minus_one, true);
			MatrixOperation.ScalarMultiplyMatrix(TmpGrad, TmpGrad, (1.0f / (float)BatchSize));
			MatrixOperation.MatrixAddMatrix(Grad.grad_Q_Phi, TmpGrad);

		}