C# (CSharp) IRLEnvironment.LastReward Exemples

Langage de programmation: C# (CSharp)

Class/Type: IRLEnvironment

Méthode/Fonction: LastReward

Exemples au hotexamples.com: 2

C# (CSharp) IRLEnvironment.LastReward - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de IRLEnvironment.LastReward extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

CurrentState(3)

CurrentStep(2)

IsEnd(2)

IsResolved(2)

LastReward(2)

Step(2)

Méthodes fréquemment utilisées

CurrentState (3)

CurrentStep (2)

IsEnd (2)

IsResolved (2)

LastReward (2)

Step (2)

Associées

TW_DEVICEEVENT

NamedEntityAttributes

Morphotactics

IPaymentCallback

ICommitRepository

PanelGrid

IGridPainter

CefSharp.IWebBrowser

IDataSubjectRight

CReverse_PetroChinaPay

Related in langs

MenuTestBase (PHP)

EntryListModificationLogList (PHP)

fiid_obj_get_data (C++)

xilinx_cresample_probe (C++)

NewLogger (Go)

MakeString (Go)

ICFBamSwingUInt32ColJPanelList (Java)

Util (Java)

ensure_unicode (Python)

jid_component (Python)

Exemple #1

0

Afficher le fichier

/// <summary> /// called after step and when the enviorment is resolved. return whether the enviourment should reset /// </summary> /// <param name="environment"></param> public bool Record(IRLEnvironment environment) { Debug.Assert(environment.IsResolved()); bool isEnd = environment.IsEnd(); for (int i = 0; i < NumberOfActor; ++i) { float reward = environment.LastReward(); AddHistory(LastState[i], reward, LastAction[i], LastActionProbs[i], LastValue[i], i); } if (isEnd || environment.CurrentStep() >= MaxStepHorizon) { float[] nextValues = new float[NumberOfActor]; if (!isEnd) { nextValues = Model.EvaluateValue(environment.CurrentState()); } else { for (int i = 0; i < NumberOfActor; ++i) { nextValues[i] = 0; } } for (int i = 0; i < NumberOfActor; ++i) { ProcessEpisodeHistory(nextValues[i], i); } return(true); } return(false); }

Exemple #2

0

Afficher le fichier

Fichier : Trainers.DQL.cs Projet : floAr/CNTKUnityTools

/// <summary> /// called after step and when the enviorment is resolved. return whether the enviourment should reset /// </summary> /// <param name="environment"></param> public virtual bool Record(IRLEnvironment environment) { Debug.Assert(environment.IsResolved()); bool isEnd = environment.IsEnd(); for (int i = 0; i < NumberOfActor; ++i) { float reward = environment.LastReward(i); AddHistory(i, LastState[i], reward, LastAction[i], isEnd); } if (isEnd || environment.CurrentStep() >= MaxStepHorizon) { for (int i = 0; i < NumberOfActor; ++i) { UpdateReplayBuffer(i); } return(true); } return(false); }