C# (CSharp) LipSyncLite MathToolBox.FindLocalLargestPeaks 예제들

프로그래밍 언어: C# (CSharp)

네임스페이스/패키지 이름: LipSyncLite

클래스/타입: MathToolBox

메소드/함수: FindLocalLargestPeaks

hotexamples.com에서의 예제들: 2

C# (CSharp) LipSyncLite MathToolBox.FindLocalLargestPeaks - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 C# (CSharp)의 LipSyncLite.MathToolBox.FindLocalLargestPeaks에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Convolute(2)

FindLocalLargestPeaks(2)

GenerateGaussianFilter(2)

DiscreteCosineTransform(1)

GenerateWindow(1)

GetValueFromArray(1)

예제 #1

파일 보기

파일: LipSyncRuntimeRecognizer.cs 프로젝트: dfghj44444/LipSyncLite

        public string RecognizeByAudioSource(AudioSource audioSource)
        {
            string result = null;

            audioSource.GetOutputData(playingAudioData, 0);
            audioSource.GetSpectrumData(playingAudioSpectrum, 0, FFTWindow.BlackmanHarris);

            if (audioSource.isPlaying == true)
            {
                amplitudeSum = 0.0f;
                for (int i = 0; i < playingAudioSpectrum.Length; ++i)
                {
                    amplitudeSum += playingAudioSpectrum[i];
                }

                if (amplitudeSum >= amplitudeThreshold)
                {
                    MathToolBox.Convolute(playingAudioSpectrum, gaussianFilter, MathToolBox.EPaddleType.Repeat, smoothedAudioSpectrum);
                    MathToolBox.FindLocalLargestPeaks(smoothedAudioSpectrum, peakValues, peakPositions);
                    frequencyUnit = audioSource.clip.frequency / 2 / windowSize;
                    for (int i = 0; i < formantArray.Length; ++i)
                    {
                        formantArray[i] = peakPositions[i] * frequencyUnit;
                    }

                    // TODO: Recognization by multiple formant
                    switch (recognizingLanguage)
                    {
                    case ERecognizerLanguage.Japanese:
                        currentVowels = vowelsByFormantJP;
                        currentVowelFormantCeilValues = vowelFormantFloorJP;
                        break;

                    case ERecognizerLanguage.Chinese:
                        currentVowels = vowelsByFormantCN;
                        currentVowelFormantCeilValues = vowelFormantFloorCN;
                        break;
                    }
                    for (int i = 0; i < currentVowelFormantCeilValues.Length; ++i)
                    {
                        if (Average(formantArray) > currentVowelFormantCeilValues[i])
                        {
                            result = currentVowels[i];
                            //Debug.Log(Average(formantArray));
                        }
                    }
                }
                else
                {
                    result = null;
                }
            }
            else
            {
                result = null;
            }

            return(result);
        }

예제 #2

파일 보기

파일: LipSyncOfflineRecognizer.cs 프로젝트: jonathanHelloWorld/AssociationConec

        /// <summary>
        ///
        /// </summary>
        /// <param name="audioClip"></param>
        /// <returns></returns>
        public string[] RecognizeAllByAudioClip(AudioClip audioClip)
        {
            int recognizeSampleCount = Mathf.CeilToInt((float)(audioClip.samples) / (float)(shiftStepSize));

            string[] result = new string[recognizeSampleCount];

            float[] currentAudioData     = new float[this.windowSize];
            float[] currentAudioSpectrum = new float[this.windowSize];

            for (int i = 0; i < recognizeSampleCount; ++i)
            {
                audioClip.GetData(currentAudioData, i * shiftStepSize);
                for (int j = 0; j < windowSize; ++j)
                {
                    currentAudioData[j] *= windowArray[j];
                }
                currentAudioSpectrum = MathToolBox.DiscreteCosineTransform(currentAudioData);

                amplitudeSum = 0.0f;
                for (int k = 0; k < windowSize; ++k)
                {
                    amplitudeSum += currentAudioSpectrum[k];
                }

                if (amplitudeSum >= amplitudeThreshold)
                {
                    MathToolBox.Convolute(currentAudioSpectrum, gaussianFilter, MathToolBox.EPaddleType.Repeat, smoothedAudioSpectrum);
                    MathToolBox.FindLocalLargestPeaks(smoothedAudioSpectrum, peakValues, peakPositions);
                    frequencyUnit = audioClip.frequency / 2 / windowSize;
                    for (int l = 0; l < formantArray.Length; ++l)
                    {
                        formantArray[l] = peakPositions[l] * frequencyUnit;
                    }

                    switch (recognizingLanguage)
                    {
                    case ERecognizerLanguage.Japanese:
                        currentVowels = vowelsByFormantJP;
                        currentVowelFormantCeilValues = vowelFormantFloorJP;
                        break;

                    case ERecognizerLanguage.Chinese:
                        currentVowels = vowelsByFormantCN;
                        currentVowelFormantCeilValues = vowelFormantFloorCN;
                        break;
                    }
                    for (int m = 0; m < currentVowelFormantCeilValues.Length; ++m)
                    {
                        if (formantArray[0] > currentVowelFormantCeilValues[m])
                        {
                            result[i] = currentVowels[m];
                        }
                    }
                }
                else
                {
                    result[i] = null;
                }
            }

            return(result);
        }