Spaces:

amir22010
/

MarketMate

Sleeping

amir22010 commited on Oct 19, 2024

Commit

224fa84

verified ·

1 Parent(s): d5c8eb9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,9 +4,9 @@ import os
 from groq import Groq
 import numpy as np
 import wave
 #tts
-import tempfile
 import torchaudio
 #from speechbrain.inference.TTS import FastSpeech2
 from speechbrain.inference.TTS import Tacotron2
@@ -17,19 +17,13 @@ tacotron2 = Tacotron2.from_hparams(source="speechbrain/tts-tacotron2-ljspeech",
 hifi_gan = HIFIGAN.from_hparams(source="speechbrain/tts-hifigan-ljspeech", savedir="pretrained_models/tts-hifigan-ljspeech")
 def text_to_speech(text):
-    with tempfile.NamedTemporaryFile(delete=False, suffix='.wav') as temp_file:
-        # mel_output, durations, pitch, energy = fastspeech2.encode_text(
-        #   [text],
-        #   pace=1.0,        # scale up/down the speed
-        #   pitch_rate=1.0,  # scale up/down the pitch
-        #   energy_rate=1.0, # scale up/down the energy
-        # )
-        mel_output, mel_length, alignment = tacotron2.encode_text(text)
-        # Running Vocoder (spectrogram-to-waveform)
-        waveforms = hifi_gan.decode_batch(mel_output)
-        # Save the waverform
-        torchaudio.save(temp_file.name, waveforms.squeeze(1), 22050)
-    return temp_file.name
 def combine_audio_files(audio_files):
     data= []

 from groq import Groq
 import numpy as np
 import wave
+import uuid
 #tts
 import torchaudio
 #from speechbrain.inference.TTS import FastSpeech2
 from speechbrain.inference.TTS import Tacotron2
 hifi_gan = HIFIGAN.from_hparams(source="speechbrain/tts-hifigan-ljspeech", savedir="pretrained_models/tts-hifigan-ljspeech")
 def text_to_speech(text):
+    mel_output, mel_length, alignment = tacotron2.encode_text(text)
+    # Running Vocoder (spectrogram-to-waveform)
+    waveforms = hifi_gan.decode_batch(mel_output)
+    # Save the waverform
+    outfile = f"{uuid.uuid4()}.wav"
+    torchaudio.save(outfile, waveforms.squeeze(1), 22050)
+    return outfile
 def combine_audio_files(audio_files):
     data= []