Spaces:

Mohssinibra
/

STT_Darija_v2

Running

Mohssinibra commited on 6 days ago

Commit

2fb86d3

verified ·

1 Parent(s): dddea8e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,9 +9,14 @@ model = Wav2Vec2ForCTC.from_pretrained("boumehdi/wav2vec2-large-xlsr-moroccan-da
 # Function to process the audio file and return transcription
 def transcribe_audio(audio_file):
-    # Load and process the audio file
-    audio_input, _ = torchaudio.load(audio_file)
-    input_values = processor(audio_input, return_tensors="pt").input_values
     # Perform transcription
     with torch.no_grad():

 # Function to process the audio file and return transcription
 def transcribe_audio(audio_file):
+    # Load and process the audio file with the correct sampling rate
+    audio_input, sampling_rate = torchaudio.load(audio_file, normalize=True)
+    # Make sure the audio input has the correct dimensions
+    audio_input = audio_input.squeeze()  # Remove unnecessary dimensions
+    # Process the audio input for the model
+    input_values = processor(audio_input, sampling_rate=sampling_rate, return_tensors="pt").input_values
     # Perform transcription
     with torch.no_grad():