From 843ec534d15c6d6efc2d5a2c70f1c53d86687c55 Mon Sep 17 00:00:00 2001
From: Wong Ding Feng <dingfengwong@gmail.com>
Date: Fri, 29 May 2026 03:00:09 +0800
Subject: [PATCH] fix: handle processor.decode returning a list of strings

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
---
 transcribe.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/transcribe.py b/transcribe.py
index 4f8c097..45f373f 100644
--- a/transcribe.py
+++ b/transcribe.py
@@ -27,7 +27,8 @@ def transcribe_audio(processor, model, audio, language="en"):
     inputs = processor(audio, sampling_rate=SAMPLE_RATE, return_tensors="pt", language=language)
     inputs.to(model.device, dtype=model.dtype)
     outputs = model.generate(**inputs, max_new_tokens=256)
-    return processor.decode(outputs, skip_special_tokens=True)
+    texts = processor.decode(outputs, skip_special_tokens=True)
+    return " ".join(texts) if isinstance(texts, list) else texts
 
 
 def record_audio(duration):