Whatsapp (Android): Deutsche Sprachnachrichten transkribieren mit Gemini API

  • 0 Antworten
  • Letztes Antwortdatum
E

elschopi

Ambitioniertes Mitglied
23
Hallo zusammen,

da es leider immer noch nicht möglich ist, unter Android deutschsprachige Sprachnachrichten bei Whatsapp zu transkribieren, und ich jemand bin, der zwar immer mal wieder welche bekommt, aber die Dinger einfach nicht mag (und oft auch grad nicht anhören kann), habe ich mir zusammen mit Gemini einen kleinen Workaround einfallen lassen.
Ein Nachteil vornweg: Da anhand des Dateidatums gearbeitet wird, gibt es keine Zuordnung zum Absender. Vielleicht bieten andere LLM oder Modelle eine Möglichkeit, Sprecher zu erkennen. Aber das geht ein bisschen über dieses Nachmittagsprojekt hinaus ;)

Ich hänge die Anleitung (Danke, Gemini) als PDF einfach mal an den Post an, das Einfügen als Markdown sah nicht gerade appetitlich in der Vorschau aus.

Aktuell wird gemini-2.5-flash verwendet, man kann aber auch gemini-2.5-flash-lite nehmen, dann gibts weniger Probleme mit rate limits. Ich würde empfehlen, immer nur 5 bis 6 Nachrichten auf einmal verarbeiten zu lassen, damit sollte man auf der sicheren Seite sein, auch bei gemini-2.5-flash (10 requests / Minute Limit).

Auf meinem Pixel 10 Pro XL funktionierts wunderbar.
 

Anhänge

  • Anleitung_Gemini_Transkript.pdf
    197 KB · Aufrufe: 1

Ähnliche Themen

cska133
Antworten
11
Aufrufe
179
cska133
cska133
T
Antworten
7
Aufrufe
731
grillelucks86
grillelucks86
8Ks
Antworten
9
Aufrufe
775
maik005
maik005
L
Antworten
1
Aufrufe
947
ses
ses
ronson
Antworten
38
Aufrufe
2.198
ronson
ronson
Zurück
Oben Unten