Whatsapp (Android): Deutsche Sprachnachrichten transkribieren mit Gemini API

  • 0 Antworten
  • Letztes Antwortdatum
E

elschopi

Ambitioniertes Mitglied
24
Hallo zusammen,

da es leider immer noch nicht möglich ist, unter Android deutschsprachige Sprachnachrichten bei Whatsapp zu transkribieren, und ich jemand bin, der zwar immer mal wieder welche bekommt, aber die Dinger einfach nicht mag (und oft auch grad nicht anhören kann), habe ich mir zusammen mit Gemini einen kleinen Workaround einfallen lassen.
Ein Nachteil vornweg: Da anhand des Dateidatums gearbeitet wird, gibt es keine Zuordnung zum Absender. Vielleicht bieten andere LLM oder Modelle eine Möglichkeit, Sprecher zu erkennen. Aber das geht ein bisschen über dieses Nachmittagsprojekt hinaus ;)

Ich hänge die Anleitung (Danke, Gemini) als PDF einfach mal an den Post an, das Einfügen als Markdown sah nicht gerade appetitlich in der Vorschau aus.

Aktuell wird gemini-2.5-flash verwendet, man kann aber auch gemini-2.5-flash-lite nehmen, dann gibts weniger Probleme mit rate limits. Ich würde empfehlen, immer nur 5 bis 6 Nachrichten auf einmal verarbeiten zu lassen, damit sollte man auf der sicheren Seite sein, auch bei gemini-2.5-flash (10 requests / Minute Limit).

Auf meinem Pixel 10 Pro XL funktionierts wunderbar.
 

Anhänge

  • Anleitung_Gemini_Transkript.pdf
    197 KB · Aufrufe: 6

Ähnliche Themen

cska133
Antworten
11
Aufrufe
398
cska133
cska133
T
Antworten
7
Aufrufe
815
grillelucks86
grillelucks86
8Ks
Antworten
9
Aufrufe
846
maik005
maik005
L
Antworten
1
Aufrufe
1.076
ses
ses
ronson
Antworten
38
Aufrufe
2.367
ronson
ronson
Zurück
Oben Unten