E 
		
				
				
			
		elschopi
Ambitioniertes Mitglied
- 23
 
Hallo zusammen,
da es leider immer noch nicht möglich ist, unter Android deutschsprachige Sprachnachrichten bei Whatsapp zu transkribieren, und ich jemand bin, der zwar immer mal wieder welche bekommt, aber die Dinger einfach nicht mag (und oft auch grad nicht anhören kann), habe ich mir zusammen mit Gemini einen kleinen Workaround einfallen lassen.
Ein Nachteil vornweg: Da anhand des Dateidatums gearbeitet wird, gibt es keine Zuordnung zum Absender. Vielleicht bieten andere LLM oder Modelle eine Möglichkeit, Sprecher zu erkennen. Aber das geht ein bisschen über dieses Nachmittagsprojekt hinaus
Ich hänge die Anleitung (Danke, Gemini) als PDF einfach mal an den Post an, das Einfügen als Markdown sah nicht gerade appetitlich in der Vorschau aus.
Aktuell wird gemini-2.5-flash verwendet, man kann aber auch gemini-2.5-flash-lite nehmen, dann gibts weniger Probleme mit rate limits. Ich würde empfehlen, immer nur 5 bis 6 Nachrichten auf einmal verarbeiten zu lassen, damit sollte man auf der sicheren Seite sein, auch bei gemini-2.5-flash (10 requests / Minute Limit).
Auf meinem Pixel 10 Pro XL funktionierts wunderbar.
				
			da es leider immer noch nicht möglich ist, unter Android deutschsprachige Sprachnachrichten bei Whatsapp zu transkribieren, und ich jemand bin, der zwar immer mal wieder welche bekommt, aber die Dinger einfach nicht mag (und oft auch grad nicht anhören kann), habe ich mir zusammen mit Gemini einen kleinen Workaround einfallen lassen.
Ein Nachteil vornweg: Da anhand des Dateidatums gearbeitet wird, gibt es keine Zuordnung zum Absender. Vielleicht bieten andere LLM oder Modelle eine Möglichkeit, Sprecher zu erkennen. Aber das geht ein bisschen über dieses Nachmittagsprojekt hinaus
Ich hänge die Anleitung (Danke, Gemini) als PDF einfach mal an den Post an, das Einfügen als Markdown sah nicht gerade appetitlich in der Vorschau aus.
Aktuell wird gemini-2.5-flash verwendet, man kann aber auch gemini-2.5-flash-lite nehmen, dann gibts weniger Probleme mit rate limits. Ich würde empfehlen, immer nur 5 bis 6 Nachrichten auf einmal verarbeiten zu lassen, damit sollte man auf der sicheren Seite sein, auch bei gemini-2.5-flash (10 requests / Minute Limit).
Auf meinem Pixel 10 Pro XL funktionierts wunderbar.