ich glaube diese frage ist schwer zu beantworten ... denn während eines telefonats kann man ja am anderen ende das resultat hören (wurde oft genug getestet, gibt auch viele youtube videos dazu), aber wie willst du überprüfen ob es auch so funktioniert? ...
meine vermutung ist es, dass noise cancellation auf der Hardware ebene passiert, da man hier enorm schnelle berechnungen braucht damit beide Wellenlängen und Frequenzen gleich sind und die Wellen genau gegenläufig schwingen. Das muss noch mit der eingabe des primären mikros vergliechen werden usw ... es wäre zu blöd sowas als software zu machen (außerdem gibt es inzwischen sogar kopfhörer die das gleiche machen. sie haben dann außen ein/paar mikros, die alle außengeräusche rausfiltern, indem sie zusätzlich zum ton der musik eine "gegenwelle" produzieren, die die außengeräusche auslöscht). Demnach würde ich vermuten dass das ganze als ein kleiner chip eingerichtet wurde.
Wenn das stimmt, dann wird es für jede art von spracheingabe funktionieren, egal ob telefonat, STT oder sonst was.
wobei an der stelle des STT ist es auch egal, denn es gibt genug algorithmen, die nebengeräusche rausfiltern, so dass eine zusätzliche noise cancellation unnötig wäre.
Ausserdem! wenn der lärm draussen ZU laut ist, dann kann mans ja eh nicht rausfiltern, egal mit welcher methode, denn dann kommt der Lärm in beide mikros gleich rein und die menschliche stimme ist dann dagegen eh zu schwach (nehmen wir dazu ein rockkonzert als beispiel) ... wenn du verstehst was ich meine