Speech to Text mit Übersetzung

HolgerDUS schrieb am 19.10.2024 um 17:00 Uhr

Hallo zusammen,

ich vermisse noch etwas praktisches:

Man kann ja gut "speech to text" nutzen. Das gesprochene Wort wird dann in der gesprochenen Sprache als Text angezeigt. Soweit so gut. Aber: Was tun, wenn jemand deutsch spricht aber ein englischer Text benötigt wird? Hier fehlt noch die Möglichkeit der Übersetzung!

Wie seht ihr das?

12th Gen Intel(R) Core(TM) i7-12700K   3.61 GHz, ASUS TUF GAMING Z690-PLUS D4, (Treiber 32.0.101.6078) NVIDIA Ventus 2 GFORCE GTX 3060 12GB, 96 GB Ram, (Treiber566.14 12 Nov.24) Windows 11 Home, 2 UHD Bildschirme per DisplayPort und HDMI.

Video ProX 16 Vers. 22.0.1.247 (UDP3)

Kommentare

BilderMacher schrieb am 19.10.2024 um 17:18 Uhr

Was tun, wenn jemand deutsch spricht aber ein englischer Text benötigt wird? Hier fehlt noch die Möglichkeit der Übersetzung!

Wie seht ihr das?

Das funktioniert bei dir nicht?

Im Gegensatz dazu, dass ein englischer Text (Audio) nicht in einen deutschen Text übersetzt wird, geht es mit deutscher Audiodatei.

Du wählst als Ausgabesprache English?

Zuletzt geändert von BilderMacher am 19.10.2024, 17:18, insgesamt 1-mal geändert.

"Je mehr die Menschen wissen, desto weniger müssen sie glauben!"

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Ich kann vieles, darf aber nicht alles.
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

-------------

Hardware / Software:
::::::::::::::::::::::::::::::::::::++++:::::::::::::::::::::::::::::::::::::::::::::::::

Intel(R) Core(TM) i7-10510U CPU @ 1.80GHz (8 CPUs), ~2.3GHz
12288 MB RAM
DirectX 12
 

Intel(R) UHD Graphics (für Import, Verarbeitung, Export)

NVIDIA GeForce MX250 (wird nicht in Schnitt-SW verwendet)

  • Video deluxe 2016 Premium
  • Video deluxe 2025 Premium
  • Video Pro X 16
  • Photostory Deluxe 2025
  • Samplitude X7 Suite
  • ACID Pro 11
  • Music Maker 2025 Premium
  • MAGIX/XARA Graphic-/Web-Designer

-----------------------------------------------------------------------------------

Edition    Windows 10 Home
Version    22H2
Installiert am    ‎15.‎10.‎2020
Betriebssystembuild    19045.5011
Leistung    Windows Feature Experience Pack 1000.19060.1000.0

------------------------------------------------------------------------------------

Standardbrowser: Mozilla Firefox 131.0.3 (64-Bit)

HolgerDUS schrieb am 19.10.2024 um 17:38 Uhr

@BilderMacher  Aha, zunächst Denkfehler, dachte ich wähle die gesprochene Sprache aus und nicht die Zieltextsprache. > O.K. > Direkt ausprobiert. Folgende Umgebung: Ich habe in einer sep. Spur selber einen deutschen Text einwandfrei gesprochen.

1 Versuch: Im ersten File wurde die Sprache nicht erkannt. 😏

2. Versuch: Beginn ab zweiten File, Text wird in englisch übersetzt. Aber wie?! Wenn ich dann einfügen sage, kommt Fehlermeldung mit Absturz. Das habe ich 3x Probiert! 😩

Bei einem anderen Projekt hatte ich zunächst Text to speech gemacht. Hat geklappt und danach ebenso Speech to text. > Hatte komplett geklappt. Hier nun nicht. Hmm... 🙃

 

Zuletzt geändert von HolgerDUS am 19.10.2024, 17:39, insgesamt 1-mal geändert.

12th Gen Intel(R) Core(TM) i7-12700K   3.61 GHz, ASUS TUF GAMING Z690-PLUS D4, (Treiber 32.0.101.6078) NVIDIA Ventus 2 GFORCE GTX 3060 12GB, 96 GB Ram, (Treiber566.14 12 Nov.24) Windows 11 Home, 2 UHD Bildschirme per DisplayPort und HDMI.

Video ProX 16 Vers. 22.0.1.247 (UDP3)

BilderMacher schrieb am 19.10.2024 um 17:42 Uhr

Ich habe noch immer Windows 10. Scheint wieder so ein 11er-Problem?

"Je mehr die Menschen wissen, desto weniger müssen sie glauben!"

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Ich kann vieles, darf aber nicht alles.
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

-------------

Hardware / Software:
::::::::::::::::::::::::::::::::::::++++:::::::::::::::::::::::::::::::::::::::::::::::::

Intel(R) Core(TM) i7-10510U CPU @ 1.80GHz (8 CPUs), ~2.3GHz
12288 MB RAM
DirectX 12
 

Intel(R) UHD Graphics (für Import, Verarbeitung, Export)

NVIDIA GeForce MX250 (wird nicht in Schnitt-SW verwendet)

  • Video deluxe 2016 Premium
  • Video deluxe 2025 Premium
  • Video Pro X 16
  • Photostory Deluxe 2025
  • Samplitude X7 Suite
  • ACID Pro 11
  • Music Maker 2025 Premium
  • MAGIX/XARA Graphic-/Web-Designer

-----------------------------------------------------------------------------------

Edition    Windows 10 Home
Version    22H2
Installiert am    ‎15.‎10.‎2020
Betriebssystembuild    19045.5011
Leistung    Windows Feature Experience Pack 1000.19060.1000.0

------------------------------------------------------------------------------------

Standardbrowser: Mozilla Firefox 131.0.3 (64-Bit)

HolgerDUS schrieb am 19.10.2024 um 17:54 Uhr

@BilderMacher und nu.... Habe das jetzt mal beim Support gemeldet. 😎

Zuletzt geändert von HolgerDUS am 19.10.2024, 18:22, insgesamt 1-mal geändert.

12th Gen Intel(R) Core(TM) i7-12700K   3.61 GHz, ASUS TUF GAMING Z690-PLUS D4, (Treiber 32.0.101.6078) NVIDIA Ventus 2 GFORCE GTX 3060 12GB, 96 GB Ram, (Treiber566.14 12 Nov.24) Windows 11 Home, 2 UHD Bildschirme per DisplayPort und HDMI.

Video ProX 16 Vers. 22.0.1.247 (UDP3)

vdl-user-v19 schrieb am 19.10.2024 um 19:48 Uhr

... zunächst Denkfehler, dachte ich wähle die gesprochene Sprache aus und nicht die Zieltextsprache.

Meiner Meinung nach ist das kein Denkfehler. Interpretiere die Funktion nur als Speech to text und nicht zusätzlich noch als "Text to text" ;-) im Sinne von zusätzlicher Übertragung in eine andere Sprache.

BilderMacher schrieb am 19.10.2024 um 20:43 Uhr

.... Habe das jetzt mal beim Support gemeldet. 😎

Sehr gute Idee!

An irgendetwas muss es ja liegen. Sie werden es sicher herausfinden.

"Je mehr die Menschen wissen, desto weniger müssen sie glauben!"

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Ich kann vieles, darf aber nicht alles.
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

-------------

Hardware / Software:
::::::::::::::::::::::::::::::::::::++++:::::::::::::::::::::::::::::::::::::::::::::::::

Intel(R) Core(TM) i7-10510U CPU @ 1.80GHz (8 CPUs), ~2.3GHz
12288 MB RAM
DirectX 12
 

Intel(R) UHD Graphics (für Import, Verarbeitung, Export)

NVIDIA GeForce MX250 (wird nicht in Schnitt-SW verwendet)

  • Video deluxe 2016 Premium
  • Video deluxe 2025 Premium
  • Video Pro X 16
  • Photostory Deluxe 2025
  • Samplitude X7 Suite
  • ACID Pro 11
  • Music Maker 2025 Premium
  • MAGIX/XARA Graphic-/Web-Designer

-----------------------------------------------------------------------------------

Edition    Windows 10 Home
Version    22H2
Installiert am    ‎15.‎10.‎2020
Betriebssystembuild    19045.5011
Leistung    Windows Feature Experience Pack 1000.19060.1000.0

------------------------------------------------------------------------------------

Standardbrowser: Mozilla Firefox 131.0.3 (64-Bit)

vdl-user-v19 schrieb am 21.10.2024 um 14:39 Uhr

Bsp.:

... wird aber komplett anders / falsch übersetzt.

Bin auch gespannt auf die Info vom Support.

Übersetzung, die weitgehend auch als solche gelten kann, habe ich normalerweise nur bei der Text zu Sprache - Funktion erwartet. Da gibt es ja auch einen Button für die Übersetzung.

Habt ihr wirklich Beispiele, wo bei der Sprache zu Text - Funktion auch eine brauchbare Übersetzung entsteht?

HolgerDUS schrieb am 21.10.2024 um 16:36 Uhr

@vdl-user-v19 Jo, so ein Kauderwelsch kommt bei mir auch, wenn es nicht vorher crasht. Z.Z. ist das unbrauchbar! 🙁  Komisch das das kein betatester bemerkt hat. ...

12th Gen Intel(R) Core(TM) i7-12700K   3.61 GHz, ASUS TUF GAMING Z690-PLUS D4, (Treiber 32.0.101.6078) NVIDIA Ventus 2 GFORCE GTX 3060 12GB, 96 GB Ram, (Treiber566.14 12 Nov.24) Windows 11 Home, 2 UHD Bildschirme per DisplayPort und HDMI.

Video ProX 16 Vers. 22.0.1.247 (UDP3)

vdl-user-v19 schrieb am 21.10.2024 um 17:12 Uhr

@HolgerDUS,

bis jetzt habe ich noch keinen eindeutigen Werbe- oder sonstigen Hinweis darauf gefunden, dass die KI-Funktion Sprache zu Text auch gleich mit übersetzen kann.

Denke also weiterhin, dass man durchaus 'nur' die gesprochene Sprache der Audiospur auswählt.

Auch in Magix Vegas Pro z.B. erhält man, soweit ich probiert habe, bei Nutzung von Sprache zu Text keine wirkliche Übersetzung. Allerdings kann man dort z.B. die erkannten Untertitel als srt-Datei (mit Zeitangaben) exportieren und sich diese dann extern in andere Sprachen übersetzen lassen und wieder in Vegas einlesen. (Diese grundsätzliche Idee hatte ich bei einem Nutzer eines Mitbewerber-Programmes gesehen. Für die Übersetzung wurde da z.B. ChatGPT mit der Anweisung die Zeitangaben beizubehalten, genutzt.)

HolgerDUS schrieb am 21.10.2024 um 17:41 Uhr

So dachte ich das auch, aber @BilderMacher schrieb das es so gehen würde. Wäre also was für ein kommendes Update!

12th Gen Intel(R) Core(TM) i7-12700K   3.61 GHz, ASUS TUF GAMING Z690-PLUS D4, (Treiber 32.0.101.6078) NVIDIA Ventus 2 GFORCE GTX 3060 12GB, 96 GB Ram, (Treiber566.14 12 Nov.24) Windows 11 Home, 2 UHD Bildschirme per DisplayPort und HDMI.

Video ProX 16 Vers. 22.0.1.247 (UDP3)

HolgerDUS schrieb am 15.11.2024 um 15:47 Uhr

So hat ein bisschen gedauert, aber heute hat sich der Support bei mir gemeldet und wir haben das in einigen Mails geklärt: Derzeit kann man nur Untertitel in der gesprochene Sprache erzeugen.

Möchte man, was ja Sinn macht, z.B. einen deutsch gesprochenen Text als englischen Untertitel haben, geht man wie in den Screenshots gezeigt vor. Erster Schritt ist das gesprochene Wort in der gleichen Sprache in Text zu generieren. Dann hat man den Text in der Titelbearbeitung. dann wird er übersetzt und anschließend in der Titelbeareitung ersetzt. Somit erscheint er wieder synchron zu den gesprochenen Wörtern .Vielleicht hilft das dem ein oder anderen. 😉

Zuletzt geändert von HolgerDUS am 15.11.2024, 15:53, insgesamt 3-mal geändert.

12th Gen Intel(R) Core(TM) i7-12700K   3.61 GHz, ASUS TUF GAMING Z690-PLUS D4, (Treiber 32.0.101.6078) NVIDIA Ventus 2 GFORCE GTX 3060 12GB, 96 GB Ram, (Treiber566.14 12 Nov.24) Windows 11 Home, 2 UHD Bildschirme per DisplayPort und HDMI.

Video ProX 16 Vers. 22.0.1.247 (UDP3)