logistic ready

Fachportal für Intralogistik

Die Sprachtechnologie von Xiaomi hilft Menschen mit Sprachstörungen

Die Sprachtechnologie von Xiaomi hilft Menschen mit Sprachstörungen

Xiaomi wird für Smartphones und eine Vielzahl von IoT-Produkten berühmt sein, aber diese Marke hat mehr zu bieten als ihre populäreren Geräte. Die Marke hat nun eine Technologie enthüllt Text zu Sprache Es wurde vom Xiaomi AI Lab entwickelt, mit dem Sie eine einzigartige und personalisierte Stimme für Benutzer mit Sprachstörungen erstellen können.

Diese einzigartige Stimme ersetzt häufigere elektronische Klänge und ermöglicht es einer Person mit einer Sprachstörung, mit anderen in einem natürlichen Ton zu kommunizieren. Diese Initiative entstand aus dem Projekt „Own My Voice“, das von Xiaomis „Technology for Good“-Komitee geleitet wurde.

Warum hat Xiaomi dieses Projekt gestartet?

Xiaomi kümmert sich um Menschen und ist bestrebt, ihre Bedürfnisse durch technologische Innovation zu erfüllen. Er entdeckte den Wunsch vieler Nutzer mit Sprachstörungen nach ihrer einzigartigen Stimme für die alltägliche Kommunikation und gründete ein Projektteam „Ich habe meine Stimme“ Um einen sprachlosen Benutzer einzuladen, als Audioempfänger zu fungieren. Zhou Shi, Vorsitzender des Technologieausschusses von Technologie zum Guten Von Xiaomi sagt er: „Wir freuen uns darauf, die vielfältigen Werte zu erkunden, die uns technologische Innovationen bringen, wie z. B. die Reaktion auf die Anfragen der Benutzer nach ihrer Identität und den Aufbau ihrer Identität.“.

Wie hat Xiaomi das Projekt umgesetzt?

Um die am besten geeignete und personalisierte Stimme für den Empfänger zu erzeugen, hat das Team mehr als 200 Freiwillige innerhalb von Xiaomi rekrutiert, um ihre Stimmen zu spenden. Sie verwendeten einen Stimmenabgleichsalgorithmus, um die Eigenschaften der von den Freiwilligen gespendeten Stimmen mit den Stimmen des Empfängers abzugleichen. Durch diesen Ansatz finden sie den am besten geeigneten Klang als primären akustischen Referenzklang für den Empfänger. Im Hinblick auf Personalisierung und Schutz der Privatsphäre wurde der ausgewählte echte Klang durch komplizierte akustische Modifikationen manipuliert, um einen neuen und originellen akustischen Klang zu erzeugen.

Siehe auch  Ein seltsames intermittierendes Radiosignal aus dem Weltraum macht Astronomen neugierig

Dann verwendeten sie die automatisch entworfene Text-to-Speech-Technologie, um das KI-Modell zu trainieren, sodass diese neue Stimme allmählich einen natürlichen Rhythmus und Ton annahm, der in der Lage ist, menschliche Emotionen und Töne wirklich auszudrücken.

Das Projekt „Ich habe meine Stimme“ Es kombiniert eine Vielzahl der fortschrittlichsten Algorithmen mit Xiaomis selbst entwickelter Sprachtechnologie, um die Privatsphäre, Sicherheit und hohe Wiedergabetreue der synthetisierten Stimme zu gewährleisten, und schafft so eine neue Idee der personalisierten Sprachsynthese für Benutzer mit Sprachstörungen.

Welche Bedeutung hat das Projekt?

Das Rückgrat dieses Projekts ist eine Gruppe von Sprachtechnologieexperten des Xiaomi AI Lab. Seit 2017 haben sie 37 Thesen zum Thema Sprache in den Proceedings großer internationaler Konferenzen wie der International Conference on Voice, Speech and Signal Processing (ICASSP) veröffentlicht. Erfolg „Ich habe meine Stimme“ Es basiert hauptsächlich auf der automatisch entworfenen und entwickelten Text-to-Speech-Technologie.

Die Text-to-Speech-Technologie im spontanen Stil lässt die Stimme in Ton, Pause, Geschwindigkeit und anderen Eigenschaften wie ein echter Mensch synthetisieren. Dadurch wird das monotone und unnatürliche Empfinden des elektronischen Klangs durch einen natürlicheren Klang ersetzt. Derzeit ist diese Technologie auf viele intelligente Geräte anwendbar, die mit Xiaoai, dem KI-Sprachassistenten von Xiaomi, ausgestattet sind. Das Projekt „Ich habe meine Stimme“ Es zeigt, dass die automatisierte Text-to-Speech-Technologie auch in den Bereichen Barrierefreiheit und Verbesserung der Benutzererfahrung weit verbreitet sein kann.

Chu shi accicento: „Wenn wir die Bedürfnisse von Minderheiten frühzeitig erkennen und darauf eingehen, kann der Prozess des Technologieeinsatzes erheblich verkürzt werden. Dadurch können die Vorteile neuer Technologien für Benutzer mit Behinderungen ohne Verzögerung zugänglich gemacht werden.“.

Von nun an wird Xiaomi weiterhin Feedback von Audioempfängern erhalten und die Machbarkeit dieses Projekts in größerem Maßstab weiter untersuchen. Xiaomi wird weiterhin die Zugänglichkeit mit den neuesten Technologien ermöglichen und sich bemühen, die unterschiedlichen Bedürfnisse der Menschen durch technologische Innovation zu erfüllen.

Siehe auch  MediaTek stellt die Chipsätze Dimension 7300 und Dimension 7300X vor