Revista El Color del Dinero

Bienvenidos a Spain News Today.

La IA está impulsando nuevas tendencias en la tecnología del habla y casos de uso

La IA está impulsando nuevas tendencias en la tecnología del habla y casos de uso

La tecnología del habla, un campo amplio que existe desde hace décadas, está evolucionando rápidamente, gracias en gran parte al surgimiento de la inteligencia artificial.

El campo ya no se centra principalmente en el reconocimiento de voz y la precisión de la conversión de voz a texto. Impulsada por IA, la conversión de voz a texto actual se ha automatizado hasta el punto en que la transcripción en tiempo real es lo suficientemente buena para la mayoría de los casos de uso empresarial. La conversión de voz a texto nunca será 100% precisa, pero está a la par de la transcripción humana y se puede realizar mucho más rápido y a una fracción del costo.

Para algunos, este puede ser el único caso interesante de uso de tecnología de voz basada en IA, pero en el campo de la comunicación y la colaboración en el lugar de trabajo, es sólo el comienzo. Durante los últimos seis años, he proporcionado una actualización anual sobre este tema en Enterprise Connect. Exploremos tres tendencias clave de la tecnología del habla discutidas en la conferencia de este año que los líderes de TI deberían tener en cuenta.

1. La inteligencia artificial se basa en la tecnología del habla.

Hoy en día, la inteligencia artificial ha ido más allá del proceso básico de transcripción. Muchas aplicaciones impulsadas por IA se han convertido en características estándar de todas las ofertas de Comunicaciones Unificadas como Servicio (UCaaS), incluida la transcripción y traducción en tiempo real, resúmenes de reuniones y elementos de acción posteriores a las reuniones. Tenga en cuenta que algunos casos de uso se aplican solo a la voz, pero otros son actividades basadas en voz asociadas con otras aplicaciones, como Calendario.

READ  Nintendo y DeNA establecerán una compañía conjunta llamada Nintendo Systems - TechCrunch

Las aplicaciones más nuevas dependen de la IA generativa, que puede generar automáticamente respuestas de correo electrónico, memorandos y publicaciones de blog coherentes a través de indicaciones de voz o de texto (la mayoría de los trabajadores probablemente preferirán usar su voz).

La situación actual se basa en formas tradicionales de tecnología del habla. Pero con la IA, los casos de uso se están volviendo más amplios y se integran en todos los flujos de trabajo, en lugar de utilizarse únicamente para el reconocimiento de voz.

Resumen de Enterprise Connect 2024


Los líderes de TI deben esperar que estas capacidades estén en juego a medida que evalúan ofertas potenciales de UCaaS o cuando consideran cómo mantenerse al tanto de sus implementaciones actuales. Todas estas aplicaciones basadas en IA todavía son un trabajo en progreso y deberían seguir mejorando, tanto en términos de precisión del habla como de qué tan bien se integran con otras herramientas de productividad y del lugar de trabajo.

2. Aplicaciones emergentes

Incluso cuando los líderes de TI evalúan estas nuevas capacidades, no deben perder de vista el panorama más amplio. Estas aplicaciones se aplican principalmente a la forma en que la gente trabaja hoy en día y se consideran productos puntuales que realizan muy bien un conjunto específico de tareas. Sin embargo, la IA avanza a un ritmo más rápido que nunca. Si bien muchas de estas tareas ya se dominan en gran medida, la próxima ola de innovación basada en la inteligencia artificial del habla está operando a una escala empresarial mayor.

Un ejemplo es la IA conversacional, que permite que los chatbots sean más conversacionales y parecidos a los humanos, lo que los convierte en opciones más aceptables para el autoservicio en el centro de contacto. Los chatbots actuales están lejos de ser perfectos, pero están ganando una adopción mucho más amplia, incluso en las empresas, donde los empleados ahora los utilizan como asistentes digitales.

Los modelos de lenguaje grande (LLM) son la próxima gran fase de la IA. La idea clave aquí es que las empresas vean valor en capturar todas las formas de comunicación digital para ayudar a que las aplicaciones de IA sean más efectivas. Aunque el texto y el vídeo se han digitalizado desde hace mucho tiempo, muchas formas de expresión no se han digitalizado. Dado que la mayor parte de la comunicación cotidiana se basa en la voz, existe un interés creciente en capturar esta información, también conocida como Datos oscurosPorque representan un valioso conjunto de entradas de datos para la inteligencia artificial.

El desarrollo y la gestión de LLM están evolucionando rápidamente, no solo debido a la naturaleza de la IA, sino también porque los ejecutivos de alto nivel ahora ven el potencial de LLM como una ventaja competitiva. (Existe, de hecho, Muchos tipos Modelos lingüísticos de inteligencia artificial, por lo que la referencia aquí a los LLM es una simplificación excesiva. La mayoría de los líderes de TI no son científicos de datos, por lo que esta es un área donde la experiencia externa será valiosa). Dado que el habla es tan central en esta tendencia, los líderes de TI deben adoptar una visión más estratégica de la tecnología del habla.

Más importante aún, descubra cómo la IA ahora conecta las aplicaciones de voz con todo lo demás, integrando el flujo de trabajo, la gestión de proyectos, la productividad personal y los resultados basados ​​en el equipo.

3. Implicaciones estratégicas de la tecnología de la información

Está claro que la TI debe ir más allá del viejo paradigma de la tecnología del habla, especialmente porque la IA impulsa tantas innovaciones relacionadas con la voz y otras comunicaciones. Como tal, las tendencias en la tecnología del habla ya no pueden verse en el vacío, donde la medida del éxito es la precisión de la transcripción.

Más importante aún, descubra cómo la IA ahora conecta las aplicaciones de voz con todo lo demás, integrando el flujo de trabajo, la gestión de proyectos, la productividad personal y los resultados basados ​​en el equipo. Las conversaciones cotidianas, dondequiera que tengan lugar, siguen teniendo un valor inherente, pero con la IA, su valor como flujos digitales mezclados con otros flujos digitales será aún mayor.

Esto es lo que hace que la tecnología de voz empresarial sea tan estratégica. Estas aplicaciones seguirán desempeñando un papel importante a la hora de ayudar a los trabajadores a comunicarse y colaborar de forma más eficaz (principalmente con UCaaS), pero el panorama más amplio es determinar dónde reside el verdadero valor empresarial de la IA.

Los datos son el oxígeno que da vida a la IA y cuantos más datos contenga su modelo, más útil será. La mayoría de las organizaciones solo capturan una pequeña porción de sus datos oscuros, y aquí es donde la tecnología del habla realmente juega un papel al pensar en sus planes de IA.

John Arnold es director de J Arnold & Associates, un analista independiente que brinda liderazgo intelectual y consultoría de mercado con un enfoque en el impacto de la tecnología de comunicaciones a nivel empresarial en la transformación digital.