Meta anunció nuevos modelos de IA capaces de reconocer y reproducir el habla en más de 1100 idiomas. Tiene diez veces la capacidad de tecnologías similares existentes, dijo la compañía en un comunicado. Enfatizó que esta es una iniciativa para preservar lenguas que están en riesgo de desaparecer.
Este Massively Multilingual Speech (MMS) está disponible para el público a través del servicio de alojamiento de código GitHub. Meta explicó que liberarlos como código abierto ayudará a los desarrolladores a crear nuevas aplicaciones de voz más inclusivas.
El nuevo modelo puede leer texto en más de 1100 dialectos y convertirlo en voz (y reconocer el habla y convertirlo en texto). Sin embargo, podrían identificar más de 4.000, lo que representaría 40 veces la capacidad disponible actualmente.
Hay alrededor de 7,000 idiomas en el mundo, pero las herramientas de reconocimiento de voz convencionales existentes solo pueden reconocer alrededor de 100. La mayoría de estos sistemas suelen requerir grandes cantidades de datos de entrenamiento etiquetados, como transcripciones. El problema es que estos también solo están disponibles en un puñado de idiomas, incluidos español, inglés y chino.
Meta aprovecho un modelo de inteligencia artificial creado en el 2020
Meta aprovecha un modelo de inteligencia artificial que desarrolló en 2020. El sistema ya puede aprender patrones de voz a partir de audio sin necesidad de grandes cantidades de datos etiquetados, como transcripciones.
La empresa matriz de Facebook e Instagram, utilizó dos nuevos conjuntos de datos. Las primeras grabaciones de audio y textos del Nuevo Testamento de la Biblia, disponibles en Internet en 1.107 idiomas. MIT Technology Review publicó una segunda grabación sin etiquetar del Nuevo Testamento, que contiene 3.809 dialectos.
Los investigadores de Meta utilizaron un algoritmo diseñado para alinear las grabaciones con el texto que las acompaña. Luego repitieron el mismo proceso con un segundo algoritmo, entrenando con los datos recién alineados. Al final, el equipo logró entrenar el algoritmo para aprender un nuevo idioma más fácilmente, incluso sin el texto que lo acompaña.
Meta comparó su modelo con los de OpenAI Whisper y otros competidores. Dijo que su tasa de error era la mitad, a pesar de cubrir 11 veces más idiomas.
“Ahora podemos construir sistemas de voz muy rápidamente con muy, muy pocos datos”, dijo al MIT Michael Auli, científico del proyecto. Sin embargo, los investigadores advierten que estos modelos de lenguaje impulsados por IA aún pueden transcribir ciertas palabras o frases incorrectamente. De hecho, esto puede conducir a un etiquetado inexacto o potencialmente ofensivo.
Después de meses de ver aplicaciones que intentan cobrarte por traer ChatGPT a tu teléfono (un servicio que es gratuito en su modo más básico), finalmente hay una aplicación oficial. OpenAI finalmente lanzó una aplicación que trae el popular Chatbot a iOS, con una versión móvil Android próximamente.
La aplicación es gratuita. Si los usuarios quieren disfrutar de la versión avanzada del chatbot usando el modelo de lenguaje GPT-4, deberán pagar $20, como ya sucedió en la versión web de esta IA. GPT-4 tiene muchas ventajas, desde tiempos de respuesta más rápidos hasta funciones únicas y la posibilidad de sincronizar chats entre diferentes dispositivos para acceder al historial de conversaciones. La aplicación también se integra con Whisper, un sistema OpenAI que transcribe el habla en texto.
La versión de navegador paga de ChatGPT ahora también es compatible con complementos de terceros. Algunos de estos complementos permiten que los modelos de lenguaje accedan a Internet e incluso compren productos en línea.
Con el anuncio, ChatGPT ha alcanzado a Bing en términos de usabilidad en dispositivos móviles. Otros chatbots, como Claude de Anthropic, Pi de Inflection AI o el chatbot español LuzIA, están llegando a los dispositivos móviles a través de integraciones con otras plataformas como Instagram, Telegram o Discord.
Mucho cuidado en no caer en estafas
Hasta ahora, el panorama de los clones de pago de ChatGPT ha estado completamente fuera de control, tanto en iOS App Store como en Google Play. Algunas de estas aplicaciones falsas incluso cobran $8 por un modelo de lenguaje que ni siquiera saben que es real. La firma de seguridad cibernética Sophos informó el martes la cantidad de estafas que intentan explotar los chatbots populares en general y ChatGPT en particular. Algunos, como Open Chat GBT o ChatGBT, incluso usan logotipos similares a los de OpenAI, pero todo lo que ofrecen es acceso a ChatGPT bajo una fuerte publicidad o una suscripción paga (nuevamente, su versión básica es gratuita). Algunas funciones de estos chatbots no están disponibles en la versión gratuita oficial de OpenAI, incluso sin una suscripción. Por supuesto, estas aplicaciones han acumulado cientos de reseñas de cinco estrellas en la tienda de aplicaciones.
NVIDIA ha anunciado oficialmente la GeForce RTX 4060, una nueva tarjeta gráfica destinada a convertirse en la favorita de los jugadores de PC promedio. Tras meses de espera el fabricante ha revelado una GPU que promete un alto rendimiento a 1080p. El anuncio es notable no solo porque reemplazará a la RTX 3060 Ti, sino también porque es la tarjeta más accesible de la serie 40.
La nueva serie incluye dos modelos: GeForce RTX 4060 y GeForce RTX 4060 Ti. Ambos se basan en la arquitectura de Ada Lovelace y presentan mejoras de rendimiento con respecto a sus predecesores. Además del rendimiento del trazado de rayos, las nuevas tarjetas también admiten DLSS 3 y generación de cuadros.
Esta es la primera vez en mucho tiempo que los usuarios podrán comprar una GPU en este rango al precio sugerido. La minería de criptomonedas y la escasez de chips han provocado que las ventas de modelos más antiguos se dupliquen durante la pandemia. Sin embargo, la GeForce RTX 4060 repite algunos de los errores de la 4070, principalmente en las características del hardware.
Dos variantes en RTX 4060
En cuanto a las especificaciones, el nuevo NVIDIA RTX 4060 viene en dos variantes de 8 GB, aunque el modelo RTX 4060 Ti tendrá una opción para 16 GB de VRAM. Las nuevas tarjetas están bien para juegos con muchos detalles a 1080p, pero eso no significa que no puedan manejar 1440p. Si hemos aprendido algo de la 2060 Super o la 3060 Ti, es que pueden funcionar mejor en QHD en algunos juegos, sí, en sus respectivos compromisos.
GeForce RTX 4060 Ti (16 GB)
GeForce RTX 4060 Ti (8 GB)
GeForce RTX 4060 (8 GB)
Arquitectura
Ada Lovelace (TSMC 4N)
Ada Lovelace (TSMC 4N)
Ada Lovelace (TSMC 4N)
Memoria (VRAM)
16 GB GDDR6
8 GB GDDR6
8 GB GDDR6
Bus de memoria
128-bit
128-bit
128-bit
Ancho de banda de memoria
288 GB/s
288 GB/s
288 GB/s
Velocidad (Boost)
2535 MHz
2535 MHz
2460 MHz
TDP
160 W
160 W
115 W
Interfaz
PCIe Gen4 x8
PCIe Gen4 x8
PCIe Gen4 x8
Precio
$499 USD
$ 399 USD
$ 299 USD
Disponibilidad
Julio 2023
Mayo 2023
Julio 2023
La idea de ofrecer una tarjeta gráfica con 8GB de VRAM es el primer punto en contra, juegos como Hogwarts Legacy, The Callisto Protocol o A Plague Tale: Requiem tienen problemas de rendimiento a 1080p en tarjetas de 8 GB, por lo que la única opción es reducir la calidad de la textura. NVIDIA ofrece una variante de 16 GB para el modelo Ti, pero tendria un costo de $499.
A tomar en cuenta….
Hablando de rendimiento, NVIDIA afirma que la nueva GeForce RTX 4060 Ti es 2,6 veces más rápida que la RTX 2060 Super y 1,7 veces más rápida que la RTX 3060 Ti. En juegos como Microsoft Flight Simulator, Hitman 3, F1 22 o The Witcher 3: Wild Hunt se aprecian los saltos, aunque con ligero detalle. La tabla se refiere a los juegos que admiten la generación de velocidad de fotogramas, una característica de las nuevas tarjetas gráficas de la serie 40.
La diferencia en rendimiento con la serie 30 no es considerable y pagar 100 (o 200) dólares adicionales por los 8 GB extra parecen una jugada típica de NVIDIA. En estos casos, lo mejor sería esperar a la siguiente generación o a la actualización intermedia. La GeForce RTX 4060 Ti estará disponible a finales de mayo por 399 dólares, mientras que la variante de 16 GB de 499 dólares y el modelo RTX 4060 de 299 dólares llegarán en julio.
Amazon tiene un nuevo altavoz inteligente. Actualizó su Echo Show 5 más popular con altavoces de pantalla y auriculares Echo Buds, al tiempo que presentó un nuevo miembro de la línea, el Echo Pop.
El nuevo Echo Pop es un dispositivo completamente nuevo en la línea de parlantes inteligentes de Alexa. Se destaca por su forma abovedada y su diseño que viene en cuatro opciones de color: blanco y negro clásico, además de coloridos lavanda y verde aguamarina.
El nuevo Echo Pop es más pequeño que el Echo Dot, y es ideal para lugares limitados. A pesar de su pequeño tamaño, el Echo Pop incluye los altavoces direccionales personalizados de Amazon y la potencia de su procesador Az2 Neural Edge. Por supuesto, tiene incorporado Alexa, por lo que puede realizar las mismas tareas que otros altavoces Echo.
Amazon Echo Buds
Los nuevos Echo Buds son una versión “lite” del modelo anterior, los Echo Buds de segunda generación. No tienen características premium como cancelación de ruido, pero también son más baratos, con un precio oficial de $50 dolares.
Lo que integran son características como controles táctiles personalizables y conectividad multipunto, lo que significa que se pueden conectar a dos dispositivos al mismo tiempo. Estos dispositivos son capaces de controlar otros habilitados para voz, al igual que otros parlantes inteligentes de Amazon.
En cuanto al sonido, según Amazon, los nuevos Echo Buds integran un driver de 12 mm y dos micrófonos, que son capaces de distinguir la voz del interlocutor de las voces de los que le rodean durante una llamada para potenciar el habla.
Tienen 5 horas de autonomía en los auriculares, hasta 20 horas con cargo extra en el estuche de carga, y cuentan con un nuevo diseño “tipo AirPod” con varillas que sobresalen de las orejas.
Amazon Echo Show 5 (3a generación)
El nuevo Echo Show 5 de tercera generación mantiene el formato compacto de la pantalla de 5,5 pulgadas pero mejora el sonido. Según Amazon, el sistema de parlantes ha sido rediseñado para brindar un sonido más claro, mejores bajos y un volumen más alto.
Además, es compatible con el nuevo protocolo Matter, integra mejores micrófonos para una mejor detección y comprensión del habla. La cámara frontal para hacer videollamadas sigue ahí. El precio oficial del nuevo Echo Show 5 en 2023 es de $90 dolares.
La renovación del altavoz con pantalla también tiene una versión para niños, el nuevo Echo Show 5 Kids. Mantiene todas las novedades de hardware anteriores, pero agrega un nuevo diseño espacial y funciones enfocadas en los niños, como controles parentales, respuestas divertidas, chistes, ayuda con la tarea, filtrado explícito de letras y la función “Crear con Alexa” para generar historias para niños.
El nuevo Amazon Echo Show 5 tiene un precio oficial de $100 dólares e integra una suscripción de un año a Amazon Kids+, que se enfoca en audiolibros, juegos, videos y servicios de habilidades de Alexa para niños.
Finalmente, Amazon también está llevando el nuevo Echo Auto de segunda generación, que llegó a México en febrero, a ocho nuevos países: Australia, Canadá, Francia, Alemania, Italia, España y el Reino Unido.
Este lunes, Mark Zuckerberg lanzó una importante actualización de privacidad en WhatsApp: bloqueo de chat. Chat Lock le permite ocultar sus conversaciones en una carpeta protegida con contraseña de miradas indiscretas.
Si está acostumbrado a archivar sus chats, bloquear conversaciones le resultará familiar. La conversación pasa de su bandeja de entrada de WhatsApp a su propia carpeta, que puede ver deslizando el dedo hacia abajo. La diferencia es que solo se puede acceder a esta carpeta usando el código de acceso de su dispositivo o datos biométricos (huella digital o reconocimiento facial).
Además, las conversaciones que guarde en carpetas de chat bloqueadas seguirán recibiendo notificaciones (si no están silenciadas), pero no mostrarán el remitente ni el contenido del mensaje.
El anuncio de Facebook muestra a un hombre enviando mensajes de texto a alguien en una fiesta en casa, bloqueando el chat antes de que su hermano y sus primos tomaran su teléfono.
Pero hay un sin fin de razones para usarlo, comenzando por ocultar notificaciones de chat confidenciales cuando tomas prestado tu teléfono para mirar fotos o sorprendes a tu pareja con un cumpleaños.
El bloqueo de chat ya se está implementando a nivel mundial y, en los próximos meses, se actualizará con nuevas opciones, como bloquear el chat en dispositivos vinculados y crear un código de acceso personalizado diferente al que usa en su teléfono.
Esta es solo una de las próximas características. WhatsApp ha pisado el acelerador y pronto tendremos edición de mensajes, transcripción de chats o WhatsApp para smartwatches con WearOS.
El 11 de mayo se anunció oficialmente ASUS ROG Ally, la computadora portátil de la compañía en la misma categoría que Steam Deck de Valve.
El anuncio reveló su precio, que es de $699 en EE. UU., pero no especificó el valor del dispositivo en México, que ahora la compañía ha revelado en su sitio web oficial: 17,999 pesos.
Para una comparación obligada, Steam Deck está disponible para su compra en diferentes plataformas en línea, importadas por terceros. En cuanto a Amazon, podemos encontrar la versión de 64 GB por unos 10.000 pesos, y el modelo de 512 GB de almacenamiento por unos 16.000 pesos.
Procesador AMD de 8 Núcleos
Mirando las especificaciones técnicas de Ally en la página de ROG México, podemos encontrar que efectivamente es el modelo más fuerte, equipado con un procesador AMD Ryzen Z1 Extreme, basado en la arquitectura Zen 4 de 4nm, ocho núcleos y dieciséis hilos, y una capacidad de 8,6 Teraflops.
En otros detalles, son iguales a la versión menos potente: pantalla de 7 pulgadas FHD 16:9, 16 GB de RAM LPDDR5, 512 GB de almacenamiento PCIe 4.0, Wi-Fi 6E, Bluetooth 5.2 y batería de 40 WHrs. , con un peso de 608 gramos.
Cabe señalar que 17999 pesos es el precio que la propia Asus dejó constancia en la tienda, así que espera a que salga a la venta en México, que está previsto para el 13 de junio de 2023, y a ver si hay alguna modificación en otras plataformas o , por el contrario, viene con el nuevo descuento o promoción por lanzamiento de un producto.
En cuanto al ROG Ally equipado con el procesador Z1, una versión menos potente, Asus no detalló el precio ni otra información. Todo apunta a que habrá que esperar a que llegue a EEUU en el tercer trimestre de 2023.
Después de numerosos rumores y filtraciones, Google reveló oficialmente el nuevo Pixel Fold en el evento de apertura de Google I/O 2023. Es el primer teléfono inteligente plegable de Google y cuenta con hardware premium y un diseño más rectangular. (más ancho y más bajo en altura) que otros pliegues. Lo mismo ocurre con el Pixel Fold.
El nuevo teléfono plegable de Google está diseñado internamente e incluye un procesador Tensor de última generación, también desarrollado por Google y, por supuesto, la última versión del sistema operativo Android. Desde el lanzamiento de Android 12L a principios de 2022, Google ha estado experimentando con la idea de las pantallas plegables y sus capacidades, pero la compañía ha esperado hasta ahora para lanzar su propio dispositivo plegable que competirá con otros dispositivos como el Galaxy Z de Samsung. Fold y otras marcas como Honor, líneas de productos y propuestas.
Características
En el caso del Pixel Fold, su pantalla principal tiene una diagonal de 7,6 pulgadas con una resolución de 2208×1840 píxeles, y una pantalla exterior de 5,8 pulgadas con una resolución de 2092×1080 píxeles. En general, el diseño del Pixel Fold es más rectangular que cuadrado, y lo mismo ocurre con los smartphones plegables de otras compañías, por ejemplo, un formato que en teoría podría ser especialmente bueno para la multitarea. Sin embargo, la pantalla interna también se nota con un bisel o marco considerable.
Internamente, el Pixel Fold cuenta con un chip Google Tensor G2, acompañado de 12 GB de RAM y 256 o 512 GB de almacenamiento. Su cámara principal consta de tres sensores, que incluyen una cámara principal de 48 MP, un sensor ultra gran angular de 10,8 MP y un sensor de teleobjetivo de 10,8 MP con zoom óptico de 5x. La cámara selfie tiene sensores de 9.5MP (externo) y 8MP (interno). En cuanto a la batería, tiene una capacidad de 4.821 mAh.
Como suele ocurrir con los Google Pixel: los rumores eran ciertos. Google sorprendió a todos al anunciar su primer teléfono plegable, el Pixel Fold.
Un video adjunto muestra el teléfono en todo su esplendor, y una página en vivo en Google Store nos permite registrarnos para obtener más información. No hay detalles técnicos del teléfono, ni precios y disponibilidad.
Lo que sí sabemos con certeza es que Pixel Fold tiene un factor de forma muy similar a los teléfonos plegables de Samsung y Oppo, con un módulo de cámara similar al Pixel 7 Pro y una pantalla exterior resistente que pliega el teléfono. La pantalla flexible se abre como un libro y los biseles son bastante generosos, con un aspecto optimista para que la cámara interna no interfiera con la pantalla, sino que esté en el borde superior.
Según Evan Blass, el Pixel Fold mide 139,7 x 158,7 x 5,2 mm y pesa 283 gramos. La pantalla exterior tiene un panel OLED de 5,8 pulgadas y la pantalla interior tiene otro panel OLED de 7,6 pulgadas. El procesador es un Google Tensor G2 con un coprocesador seguro Titan M2. La memoria es de 12 GB. Las opciones de memoria aumentarán de 256 GB a 5128 GB con la tecnología UFS 3.1.
Las cámaras tampoco son una sorpresa para Blass: una cámara principal de 48 MP, una cámara ultra gran angular de 10,8 MP y una cámara de teleobjetivo de doble píxel de 10,8 MP. La pequeña cámara frontal interna es de 8 MP. El Fold tiene una clasificación de resistencia al agua IPX8 y una batería de 4821 mAh. Viene en dos colores: obsidiana y porcelana.
A principios de abril, se reveló que los ingenieros de una fábrica de Samsung habían usado ChatGPT para obtener soporte y corregir errores en sus procesos, alimentando al chatbot con información confidencial sobre la fábrica, lo que resultó en tres violaciones de datos separadas en solo 20 días.
Si bien se tomaron medidas inmediatas para evitar nuevos casos de este tipo, Samsung Electronics prohibió por completo el uso de herramientas de IA generativa.
Según Bloomberg, específicamente Marc Gurman, la compañía notificó a los empleados sobre la nueva política a través de un memorando que el medio pudo ver.
En el documento, a Samsung le preocupa que los datos transmitidos a plataformas de inteligencia artificial, incluidas Google (Bard) y Microsoft (Bing), puedan almacenar información en servidores externos, lo que dificulta su recuperación y eliminación, además de ser un riesgo de filtración. revelada a otros usuarios.
Prohibida la IA generativa a todo empleado de Samsung
Las nuevas reglas prohíben el uso de IA generativa en computadoras, tabletas y teléfonos inteligentes propiedad de la empresa, así como su uso en redes internas. Por supuesto, la decisión de Samsung no se aplica a los consumidores, ya que solo se preocupa por controlar el uso de la inteligencia artificial por parte de los empleados.
La empresa también pidió a los empleados que usan ChatGPT junto con otras opciones que no envíen información relacionada con la empresa o datos personales que puedan revelar propiedad intelectual, lo que podría dar lugar a “medidas disciplinarias” que pueden incluir el despido.
Gurman detalló que Samsung está desarrollando sus propias herramientas internas de inteligencia artificial para traducir y resumir documentos y ayudar con el desarrollo de software.
Al mismo tiempo, está buscando cómo evitar la carga de información confidencial de la empresa a servicios externos, proporcionando así un entorno seguro para el uso de inteligencia artificial generativa para mejorar la productividad y la eficiencia de los empleados.
En el memorando, Samsung aclaró que hasta que se implementen esas medidas, “el uso de la IA generativa se limitará temporalmente”.
Aunque Asus confirmó oficialmente la existencia de su nueva videoconsola hace unas semanas, la marca taiwanesa aún no ha dicho nada sobre las características que traerá ROG Ally. hasta hoy.
Dentro de la consola encontraremos 16 GB de RAM, un SSD de 512 GB y un procesador de 4 nm de la serie AMD Ryzen Z1. Impulsado por la arquitectura Zen 4, este procesador está hecho a medida con gráficos RDNATM 3 y promete potenciar los juegos más exigentes con una resolución de 1080p de ROG Ally. Su pantalla también tiene un brillo máximo de 500 nits, una frecuencia de actualización de 120 Hz y es compatible con la tecnología Adaptive Sync.
Los propios ingenieros de Asus explicaron que optaron por un enfoque más ergonómico con un joystick asimétrico, similar a un controlador de Xbox. Notarás que el ROG Ally tiene la combinación habitual de botones, con cuatro disparadores en la parte superior y dos botones en la parte posterior que se pueden configurar como teclas macro. Pesa apenas 608 gramos y cuenta con una capa de victus Gorilla Glass para protegerlo de los impactos.
Sistema de doble ventilador para evitar que se caliente
ROG Ally se ejecuta en Windows 11, por lo que es compatible con casi todas las plataformas de juego del mercado, como Steam, Epic Games, EA Play o Battlenet. Además de tener una interfaz de escritorio similar a la de Windows, ROG Ally también viene con una edición especial del software Armory Crate de Asus, que nos permitirá personalizar una variedad de configuraciones de la consola, desde el mapeo de botones hasta la sensibilidad del disparador y los joysticks.
Vale la pena señalar que ASUS también ha puesto especial cuidado en todos los detalles multimedia de la consola. Hay una ranura MicroSD, un conector para auriculares e incluso sonido Dolby Atmos.
Tendremos que esperar al evento de lanzamiento oficial de ROG Ally el 11 de mayo para ver la consola en acción y saber cuánto costará.