La industria de la inteligencia artificial (IA) está cambiando y evolucionando rápidamente. Somos testigos de avances sorprendentes y productos innovadores que superan los límites de lo que creíamos posible.
Hemos presentado algunos productos impresionantes y de vanguardia que revolucionarán diversos sectores y mejorarán la productividad personal esta semana.
OpenAI ha lanzado oficialmente la búsqueda web ChatGPT.
OpenAI ha lanzado oficialmente el Búsqueda web en ChatGPT función que puede recuperar rápidamente y en tiempo real resultados de búsqueda con enlaces web relevantes. Ya no es necesario utilizar otras extensiones web o aplicaciones para lograr esta función.
Todas las respuestas de búsqueda también incluyen citas de fuentes. ChatGPT también proporcionará respuestas más detalladas al incorporar contexto a las consultas de búsqueda.
Además, al descargar la extensión del navegador Chrome, ChatGPT se puede configurar como motor de búsqueda predeterminado. ¡De esta manera, podrás usarlo de forma rápida y directa!
Cómo utilizar el Búsqueda web en ChatGPT función si no eres suscriptor de ChatGPT Plus
OpenAI ha anunciado que la función de búsqueda de ChatGPT solo está disponible para los usuarios de ChatGPT Plus y Team, que pueden utilizarla de inmediato. Los usuarios pagos no tendrán que esperar un tiempo.
Sin embargo, OpenAI planea implementar el acceso a usuarios gratuitos en los próximos meses.
Esperar el lanzamiento:Si no es un suscriptor pago, deberá esperar a que OpenAI extienda la función a los usuarios gratuitos, lo que se espera que ocurra en los próximos meses.
Únase a la lista de espera:Si está disponible, considere unirse a cualquier lista de espera que OpenAI pueda proporcionar para obtener acceso temprano a funciones como ChatGPT Search.
Revisar regularmente:Esté atento a los anuncios de OpenAI con respecto a las actualizaciones sobre cuándo la función de búsqueda estará disponible para los usuarios gratuitos.
¿Cómo garantiza ChatGPT la precisión de sus resultados de búsqueda web?
ChatGPT garantiza la precisión de sus resultados de búsqueda a través de varios métodos:
Recuperación de datos en tiempo real:Accede a información actualizada a través de motores de búsqueda, recopilando contenidos de fuentes confiables y citándolos.
Criterios de selección:ChatGPT prioriza fuentes relevantes, autorizadas y recientes para que coincidan con las consultas de los usuarios.
Refinamiento de búsqueda:Si faltan resultados iniciales, refina las consultas para mejorar la relevancia.
Comentarios de los usuarios:Se adapta en función de las correcciones del usuario para mejorar las respuestas con el tiempo.
HeyGen lanzó una nueva función para crear humanos digitales
HeyGen ha lanzado una nueva función que permite a los usuarios crear humanos digitales usando solo fotografías, sin filmar.
Puedes cargar tu propia foto o ingresar un mensaje de texto para generar una imagen de personaje virtual, que puede usarse para entrenar tu propio avatar digital de video de IA.
Cuanto más imágenes de referencia cargues del personaje, mayor será la consistencia de los rasgos faciales en las imágenes generadas.
Estos humanos digitales tienen movimientos corporales naturales, ropa personalizable, poses y fondos intercambiables, y puedes seleccionar género, edad y etnia.
Puedes editar el guión, elegir diferentes voces y expresiones emocionales y generar rápidamente el vídeo en poco tiempo.
Suno ha lanzado Personas
Suno ha lanzado una nueva función llamada Personas.
Permite a los usuarios guardar las características principales de una canción, como la voz, el estilo y la atmósfera, que luego pueden reutilizarse en nuevas creaciones.
Esta función está diseñada para ayudarle a mantener su estilo musical único.
Cómo crear un personaje: elige una canción que te guste, haz clic en "Crear" y luego crea un personaje. Agrega letras y estilo: los usuarios pueden agregar letras y estilo como en las creaciones normales.
Configuración pública y privada: puedes elegir configurar una Persona como pública o privada. Las Personas públicas tendrán su propia página, podrán ser utilizadas por otros usuarios y aparecerán en tu biblioteca y en tu perfil personal.
GitHub introdujo más modelos de IA en GitHub Copilot
GitHub anunció que está introduciendo más modelos de IA en GitHub Copilot para mejorar las opciones y las capacidades de personalización de los desarrolladores.
Los nuevos modelos incluyen:
Soneto Claude 3.5
Géminis 1.5 Pro
o1-vista previa y o1-mini
GitHub también ha lanzado GitHub Spark, una herramienta para crear aplicaciones completamente con lenguaje natural.
No es necesario conocer técnicas de implementación complejas, como configurar servidores o bases de datos.
GitHub Spark completará automáticamente toda la configuración de la nube y la asignación de recursos en segundo plano, lo que permitirá que incluso los principiantes creen aplicaciones web completamente a través del lenguaje natural.
En otras palabras, solo tienes que decirle “lo que quieres hacer” y te proporcionará una aplicación funcional, haciendo que el proceso sea tan simple como una conversación.
Stability AI ha lanzado el modelo Stable Diffusion 3.5 Medium.
Está disponible de forma gratuita tanto para usuarios comerciales como no comerciales. Con un modelo de 2500 millones de parámetros, está diseñado específicamente para hardware de consumo.
El modelo requiere solo 9,9 GB de VRAM y puede funcionar con la mayoría de tarjetas gráficas estándar con hardware de consumo.
Puede generar imágenes de alta calidad en múltiples resoluciones, produciendo resultados superiores a otros modelos de tamaño medio.
Según el análisis de Stability AI, Stable Diffusion 3.5 Large lidera el mercado en adherencia rápida y rivaliza con modelos mucho más grandes en calidad de imagen.
¿Cómo utilizar Stable Diffusion 3.5?
Pasos de instalación para uso local
Ahora puedes descargar los modelos Stable Diffusion 3.5 Large y Stable Diffusion 3.5 Large Turbo desde Cara abrazada y el código de inferencia en GitHubY luego puedes ejecutarlo en tu computadora u otro hardware.
Antes de poder ejecutarlo en la computadora, debe configurar los requisitos previos e instalar las bibliotecas esenciales.
Mientras instala las bibliotecas Python necesarias, puede ejecutar Stable Diffusion localmente.
Acceso en línea
Usando ComfyUI
ComfyUI ofrece una interfaz fácil de usar para gestionar sus flujos de trabajo con Stable Diffusion 3.5. Puede arrastrar diferentes archivos a la interfaz y ejecutar tareas de generación de imágenes fácilmente.
Uso de espacios para abrazar la cara
Visita Hugging Face Spaces para ejecutar modelos de difusión estable directamente en tu navegador sin requisitos de instalación.
Para más usuarios, muchas aplicaciones y sitios web pronto integrarán el último modelo Stable Diffusion 3.5 para la generación de imágenes, ¡así que permanezca atento a las actualizaciones!
Ultralight-Digital-Human: un modelo humano digital ultraligero que puede funcionar en un teléfono móvil
Ultraligero-Digital-Humano:un modelo humano digital ultraligero que admite operaciones en tiempo real en dispositivos móviles.
El algoritmo del modelo está optimizado para funcionar sin problemas, incluso en dispositivos de bajo consumo.
Sólo se necesitan de 3 a 5 minutos de vídeo para completar la capacitación.
Asegúrate de que cada fotograma del vídeo muestre el rostro completo de la persona y que el sonido sea claro y sin ruidos. Colócalo en una carpeta nueva.
Además, a través de procesos de inferencia y flujo de datos optimizados, el modelo puede procesar datos de entrada (como video y audio) en tiempo real, lo que permite respuestas humanas digitales instantáneas.
El Plataforma de video con inteligencia artificial D-ID Lanzó nuevas herramientas humanas digitales
La plataforma de video con inteligencia artificial D-ID ha lanzado dos nuevos herramientas humanas digitales—Express y Premium+, diseñados específicamente para la creación de contenido, tienen como objetivo permitir a las empresas aplicar humanos virtuales más realistas en áreas como marketing, ventas y atención al cliente.
El humano virtual Express solo requiere un minuto de entrenamiento en video para generarse y puede sincronizarse con los movimientos de la cabeza del usuario.
El humano virtual Premium+ requiere un video de entrenamiento más largo, pero puede realizar movimientos de manos y torso, creando interacciones humanas más realistas.
Estas herramientas facilitan la generación de vídeos humanos virtuales, reduciendo los costos comerciales en marketing y ofreciendo una aplicabilidad más amplia.
La API de Google Gemini ha introducido el «Anclaje de búsqueda»
Google lanzó la nueva función “Anclaje de búsqueda de Google” en su API Gemini y Google AI Studio. Es muy cómodo de usar.
Esta función aprovecha datos en tiempo real de la Búsqueda de Google para brindar a los usuarios información más precisa y actualizada, junto con enlaces de apoyo y sugerencias de búsqueda, lo que hace que las respuestas de la IA sean más confiables.
Utilizar los últimos datos de noticias obtenidos a través de búsquedas reduce la desinformación.
La búsqueda en tiempo real obtiene la información más reciente, lo que permite obtener mejores respuestas en determinados resultados de búsqueda.
En las respuestas se incluyen enlaces a fuentes de información, lo que facilita que los usuarios verifiquen la credibilidad de la información.
Claude para escritorio
IA antrópica ¡Claude ha creado una aplicación de escritorio! Ahora está disponible para Mac y Windows.
Como tu Asistente de IAClaude puede ayudarte a realizar trabajos más profundos de forma más rápida y creativa.
Ahora puedes usar Claude en cualquier dispositivo, conversar con Claude y pedirle que te ayude a encontrar respuestas a tus preguntas y analizar el contenido de las imágenes.
¡Claude ha aprendido a comprender cuadros y gráficos en archivos PDF!
Anthropic estaba implementando la capacidad de enviar archivos PDF de Claude en la API de Anthropic.
Con la nueva versión beta de compatibilidad con PDF, puedes incluir directamente un PDF en tu solicitud de API. Leer artículos de investigación ahora es más fácil.
El nuevo modelo Claude 3.5 Sonnet ahora admite la entrada de PDF y comprende tanto el texto como el contenido visual dentro de los documentos.
Puede experimentar esta función en la vista previa de funciones.
Puede hacer cualquier pregunta específica que desee sobre el contenido del PDF y Claude puede responder a sus preguntas basándose en su capacidad de lectura de imágenes.
¿Cómo funciona el soporte de PDF?
- El sistema convertirá cada página del PDF en una imagen.
- El sistema obtiene una mejor comprensión del PDF al analizar el texto y las imágenes.
- Se pueden utilizar simultáneamente otras funciones de Claude.
¿Cómo puedo habilitar el uso de la función Visual PDF en Claude?
Para habilitar la función Visual PDFs en Claude, siga estos pasos:
- Acceder a la configuración:
Abra la interfaz de Claude y busque un ícono de matraz o un menú de configuración. - Habilitar archivos PDF visuales:
Haga clic en el icono del frasco, navegue hasta la opción Visual PDFs y actívela. Esto permitirá que Claude procese e interprete imágenes y elementos visuales dentro de documentos PDF. - Sube tu PDF:
Una vez habilitada la función, puedes cargar un documento PDF arrastrándolo a la ventana de chat o usando el botón de carga. Es muy fácil y conveniente. - Interactúa con Claude:
Después de cargar los archivos PDF, puede hacerle preguntas a Claude sobre el texto y las imágenes que contiene el PDF, lo que mejorará su interacción con documentos complejos. Esto le permitirá leer documentos de manera más cómoda y aumentará su eficiencia.