• Home
  • Contact Us
  • Disclaimer
  • Privacy Policy
  • Terms & Conditions
jueves, diciembre 25, 2025
No Result
View All Result
Corresponsal 360
  • Home
  • Noticias
  • Tecnología
  • Deportes
  • Política
  • Salud
  • Turismo
  • Cultura
  • Home
  • Noticias
  • Tecnología
  • Deportes
  • Política
  • Salud
  • Turismo
  • Cultura
No Result
View All Result
Corresponsal 360
No Result
View All Result
Home Tecnología

¿Eres el idiota? ¡Por supuesto que no! Cuantificando el problema de adulación de los LLM

by Team
octubre 25, 2025
in Tecnología
0
¿Eres el idiota? ¡Por supuesto que no! Cuantificando el problema de adulación de los LLM




Tasas de adulación medidas en el punto de referencia BrokenMath. Más bajo es mejor.

Tasas de adulación medidas en el punto de referencia BrokenMath. Más bajo es mejor.


Crédito:

Petrov y otros


GPT-5 también mostró la mejor «utilidad» entre los modelos probados, resolviendo el 58 por ciento de los problemas originales a pesar de los errores introducidos en los teoremas modificados. Sin embargo, en general, los investigadores encontraron que los LLM también mostraron más adulación cuando el problema original resultó más difícil de resolver.

Si bien las pruebas alucinantes de teoremas falsos son obviamente un gran problema, los investigadores también advierten contra el uso de LLM para generar teoremas novedosos para la resolución de IA. En las pruebas, descubrieron que este tipo de casos de uso conduce a una especie de «autoadulación», donde es aún más probable que los modelos generen pruebas falsas de teoremas no válidos que inventaron.

No, claro que no eres el pendejo.

Mientras que puntos de referencia como BrokenMath intentan medir la adulación del LLM cuando los hechos están tergiversados, un estudio separado analiza el problema relacionado de la llamada «adulación social». En un papel preimpreso Publicado este mes, investigadores de Stanford y la Universidad Carnegie Mellon definen esto como situaciones «en las que el modelo afirma al propio usuario: sus acciones, perspectivas y autoimagen».

Por supuesto, ese tipo de afirmación subjetiva del usuario puede estar justificada en algunas situaciones. Entonces, los investigadores desarrollaron tres conjuntos separados de indicaciones diseñadas para medir diferentes dimensiones de la adulación social.

Por un lado, se recopilaron más de 3.000 “preguntas abiertas para buscar asesoramiento” de Reddit y columnas de consejos. En este conjunto de datos, un grupo de “control” de más de 800 humanos aprobó las acciones del solicitante de consejo sólo el 39 por ciento de las veces. Sin embargo, en 11 LLM probados, las acciones del solicitante de asesoramiento fueron respaldadas en un enorme 86 por ciento de las veces, lo que destaca el afán de complacer por parte de las máquinas. Incluso el modelo probado más crítico (Mistral-7B) obtuvo una tasa de aprobación del 77 por ciento, casi el doble que la línea base humana.

Tags: adulaciónCuantificandoeresidiotaLLMlosporproblemaSUPUESTO
Team

Team

Next Post
CLA versus carnitina

CLA versus carnitina

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Recomendada

Labor de labor de escocés MSP suspendido por acusación de conducta inapropiada | Política escocesa

Labor de labor de escocés MSP suspendido por acusación de conducta inapropiada | Política escocesa

3 meses ago
Las veces que Eleazar Gómez ha hecho trampa descaradamente en La Granja VIP

Las veces que Eleazar Gómez ha hecho trampa descaradamente en La Granja VIP

2 meses ago

Noticias populares

  • «EVOLARA: TU SEGUNDO VUELO»

    «EVOLARA: TU SEGUNDO VUELO»

    0 shares
    Share 0 Tweet 0
  • 15 lugares para visitar en la Antártida no puede permitirse perderse

    0 shares
    Share 0 Tweet 0
  • Banco de semillas liderado por indígenas protege la biodiversidad del Amazonas – Latin America News Dispatch

    0 shares
    Share 0 Tweet 0
  • La Inteligencia Artificial Gran Aporte al Turismo en la Región de Los Lagos

    0 shares
    Share 0 Tweet 0
  • INFORME: Los demócratas pusieron al corrupto fiscal general de Obama, Eric Holder, a cargo de examinar a los candidatos a vicepresidente para Kamala Harris | The Gateway Pundit

    0 shares
    Share 0 Tweet 0

Sobre nosotras

Bienvenido a corresponsal360.com ¡El objetivo de corresponsal360.com es brindarle las mejores fuentes de noticias para cualquier tema! Nuestros temas se seleccionan cuidadosamente y se actualizan constantemente, ya que sabemos que la web se mueve rápido y nosotros también lo intentamos.

Categoría

  • Blog
  • Cultura
  • Deportes
  • Noticias
  • Política
  • Salud
  • Tecnología
  • Turismo

Mensajes recientes

  • Actualizaciones en vivo de Lions vs. Vikings: puntaje del juego navideño de la NFL, probabilidades y lo último
  • Jimmy Kimmel lanza ataque a Trump en mensaje navideño
  • Venezuela: familiares reportaron excarcelación de 71 personas detenidas tras las elecciones presidenciales en 2024 Nicolás Maduro última | MUNDO
  • Home
  • Contact Us
  • Disclaimer
  • Privacy Policy
  • Terms & Conditions

Copyright © 2024 Corresponsal360.com | All Rights Reserved.

No Result
View All Result
  • Home
  • Noticias
  • Tecnología
  • Deportes
  • Política
  • Salud
  • Turismo
  • Cultura

Copyright © 2024 Corresponsal360.com | All Rights Reserved.