¿Cuándo harán los agentes del navegador un trabajo real?

Agentes basados en la visión

Los agentes basados en visión tratan el navegador como un lienzo visual. Miran capturas de pantalla, las interpretan utilizando modelos multimodales y generan acciones de bajo nivel como «hacer clic (210,260)» o «escribir» Peter Pan «. Esto imita cómo un humano usaría una computadora: leer texto visible, ubicar botones visualmente y hacer clic donde sea necesario.

La ventaja es la universalidad: el modelo no necesita datos estructurados, sólo píxeles. La desventaja es la precisión y el rendimiento: los modelos visuales son más lentos, requieren desplazarse por toda la página y tienen problemas con cambios de estado sutiles entre capturas de pantalla (“¿Ya se puede hacer clic en este botón?”).

Agentes basados en DOM

Los agentes basados en DOM, por el contrario, operan directamente en el Modelo de objetos de documento (DOM), el árbol estructurado que define cada página web. En lugar de interpretar píxeles, razonan sobre representaciones textuales de la página: etiquetas de elementos, atributos, roles ARIA y etiquetas.

¿Cuándo harán los agentes del navegador un trabajo real?

Team

codescubridor de la doble hélice del ADN que reformuló la biología moderna

Deja una respuesta Cancelar la respuesta

Recomendada

Gerentes libertarios del Pami se otorgan aumentos millonarios mientras el Gobierno ofrece menos del 1% a los empleados

Nosotros dice 'todas las opciones' en la mesa para ayudar a estabilizar la agitación fiscal de Argentina

Noticias populares

«EVOLARA: TU SEGUNDO VUELO»

15 lugares para visitar en la Antártida no puede permitirse perderse

Banco de semillas liderado por indígenas protege la biodiversidad del Amazonas – Latin America News Dispatch

La Inteligencia Artificial Gran Aporte al Turismo en la Región de Los Lagos

INFORME: Los demócratas pusieron al corrupto fiscal general de Obama, Eric Holder, a cargo de examinar a los candidatos a vicepresidente para Kamala Harris | The Gateway Pundit

Sobre nosotras

Categoría

Mensajes recientes

¿Cuándo harán los agentes del navegador un trabajo real?

Agentes basados ​​en la visión

Agentes basados ​​en DOM

Deja una respuesta Cancelar la respuesta

Recomendada

Noticias populares

Sobre nosotras

Categoría

Mensajes recientes

Agentes basados en la visión

Agentes basados en DOM