
Según los analistas, las ofertas de Databricks y Snowflake ayudarían a las empresas a reducir la complejidad de los flujos de trabajo necesarios para analizar datos no estructurados, especialmente documentos.
Históricamente, las empresas han tenido que construir procesos de OCR complejos, lentos y frágiles si quieren llevar datos de documentos, como archivos PDF, a un flujo de trabajo de IA, lo que resultó en la culminación de RAG, que permitía la búsqueda semántica sobre texto analizado pero aún luchaba con estructuras de documentos matizadas como tablas, dijo Bradley Shimmin, líder de práctica de datos, análisis e infraestructura en The Futurum Group.
Para manejar documentos con tablas, las empresas a menudo encadenaban llamadas LLM adicionales para extraer y reconstruir tablas como JSONque era efectivo pero riesgoso debido a las alucinaciones, dijo Shimmin, y agregó que en lugar de unir OCR, RAG y una lógica de extracción personalizada, ai_parse de Databricks colapsa todo el flujo de trabajo en una única declaración SQL declarativa.




