
- Una base de datos vectorial, que almacena incrustaciones de documentos, se escala rápidamente y admite almacenamiento distribuido para indexación avanzada y consultas vectoriales.
- Una biblioteca de vectores, que es una forma más rápida y ligera de contener incrustaciones de vectores.
- Soporte de vectores integrado en la base de datos existente para almacenar incrustaciones de vectores y admitir consultas.
La mejor opción depende de sus circunstancias específicas. Por ejemplo, una base de datos nativa de vectores es el método más sólido, pero es demasiado costosa y requiere muchos recursos para ser práctica para organizaciones más pequeñas. Una biblioteca vectorial es más rápida y mejor para momentos en que la latencia es el enemigo, mientras que integrar capacidades vectoriales es más fácil pero no se escala lo suficientemente bien para las necesidades empresariales pesadas.
3. Construya un proceso de recuperación sólido.
Está justo ahí en el nombre: RAG se trata de recuperar los datos correctos para generar respuestas precisas. Sin embargo, no puede simplemente apuntar su infraestructura RAG a fuentes de datos y esperar que recupere las mejores respuestas. Debe enseñar a los sistemas RAG cómo recuperar información relevante, con un fuerte énfasis en la relevancia. Con demasiada frecuencia, los sistemas RAG recopilan datos en exceso, lo que genera excesivo ruido y confusión.
«La investigación experimental demostró que la calidad de la recuperación importa mucho más que la cantidad, y los sistemas RAG que recuperan menos documentos pero más relevantes superan en la mayoría de los casos a aquellos que intentan recuperar la mayor cantidad de contexto posible, lo que resulta en una sobreabundancia de información, gran parte de la cual podría no ser lo suficientemente relevante». observa Iván Palomares Carrascosaasesor de proyectos de aprendizaje profundo y LLM.




