
Si alguna vez te has preguntado por qué todo el mundo usa la inteligencia artificial generativa a nivel personal pero se ven pocos casos de uso en el mundo empresarial, aquí van 3 razones que pueden explicarlo:
Es muy genérica; la IA Generativa ha aprendido basándose en millones de datos, pero estos datos son generales, los que se han podido recopilar de miles de fuentes que son públicas. Sin embargo, una empresa toma decisiones en base a datos de su propio negocio, que son privados. Estos datos no han podido sido aprendidos, por lo que la IA no ofrece buenas respuestas a las preguntas sobre cada negocio particular.
Alucina: la IA Generativa produce respuestas sin sentido de vez en cuando, lo que se conoce como Alucinaciones. Al faltar el contexto de negocio, las alucinaciones son mucho mayores cuando las preguntas se refieren a casos empresariales.
Está Desfasada: la IA Generativa no está actualizada. Ha aprendido muchos datos, pero de fechas pasadas ya que el esfuerzo para recoger información nueva es enorme. Esto significa que no contempla información de las últimas semanas o últimos meses.
¿Cómo lo solucionamos?
La opción más obvia sería crear un modelo personalizado para cada negocio, enseñando a la IA con nuestros propios datos. El problema de esta opción es que es demasiada costosa en tiempo y dinero.
Por eso hoy día cada vez veo más soluciones que utilizan RAG (Retrieval Augmented Generation), que es una manera de personalizar el modelo general de IA Generativa, dándole el contexto adecuado antes de contestar a nuestra pregunta.
Para ello, primero recogemos los documentos de negocio relevantes, los indexamos e introducimos en forma de vectores en una base de datos. Después, al hacer nuestras preguntas, pedimos a la IA Generativa que entienda lo que queremos, pero conteste usando solamente la información de la documentación almacenada. También podríamos indicar los documentos al mismo tiempo que hacemos la pregunta sobre ellos.
Con esta técnica eliminamos las alucinaciones completamente porque tendremos respuestas basadas en nuestros documentos. Además, la solución siempre estará actualizada ya que vamos indexando nuevos documentos a medida que se generan.