El papel de la ciencia de datos en la democratización de la IA

En la era emergente del desarrollo de la IA, ¿cuáles deberían ser los puntos focales de los equipos de ciencia de datos?

Lior Sidi, 6 de marzo de 2024. Hacia la ciencia de datos, MEDIUM

Hasta hace poco, solo se podía acceder a los modelos de IA a través de soluciones creadas por científicos de datos u otros proveedores de servicios. Hoy en día, la IA se está democratizando y está disponible para quienes no son expertos en IA, permitiéndoles desarrollar sus propias soluciones basadas en IA.

Lo que antes les llevaba semanas o meses a los equipos de ciencia de datos recopilar datos, anotar, ajustar e implementar un modelo, puede llevar unos minutos construirlo con indicaciones simples y el último modelo de IA generativa. A medida que avanza la tecnología de IA, existe la expectativa de adoptarla y crear productos más inteligentes impulsados ​​por IA y nosotros, como expertos en IA, tenemos la responsabilidad de respaldarla en toda la organización.

En Wix no somos ajenos a esta transformación, desde 2016 (mucho antes de ChatGPT, 22 de noviembre) nuestro equipo de ciencia de datos ha estado creando numerosas funciones impactantes impulsadas por IA . En los últimos tiempos, con el advenimiento de la revolución GenAI, un número cada vez mayor de roles dentro de Wix han adoptado esta tendencia y juntos, hemos implementado con éxito numerosas funciones adicionales, potenciando la creación de sitios web con chatbots , enriqueciendo las capacidades de creación de contenido y optimizando cómo las agencias trabajan .

En nuestro papel como grupo de ciencia de datos en Wix, tenemos la responsabilidad de garantizar la calidad y la aceptación generalizada de la IA . Reconociendo la necesidad de contribuir activamente a la democratización de la IA, hemos identificado tres funciones clave que debemos asumir y encabezar: 1. Garantizar la seguridad , 2. Mejorar la accesibilidad y 3. Mejorar la precisión .

Los tres roles de la ciencia de datos.
Los tres roles de la ciencia de datos

Ciencia de datos + Equipos de producto = Impacto de la IA

El arte de construir modelos de IA es la capacidad de navegar y generalizar hasta casos extremos invisibles. Requiere una práctica de ciencia de datos que comprenda la comprensión empresarial y de datos que se evalúe y ajuste de forma iterativa.

La democratización de la IA para los equipos de productos (gerentes de productos, desarrolladores, analistas, UX, redactores de contenido, etc.) puede acelerar el tiempo para enviar aplicaciones impulsadas por la IA, pero requiere la colaboración con la ciencia de datos para idear los procesos y técnicas adecuados.

En los diagramas FODA a continuación podemos ver cómo los equipos de productos y ciencia de datos complementan las debilidades y amenazas de cada uno con sus fortalezas y oportunidades y, finalmente, entregan a tiempo productos de IA impactantes, confiables y de vanguardia.

Equipo de producto vs Data Sciemce FODA
Equipos de producto vs FODA de ciencia de datos

1. Garantizar la seguridad de la IA

Uno de los temas más discutidos estos días es la seguridad del uso de la IA. Cuando nos centramos en soluciones orientadas a productos, hay algunas áreas que debemos considerar.

  1. Regulación : los modelos pueden tomar decisiones que podrían discriminar a ciertas poblaciones, por ejemplo, ofrecer descuentos basados ​​en el género o discriminación de género para anuncios de empleo bien remunerados . Además, cuando se utilizan herramientas de terceros, como modelos de lenguajes grandes (LLM) externos, se pueden filtrar datos secretos de la empresa o información de identificación personal (PII) de los usuarios . Recientemente, Nature argumentó que debería haber una visión general regulatoria para las solicitudes basadas en LLM.
  2. Reputación : los modelos orientados al usuario pueden tener errores y producir malas experiencias; por ejemplo, un chatbot basado en LLM puede responder incorrectamente o no estar actualizado, o respuestas racistas tóxicas o inconsistencias en el chatbot de Air Canada .
  3. Daño : los modelos de toma de decisiones pueden predecir respuestas incorrectas y afectar la operación comercial; por ejemplo, un modelo que predice el precio de la vivienda causa una pérdida de 500 millones de dólares .

Los científicos de datos comprenden la incertidumbre de los modelos de IA y pueden ofrecer diferentes soluciones para manejar dichos riesgos y permitir el uso seguro de la tecnología, por ejemplo:

  • Modelado seguro : desarrolle modelos para mitigar el riesgo, por ejemplo, un modelo de enmascaramiento de PII y un modelo de detección de uso indebido.
  • Evaluación a escala : aplique técnicas avanzadas de evaluación de datos para monitorear y analizar el rendimiento del modelo y el tipo de errores.
  • Personalización de modelos : trabajar con datos anotados limpios, filtrar puntos de datos dañinos e irrelevantes y crear modelos más pequeños y más personalizables.
  • Investigación sobre ética : lea y aplique las últimas investigaciones sobre ética en la IA y proponga mejores prácticas.

2. Mejorar la accesibilidad de la IA

La IA debe ser fácil de usar y estar disponible para que los no expertos en IA la integren en sus productos. Hasta hace poco, la forma de integrarse con los modelos eran modelos en línea/fuera de línea desarrollados por un científico de datos; son modelos confiables, específicos de casos de uso y sus predicciones son accesibles.

Pero su principal inconveniente es que no son personalizables por un experto que no sea en IA. Es por eso que se nos ocurrió un enfoque Do-AI-Yourself (D-AI-Y) que le permite construir su modelo y luego implementarlo como un servicio en una plataforma.

El objetivo es construir rápidamente modelos simples pero valiosos con poca experiencia en IA. En caso de que el modelo requiera mejoras e investigación, contamos con un científico de datos a bordo.

El D-AI-Y contiene los siguientes componentes:

  1. Educación: enseñar a la organización sobre IA y cómo usarla adecuadamente, en Wix tenemos un programa de embajadores de IA, que es una puerta de entrada al conocimiento de IA entre los diferentes grupos de Wix y el grupo de Ciencia de Datos, donde se capacita y actualiza a los representantes de los grupos. con nuevas herramientas de IA y mejores prácticas para aumentar la calidad de escala y la velocidad de los proyectos basados ​​en IA en Wix.
  2. Plataforma : tenga una forma de conectarse a LLM y escribir indicaciones. La plataforma debe tener en cuenta el costo y la escala del modelo y la accesibilidad a las fuentes de datos internas. En Wix, el grupo de ciencia de datos creó una plataforma de inteligencia artificial que conecta diferentes roles en Wix con modelos de una variedad de proveedores (para reducir el bloqueo de proveedores de LLM) y otras capacidades como la búsqueda semántica. La plataforma actúa como un centro centralizado para que todos puedan usar y compartir sus modelos, controlarlos, monitorearlos y servirlos en producción.
  3. Mejores prácticas y herramientas para construir modelos sencillos y directos utilizando indicaciones o modelos dedicados para resolver una determinada tarea de aprendizaje: clasificación, robot de control de calidad, sistema de recomendación, búsqueda semántica, etc.
  4. Evaluación : para cada tarea de aprendizaje sugerimos un determinado proceso de evaluación y también brindamos orientación sobre la curación de datos si es necesario.

Por ejemplo, una empresa crea muchos modelos de preguntas y respuestas utilizando la generación de aumento de recuperación (RAG), un enfoque que responde preguntas buscando evidencia relevante que pueda responder la pregunta y luego aumenta la evidencia en el mensaje del LLM para que pueda generar una respuesta confiable basada en él.

Entonces, en lugar de simplemente conectar cajas negras y esperar lo mejor, el equipo de ciencia de datos puede generar: 1. Y material educativo y conferencias sobre el tema RAG, por ejemplo esta conferencia que di sobre la búsqueda semántica utilizada para mejorar RAG. 2. Equipar la plataforma con una base de datos vectorial adecuada y un incrustador relevante 3. Directrices para construir RAG, cómo recuperar la evidencia y escribir el mensaje de generación 4. Directrices y herramientas que respaldarán la evaluación adecuada de RAG tal como se explica en esta publicación de TDS y en Tríada RAG de Trulens .

Esto permitirá que muchos roles en la empresa creen sus propios modelos de aplicaciones basadas en RAG de una manera confiable, precisa y escalable.

3. Mejorar la precisión de la IA

A medida que la IA se adopta cada vez más, surge la expectativa de crear soluciones más complejas, precisas y avanzadas. Al final del día, existe un límite en cuanto a cuánto puede mejorar el rendimiento de los modelos un experto que no sea en IA, ya que requiere una comprensión más profunda de cómo funcionan los modelos.

Para hacer que los modelos sean más precisos, el grupo de ciencia de datos se centra en este tipo de esfuerzos:

  1. Mejore los modelos comunes : personalice y mejore los modelos para mantener el conocimiento de Wix y superar los modelos externos generales listos para usar.
  2. Personalice modelos : modelos desafiantes y con alta prioridad que el D-AI-Y no puede admitir. A diferencia de los modelos comunes, aquí tenemos modelos muy específicos de casos de uso que requieren personalización.
  3. Mejorar el D-AI-Y : a medida que mejoramos nuestra plataforma D-AI-Y, las mejores prácticas, las herramientas y la IA de evaluación se vuelven más precisas, por lo tanto, seguimos invirtiendo tiempo y esfuerzo de investigación para mejorar e identificar formas innovadoras de mejorarlo.

Conclusión

Después de años de espera, la democratización de la IA está ocurriendo, ¡aceptémosla! La comprensión inherente del negocio de los equipos de productos junto con la facilidad de uso de GenAI les permite crear funciones impulsadas por IA que mejoran las capacidades de sus productos.

Debido a que los no expertos en IA no cuentan con un conocimiento profundo de cómo funcionan los modelos de IA y cómo evaluarlos adecuadamente a escala, podrían enfrentar problemas relacionados con la confiabilidad y precisión de los resultados. Aquí es donde el grupo de ciencia de datos puede ayudar y respaldar sus esfuerzos guiando a los equipos sobre cómo usar los modelos de manera segura, crear servicios de mitigación si es necesario, compartir las mejores prácticas más recientes en torno a las nuevas capacidades de IA, evaluar su desempeño y brindarles servicios a escala. .

Cuando una característica de IA muestra un gran impacto comercial, los equipos de producto inmediatamente comenzarán a redirigir sus esfuerzos hacia la mejora de los resultados; aquí es donde los científicos de datos pueden ofrecer enfoques avanzados para mejorar el rendimiento a medida que comprenden cómo funcionan estos modelos.

Para concluir, el papel de la ciencia de datos en la democratización de la IA es crucial, ya que cierra la brecha entre la tecnología de IA y aquellos que pueden no tener una amplia experiencia en IA. A través de la colaboración entre científicos de datos y equipos de productos, podemos aprovechar las fortalezas de ambos campos para crear soluciones impulsadas por IA seguras, accesibles y precisas que impulsen la innovación y brinden experiencias de usuario excepcionales. Con avances e innovaciones continuos, el futuro de la IA democratizada tiene un gran potencial para un cambio transformador en todas las industrias.

*A menos que se indique lo contrario, todas las imágenes son del autor.

Comparte en tus perfiles

Facebook
Twitter
LinkedIn

Artículos Relacionados:

La Ley de Datos de la Unión Europea comienza a aplicarse para impulsar el potencial de innovación ESMARTCITY. 15/09/2025 La Comisión Europea ha anunciado que la Ley de Datos ha comenzado a aplicarse para ofrecer a los usuarios control sobre los datos generados por sus dispositivos conectados, a la vez que impulsa el potencial de innovación basada en

Seguir leyendo »

¿Para quién son las calles?

Más del 80% del espacio vial de Toronto está destinado de forma inequitativa a los vehículos motorizados. ¿Cómo se puede rediseñar esto de forma justa? Por Jeff Allen , Lanrick Bennett Jr. y Mia Wang ~ Septiembre de 2025 Jeff Allen dirigió el análisis y la visualización de datos para este proyecto, y apoyó la redacción; Lanrick Bennett Jr. dirigió la

Seguir leyendo »

AGROBIOTECNOLOGÍA

Argentina marca un récord histórico: 11 cultivos transgénicos aprobados en 2025 El agro argentino suma nuevas herramientas para ganar eficiencia y enfrentar plagas. La Secretaría de Agricultura, Ganadería y Pesca autorizó en los últimos días dos nuevos eventos biotecnológicos -uno de maíz y otro de soya que elevan a 11 el total de aprobaciones en

Seguir leyendo »