se ha quedado sin datos de entrenamiento
«Básicamente, hemos agotado el conocimiento acumulado de la humanidad cuando se trata de entrenar inteligencia artificial». Eso es lo que dijo el plutócrata Elon Musk durante una reciente discusión pública de X el miércoles por la noche con el presidente de la firma de marketing Stagwell, Mark · Said en el diálogo con Mark Penn. Musk dijo que este agotamiento de recursos «sucedió básicamente en el último año», sugiriendo que la naciente industria de la IA debe encontrar una manera de superar esta limitación que acaba de encontrar.
Musk, quien también es el fundador de la empresa. AIProveedor de chatbot Gronk Quien se ha unido recientemente a las redes sociales «La única forma de complementar [los datos del mundo real] esta relacionado con Datos completosdonde la inteligencia artificial crea [datos de entrenamiento]», explicó el empresario.
«Con datos completos… [la IA] Me calificaré y pasaré por este proceso de autoestudio.«Musk dijo que si bien los argumentos a favor del uso de datos artificiales han atraído muchas críticas debido al impacto que dichos datos podrían tener en la calidad final de las respuestas de la IA.
Musk no es el único que habla de este tema. Hace un mes, cofundador inteligencia artificial abierta Ilya Sutskever ha advertido que Internet se está quedando sin fuentes de información para entrenar inteligencia artificial, lo que obligará a la industria a cambiar la forma en que desarrolla la inteligencia artificial.
Además de utilizar datos disponibles en Internet y datos generados por humanos, otra opción es utilizar dispositivos IoT para capturar datos en tiempo real.
Estas empresas podrán seguir recopilando nuevos datos generados en plataformas con las que han firmado acuerdos de cooperación, como medios de comunicación, redes sociales o foros como Reddit. Sin embargo, los nuevos datos no se generan lo suficientemente rápido, por lo que los algoritmos de IA deben poder aprender más profundamente de los datos existentes. Esto es para hacerlos más inteligentes.
Otras grandes empresas como Microsoft, OpenAI y Meta ya están utilizando datos artificiales para entrenar sus modelos. La consultora Gartner predice que para 2024, el 60% de los datos utilizados para proyectos de análisis e inteligencia artificial se generarán sintéticamente.
Problemas de datos integrales
Muchos expertos critican el uso de datos sintéticos porque pueden crear un circuito de retroalimentación que impide que la IA aprenda cosas verdaderamente nuevas y, en cambio, se vuelve menos creativa y sesgada. esto se llama «Choque de modelo»;El momento en el que un modelo de IA se deteriora por fuentes de información de mala calidad.
Como señala IBM, algunos de los efectos de este fenómeno son una peor toma de decisiones, el desinterés de los usuarios por respuestas más limitadas y un conocimiento más limitado influenciado por inclinaciones políticas específicas.
Puedes consultar la fuente de este artículo aquí