
El desarrollo de la inteligencia artificial generativa requiere grandes volúmenes de datos para su entrenamiento. Sin embargo, en Taiwán, la disponibilidad de contenido en chino tradicional se ha visto limitada por las restricciones de la legislación sobre derechos de autor.
Ante esta situación, el Ministerio de Desarrollo Digital (MODA, siglas en inglés) anunció la creación del «Corpus de Entrenamiento de IA Soberana de Taiwán», que permitirá flexibilizar la normativa y ofrecer gratuitamente datos de entrenamiento a modelos extensos de lenguaje (LLM, siglas en inglés) tanto nacionales como internacionales. Con esta iniciativa, se busca aumentar el uso de datos taiwaneses en la formación de IA, reduciendo así los conflictos legales entre las empresas de inteligencia artificial y los propietarios de contenido.
A diferencia de otros países, donde las empresas como OpenAI deben pagar regalías por el uso de datos, Taiwán adoptará un enfoque basado en la voluntariedad y la priorización de contenido sin restricciones de derechos de autor o con licencias adquiridas. Entre los materiales considerados para el corpus de entrenamiento incluyen las obras donadas por particulares, como ensayos, novelas, críticas, poesía, artículos académicos y biografías; documentos gubernamentales no confidenciales con derechos de autor estatales, como planes de gobierno, informes de gestión, estudios de investigación y publicaciones oficiales.
El viceministro de Desarrollo Digital, Lin Yi-jing, explicó que el mayor reto en el desarrollo de la IA generativa no es la tecnología, sino las barreras legales y políticas. Según Lin, las grandes empresas de IA estadounidenses no están preocupadas por los costos económicos, sino por los tiempos de negociación y los obstáculos legales. «Si Taiwán no puede proporcionar un corpus de entrenamiento en chino tradicional con perspectiva local, las empresas simplemente evitarán cualquier contenido proveniente de Taiwán», advirtió Lin.
Lin subrayó que, por ahora, la prioridad es hacer disponibles los datos gubernamentales para responder a la necesidad urgente de entrenamiento de IA. No obstante, el involucramiento del sector privado y la sociedad en general requerirá amplios consensos, incluyendo diálogos con el Legislativo, la industria mediática y el público. «Este proceso llevará mucho tiempo. No es algo que pueda resolverse en uno o dos años», concluyó.