Saltar a contenido

Consideraciones legales y éticas

Esta documentación es orientativa; no constituye asesoramiento legal. Consulte a un abogado para casos comerciales.

Datos de entrenamiento

Política Detalle
✅ Permitido CC-BY, CC-BY-SA, CC0, dominio público, datos propios con cesión escrita
⚠️ Investigación CC-BY-NC, CC-BY-NC-SA, datasets "research-only"
❌ Prohibido Scraping YouTube / Spotify / SoundCloud / Apple Music
❌ Prohibido Common Crawl de letras (Genius, MusixMatch sin licencia)
❌ Prohibido Catálogo comercial sin licencia escrita

Para producto comercial evita CC-BY-NC (MUSDB18, Jamendo metadata, MAESTRO, MedleyDB). Migra a corpus 100 % CC-BY-SA / CC0 / licencia propia.

Voces y artistas

  • No entrenar con cantantes identificables sin contrato escrito de cesión de derechos.
  • Implementar rechazo por similaridad de embedding (Resemblyzer / ECAPA-TDNN) contra una base de embeddings de cantantes famosos públicamente conocidos.
  • Para canto en español:
  • España: Art. 51 LPI (cesión expresa, oneroso, formal).
  • EE. UU.: 17 USC §201 (work-for-hire o assignment escrito).
  • México: LFDA Art. 41 + Cap. III.

Plantilla mínima del contrato (no exhaustivo): - Identificación de las partes. - Descripción del trabajo (n horas, idiomas, dialectos, géneros). - Cesión EXPRESA de derechos de explotación, sin exclusividad opcional. - Reconocimiento + remuneración + duración. - Restricciones de uso (no clonado de voz para fines maliciosos).

Watermarking — obligatorio

EU AI Act art. 50 (en vigor por fases 2024-2026): el output de GPAI sintético debe ser machine-detectable.

  • AudioSeal (Meta, MIT, ICML 2024): inserción proactiva + detección localizada con msg 16 bits. Implementado en src/watermark/audioseal_wrap.py.
  • Alternativa: SilentCipher (Sony, Interspeech 2024).

Todas las salidas pasan por watermark antes de exportar.

Licencias del código y dependencias

Componente Licencia
Código propio Apache-2.0
PyTorch / torchaudio / einops BSD-3
pyloudnorm / librosa / scipy / numpy BSD-3
pretty_midi / mido / music21 MIT / BSD-3
sentencepiece Apache-2.0
pedalboard GPLv3 — peligro en distribución comercial
frechet-audio-distance MIT
laion-clap MIT
audioseal MIT
Gradio / FastAPI / uvicorn Apache-2.0 / MIT
silabeador LGPL — uso compatible

Sobre pedalboard

Si distribuyes el binario o servicio que importa pedalboard, debes ofrecer el código bajo GPLv3.

  • ✅ Uso interno research/personal.
  • ❌ SaaS comercial cerrado.

Mitigación: src/mixing/dsp_pure.py ofrece biquad EQ, compresor, FDN reverb, limiter en numpy/scipy puros, compatibles con Apache-2.0. Activable por flag de configuración.

Regulación

  • EU AI Act (entrada por fases 2024-2026): GPAI deben publicar resumen del entrenamiento; output sintético machine-detectable.
  • US EO 14110 (2023) + NIST AI RMF.
  • Mantener MODEL_CARD.md y DATASHEET.md (Mitchell et al. 2019; Gebru et al. 2018) actualizados.

Riesgos y mitigaciones

Riesgo Mitigación
Suplantación de cantante Filtro embedding + watermark + ToS prohibitiva
Letras infractoras Sólo corpus DP / sintético; sin scraping
Sesgo geográfico/idiomático Balance corpus + auditoría periódica
Deepfake malicioso Watermark + log audit + abuse reporting
Hallucinación factual Modelo no es chatbot; las letras son artísticas, sin pretensión informativa

Hash del modelo + audit log

Cada generación deja en out/<song_id>.json:

{"song_id": "...",
 "spec": {...},
 "lyrics": "...",
 "duration_s": 30.0,
 "elapsed_s": 12.3,
 "model_version": "suno-local-0.1.0",
 "model_hash": "<sha256 de los ckpts>"}

Mantener este log es esencial para responder a quejas / takedowns.