Consideraciones legales y éticas¶
Esta documentación es orientativa; no constituye asesoramiento legal. Consulte a un abogado para casos comerciales.
Datos de entrenamiento¶
| Política | Detalle |
|---|---|
| ✅ Permitido | CC-BY, CC-BY-SA, CC0, dominio público, datos propios con cesión escrita |
| ⚠️ Investigación | CC-BY-NC, CC-BY-NC-SA, datasets "research-only" |
| ❌ Prohibido | Scraping YouTube / Spotify / SoundCloud / Apple Music |
| ❌ Prohibido | Common Crawl de letras (Genius, MusixMatch sin licencia) |
| ❌ Prohibido | Catálogo comercial sin licencia escrita |
Para producto comercial evita CC-BY-NC (MUSDB18, Jamendo metadata, MAESTRO, MedleyDB). Migra a corpus 100 % CC-BY-SA / CC0 / licencia propia.
Voces y artistas¶
- No entrenar con cantantes identificables sin contrato escrito de cesión de derechos.
- Implementar rechazo por similaridad de embedding (Resemblyzer / ECAPA-TDNN) contra una base de embeddings de cantantes famosos públicamente conocidos.
- Para canto en español:
- España: Art. 51 LPI (cesión expresa, oneroso, formal).
- EE. UU.: 17 USC §201 (work-for-hire o assignment escrito).
- México: LFDA Art. 41 + Cap. III.
Plantilla mínima del contrato (no exhaustivo): - Identificación de las partes. - Descripción del trabajo (n horas, idiomas, dialectos, géneros). - Cesión EXPRESA de derechos de explotación, sin exclusividad opcional. - Reconocimiento + remuneración + duración. - Restricciones de uso (no clonado de voz para fines maliciosos).
Watermarking — obligatorio¶
EU AI Act art. 50 (en vigor por fases 2024-2026): el output de GPAI sintético debe ser machine-detectable.
- ✅ AudioSeal (Meta, MIT, ICML 2024): inserción proactiva + detección localizada con msg 16 bits. Implementado en
src/watermark/audioseal_wrap.py. - Alternativa: SilentCipher (Sony, Interspeech 2024).
Todas las salidas pasan por watermark antes de exportar.
Licencias del código y dependencias¶
| Componente | Licencia |
|---|---|
| Código propio | Apache-2.0 |
| PyTorch / torchaudio / einops | BSD-3 |
| pyloudnorm / librosa / scipy / numpy | BSD-3 |
| pretty_midi / mido / music21 | MIT / BSD-3 |
| sentencepiece | Apache-2.0 |
| pedalboard | GPLv3 — peligro en distribución comercial |
| frechet-audio-distance | MIT |
| laion-clap | MIT |
| audioseal | MIT |
| Gradio / FastAPI / uvicorn | Apache-2.0 / MIT |
| silabeador | LGPL — uso compatible |
Sobre pedalboard¶
Si distribuyes el binario o servicio que importa pedalboard, debes ofrecer el código bajo GPLv3.
- ✅ Uso interno research/personal.
- ❌ SaaS comercial cerrado.
Mitigación: src/mixing/dsp_pure.py ofrece biquad EQ, compresor, FDN reverb, limiter en numpy/scipy puros, compatibles con Apache-2.0. Activable por flag de configuración.
Regulación¶
- EU AI Act (entrada por fases 2024-2026): GPAI deben publicar resumen del entrenamiento; output sintético machine-detectable.
- US EO 14110 (2023) + NIST AI RMF.
- Mantener
MODEL_CARD.mdyDATASHEET.md(Mitchell et al. 2019; Gebru et al. 2018) actualizados.
Riesgos y mitigaciones¶
| Riesgo | Mitigación |
|---|---|
| Suplantación de cantante | Filtro embedding + watermark + ToS prohibitiva |
| Letras infractoras | Sólo corpus DP / sintético; sin scraping |
| Sesgo geográfico/idiomático | Balance corpus + auditoría periódica |
| Deepfake malicioso | Watermark + log audit + abuse reporting |
| Hallucinación factual | Modelo no es chatbot; las letras son artísticas, sin pretensión informativa |
Hash del modelo + audit log¶
Cada generación deja en out/<song_id>.json:
{"song_id": "...",
"spec": {...},
"lyrics": "...",
"duration_s": 30.0,
"elapsed_s": 12.3,
"model_version": "suno-local-0.1.0",
"model_hash": "<sha256 de los ckpts>"}
Mantener este log es esencial para responder a quejas / takedowns.