¿Qué es un reclist?[]
La palabra Reclist es una fusión de las palabras Recording + List del inglés (Grabar y Lista, en español).
En el contexto de UTAU, llamamos reclist a las lista de sonidos que se usan para grabar un banco de voz. A estos sonidos se les llama "fonema".
En sus comienzos, cuando UTAU se creó allá en el 2008, solo existía un tipo de reclist; los CV.
Sin embargo, con los años, la comunidad ha ido desarrollando diferentes formatos.
A día de hoy tenemos los siguientes (podéis hacer click para ir a la lista de bancos de voz de cada tipo):
¿Qué tipo de reclist debo usar?[]
Cada tipo de reclist tiene sus ventajas y desventajas, y algunos solo son útiles dependiendo del idioma:
CV[]
El CV (ConsonanteVocal) es el tipo de reclist más sencillo de grabar y más rápido de configurar pero que peor resultados da, ya que el sonido suena poco fluido e incomprensible en algunas ocasiones.
Está compuesto únicamente por silabas y vocales. Como por ejemplo "ka", "re", "a", "mi", "e", "zu", "kya", "myu", "n".
En algunos reclists también se incluyen fonemas de 2 vocales como "ae", "ui", "oi" y fonemas de comienzo y final como "- ka", "- i", "- myu", "i -", "a -".
Si quisiéramos escribir la frase "Sekai de ichiban" en CV tradicional, sería así:
[se] [ka] [i] [de] [i] [chi] [ba] [n]
En un CV con los fonemas extra anteriormente mencionados, sería así:
[- se] [ka] [ai] [de] [ei] [chi] [ba] [n] [n -]
Este formato es útil para idiomas que usan escritura silábica como es el caso del japonés.
VCV[]
El VCV (VocalConsonanteVocal) es el tipo de reclist que más tiempo toma grabar y configurar pero que mejor resultado da, ya que el sonido suena muy fluido y comprensible.
Está compuesto por 2 tipos de fonemas:
- Vocal acompañada de una silaba o vocal. Como por ejemplo "a ka", "i re", "a o", "u mi", "e zu", "o kya", "e n".
- Sonidos CV de comienzo como "- ka", "- re", "- o", "- mi", "- kya".
En algunos reclist también se incluyen fonemas de final de vocal como: "e -", "o -", "n -".
Si quisiéramos escribir la frase "Sekai de ichiban" en VCV tradicional, sería así:
[- se] [e ka] [a i] [i de] [e i] [i chi] [i ba] [a n]
En un VCV con los fonemas extra de final de vocal, sería así:
[- se] [e ka] [a i] [i de] [e i] [i chi] [i ba] [a n] [n -]
Este formato es útil para idiomas que usan escritura silábica como es el caso del japonés.
Para idiomas más complejos (con mucha cantidad de sonidos, como el español o el inglés) este formato se recomienda, ya que los reclists para poder incluir todos los sonidos de esos idiomas quedan muy largos, y por lo tanto, toman mucho tiempo de grabar y configurar.
A día de hoy tenemos opciones con un resultado similar al VCV (los VCCV y CVVC) que requieren mucho menos tiempo de trabajo, lo cual es ideal para este tipo de idiomas.
CVVC[]
El CVVC (ConsonanteVocalVocalConsonante) es el tipo de reclist que toma menos tiempo de grabar y configurar que el VCV pero algo más tiempo que el CV. Da un resultado similar al del VCV, ya que el sonido suena fluido y comprensible.
Sin embargo, es más difícil de usar en UTAU que un VCV. Pero esta dificultad no existe en OpenUTAU, gracias a su sistema de phonemizers.
Está compuesto por 5 tipos de fonemas:
- Sonidos CV de comienzo como "- ka", "- re", "- o", "- mi", "- kya".
- Sonidos CV como "ka", "re", "a", "mi", "e", "zu", "kya", "myu", "n".
- Sonidos VV como "ae", "oi", "eu".
- Sonidos VC para ser usados como puente entre los CV como "a k", "e r", "i m", "u z", "o ts", "n p".
- Sonidos VC para final de consonante en una palabra como "ak", "er", "im", "uz", "ots", "np".
En algunos reclist también se incluyen fonemas de final de vocal como: "e -", "o -", "n -".
Si quisiéramos escribir la frase "Sekai de ichiban" en CVVC tradicional, sería así:
[- se] [e k] [ka] [a i] [i d] [de] [e i] [i ch] [chi] [i b] [ba] [a n]
En un CVVC con los fonemas extra de final de vocal, sería así:
[- se] [e k] [ka] [a i] [i d] [de] [e i] [i ch] [chi] [i b] [ba] [a n] [n -]
Un ejemplo de una frase en español, como "¿Pan con chicharrón vende?", sería:
[- pa] [an] [n k] [ko] [on] [n ch] [chi] [i ch] [cha] [a rr] [rro] [on] [n v] [ve] [en] [n d] [de]
Con los fonemas extra de final de vocal, sería así:
[- pa] [an] [n k] [ko] [on] [n ch] [chi] [i ch] [cha] [a rr] [rro] [on] [n v] [ve] [en] [n d] [de] [e -]
Este formato es útil para todo tipo de idiomas. Además, es un buen sustito del VCV para los idiomas que tengan muchos sonidos, ya que los reclists son mucho más cortos y dan un resultado algo similar al del VCV.
Sin embargo, si el idioma contiene sonidos con varias consonantes juntas (CCV, como "tre", "dra", "pli", "klo") es más optimo el formato VCCV, ya que requiere grabar menos sonidos y da el mismo resultado que el CVVC.
VCCV[]
El VCCV (VocalConsonanteConsonanteVocal) es un tipo de reclist que toma menos tiempo de grabar y configurar que el CVVC pero algo más de tiempo que el CV. Da un resultado similar al del CVVC, ya que el sonido suena fluido y comprensible.
Sin embargo, es algo más difícil de usar en UTAU que un CVVC. Pero esta dificultad no existe para algunos idiomas en OpenUTAU, gracias a su sistema de phonemizers.
Está compuesto por 11 tipos de fonemas:
- Sonidos CC de comienzo para unir con los _CV como "- dr", "- tr", "- pw", "- ky", "- pl".
- Sonidos CC de media frase para unir con los _CV como "dr", "tr", "pr", "kl", "pl".
- Sonidos _CV de conexión con los CC como "_ra", "_we", "_yo", "_li".
- Sonidos CV de comienzo como "- ka", "- re", "- o", "- mi", "- kya".
- Sonidos CV como "ka", "re", "a", "mi", "e", "zu", "kya", "myu", "n".
- Sonidos VV como "ae", "oi", "eu".
- Sonidos VC para ser usados como puente entre los CV como "a k", "e r", "i m", "u z", "o ts", "n p".
- Sonidos VC para final de consonante en una palabra como "ak", "er", "im", "uz", "ots", "np".
- Sonidos V para final de vocal como "e -", "o -", "n -".
- Sonidos CC para media frase como "gs", "ms", "ns", "rs".
- Sonidos CC para final de doble consonante como "gs -", "ms -", "ns -", "rs-".
Si quisiéramos escribir la frase "Tres grandes pianos" en VCCV sería así:
[-tr] [_re] [es] [sg] [gr] [_ra] [an] [n d] [de] [es] [sp] [py] [_ya] [an] [no] [os -]
Este formato solo sirve para idiomas que tengan sonidos con doble consonante como el español o el inglés. Para idiomas como el japonés no sirven, ya que la única diferencia entre el VCCV y el CVVC es esta separación de los fonemas CCV (de "tra" en CVVC a "tr" + "_ra" en VCCV) y ya que estos sonidos no existen en japonés, el resultado sería exactamente igual al de un CVVC.
Actualmente, para español e inglés se recomienda el crear bancos de voz VCCV en vez de CVVC, ya que requiere grabar menos sonidos y da el mismo resultado que el CVVC.
Arpasing[]
El Arpasing es un tipo de reclist creado por Kanru Hua para hacer bancos de voz en inglés con la menor cantidad de fonemas posibles, usando la escritura Arpabet y CMUDict.
Hay varios reclists creados en este formato que se centran en ciertos acentos del inglés o añaden sonidos que los reclists de Kanru Hua no incluyen.
El modo de uso es muy similar al del VCCV, tiene un asistente para facilitar su uso en UTAU y un phonemizer para OpenUTAU.
El método de grabación en vez de ser con silabas como es normalmente en los otros formatos, la mayoría de los reclists de Arpasing se graban pronunciando palabras, lo cual ayuda a que el banco de voz suene con el acento de la persona que lo grabó.
Si quisiéramos escribir la frase "Stranded on this island" en Arpasing sería así:
[- s] [s t] [t r] [r ae] [ae n] [n d] [d eh] [eh d] [d aa] [aa n] [n dh] [dh ih] [ih s] [s ay] [ay l] [l eh] [eh n] [n d] [d -]
Todos los artículos (5)