Calvin & Hobbes

Calvin & Hobbes
Calvin, Hobbes and the peace of life

This is my favorite comic ever. Authored by the genius of Bill Waterson, Calvin & Hobbes was syndicated for a decade to newspapers worldwide. As it’s often the case for bright minds, Mr. Waterson is not without his mysteries and the strength of his beliefs. For instance, he has never authorized any merchandise based on the characters and settings of Calvin & Hobbes, feeling that such commercial overexposure would downgrade the essence of the story and its characters. He also believes that there is no “high art” or “low art”, just art. Anyway, I love his work. I’m very fond of stories which, albeit seemingly targeted at younger audiences, have a deep philosophical and critical background (e.g., Phineas and Ferb). Summarizing, Calvin & Hobbes is an artistic masterpiece. Don’t miss it.

On Wishes and Happiness

I’d also love a big sunny field, Hobbes 🙂

Articulatory Speech Synthesis

Solution to the inverse problem is interesting, among other reasons, for the reduction of memory space and bandwidth requirements for storage and transmission of speech signals.

Today, we’ll temporarily move away from assembly programming. It’s time to discuss a theme that I like a lot: articulatory speech synthesis. Simply put, speech synthesis comprises all the processes of production of synthetic speech signals. Currently, the most popular method for such task is the concatenative approach, which yields synthetic speech output by combining pre-recorded speech segments. Such segments, recorded from human speakers, are collected into a large database, or corpus which is segmented based on phonological features of a language, e.g., transitions from one phoneme to at least one other phoneme. A phoneme is the smallest posited structural unit that distinguishes meaning. It’s important to point out that phonemes are not the physical segments themselves, but, in theoretical terms, cognitive abstractions or categorizations of them. In turn, physical segments, referred to as phones, constitute the instances of phonemes in the actual utterances. For example, the words “madder” and “matter” obviously are composed of distinct phonemes; however, in american english, both words are pronounced almost identically, which means that their phones are the same, or at least very close in the acoustic domain.

On the other hand, articulatory synthesis produces a complete synthetic output, typically based on mathematical models of the structures (lips, teeth, tongue, glottis, and velum, for instance) and processes (transit of airflow along the supraglottal cavities, for instance) of speech. Technically, articulatory speech synthesis transforms a vector p(t) of anatomic or physiologic parameters into a speech signal Sv with predefined acoustic properties. For example, p(t) may include hyoid and tongue body position, protrusion and opening of lips, area of the velopharyngeal port, and so on. This way, an articulatory synthesizer ArtS maps the articulatory domain (from which p(t) is drawn) into the acoustic domain (where frequency properties of Sv lie). Computing the acoustic properties of Sv is the task of a special function. Now, using these definitions, the speech inverse problem is stated as an optimization problem, in which we try to find the best p(t) to minimize the acoustic distance between Sv and the output of ArtS.

The solution to the inverse problem is interesting for the following applications:

  1. Reduction of memory space and bandwidth requirements for storage and transmission of speech signals.
  2. Low cost and noninvasive comprehension and recollection of data on phonatory processes.
  3. Speech recognition, by means of transition to the articulatory domain, where signals may be characterized by fewer parameters.
  4. Retrieving the best parameters for synthesis of high-quality speech signals.

However, because mapping between articulatory and acoustic domains is nonlinear and many-to-one, definition and achievement of acceptable solutions to the inverse problem are not trivial issues. Globally, qualifying a candidate solution follows some type of relation on the acoustical domain. Furthermore, from the family of solutions to the problem, we are frequently interested only in those configurations consistent to descriptions of articulatory phonetics. Several groups have approached this problem. For example, Yehia and Itakura adopted an approach based on geometric representations of the articulatory space, including spatial constraints. Dusan and Deng used analytical methods to recover the vocal tract configurations. Sondhi and Schroeter relied on a codebook technique. Genetic algorithms have also been used, albeit the approach and type of signals studied differ to those used in this research. These later studies mainly investigate relations between articulation and perception on the basis of the tasks of the task dynamic description of inputs to a synthesizer. More recent research recur to control points experimentally measured to a group of speakers, and inversion minimizes the distance between the articulatory model and the referred points, by using quadratic approximations. On our side, we have previously investigated the application of computational intelligence techniques to the speech inverse problem. Concretely, fuzzy rules for modeling the tongue kinematics, neural networks to generate the glottal airflow and genetic algorithms to carry out the overall optimization process. Another novelty of our previous research was the use of the five spanish vowels as target phonemes for inversion.

Synthesis Models

In a broader level, ArtS integrates two models: the articulatory and the acoustic model. An articulatory model represents the essential components for speech production, and its main purpose is computation of the area function A(x, t), which reflects the variation in cross-sectional area of the acoustic tube whose boundaries are located at the glottis and the mouth, respectively. Here, transitions between phonemes are not researched, and thereby the time variable will be dropped from the area function and from the vector p. On its side, an acoustic model specify the transformations between A(x) and the acoustic domain. Naturally, such mapping also requires information about the energy source exciting the tract. According to the acoustic theory of speech production, the target phonemes are considered as the output of a filter characterized by A(x) and excited by a periodic glottal signal.

In this post, we’ll restrict our presentation to the Articulatory Model:

Articulatory Model

Continue reading “Articulatory Speech Synthesis”

Gracias por el Fuego

Mario Benedetti
Mario Benedetti

pero aquí abajo abajo
cerca de las raíces es donde la memoria
ningún recuerdo omite
y hay quienes se desmueren
y hay quienes se desviven
y así entre todos logran
lo que era un imposible
que todo el mundo sepa
que el Sur también existe.

(última estrofa del poema “El Sur también existe”, de Mario Benedetti)

Nació en Paso de los Toros el 14 de Septiembre de 1920, por lo que hoy estaría cumpliendo 90 años (por cierto, su nombre completo es “Mario Orlando Hamlet Hardy Brenno Benedetti Farrugia”). Mago creador de varias de las páginas más brillantes de la literatura universal, como su cuento Esa Boca, uno de mis favoritos de siempre. Muchísimas gracias por el fuego.

The boy is back in town

El muchacho tenía varios días sin escribir aquí. Estaba de viaje.  El mundo es un lugar maravilloso, a pesar de los telediarios. Pero al regresar, como suele suceder, se encuentra uno con multitud de compromisos, perfectamente apilados, expectantes y urgentes. Hoy, justamente, he cumplido con el más perentorio de dichos compromisos, por lo cual me concedo una pequeña licencia para pasar por aquí. Algunas novedades:

  • Hace algunos días recibí las notificaciones de aceptación para unos cuentos míos: “Un lunes cualquiera” y “Una Jaula” aparecerán en los venideros ejemplares de las revistas Narrativas y Mandeb, respectivamente.
  • Aquí en mi casa, curioseando en un estante relativamente olvidado encontré dos LP fantásticos, uno de Raphael y otro de Nino Bravo. Los adquirió mi mamá hace muchos años, y después de cumplir con su propósito de divertimento en aquellas décadas, los discos habían quedado relegados al polvo. La música de estos dos artistas españoles me fascina, así que le dedicaré un post a estos discos en cuanto tenga más tiempo.
  • Hablando de discos… el “manolenta” Eric Clapton ha publicado un sensacional disco de blues. Su interpretación de Autumn Leaves es magistral.
  • Las esperas de los aeropuertos me han servido para escribir poesía. O mejor dicho, para transformar chispazos de lucidez en versos sueltos. Pero aún falta la amalgama que convierta en poemas esos botes a la deriva.
  • Hace rato que llueve abundantemente en varias partes de Venezuela.
  • En Margarita, este 8 de Septiembre, se celebró el día de la Patrona de Oriente, la Virgen del Valle. Mi pueblo, su gente, su fe.
  • Uuuuhhh… El Barcelona perdió con el Hércules 2-0 en el Camp Nou. No me esperaba eso. Pero gloria al vencedor y honor al vencido. Me gustó el despliegue del equipo de Alicante.
  • Tampoco he tenido tiempo para pasar por mis blogs favoritos. Y hay muchos correos electrónicos que aún debo contestar. Y hay muchas amistades que debo visitar. Todo con calma.

Thank you for all delighted people

A few days ago, two of my favorites artists released new music. First, folk star Sufjan Stevens published his EP “All delighted people”, which is a musical delight. The EP contains 8 tracks, some of which are really long (e.g., the track “Djohariah” is 17:02 minutes long), and all of which are really good. My favorite one is “The Owl and the Tanager”. This EP let us foresee that Sufjan’s upcoming album (The Age of Adz) will be a masterpiece. By the way, we can already pre-order “The Age of Adz” here.

Cover of Surfjan's "All Delighted People" EP

And now it’s time for talking about other gifted singer, Antony Hegarty, known best as the lead singer of Antony and the Johnsons. Antony Hegarty is a full-fledged artist: writer, director, painter, and of course, an excellent crooner. If you like Nina Simone or Billie Holiday, I think you will like Antony and the Johnsons too. Their most recent EP, “Thank you for your love”, is excellent. The homonymous track of this EP is a tribute to sweetness. I also liked the Dylan and Lennon’s covers. Their next album, Swanlights, will be released October 5 through the label Secretly Canadian, and we can pre-order it here.

Cover of Antony and the Johnsons' "Thank you for your love" EP
Cover of Antony and the Johnsons' "Thank you for your love" EP

Here’s the official video of “Thank you for your love”:

Lovely music. I’ve been listening to these two EPs in recent nights, surrounded by notes of pure delight.

hello world, C and GNU as

A thing all these programs had in common was their use of the 09h function of INT 21h for printing the “hello, world!” string. But it’s time to move forward. Now I plan to use the lovely C printf function.

GNU Head

Finally, it’s time to switch to the fabulous GNU as. We’ll forget about DEBUG for some time. Thanks DEBUG. GNU as, Gas, or the GNU Assembler, is obviously the assembler used by the GNU Project. It is part of the Binutils package, and acts as the default back-end of gcc. Gas is very powerful and can target several computer architectures. Quite a program, then. As most assemblers, Gas’ input is comprised of directives (also referred to as Pseudo Ops), comments, and of course, instructions. Instructions are very dependent on the target computer architecture. Conversely, directives tend to be relatively homogeneous.

1 Syntax

Originally, this assembler only accepted the AT&T assembler syntax, even for the Intel x86 and x86-64 architectures. The AT&T syntax is different to the one included in most Intel references. There are several differences, the most memorable being that two-operand instructions have the source and destinations in the opposite order. For example, instruction mov ax, bx would be expressed in AT&T syntax as movw %bx, %ax, i.e., the rightmost operand is the destination, and the leftmost one is the source. Other distinction is that register names used as operands must be preceded by a percent (%) sign. However, since version 2.10, Gas supports Intel syntax by means of the .intel_syntax directive. But in the following we’ll be using AT&T syntax.

Continue reading “hello world, C and GNU as”

Las Elecciones

Otra vez, tiempo de elecciones en Venezuela. Me lo recuerdan los frecuentes mensajes que llegan a mi celular anunciando alguna maravilla del consejo electoral, como por ejemplo, que ser miembro de mesa es “un derecho y una obligación”. Por alguna razón, percibo una contradicción en la simultaneidad de “derecho” y “obligación”… pero realmente hace algunos años desistí de interpretar los mensajes institucionales, y desde entonces soy más feliz.

Las campañas políticas representan otra señal de la llegada de las elecciones, quizás la señal más conspicua. Ahí los estoy escuchando. Por el alborozo, obviamente están muy cerca de la casa. Están presentando alguna nueva y juvenil estrella política, cuya fulgurante carrera comienza a perderse de vista sin haber ganado nada aún. “Uno de los nuestros”, les escucho decir, a lo lejos. Estas campañas me recuerdan a un carnaval: gente desfilando en una comparsa, tipos con caretas multicolor, música tropical, predicciones irreconciliables sobre la comparsa que ganará, y también reparticiones de caramelos o del pariente no menos noble de estos últimos: las bolsas de comida.

“Uno de los nuestros”, siguen diciendo. Y quizás pasen por la casa entregando algún “plan de trabajo de nuestro futuro representante en tal parte”, evidentemente redactado en Word, con algunos títulos en Comic Sans. Puede que venga un grupo de tres o cuatro, de los cuales en tu vida has cruzado miradas sólo con uno de ellos. Ése que conoces sólo de vista saludará como si fueras un amigo de toda la vida, e inmediatamente te hablará asumiendo que estás totalmente a favor de los colores políticos que él viste. Sonreiré, aceptaré el papelito, prometeré un voto, los despediré risueño, y me regresaré a la cocina pensando en la manera de mejorar el algoritmo de rendering.

Ahora suben el volumen de la música. Y con estas referencias a “carnaval” y “música”, siento el impulso de cantar el uruguayísimo tema de Pedro Ferreira: La gente se alborota al oír su sonar. / El barrio se enloquece y se pone a bailar, / y todo el mundo goza al compás de los cueros / sintiendo la llamada que pasa y se va. Ah, mi América y su música hermosa. Por lo menos estas elecciones acaban de hacerme recordar algo lindo.

“Uno de los nuestros”, dicen otra vez. Pero ahora ladran los perros y no me dejan escuchar.

La gente va muy bien

La gente va muy bien es una deliciosa canción de Serrat, que entre otras cosas demuestra que la gente va muy bien para escribir canciones que hablan de lo bien que va la gente 😀 Los versos de esa canción combinan crítica y ternura, como el que dice: La gente va muy bien para aplaudir al jefe, animar el paisaje y preservar la especie. O mi estrofa favorita: La gente va muy bien para contarles cuentos, para darles porrazos y venderles ungüentos. La gente va muy bien… La gente va muy bien para decir que “sí”, para decir “amén”. Me encanta ese tema.

En otro sentido, según lo que he visto y escuchado en estas semanas, agregaré que la gente va muy bien haciendo colas kilométricas para comprar una caja de whisky. La gente va muy bien para comprar unas cervezas en vez de comprar un libro para sus hijos. La gente va muy bien para enviar a sus hijos muy lejos, a campamentos, guarderías, tareas dirigidas, y cualquier cosa que sirva para reemplazar la escuela o el liceo durante las vacaciones. La gente va muy bien para decir: “¿qué #$%&# me ves tú?”. La gente va muy bien para quejarse de sus gobiernos y no hacer nada excepto quejarse. La gente va muy bien para antojarse de alguna cosa justo cuando escasea o ya se ha acabado. La gente va muy bien para envidiar a otros. La gente va muy bien para empezar a leer los diarios por la parte más morbosa. La gente va muy bien para maltratar el lenguaje. La gente va muy bien para escribir alguna entrada sobre la gente. La gente va muy bien para todo. Acá el anormal es uno.

Sin embargo, hay mucha, muchísima gente que va muy bien para regalarnos a todos alguna genialidad, alguna sonrisa inesperada, alguna palabra de aliento, alguna muestra de calidez humana. Bendita sea esa gente.