💾 Archived View for compudanzas.net › tutorial_de_uxn_d%C3%ADa_1.gmi captured on 2022-01-08 at 13:49:38. Gemini links have been rewritten to link to archived content
⬅️ Previous capture (2021-12-03)
-=-=-=-=-=-=-
hola! en esta primera sección del tutorial de uxn vamos a hablar de los aspectos básicos de la computadora uxn llamada varvara, su paradigma de programación en un lenguaje llamado uxntal, su arquitectura, y por que puede que quieras aprender a programarla.
también saltaremos directo a nuestros primeros programas simples para demostrar conceptos fundamentales que desarrollaremos en los próximos días.
o primero que nada... ¿qué es uxn?
Uxn es una computadora portable de 8 bit capaz de correr herramientas y juegos simples programable en su propio pequeño lenguaje ensamblador. Es también un ámbito de juego donde aprender habilidades básicas de computación.
te invito a leer "why create a smol virtual computer" del sitio de 100R, también:
uxn es el núcleo de la computadora virtual (¿por el momento?) varvara. es lo suficientemente simple como para ser emulada por diversas plataformas de computación viejas y nuevas y ser seguida a mano.
personalmente, veo en ella las siguientes virtudes:
¡todos estos conceotos suenan genial para mí, y espero que para tí también! sin embargo, noto algunos aspectos que pueden hacerla parecer no tan asequible:
la idea de este tutorial es explorar estos dos aspectos y revelar cómo trabajan juntos para dar a uxn su poder con una complejidad relativamente baja.
el núcleo uxn está inspirado por las máquinas forth en que utiliza la recombinación de componentes simples para lograr soluciones apropiadas, y en que es una máquina basada en pila.
esto implica que está principalmente basada en interacciones con una pila "push down", dónde las operaciines son indicadas mediante la llamada notación postfija.
Notación Polaca Reversa (NPR), también conocida como notación postfija polaca o simplemente notación postfija, es una notación matemática en la que los operadores siguen a sus operandos [...]
Notación Polaca Inversa - Wikipedia
en notación postfija, la suma de nos números sería escrita de la siguiente forma:
1 48 +
dónde, leyendo de izquierda a derecha:
el libro Starting Forth tiene algunas ilustraciones grandiosas sobre este proceso de suma:
The Stack: Forth’s Workspace for Arithmetic
expresiones más complejas en notación infija, que requieren paréntesis o reglas de precedencia de operadores (y un sistema más complejo para codificarlas), pueden ser simplificadas mediante notación postfija.
por ejemplo, la siguiente expresión infija:
(3 + 5)/2 + 48
puede ser escrita en notación postfija como:
3 5 + 2 / 48 +
también podemos escribirla de muchas otras maneras, por ejemplo:
48 3 5 + 2 / +
¡asegúrate de que éstas expresiones funcionan y son equivalentes! sólo debes seguir estas reglas, leyendo de izquierda a derecha:
nota: en el caso de la división, los operandos siguen el mismo orden de izquierda a derecha. 3/2 sería escrito como:
3 2 /
irás descubriendo cómo el uso de la pila puede ser muy poderoso ya que ahorra operandos y/o resultados intermedios sin necesidad de que asignemos explicitamente un espacio en memoria para ellos (por ejemplo, mediante el uso de "variables" en otros lenguajes de programación)
¡vamos a volver a la notación postfija y la pila muy pronto!
una de las cuestiones de programar una computadora a un nivel bajo de abstracción, como estaremos haciendo con uxn, es que tenemos que conocer y estar atentos a sus funcionamientos internos.
las palabras binarias de 8 bits, también conocidas como bytes, son los elementos básicos de codificación y manipulación de datos en uxn.
uxn puede manejar también palabras binarias de 16 bits (2 bytes), también conocidas como cortos, mediante la concatenación de dos bytes consecutivos. vamos a hablar más sobre esto en el segundo día de este tutorial.
los números en uxn son expresados utilizando el sistema hexadecimal (base 16), en el qhe cada dígito (nibble) va de 0 a 9 y luego de 'a' a 'f' (en minúscula).
un byte necesita dos dígitos hexadecimales (nibbles) para ser expresado, y un corto necesita cuatro.
se ha dicho que el cpu uxn es una remolacha, capaz de ejecutar 32 instrucciones diferentes con tres banderas de modo diferentes.
cada instrucción junto con sus banderas de modo puede ser codificada en una sola palabra de 8 bits.
todas estas instrucciones operan sobre elementos en la pila, ya sea tomando de ella sus operandos y/o empujando en ella sus resultados.
vamos a ir cubriendo lentamente estas instrucciones durante este tutorial.
la memoria en la computadora uxn consiste en cuatro espacios separados:
cada byte en la memoria principal posee una dirección de 16 bits (2 bytes) de tamaño, mientras que cada byte en la memoria de entrada/salida posee una dirección de 8 bits (1 byte) de tamaño. ambas pueden ser accedidas de manera aleatoria.
los primeros 256 bytes de la memoria principal constituyen una sección llamada página cero. esta sección puede ser referenciada por 8 bits (1 byte), y su propósito es almacenar datos durante el tiempo de ejecución de la máquina.
hay tres instrucciones diferentes para interactuar con cada uno de estos espacios de memoria.
la memoria principal almacena el programa a ser ejecutado, empezando en el byte 257 (dirección 0100 en hexadecimal). también puede almacenar datos.
las pilas no pueden ser accedidas aleatoriamente; la máquina uxn se ocupa de ellas.
el cpu uxn lee un byte por vez de la memoria principal.
el contador de programa es una palabra de 16 bits que indica la dirección del próximo byte a leer. su valor inicial es la dirección 0100 en hexadecimal.
una vez que el cpu lee un byte, lo decodifica como instrucción y lo ejecuta.
la instrucción va a implicar normalmente un cambio en la(s) pila(s), y algunas veces también un cambio en el flujo normal del contador de programa: en lugar de apuntar al siguiente byte en memoria, puede ser apuntado a otro lado, "saltando" de un lugar en memoria a otro.
¿liste? obtengamos el ensamblador uxn (uxnasm) y emulador (uxnemu) de su repositorio git:
estas instrucciones son para sistemas basados en linux.
si necesitas una mano, encuéntranos en #uxn en irc.esper.net :)
para compilar uxnemu, necesitamos instalar la librería SDL2.
en una terminal en debian/ubuntu, correr:
$ sudo apt install libsdl2-dev
on en guix:
$ guix install sdl2
obtengamos y compilemos uxnemu y uxnasm:
$ git clone https://git.sr.ht/~rabbits/uxn $ cd uxn $ ./build.sh
si todo fué bién, verás varios mensajes en la terminal y una pequeña ventana con el título uxn, y una aplicación demo: uxnemu está ahora corriendo una "rom" correspondiendo a esa aplicación.
verás que luego de compilar uxn, cuentas con tres nuevos archivos ejecutables en el directorio bin/:
puedes ajustar tu $PATH para tenerlos disponibles en todos lados.
la idea es que para correr un programa escrito en uxntal (el lenguaje ensamblador de uxn), primero tienes que ensamblarlo en una "rom", y luego puedes correr esta rom con el emulador.
por ejemplo, para correr darena que se encuentra en projects/examples/demos/ :
ensambla darena.tal en darena.rom $ ./bin/uxnasm projects/examples/demos/darena.tal bin/darena.rom correr darena.rom $ ./bin/uxnemu bin/darena.rom
¡échale una mirada a los demos disponibles! (¡o no, y empecemos a programar los nuestros!)
uxntal es el lenguaje ensamblador para la máquina uxn.
estuvimos hablando antes sobre el cpu uxn y las 32 instrucciones que sabe cómo ejecutar, cada una de ellas codificada como una sola palabra de 8 bits (byte).
ese lenguaje ensamblador uxntal implica que hay una relación uno a uno mapeando de una instrucción escrita en el lenguaje a una palabra de 8 bit correspondiente que el cpu puede interpretar.
por ejemplo, la instrucción ADD (suma) en uxntal es codificada como un byte con el valor 18 en hexadecimal, y corresponde al siguiente conjunto de de acciones: toma los dos elementos superiores de la pila, los suma, y empuja el resultado a la pila.
en sistemas de tipo forth podemos ver el siguiente tipo de notación para expresar los operandos que una instrucción toma de la pila, y el(los) resultado(s) que empuja devuelta a la pila:
ADD ( a b -- a+b )
esto significa que ADD toma el primer elemento desde arriba 'b', luego toma el siguiente primer elemento 'a', y empuja devuelta el resultado de sumar a+b.
ahora que estamos en eso, hay una instrucción complementaria, SUB (resta) (opcode 19), que toma los dos elementos superiores de la pila, los resta, y empuja a la pila el resultado:
SUB ( a b -- a-b )
nota que el orden de los operandos es similar al de la división que discutimos arriba cuando hablamos de notación postfija.
escribamos el siguiente programa en nuestro editor de texto favorito, y guardémoslo como hola.tal:
( hola.tal ) |0100 LIT 68 LIT 18 DEO
ensamblémoslo y corrámoslo:
$ ./bin/uxnasm hola.tal bin/hola.rom && ./bin/uxnemu bin/hola.rom
veremos una salida con el siguiente aspecto:
Assembled bin/hola.rom(5 bytes), 0 labels, 0 macros. Uxn loaded[bin/hola.rom]. Device added #00: system, at 0x0000 Device added #01: console, at 0x0010 Device added #02: screen, at 0x0020 Device added #03: audio0, at 0x0030 Device added #04: audio1, at 0x0040 Device added #05: audio2, at 0x0050 Device added #06: audio3, at 0x0060 Device added #07: ---, at 0x0070 Device added #08: controller, at 0x0080 Device added #09: mouse, at 0x0090 Device added #0a: file, at 0x00a0 Device added #0b: datetime, at 0x00b0 Device added #0c: ---, at 0x00c0 Device added #0d: ---, at 0x00d0 Device added #0e: ---, at 0x00e0 Device added #0f: ---, at 0x00f0 h
la última 'h' que vemos es la salida de nuestro programa. cambia el 68 a, por ejemplo, 65, y verás una 'e'.
¿qué es lo que está pasando?
acabamos de correr el siguiente programa en uxntal:
( hola.tal ) |0100 LIT 68 LIT 18 DEO
la primera línea es un comentario: los comentarios son encerrados entre paréntesis y debe haber un espacio entre cada paréntesis y el contenido. de manera similar a otros lenguajes de programación, los comentarios son ignorados por el ensamblador.
en la segunda linea ocurren varias cosas:
leyendo el programa de izquierda a derecha, podemos ver el siguiente comportamiento:
¿y qué es el dispositivo de entrada/salida con la dirección 18?
mirando en la tabla de dispositivos de la referencia varvara, podemos ver que el dispositivo con la dirección 1 en el nibble superior es la consola (entrada y salida estandard), y que la columna con la dirección 8 corresponde a "escritura".
asique, el dispositivo 18 corresponde a "escribir en consola", o salida estandard.
¡nuestro programa está enviando el valor hexadecimal 68 (caracter 'h') a la salida estandard!
puedes ver los valores hexadecimales de los caracteres ascii en la siguiente tabla:
podemos ver que el ensamblador reporta que nuestro programa es de 5 bytes de tamaño:
Assembled bin/hola.rom(5 bytes), 0 labels, 0 macros.
para el curioso (¡como tú!), podemos usar una herramienta como hexdump para ver sus contenidos:
$ hexdump -C bin/hola.rom 00000000 80 68 80 18 17 |.h...| 00000005
80 es el "opcode" correspondiente a LIT, y 17 es el opcode correspondiente a DEO. ¡y ahí están nuestros 68 y 18!
¡osea, efectivamente, nuestro programa ensamblado presenta una correspondencia uno a uno con las instrucciones que acabamos de escribir!
de hecho, podríamos haber escrito nuestro programa con estos números hexadecimales (el código máquina), y hubiera funcionado igual:
( hola.tal ) |0100 80 68 80 18 17 ( LIT 68 LIT 18 DEO )
tal vez no sea la manera más práctica de programar, pero ciertamente una divertida :)
puedes encontrar los opcodes de todas las 32 instrucciones en la referencia uxntal
podemos expandir nuestro programa para imprimir más caracteres:
( hola.tal ) |0100 LIT 68 LIT 18 DEO ( h ) LIT 6f LIT 18 DEO ( o ) LIT 6c LIT 18 DEO ( l ) LIT 61 LIT 18 DEO ( a ) LIT 0a LIT 18 DEO ( newline )
si lo ensamblamos y corremos, tendremos un 'hola' en nuestra terminal, usando 25 bytes de programa :)
¿ok, y... te gusta?
¿parece innecesariamente complejo?
veremos ahora algunas virtudes de uxntal que hacen escribir y leer código más "confortable".
las runas son caracteres especiales que indican a uxnasm algún pre procesamiento a hacer al ensamblar nuestro programa.
ya vimos la primera de ellas: | define un pad absoluto: la dirección donde el siguiente elemento escrito será ubicado en memoria.
si la dirección es de 1 byte de longitud, es asumido que es una dirección de el espacio de entrada/salida o de la página cero.
si la dirección es de 2 bytes de longitud, es asumido que es una dirección de la memoria principal.
hablemos de otra: #.
éste caracter define un "hex literal": es básicamente un atajo para la instrucción LIT.
usando esta runa, podemos reescribir nuestro primer programa como:
( hola.tal ) |0100 #68 #18 DEO
nota que sólo puedes usar esta runa para escribir los contenidos de uno o dos bytes (dos o cuatro nibbles).
el siguiente tendría el mismo comportamiento que el programa de arriba, pero usando un byte menos (en la siguiente sección/día veremos por qué)
( hola.tal ) |0100 #6818 DEO
importante: recuerda que esta runa (y las otras con la palabra "literal" en su nombre) es un atajo para la instrucción LIT. esto puede prestarse a confusión en algunos casos :)
ésta es la runa de caracter raw: '
nos permite que uxnasm decodifique el valor numérico de un caracter ascii.
nuestro "programa hola" luciría de la siguiente manera, usando las nuevas runas que acabamos de aprender:
( hola.tal ) |0100 LIT 'h #18 DEO LIT 'o #18 DEO LIT 'l #18 DEO LIT 'a #18 DEO #0a #18 DEO ( newline )
el "raw" en el nombre de esta runa indica que no es literal, por ejemplo que no agrega una instrucción LIT.
incluso ahora que sabemos que #18 corresponde a empujar la dirección de dispositivo escribir en consola en la pila, por legibilidad y para asegurar nuestro código a futuro es una buena práctica asignar una serie de etiquetas que corresponderán a ese dispositivo y sus sub direcciones.
la runa @ nos permite definir etiquetas, y la runa & nos permite definir sub etiquetas.
por ejemplo, para el dispositivo de consola, la manera en que verías esto escrito en programas para la computadora varvara es la siguiente:
|10 @Console [ &vector $2 &read $1 &pad $5 &write $1 &error $1 ]
podemos ver un pad absoluto a la dirección 10, que asigna lo siguiente a esa dirección. dado que la dirección consiste en un sólo byte, uxnasm asume que es para el espacio de memoria de entrada/salida o la página cero.
luego vemos la etiqueta @Console: ésta etiqueta va a corresponder a la dirección 10.
los corchetes son ignorados, pero incluidos por legibilidad.
luego tenemos varias sub etiquetas, indicadas por la runa &, y pads relativos, indicados por la runa $. ¿cómo los leemos/interpretamos?
nada de esto sería traducido a código máquina, pero nos asiste al escribir código uxntal.
la runa para referirse a una dirección literal en la página cero o el espacio de direcciones de entrada/salida, es . (punto), y una / (barra) nos permite referirnos a una de sus sub etiquetas.
recuerda: al ser una runa de "dirección literal" va a agregar una instrucción LIT antes de la correspondiente dirección :)
podemos reescribir nuestro "programa hola mundo" como sigue:
( hola.tal ) ( devices ) |10 @Console [ &vector $2 &read $1 &pad $5 &write $1 &error $1 ] ( programa principal ) |0100 LIT 'h .Console/write DEO LIT 'o .Console/write DEO LIT 'l .Console/write DEO LIT 'a .Console/write DEO #0a .Console/write DEO ( newline )
ahora esto empieza a parecerse más a los ejemplos que puedes encontrar en línea y/o en el repositorio uxn :)
siguiendo con la herencia de forth (?), en uxntal podemos definir nuestras propias "palabras" que nos permiten agrupar y reutilizar instrucciones.
durante el ensamblado, estos macros son (recursivamente) reemplazados por los contenidos de sus definiciones.
por ejemplo, podemos ver que el siguiente fragmento de código es repetido varias veces en nuestro programa.
.Console/write DEO ( equivalent to #18 DEO, or LIT 18 DEO )
podemos definir un macro llamado EMIT que tomará de la pila un byte correspondiente a un caracter, y lo imprimirá en la salida estandard. para esto, necesitamos la runa %, y llaves para la definición.
¡no olvides los espacios!
( escribe un caracter a la salida estandard ) %EMIT { .Console/write DEO } ( caracter -- )
para llamar a un macro, sólo escribimos su nombre:
( imprime caracter h ) LIT 'h EMIT
podemos llamar macros dentro de macros, por ejemplo:
( imprime una nueva línea ) %NL { #0a EMIT } ( -- )
usando todos estos macros y runas, nuestro programa puede terminar luciendo como lo siguiente:
( hola.tal ) ( dispositivos ) |10 @Console [ &vector $2 &read $1 &pad $5 &write $1 &error $1 ] ( macros ) ( imprime un caracter en la salida estandard ) %EMIT { .Console/write DEO } ( caracter -- ) ( imprime una nueva línea ) %NL { #0a EMIT } ( -- ) ( programa principal ) |0100 LIT 'h EMIT LIT 'o EMIT LIT 'l EMIT LIT 'a EMIT NL
termina siendo ensamblado en los mismos 25 bytes que los ejemplos de arriba, pero con suerte más legible y mantenible.
podemos "mejorar" este programa haciendo que un loop imprima los caracteres, pero estudiaremos eso más tarde :
en nuestro programa previo, el macro EMIT es llamado justo después de empujar un caracter a la pila.
¿cómo reescribirías el programa para empujar primero todos los caracteres, y luego "EMIT"ir todos ellos en una secuencia como ésta?
EMIT EMIT EMIT EMIT EMIT
si miras en la tabla ascii, verás que el código hexadecimal 30 corresponde al dígito 0, 31 al dígito 1, siguiendo hasta el 39 que corresponde al dígito 9.
define un macro IMPRIMIR-DIGITO que toma un número (del 0 al 9) de la pila, e imprime el correspondiente dígito en la salida estandard.
%IMPRIMIR-DIGITO { } ( número -- )
éstas son las instrucciones que cubrimos hoy:
¡bién hecho!
en el tutorial de uxn día 2 empezamos a explorar los aspectos visuales de la computadora varvara: ¡hablamos sobre los aspectos fundamentales del dispositivo de pantalla para que podamos empezar a dibujar en el!
¡sin embargo, te invito a tomar un pequeño descanzo antes de continuar! :)
si este tutorial te ha resultado de ayuda, considera compartirlo y brindarle tu apoyo :)
most recent update on: 12021-08-17
text, images, and code are shared with the peer production license