Types de données
Catnip supporte les types de données suivants :
Nombres
# Entiers
chaussette_gauche = 42
chaussette_droite = -17
# Flottants
pi = 3.14159
constante_de_cafe = 2.71828
# Notation scientifique
espace_infiniment_loin = 1.5e10
# Hexadécimal, binaire, octal
hex_val = 0xFF
bin_val = 0b1010
oct_val = 0o755
# Grands entiers (promotion automatique)
fact50 = 30414093201713378043612608166064768844377641568960512000000000000
big = 2 ** 100
# ⇒ 1267650600228229401496703205376
Grands entiers
L'arithmétique sur les entiers est en précision arbitraire. Les petits entiers (48-bit signés, de -2^47 a 2^47-1) sont
stockés inline sans allocation. Au-dela, la VM promeut automatiquement en BigInt (Arc<BigInt> via num-bigint). La
demotion inverse se fait si le resultat retombe dans la plage SmallInt.
# Promotion transparente
2 ** 100
# ⇒ 1267650600228229401496703205376
# Factorielle de grands nombres
fact = (n) => { if n <= 1 { 1 } else { n * fact(n - 1) } }
fact(50)
# ⇒ 30414093201713378043612608166064768844377641568960512000000000000
# Arithmétique mixte SmallInt/BigInt
(2 ** 100) + 1
# ⇒ 1267650600228229401496703205377
Toutes les opérations arithmétiques (+, -, *, //, %, **) et de comparaison (<, >, ==, etc.)
fonctionnent de maniere uniforme sur SmallInt et BigInt. La division / promeut en float.
Les entiers Catnip ne debordent jamais. Ils grandissent jusqu'a ce que la RAM s'ennuie.
Décimales exactes
Le suffixe d (ou D) crée un nombre décimal base-10 exact (Python decimal.Decimal, 28 chiffres significatifs).
Résout le problème classique IEEE 754 : 0.1 + 0.2 != 0.3 en float.
# Littéraux décimaux
prix = 99.99d
taxe = 0.08d
total = prix + prix * taxe
# ⇒ 107.9892d
# Le test canonique
0.1d + 0.2d == 0.3d
# ⇒ True (faux en float)
# Promotion entier → Decimal
2 + 0.5d
# ⇒ 2.5d
# Builtin Decimal()
Decimal("3.14")
# ⇒ 3.14d
Règles de mélange :
Decimal op Decimal→DecimalInt op Decimal→Decimal(promotion exacte)Decimal op Float→ TypeError (pas de coercion implicite)
La division arrondit au contexte décimal Python (28 chiffres significatifs). 10d / 2d donne 5d, 1d / 3d donne
0.3333...d (28 chiffres).
Les décimales ne mentent pas. Elles arrondissent poliment à 28 chiffres, ce qui suffit pour la plupart des réalités.
Nombres complexes
Le suffixe j (ou J) crée un nombre imaginaire pur. La construction d'un complexe complet passe par l'addition
standard.
# Imaginaire pur
2j
# ⇒ 2j
# Complexe via addition
1 + 2j
# ⇒ (1+2j)
# Arithmétique
(1+2j) * (3+4j)
# ⇒ (-5+10j)
# Attributs
(1+2j).real
# ⇒ 1.0
(1+2j).imag
# ⇒ 2.0
(1+2j).conjugate()
# ⇒ (1-2j)
abs(3+4j)
# ⇒ 5.0
# Builtin complex()
complex(1, 2)
# ⇒ (1+2j)
Règles de mélange :
int op complex→complexfloat op complex→complexcomplex op complex→complex
L'égalité (==, !=) fonctionne. Les comparaisons d'ordre (<, <=, >, >=) lèvent un TypeError - un nombre
complexe n'a pas d'ordre total.
Les complexes vivent dans un plan, pas sur une droite. Leur demander qui est le plus grand, c'est demander à un point de la carte de se justifier.
Chaînes de caractères
# Chaînes simples ou doubles guillemets
message = "BORN TO SEGFAULT"
name = 'Capitaine Whiskers'
# Chaînes multilignes (doubles ou simples guillemets)
text = """
Ceci est une chaîne
sur plusieurs lignes
"""
text2 = '''
Même chose avec
des guillemets simples
'''
Pas de concaténation implicite
Contrairement à Python, Catnip ne concatène pas automatiquement les chaînes adjacentes :
# Python : "hello" "world" → "helloworld"
# Catnip : erreur de syntaxe
# Utiliser l'opérateur + explicitement
message = "hello" + "world"
Pourquoi ce choix ?
La concaténation implicite est une source de bugs silencieux, notamment dans les listes :
# En Python, une virgule oubliée passe inaperçue :
items = [
"foo",
"bar" # virgule oubliée
"baz"
]
# items == ["foo", "barbaz"] - aucune erreur, bug silencieux
Forcer un opérateur explicite élimine cette catégorie de bugs. Une erreur de syntaxe visible vaut mieux qu'un comportement incorrect silencieux.
La concaténation implicite applique le principe du moindre effort au mauvais endroit : elle économise un caractère (
+) mais coûte potentiellement des heures de débogage. Le ratio effort/bénéfice est défavorable d'un facteur d'environ 10⁴.
F-strings (chaînes interpolées)
Les f-strings permettent d'interpoler des expressions directement dans les chaînes, sans multiplier les concaténations.
Syntaxe : préfixer la chaîne avec f ou F (insensible à la casse) et utiliser {expression} pour insérer des
valeurs.
# Variables simples
astronaute = "Léonie"
age = 30
f"Je m'appelle {astronaute} et j'ai {age} ans"
# → "Je m'appelle Léonie et j'ai 30 ans"
# Expressions arithmétiques
x = 10
y = 20
f"La somme de {x} et {y} est {x + y}"
# → "La somme de 10 et 20 est 30"
# Appels de fonction
double_burrito = (n) => { n * 2 }
n = 5
f"Le double de {n} est {double_burrito(n)}"
# → "Le double de 5 est 10"
# Échappements standards
f"Ligne 1\nLigne 2" # Retour à la ligne
f"Colonne 1\tColonne 2" # Tabulation
# Majuscules ou minuscules
F"Valeur: {42}" # Identique à f"Valeur: {42}"
Note : les expressions dans les f-strings sont évaluées dans le scope courant. Les variables non définies ou les erreurs de syntaxe produisent des messages d'erreur clairs.
Spécificateurs de format
Les f-strings supportent les spécificateurs de format Python standard via la syntaxe {expression:format_spec}.
Nombres entiers :
n = 42
f"{n:05}" # → "00042" (zero-padding sur 5 caractères)
f"{n:>10}" # → " 42" (aligné à droite sur 10 caractères)
f"{n:<10}" # → "42 " (aligné à gauche sur 10 caractères)
f"{n:^10}" # → " 42 " (centré sur 10 caractères)
f"{n:x}" # → "2a" (hexadécimal)
f"{n:b}" # → "101010" (binaire)
Nombres flottants :
pi = 3.14159
f"{pi:.2f}" # → "3.14" (2 décimales)
f"{pi:.4f}" # → "3.1416" (4 décimales, arrondi)
f"{pi:8.2f}" # → " 3.14" (largeur 8, 2 décimales)
f"{pi:e}" # → "3.14159e+00" (notation scientifique)
Pourcentages :
ratio = 0.856
f"{ratio:.1%}" # → "85.6%" (pourcentage avec 1 décimale)
f"{ratio:.0%}" # → "86%" (pourcentage arrondi)
Alignement et remplissage :
text = "chat"
f"{text:>10}" # → " chat" (aligné à droite)
f"{text:*<10}" # → "chat******" (remplissage avec *)
f"{text:_^10}" # → "___chat___" (centré avec _)
Référence complète : tous les spécificateurs de la Format Specification Mini-Language Python sont supportés.
Conversion flags
Les flags !r, !s et !a appliquent une conversion avant le formatage :
!rappellerepr()sur la valeur (utile pour afficher les guillemets autour des chaînes)!sappellestr()(comportement par défaut)!aappelleascii()
name = "Alice"
f"{name!r}" # → "'Alice'"
f"{name!r:>15}" # → " 'Alice'" (repr + alignement)
f"{42!s}" # → "42" (conversion explicite en str)
Debug syntax
La syntaxe = après une expression affiche à la fois le code source et le résultat, ce qui facilite le débogage sans
dupliquer le nom de la variable :
x = 42
f"{x=}" # → "x=42"
f"{x=:.2f}" # → "x=42.00" (debug + format)
f"{x=!r}" # → "x=42" (debug + conversion)
a = 5
b = 3
f"{a + b=}" # → "a + b=8" (fonctionne avec les expressions)
Limitations
Les f-strings imbriquées (nested f-strings) ne sont pas supportées. En Python 3.12+, les f-strings peuvent contenir d'autres f-strings grâce à la réécriture du parser en PEG récursif (PEP 701). Catnip utilise un parser Tree-sitter dont le tokenizer ne supporte pas la récursion à l'intérieur des interpolations.
# OK
f"{x:.2f}"
# Pas supporté
# f"{x:{'.2f' if precise else '.0f'}}"
# f"{f'{x}'}"
L'impossibilité technique d'imbriquer des f-strings dans des f-strings empêche aussi d'imbriquer cette note dans elle-même, ce qui est probablement une bonne chose.
Chaînes de bytes
Les chaînes de bytes utilisent le préfixe b et produisent un objet bytes Python :
# Bytes simples
data = b"hello world"
print(data) # b'hello world'
# Conversion en string
text = data.decode("utf-8")
print(text) # hello world
# Avec séquences d'échappement
binary = b"\x48\x65\x6c\x6c\x6f" # Hello en hexadécimal
newlines = b"line1\nline2"
# Bytes multilignes
raw = b"""
binary
data
"""
# Chargement de modules Python (voir docs/user/)
orjson = import("orjson")
json_bytes = orjson.dumps(dict(key="value")) # Retourne bytes
Booléens
vrai = True
faux = False
rien = None
Truthiness (valeur de vérité)
Catnip utilise les mêmes règles de truthiness que Python. Toute valeur peut être évaluée dans un contexte booléen (if,
while, and, or, not).
Valeurs falsy (évaluées à False) :
FalseNone0(entier zéro)0.0(flottant zéro)""(chaîne vide)list()(liste vide)tuple()(tuple vide)set()(set vide)dict()(dictionnaire vide)~[](topos vide ND)
Tout le reste est truthy : nombres non nuls, chaînes non vides, collections non vides, structs, fonctions.
x = 0
if x { "jamais" } else { "zero est falsy" }
# ⇒ "zero est falsy"
s = ""
if s { "jamais" } else { "chaine vide est falsy" }
# ⇒ "chaine vide est falsy"
data = list(1)
if data { "liste non vide est truthy" }
# ⇒ "liste non vide est truthy"
# Court-circuit : and/or retournent un booléen (pas la valeur opérande)
0 or "fallback" # ⇒ True (pas "fallback" comme en Python)
"ok" and 42 # ⇒ True (pas 42 comme en Python)
False and "nope" # ⇒ False
La truthiness est déléguée au protocole Python (
__bool__/__len__). Les structs Catnip sont toujours truthy, sauf si quelqu'un implémente un jour un struct quantique dans un état superposé vrai-faux, ce qui n'est pas prévu.
Listes
Catnip supporte les littéraux de listes avec la syntaxe list(…) :
# Liste vide
empty = list()
# Liste de nombres
scores_de_licorne = list(1, 2, 3, 4, 5)
# Liste de chaînes
crew = list("Alice", "Bob", "Charlie")
# Liste avec expressions
computed = list(1 + 1, 2 * 3, 10 / 2) # list(2, 6, 5.0)
# Listes imbriquées
matrix = list(
list(1, 2, 3),
list(4, 5, 6),
list(7, 8, 9)
)
# Avec virgule finale (optionnel)
items = list(1, 2, 3,)
# Accès aux éléments
first = scores_de_licorne[0] # 1
last = scores_de_licorne[2] # 3
last = scores_de_licorne[-1] # 5 (indexation négative)
# Slicing
scores_de_licorne[1:3] # list(2, 3)
scores_de_licorne[::-1] # list(5, 4, 3, 2, 1)
# Itération
for n in scores_de_licorne {
print(n)
}
# Avec fonctions Python
total = sum(list(1, 2, 3, 4, 5)) # 15
length = len(crew) # 3
Note : La syntaxe list(…) évite la confusion avec la notation de broadcast .[…].
Sémantique des collections
list(), tuple() et set() sont des littéraux purs : chaque argument devient un élément.
Règle déterministe :
- 0 argument : collection vide
- 1+ arguments : un argument = un élément (pas de consommation implicite d'itérable)
list() # []
list(range(5)) # [range(0, 5)]
list(list(1, 2, 3)) # [[1, 2, 3]]
list("hello") # ["hello"]
list(42) # [42]
list(1, 2, 3) # [1, 2, 3]
list("hello", "world") # ["hello", "world"]
Même principe pour tuple() et set().
L'expansion est explicite via * (et ** pour dict) :
list(*list(1, 2), 3, *tuple(4, 5)) # [1, 2, 3, 4, 5]
tuple(*list(1, 2), 3) # (1, 2, 3)
set(*list(1, 2, 2), 3) # {1, 2, 3}
dict(**dict(a=1), ("b", 2), c=3) # {"a": 1, "b": 2, "c": 3}
Sets
Les sets sont des collections non ordonnées sans répétition, ils utilisent la syntaxe set(…) :
# Set vide
empty = set()
# Set avec valeurs
numbers = set(1, 2, 3, 4, 5)
# Les doublons sont automatiquement supprimés
unique = set(1, 2, 2, 3, 3, 3) # {1, 2, 3}
# Opérations sur les sets (via Python)
a = set(1, 2, 3, 4)
b = set(3, 4, 5, 6)
union = a.union(b) # {1, 2, 3, 4, 5, 6}
intersection = a.intersection(b) # {3, 4}
difference = a.difference(b) # {1, 2}
Dictionnaires
Les dictionnaires supportent deux notations : paires (clé, valeur) et kwargs clé=valeur.
# Dictionnaire vide
empty = dict()
# Notation kwargs (clés string implicites)
pirate = dict(name="Capitaine Whiskers", age=7, city="Paris")
# Notation paires (clés arbitraires)
mapping = dict((1, "un"), (2, "deux"), (3, "trois"))
# Mixte : paires et kwargs dans le même appel
mixed = dict((1, "un"), name="Alice", (2, "deux"))
# Valeurs calculées
stats = dict(sum=1 + 2 + 3, product=2 * 3 * 4)
# Structures imbriquées
data = dict(
numbers=list(1, 2, 3),
info=dict(x=10, y=20)
)
# Accès aux valeurs
nom_capitaine = pirate["name"] # "Capitaine Whiskers"
# Avec virgule finale (optionnel)
config = dict(debug=True, port=8080,)
Note : La syntaxe dict(...) utilise des paires ou des kwargs car {…} est réservé pour les blocs de code. Les
kwargs convertissent l'identifiant en clé string au parse time.
Tuples
Les tuples sont des séquences immutables, avec la syntaxe tuple(…) :
# Tuple vide
empty = tuple()
# Tuple de coordonnées
coords_lune = tuple(10, 20)
# Accès par index
coords_lune[0] # 10
coords_lune[-1] # 20
# Unpacking dans for
for (x, y) in list(tuple(1, 2), tuple(3, 4)) {
print(f"{x}, {y}")
}
Note : la syntaxe (a, b) est réservée aux appels de fonction et au groupement d'expressions. Les tuples utilisent
tuple(…) pour lever l'ambiguité.
Ranges (via Python)
range() est un builtin Python disponible directement. C'est un itérable, consommable avec for...in :
for i in range(1, 10) {
print(i) # 1 à 9
}
list(range(5)) # [range(0, 5)] (littéral à 1 élément)
Différences avec Python
Quelques types et syntaxes Python qui n'existent pas en Catnip :
- Pas de séparateur
_dans les nombres :1_000_000n'est pas reconnu, écrire1000000 - Pas de raw strings : pas de préfixe
r"...", les séquences d'échappement sont toujours interprétées - Pas d'opérateur
in:x in collectionn'existe pas, utilisercollection.__contains__(x) - Pas de concaténation implicite de chaînes adjacentes (voir plus haut)
list() / tuple() / set() : littéraux purs
En Python, list() est un constructeur qui prend un seul itérable. [...] est un littéral. Ce sont deux syntaxes
distinctes.
En Catnip, list() est uniquement un littéral (même principe pour tuple() et set()). La syntaxe [...] n'existe
pas (réservée au broadcast). La règle est :
| Arité | Comportement | Exemple |
|---|---|---|
| 0 | collection vide | list() → [] |
| 1+ | littéral (argument encapsulé tel quel) | list(range(5)) → [range(0, 5)] |
Ruptures avec Python :
list(1, 2, 3)fonctionne (Python lève TypeError)list(42)encapsule (Python lève TypeError)list("hello")encapsule la chaîne entière (Python itère en caractères)
Ce choix impose une sémantique unique et prévisible : un argument = un élément. Aucune branche implicite selon
__iter__.
Topos ND (~[])
~[] est un singleton vide utilisé par les opérateurs ND. Il est falsy, itérable vide, et sa longueur vaut 0.
empty = ~[]
len(empty) # 0
list(empty) # [~[]]
if empty { 1 } else { 2 } # 2