Data & Analytics
Analyse de données avec les bibliothèques Python de référence.
Pourquoi cette catégorie
NumPy, DuckDB, pandas : l'écosystème data science Python est incontournable. Catnip s'intègre sans friction : les arrays NumPy, les DataFrames, les connexions SQL fonctionnent directement.
Le broadcasting Catnip (.[op]) complète NumPy : même idiome pour les listes Python et les arrays NumPy.
Exemples
| Fichier | Module | Description |
|---|---|---|
numpy_climate.cat |
numpy | Analyse climatique, statistiques, vectorisation |
duckdb_analytics.cat |
duckdb | SQL analytique in-process, agrégations |
sqlalchemy_duckdb.cat |
sqlalchemy + duckdb | ORM complet, requêtes analytiques |
polars_parallel_ingest.cat |
polars | Ingestion parallèle de CSV avec ND-map (eager + lazy) |
Données
nasa_temperature.csv- Anomalies de température globale (source NASA GISS)
Exécution
# NumPy
catnip -f numpy data-analytics/numpy_climate.cat
# DuckDB
catnip -f duckdb data-analytics/duckdb_analytics.cat
# SQLAlchemy + DuckDB
catnip -f sqlalchemy -f duckdb data-analytics/sqlalchemy_duckdb.cat
# Polars (ND-map parallel)
catnip -f polars -f tempfile -f pathlib data-analytics/polars_parallel_ingest.cat
À venir
- pandas avancé - Algèbre linéaire, comparaison broadcasting
- dask - DataFrames distribués pour gros volumes