Nel panorama sempre più AI-native del web, il modo in cui i contenuti vengono strutturati e resi leggibili dai modelli linguistici è diventato cruciale.
In LevelZero abbiamo deciso di testare una delle più interessanti proposte emerse nel 2024: il file llms.txt, un formato pensato per facilitare l’accesso semantico ai contenuti da parte dei Large Language Models (LLM) come ChatGPT, Claude, Gemini o strumenti di ricerca AI avanzati.

Cos’è il file llms.txt
Introdotto da Jeremy Howard (fast.ai), llms.txt è un file in formato Markdown che si affianca a robots.txt e alle sitemap XML, ma con uno scopo specifico: fornire una guida semantica ai contenuti più rilevanti di un sito web.
Serve principalmente a:
- evidenziare le sezioni chiave (FAQ, Servizi, Blog);
 - eliminare il rumore (ads, sidebar, pop-up);
 - rendere più semplice la costruzione di dataset per modelli AI;
 - supportare architetture di tipo RAG (Retrieval-Augmented Generation);
 - ottimizzare l’indicizzazione semantica dei contenuti web.
 
Il test su levelzero.it
Abbiamo creato una prima versione di plugin per WordPress che genera automaticamente un file llms.txt includendo:
- le informazioni base del sito (titolo, lingua, descrizione);
 - i link di navigazione primaria;
 - le pagine istituzionali con estratti semplificati;
 - gli articoli del blog;
 - i prodotti in evidenza (se è presente WooCommerce);
 - le FAQ e una nota dedicata all’uso da parte degli LLM.
 
Puoi vedere il risultato direttamente su: https://levelzero.it/llms.txt
Perché può essere strategico
Implementare llms.txt significa iniziare a progettare il sito web come fonte dati, non solo come vetrina. Questo approccio permette di:
- preparare contenuti per l’interrogazione da parte di chatbot e agenti AI;
 - costruire dataset semantici per l’addestramento di modelli proprietari;
 - supportare scenari di assistenza clienti, knowledge base, documentazione tecnica e molto altro.
 
Prossimi step
Stiamo lavorando all’evoluzione del plugin per:
- permettere configurazioni da backend;
 - supportare custom post type e contenuti avanzati;
 - inserire dichiarazioni di contenuti generati da AI;
 - integrare il file in pipeline semantiche più ampie.
 
Vuoi testarlo?
Se sei uno sviluppatore, un’azienda o un team che lavora con AI, chatbot o knowledge automation, llms.txt è un punto di partenza concreto per creare contenuti “AI-readable”.
Facci saper se ci sono margini miglioramento o quali altre sezioni andresti ad integrare a livello semantico.
