Nel panorama sempre più AI-native del web, il modo in cui i contenuti vengono strutturati e resi leggibili dai modelli linguistici è diventato cruciale.

In LevelZero abbiamo deciso di testare una delle più interessanti proposte emerse nel 2024: il file llms.txt, un formato pensato per facilitare l’accesso semantico ai contenuti da parte dei Large Language Models (LLM) come ChatGPT, Claude, Gemini o strumenti di ricerca AI avanzati.

llms.txt e WordPress: il nostro test per preparare il web alla lettura da parte dell'AI

Cos’è il file llms.txt

Introdotto da Jeremy Howard (fast.ai), llms.txt è un file in formato Markdown che si affianca a robots.txt e alle sitemap XML, ma con uno scopo specifico: fornire una guida semantica ai contenuti più rilevanti di un sito web.

Serve principalmente a:

  • evidenziare le sezioni chiave (FAQ, Servizi, Blog);
  • eliminare il rumore (ads, sidebar, pop-up);
  • rendere più semplice la costruzione di dataset per modelli AI;
  • supportare architetture di tipo RAG (Retrieval-Augmented Generation);
  • ottimizzare l’indicizzazione semantica dei contenuti web.

Il test su levelzero.it

Abbiamo creato una prima versione di plugin per WordPress che genera automaticamente un file llms.txt includendo:

  • le informazioni base del sito (titolo, lingua, descrizione);
  • i link di navigazione primaria;
  • le pagine istituzionali con estratti semplificati;
  • gli articoli del blog;
  • i prodotti in evidenza (se è presente WooCommerce);
  • le FAQ e una nota dedicata all’uso da parte degli LLM.

Puoi vedere il risultato direttamente su: https://levelzero.it/llms.txt

Perché può essere strategico

Implementare llms.txt significa iniziare a progettare il sito web come fonte dati, non solo come vetrina. Questo approccio permette di:

  • preparare contenuti per l’interrogazione da parte di chatbot e agenti AI;
  • costruire dataset semantici per l’addestramento di modelli proprietari;
  • supportare scenari di assistenza clienti, knowledge base, documentazione tecnica e molto altro.

Prossimi step

Stiamo lavorando all’evoluzione del plugin per:

  • permettere configurazioni da backend;
  • supportare custom post type e contenuti avanzati;
  • inserire dichiarazioni di contenuti generati da AI;
  • integrare il file in pipeline semantiche più ampie.

Vuoi testarlo?

Se sei uno sviluppatore, un’azienda o un team che lavora con AI, chatbot o knowledge automation, llms.txt è un punto di partenza concreto per creare contenuti “AI-readable”.

Facci saper se ci sono margini miglioramento o quali altre sezioni andresti ad integrare a livello semantico.