Autore: wp_14910800

  • Ouverture sul Quarto Cerchio – Atto III Governare la complessità

    Ouverture sul Quarto Cerchio – Atto III Governare la complessità

    In questo ultimo atto dell’Ouverture sul Quarto Cerchio approfondiamo il tema di un contesto in cui piattaforme cloud, modelli open e architetture ibride stanno convergendo, la vera sfida non è più tecnologica, ma architetturale.

    La diffusione di sistemi agentici — composti da componenti autonomi, distribuiti e interconnessi — introduce un livello di complessità che richiede nuovi modelli di governo, capaci di garantire controllo, sicurezza e sostenibilità nel tempo.

    Questo articolo esplora come affrontare questa complessità attraverso una combinazione coerente di pattern architetturali consolidati: Zero Trust, Self-Contained Systems ed Event-Driven Architecture. Una griglia interpretativa che, se applicata con pragmatismo, consente di strutturare sistemi distribuiti mantenendone la governabilità.

    All’interno di questa visione, la CI/CD full Infrastructure as Code emerge come naturale estensione operativa del principio Zero Trust, trasformando sicurezza e controllo in elementi intrinseci del ciclo di vita.

    Più che proporre nuove soluzioni, questo Atto III offre una chiave di lettura: un modo per interpretare e governare la complessità dei moderni ecosistemi cloud-native, mantenendo saldo il legame tra architettura, sicurezza e delivery.

    Ouverture sul Quarto Cerchio – Atto III Governare la complessità

    Quando la tecnologia smette di essere la domanda

    A questo punto, il quadro è completo.

    Abbiamo osservato una convergenza nelle piattaforme cloud, una convergenza nei modelli open e distribuiti, e un’evoluzione verso architetture ibride in cui agenti, modelli e dati si distribuiscono su più livelli.

    La domanda, ormai, non è più tecnologica.
    È architetturale.

    Come si governa un sistema composto da agenti distribuiti, modelli eterogenei e ambienti multipli, mantenendo controllo, sicurezza e conformità?

    Dal modello alla struttura

    Il modello agentico introduce naturalmente autonomia, interazione e distribuzione. È proprio questa sua forza a renderlo complesso da gestire in contesti enterprise.

    Non si tratta solo di far funzionare gli agenti.
    Si tratta di renderli governabili.

    Autonomia operativa, accesso dinamico ai dati, interazioni tra componenti e distribuzione del carico sono tutti elementi che, senza una struttura, tendono rapidamente a sfuggire al controllo.

    Per questo motivo, adottare un modello non basta.
    Serve incapsularlo all’interno di un’architettura coerente.

    Una griglia per governare: ZT–SCS–EDA

    Per affrontare questa complessità, non è necessario inventare nuovi paradigmi. È spesso più efficace combinare pattern già consolidati.

    Tre, in particolare, si integrano in modo naturale:

    Questi tre approcci, combinati, permettono di costruire un sistema distribuito che resta governabile nel tempo.

    Zero Trust: fiducia esplicita, controllo continuo

    In un sistema agentico distribuito, il concetto di perimetro fidato perde significato.

    Ogni componente deve essere considerato potenzialmente non affidabile fino a prova contraria.

    Il principio di Zero Trust — formalizzato anche dal National Institute of Standards and Technology (NIST) — è semplice: non fidarsi mai implicitamente, verificare sempre.

    Questo si traduce in:

    • autenticazione continua
    • controllo granulare degli accessi
    • isolamento tra componenti
    • tracciabilità delle interazioni

    Nel mondo agentico, ogni invocazione di tool, ogni accesso ai dati e ogni scambio tra agenti diventa un evento critico da verificare e registrare.

    Self-Contained Systems: separare per governare

    Se Zero Trust definisce il controllo, i Self-Contained Systems definiscono la struttura.

    Ogni componente viene progettato come un sistema autonomo, con logica, dati e interfacce proprie.

    Applicato agli agenti, questo significa evitare piattaforme centralizzate e monolitiche.

    Un agente — o un gruppo di agenti — diventa un dominio autonomo, con responsabilità chiare e confini ben definiti.

    PrincipioBeneficio
    IsolamentoRiduzione dell’impatto dei problemi
    AutonomiaEvoluzione indipendente
    Dati localiMaggiore controllo e compliance
    Interfacce chiareRiduzione dell’accoppiamento

    Questa impostazione rende il sistema più resiliente e più facile da governare.

    Event-Driven Architecture: coordinare senza legare

    Se i sistemi sono autonomi, serve un modo per coordinarli senza accoppiarli.

    L’Event-Driven Architecture risponde a questa esigenza introducendo un modello basato su eventi.

    I componenti non si chiamano direttamente.
    Reagiscono a ciò che accade.

    Questo approccio consente di:

    • orchestrare flussi complessi
    • gestire stati distribuiti
    • integrare componenti eterogenei
    • reagire dinamicamente ai cambiamenti
    ApproccioEffetto
    Comunicazione a eventiRiduzione accoppiamento
    AsincroniaMaggiore scalabilità
    ReattivitàAdattabilità del sistema
    DisaccoppiamentoMaggiore resilienza

    In un ecosistema agentico, questo è il tessuto connettivo che rende possibile la distribuzione.

    Una sintesi operativa

    La combinazione dei tre pattern produce una struttura chiara:

    PatternRuolo
    Zero TrustControllo e sicurezza
    SCSStruttura e responsabilità
    EDACoordinamento e flessibilità

    Il risultato è un sistema in cui ogni componente è controllato, ogni responsabilità è esplicita e ogni interazione è tracciabile.

    Il ruolo dell’enterprise architecture

    A questo punto emerge una distinzione fondamentale.

    L’enterprise architecture non ha il compito di scegliere strumenti o piattaforme.
    Ha il compito di dare forma al sistema.

    Questo significa definire come gli elementi vengono:

    • isolati
    • integrati
    • governati
    • evoluti nel tempo

    Il modello agentico resta invariato.
    È l’architettura a determinarne il valore reale.

    Il pragmatismo come competenza chiave

    C’è però un elemento che non può essere ignorato.

    Se Zero Trust rappresenta ormai un riferimento difficilmente discutibile, lo stesso non vale — in senso assoluto — per SCS ed EDA.

    Questi pattern sono estremamente efficaci, ma non universali.

    Devono essere adattati.

    Ogni contesto introduce vincoli: organizzativi, tecnologici, normativi. Applicare rigidamente un modello può portare a soluzioni eleganti sulla carta, ma fragili nella realtà.

    Un’architettura efficace nasce dalla capacità di interpretare, non di applicare.

    Il ruolo dell’architetto è quindi quello di scegliere consapevolmente:

    • quando aderire
    • quando semplificare
    • quando discostarsi

    E soprattutto, rendere esplicite queste decisioni.

    Zero Trust e CI/CD full Infrastructure as Code

    Se Zero Trust viene preso sul serio, allora cambia anche il modo in cui si costruisce e si evolve l’architettura.

    Non basta proteggere l’accesso ai sistemi.
    Serve controllare anche come questi sistemi vengono modificati.

    Da qui emerge una conseguenza naturale: l’adozione di una CI/CD full Infrastructure as Code.

    Framework e pratiche come Terraform, Pulumi o pipeline su GitHub Actions rendono possibile questo approccio.

    ElementoApproccio tradizionaleApproccio IaC
    ConfigurazioneManualeVersionata
    ModificheNon tracciateTracciabili
    SicurezzaA posterioriIntegrata
    AuditComplessoNativo

    In questo modello, infrastruttura, configurazioni, identità e policy diventano artefatti versionati.

    Zero Trust smette di essere solo un principio di sicurezza.
    Diventa un principio di ingegnerizzazione del ciclo di vita.

    Architetture agentiche in contesti reali

    Quando questi principi vengono applicati, emergono alcuni pattern ricorrenti.

    In contesti cloud-native regolati, gli agenti operano su piattaforme hyperscaler, con accessi controllati, domini separati e coordinamento a eventi.

    In scenari ibridi, i dati sensibili restano localmente, mentre il cloud viene utilizzato per capacità di elaborazione avanzata. L’architettura separa chiaramente responsabilità e flussi.

    Nei contesti più evoluti, gli agenti si distribuiscono tra cloud, infrastrutture HPC e workstation locali, creando pool dinamici di elaborazione.

    In tutti questi casi, ciò che cambia non è il modello agentico.
    È il modo in cui viene governato.

    Governare la complessità

    Il pattern ZT–SCS–EDA non è una formula.

    È una lente.

    Permette di leggere la complessità, strutturarla e renderla governabile.

    All’interno di questa lente:

    • Zero Trust rappresenta il principio non negoziabile
    • SCS ed EDA offrono strumenti potenti, da adattare con consapevolezza

    La CI/CD full IaC diventa il meccanismo operativo che rende tutto questo concreto.

    Alla fine, il lavoro dell’architetto non è applicare modelli.

    È costruire sistemi che funzionano davvero.
    E mantenere, nel tempo, l’equilibrio tra visione e realtà.

    Conclusione — Il governo della complessità come nuova competenza

    Il Quarto Cerchio non introduce semplicemente una nuova tecnologia.
    Introduce una nuova condizione.

    Una condizione in cui sistemi, modelli e agenti non sono più elementi isolati, ma parti attive di un ecosistema dinamico, distribuito e in continua evoluzione.

    In questo scenario, la complessità non è un effetto collaterale.
    È una proprietà intrinseca del sistema.

    E come tale, non può essere eliminata.
    Può solo essere governata.

    Oltre il modello, verso la responsabilità architetturale

    Abbiamo visto come il modello agentico abiliti nuove capacità: autonomia, adattabilità, interazione continua tra componenti.

    Ma è altrettanto evidente che queste stesse capacità, senza una struttura adeguata, rischiano di trasformarsi in fragilità.

    È qui che entra in gioco l’architettura.

    Non come esercizio teorico, ma come disciplina operativa.
    Non come scelta tecnologica, ma come responsabilità.

    Governare significa definire confini, rendere esplicite le interazioni, controllare le evoluzioni.

    Significa trasformare un insieme di componenti intelligenti in un sistema affidabile.

    Un equilibrio da costruire nel tempo

    Il pattern ZT–SCS–EDA, insieme alla CI/CD full Infrastructure as Code, non rappresenta una soluzione definitiva.

    Rappresenta un equilibrio.

    Un equilibrio tra:

    • autonomia e controllo
    • distribuzione e coerenza
    • flessibilità e sicurezza

    Un equilibrio che non si raggiunge una volta sola, ma che va costruito e mantenuto nel tempo.

    Ogni evoluzione del sistema, ogni nuovo agente, ogni integrazione introduce nuove variabili.
    E richiede nuove scelte.

    Il ruolo dell’architetto nel Quarto Cerchio

    In questo contesto, il ruolo dell’architetto evolve.

    Non è più solo colui che disegna sistemi.
    Diventa colui che ne governa il comportamento nel tempo.

    Un interprete della complessità.

    Qualcuno capace di leggere pattern, adattarli al contesto, renderli sostenibili.
    Qualcuno che non nasconde le deviazioni, ma le comprende e le governa.

    Perché, nel Quarto Cerchio, la differenza non sta nell’adottare un modello.

    Sta nel saperlo rendere reale.

    Uno sguardo oltre

    Se il Primo Atto ha introdotto il cambiamento,
    se il Secondo ha mostrato la trasformazione in atto,
    questo Terzo Atto ne ha definito il governo.

    Ma il percorso non si ferma qui.

    Perché governare la complessità è solo il primo passo.

    La vera sfida, ora, sarà comprendere come questa complessità possa diventare valore.
    Come possa essere resa accessibile, utilizzabile, condivisibile.

    E soprattutto, come possa essere guidata non solo dall’architettura, ma dalle persone che ne fanno parte.


  • Ouverture sul Quarto Cerchio – Atto II – Oltre il cloud

    Ouverture sul Quarto Cerchio – Atto II – Oltre il cloud

    Partendo dalla convergenza osservata nel primo atto, la domanda che emerge è inevitabile: questo modello è davvero confinato alle piattaforme cloud?

    Osservando ciò che sta accadendo al di fuori di questo perimetro, la risposta appare più articolata. Il cloud ha rappresentato il primo punto di sintesi, ma non è più l’unico spazio in cui questi pattern evolvono.

    Sta emergendo qualcosa di più ampio. Un movimento che non sostituisce il cloud, ma lo supera, integrandolo in un contesto più distribuito e flessibile.

    Ouverture sul Quarto Cerchio – Atto II – Oltre il cloud

    Gli stessi pattern, fuori dal cloud

    Se si sposta lo sguardo verso framework open source e ambienti locali, emerge una seconda forma di convergenza, meno evidente ma altrettanto significativa.

    Framework come LangChain, LangGraph e AutoGen non nascono come piattaforme integrate, ma come strumenti di composizione. Consentono di costruire esplicitamente ciò che nel cloud viene spesso incapsulato: orchestrazione dei flussi, integrazione con strumenti esterni, meccanismi di retrieval e gestione del contesto.

    Il modello, ancora una volta, resta lo stesso.
    Cambia il modo in cui viene reso disponibile.

    Nel cloud è integrato.
    Nel mondo open è costruito.

    Framework integrati ed ecosistemi

    Accanto ai framework open, stanno emergendo soluzioni più integrate, spesso promosse dagli hyperscaler.

    Un esempio è rappresentato da Microsoft Agent Framework, che introduce un livello di orchestrazione più strutturato e profondamente integrato con l’ecosistema Microsoft.

    Questi strumenti non si contrappongono ai framework open source. Si collocano su un piano diverso. Rendono il modello più immediatamente utilizzabile, integrandolo con servizi, identità e strumenti già presenti nelle organizzazioni.

    Anche in questo caso, il modello non cambia.
    Cambia il livello di astrazione.

    Linguaggi ed ecosistemi di sviluppo

    In questo scenario, anche il linguaggio utilizzato assume un ruolo rilevante.

    Ecosistemi come Python continuano a dominare nella sperimentazione e nella prototipazione, grazie alla disponibilità di librerie mature e alla velocità di sviluppo.

    Ambienti come .NET e Java risultano invece più naturali in contesti enterprise, dove l’integrazione con sistemi esistenti e i requisiti normativi sono già consolidati.

    La scelta del linguaggio non è quindi solo tecnica.
    Influenza direttamente il modo in cui il modello viene implementato, integrato e governato.

    Interoperabilità e apertura

    Questo livello crescente di integrazione non implica necessariamente chiusura. Al contrario, sta emergendo una crescente attenzione verso modelli di interoperabilità.

    Protocolli come Model Context Protocol e pattern emergenti di comunicazione tra agenti rendono possibile costruire sistemi in cui modelli, strumenti e componenti non appartengono a un unico ecosistema.

    Non si tratta più di piattaforme chiuse.
    Si tratta di ecosistemi che cercano un equilibrio tra integrazione e apertura.

    Perché nasce l’ibrido

    A questo punto entra in gioco un elemento già emerso nel primo atto: l’efficienza.

    L’utilizzo esclusivo di modelli di grandi dimensioni, orchestrati in cloud, non è sempre sostenibile. Non lo è in termini di costi, latenza, controllo e prevedibilità operativa.

    Per questo motivo iniziano a emergere architetture ibride. Architetture in cui modelli più leggeri gestiscono task specifici, componenti locali riducono il carico e il cloud viene utilizzato in modo selettivo.

    Non si tratta di sostituire il cloud.
    Si tratta di usarlo in modo più mirato.

    Hardware locale: il ritorno del calcolo vicino al dato

    Questo scenario riporta al centro anche il tema dell’hardware.

    L’evoluzione delle GPU e dei sistemi compatti ha reso possibile portare capacità di calcolo significative anche in ambienti locali. Workstation dotate di GPU NVIDIA, desktop AI-ready e micro-pc ad alte prestazioni consentono oggi di eseguire modelli direttamente vicino al dato.

    Queste soluzioni si affiancano a infrastrutture più strutturate, come centri HPC o piattaforme dedicate come Intacture.

    Ne emerge un continuum architetturale:

    LivelloRuolo principale
    Edge / Micro PCLatenza minima, task locali
    Workstation GPUElaborazioni complesse on-site
    HPC / infrastruttureCarichi intensivi controllati
    Cloud hyperscalerScalabilità e modelli avanzati

    Verso sistemi distribuiti di agenti

    In questo contesto emerge un ulteriore passo evolutivo.

    I sistemi agentici non sono più componenti isolati, ma pool distribuiti di capacità. Agenti diversi possono operare su cloud pubblici, ambienti multi-cloud, sistemi locali o infrastrutture dedicate, coordinati da logiche di orchestrazione.

    Questo permette di costruire architetture in cui ogni componente viene scelto in funzione del contesto, dei vincoli normativi e degli obiettivi di efficienza.

    Non è più una questione di scegliere una piattaforma.
    È una questione di orchestrare un ecosistema.

    Il ruolo del sistema operativo

    In questo scenario, il sistema operativo torna a essere un elemento architetturale rilevante.

    Se nel paradigma cloud il sistema operativo è stato progressivamente astratto, nei contesti locali e ibridi riemerge come layer di controllo e integrazione.

    Distribuzioni Linux rappresentano oggi lo standard de facto per ambienti AI-ready. Offrono flessibilità, controllo sulle risorse hardware e integrazione nativa con container e runtime moderni.

    Il sistema operativo non è più solo un ambiente di esecuzione. Diventa il punto di convergenza tra:

    • hardware (GPU, CPU, acceleratori)
    • runtime (container, orchestratori)
    • framework applicativi
    • tool di sviluppo e osservabilità

    In un’architettura distribuita, il sistema operativo definisce il perimetro operativo entro cui questi elementi possono cooperare.

    Matrice di convergenza atto I

    Nel primo atto abbiamo introdotto una matrice di convergenza. Nel contesto distribuito, questa matrice si estende oltre il cloud e consente di mappare anche framework open e soluzioni locali.

    Possiamo rileggerla attraverso quattro dimensioni principali:

    DimensioneDescrizione
    ModelloCapacità di eseguire e gestire modelli AI
    OrchestrazioneGestione dei flussi, degli agenti e delle interazioni
    IntegrazioneConnessione con dati, API e strumenti esterni
    RuntimeAmbiente di esecuzione (cloud, container, locale)

    Matrice di convergenza dei framework

    Applicando questa matrice ai principali framework e strumenti, emerge chiaramente il loro posizionamento.

    Strumento / FrameworkModelloOrchestrazioneIntegrazioneRuntime
    LangChainMedioMedioAltoLocale/Cloud
    LangGraphMedioAltoMedioLocale/Cloud
    AutoGenMedioAltoMedioLocale/Cloud
    Microsoft Agent FrameworkAltoAltoAltoCloud/Hybrid

    Questa lettura evidenzia un aspetto chiave: nessuno di questi strumenti copre completamente tutte le dimensioni in modo uniforme.

    La differenza non è nel modello, ma nel livello di astrazione e integrazione.

    Il livello runtime: dal container al sistema distribuito

    Il runtime rappresenta il punto di contatto tra astrazione e realtà operativa.

    Nei contesti moderni, questo livello è spesso basato su container e orchestratori come Kubernetes.

    Il runtime consente di:

    • distribuire componenti su ambienti diversi
    • isolare carichi di lavoro
    • scalare dinamicamente
    • gestire resilienza e fault tolerance

    In un ecosistema distribuito, il runtime diventa il tessuto connettivo tra cloud e ambienti locali.

    Soluzioni locali ed enterprise

    Il concetto di “locale” non si limita più al singolo dispositivo. Include un ampio spettro di soluzioni, che vanno dal micro-pc fino alle infrastrutture enterprise.

    Possiamo sintetizzarle nel seguente schema:

    TipologiaEsempi concretiRuolo principale
    Edge / Micro PCNUC, Raspberry PiElaborazione vicino al dato
    Workstation AIPC con GPU NVIDIASviluppo e inferenza avanzata
    Server on-premCluster aziendaliControllo e compliance
    HPC / infrastruttureIntactureCarichi intensivi e simulazioni
    Private cloudKubernetes on-premScalabilità interna controllata

    Queste soluzioni non sostituiscono il cloud. Lo completano.

    Permettono di distribuire i carichi in funzione di:

    • latenza
    • costi
    • requisiti normativi
    • sensibilità del dato

    Modelli specializzati e orchestrazione adattiva

    Nel contesto delle architetture ibride, emerge una necessità sempre più evidente: non tutti i modelli devono fare tutto.

    L’utilizzo di modelli generalisti, spesso di grandi dimensioni e tipicamente eseguiti in cloud, rappresenta una soluzione potente ma non sempre efficiente. In molti scenari, è possibile ottenere risultati migliori — in termini di latenza, costi e controllo — attraverso l’adozione di modelli specializzati, progettati per rispondere a esigenze specifiche.

    Questi modelli possono essere ottimizzati per task ben definiti: classificazione, estrazione di informazioni, analisi semantica mirata o inferenza su dataset circoscritti. La loro dimensione ridotta e la maggiore prevedibilità li rendono particolarmente adatti all’esecuzione in ambienti locali o on-premise.

    In questo scenario, il valore non risiede nel singolo modello, ma nella capacità di orchestrare dinamicamente più modelli, ciascuno attivato in funzione del contesto.

    Framework come LangChain , LangGraph e Microsoft Agent Framework permettono di costruire workflow in cui:

    • modelli locali gestiscono le operazioni più frequenti e a bassa complessità
    • modelli specializzati intervengono su task mirati
    • modelli avanzati in cloud vengono attivati solo quando necessario

    In particolare, mentre LangChain e LangGraph offrono maggiore flessibilità compositiva, Microsoft Agent Framework introduce un livello più strutturato e integrato, particolarmente adatto a contesti enterprise dove identità, sicurezza e integrazione con servizi esistenti giocano un ruolo centrale.

    Questo approccio consente di introdurre una logica di orchestrazione adattiva, in cui il sistema decide dinamicamente dove e come eseguire ogni componente.

    Il risultato è un utilizzo più efficiente delle risorse disponibili:

    Tipo di modelloPosizionamento tipicoRuolo principale
    Modelli leggeriLocale / edgeTask frequenti, bassa latenza
    Modelli specializzatiLocale / on-premFunzioni mirate e ottimizzate
    Modelli generalistiCloudTask complessi, ragionamento avanzato

    In questo contesto, il cloud non scompare.
    Diventa una risorsa strategica, da attivare in modo selettivo.

    L’architettura non è più definita da un’unica scelta tecnologica, ma da una strategia di utilizzo consapevole delle capacità disponibili.

    È qui che il concetto di ecosistema distribuito trova la sua piena espressione: non come somma di componenti, ma come sistema orchestrato in grado di adattarsi al contesto operativo.

    Esempi di modelli specializzati in architetture ibride

    Per comprendere davvero il valore delle architetture ibride, è utile osservare come diversi tipi di modelli possano essere impiegati in modo complementare.

    Non esiste un modello unico ottimale per tutti gli scenari. Esistono invece combinazioni efficaci, costruite in funzione del contesto operativo.

    Modelli locali per task specifici

    In ambienti locali o on-premise, trovano spazio modelli più leggeri e specializzati, progettati per operare con risorse limitate e garantire tempi di risposta ridotti.

    Modelli come Llama 3 (nelle sue varianti più compatte) o Mistral 7B rappresentano esempi concreti. Possono essere eseguiti su workstation dotate di GPU o anche su infrastrutture più contenute, mantenendo buone capacità di inferenza.

    Questi modelli sono particolarmente adatti per:

    • classificazione di documenti
    • estrazione di entità
    • generazione controllata di contenuti
    • assistenza interna su dataset aziendali

    Il loro valore risiede nella prevedibilità e nel controllo.

    Modelli specializzati per funzioni mirate

    Accanto ai modelli generalisti compatti, esistono modelli progettati per task specifici.

    Ad esempio:

    • Sentence-BERT per la generazione di embedding e la similarità semantica
    • Whisper per la trascrizione audio
    • YOLO per il riconoscimento visivo

    Questi modelli possono essere integrati direttamente nei workflow locali, riducendo la necessità di inviare dati verso il cloud.

    Sono fondamentali quando:

    • la latenza è critica
    • i dati sono sensibili
    • il task è ben definito

    Modelli avanzati in cloud per capacità estese

    Per task più complessi, che richiedono capacità di ragionamento avanzato o conoscenza generalista, entrano in gioco modelli eseguiti in cloud.

    Modelli come GPT-4 o Claude rappresentano esempi di riferimento.

    Questi modelli vengono tipicamente utilizzati per:

    • generazione complessa di contenuti
    • analisi articolate
    • supporto decisionale
    • orchestrazione logica di task multipli

    In un’architettura ibrida, il loro utilizzo è intenzionalmente selettivo.

    Un esempio di orchestrazione ibrida

    Per rendere più concreto il modello, consideriamo un flusso tipico.

    FaseModello utilizzatoPosizionamento
    Ingestione documentoMistral 7BLocale
    Estrazione embeddingSentence-BERTLocale
    Ricerca semanticaMotore localeLocale
    Generazione rispostaGPT-4Cloud
    Post-processingModello leggero localeLocale

    In questo scenario:

    • il cloud interviene solo nel momento di maggiore valore
    • il carico operativo resta distribuito
    • i dati sensibili possono essere gestiti localmente

    Verso una strategia di selezione dei modelli

    Questi esempi evidenziano un principio chiave: la progettazione non parte dal modello, ma dal contesto.

    La scelta deve considerare:

    FattoreImpatto sulla scelta del modello
    LatenzaFavorisce modelli locali
    CostiRiduce uso continuo del cloud
    Sensibilità datiSpinge verso esecuzione on-prem
    Complessità taskRichiede modelli avanzati
    ScalabilitàFavorisce integrazione con cloud

    L’architettura ibrida nasce esattamente da questo bilanciamento.

    Non esiste un “modello migliore”.
    Esiste una combinazione ottimale di modelli, orchestrata in funzione del contesto.
    È questo passaggio che trasforma un insieme di strumenti in un ecosistema distribuito.


    Atto II – Chiusura

    Nel corso di questo atto abbiamo progressivamente spostato il punto di osservazione.

    Dal cloud come centro della convergenza, siamo passati a un ecosistema più ampio, in cui modelli, framework, runtime e infrastrutture cooperano su più livelli. Abbiamo visto come gli stessi pattern emergano anche al di fuori delle piattaforme integrate, prendendo forma attraverso strumenti di composizione, architetture ibride e sistemi distribuiti.

    Abbiamo osservato il ritorno del sistema operativo come layer abilitante, la centralità del runtime come tessuto connettivo e il ruolo sempre più rilevante di modelli specializzati, orchestrati in funzione del contesto. Il cloud non scompare, ma viene ricollocato: da piattaforma dominante a risorsa strategica.

    Ne emerge un cambio di paradigma.

    Non si tratta più di progettare applicazioni su una piattaforma.
    Si tratta di orchestrare ecosistemi distribuiti, in cui ogni componente può risiedere in un punto diverso del continuum architetturale.

    Ed è proprio qui che la complessità raggiunge il suo livello più alto.

    Perché se la tecnologia ha trovato una forma di convergenza, la governance non è ancora definita con la stessa chiarezza.

    Come si gestiscono identità e accessi in un sistema distribuito tra cloud, on-premise ed edge?
    Come si garantiscono sicurezza, compliance e osservabilità quando i modelli operano su livelli diversi?
    Come si controllano costi, prestazioni e comportamento di un sistema che si adatta dinamicamente?

    La domanda, a questo punto, non è più tecnologica.

    È organizzativa. È architetturale. È strategica.

    È la domanda che apre il prossimo atto:

    Come si governa un ecosistema distribuito?


  • Ouverture sul Quarto Cerchio – Atto I – Convergenza

    Ouverture sul Quarto Cerchio – Atto I – Convergenza

    Negli ultimi mesi, il concetto di Agentic AI è emerso come uno dei temi centrali nell’evoluzione dei sistemi informativi. Ma al di là dell’hype, ciò che sta realmente prendendo forma è una convergenza strutturale tra piattaforme cloud, framework open e architetture distribuite.

    Questo articolo propone una lettura in tre atti: prima osservando la convergenza dei modelli nelle piattaforme hyperscaler, poi esplorando scenari ibridi e distribuiti orientati all’efficienza, e infine riportando il tutto nel contesto enterprise, dove entrano in gioco vincoli di governance, sicurezza e conformità.

    Il risultato è una prospettiva unitaria in cui gli agenti non sono più semplici componenti applicativi, ma elementi infrastrutturali, da progettare e governare attraverso pattern architetturali come Zero Trust, Self-Contained Systems ed Event-Driven Architecture, supportati da pratiche CI/CD e Infrastructure as Code.


    Ouverture sul Quarto cerchio – Atto I – Convergenza

    Negli articoli precedenti sul Quarto Cerchio abbiamo osservato come l’AI stia progressivamente smettendo di essere uno strumento per diventare una dimensione strutturale dell’ecosistema aziendale.

    Un ecosistema che comprende software, piattaforme, dati, ma anche processi, persone e modelli operativi.

    L’Interludio ci ha portato a fermarci un momento, a osservare il contesto, a prendere distanza dal rumore.

    Ora è tempo di riprendere il tema.

    Questa Ouverture nasce da una domanda che negli ultimi mesi è diventata inevitabile:
    che cosa sta realmente emergendo sotto il termine “Agentic AI”?

    Non come hype o come funzionalità di prodotto, ma come possibile nuova baseline tecnologica.

    C’è però un aspetto che cambia radicalmente il modo in cui questo tema va affrontato.

    Se osserviamo gli agenti dal punto di vista di un appassionato o di un contesto sperimentale, le opzioni disponibili sembrano quasi illimitate.

    Ma in un ecosistema aziendale — soprattutto in ambiti regolati — la realtà è diversa.

    Normative come NIS2, DORA e framework emergenti come ISO/IEC 42001 introducono vincoli concreti su:

    • gestione del dato
    • tracciabilità
    • localizzazione
    • auditabilità

    In questo contesto, la domanda non è più “cosa è possibile fare”, ma: quali opzioni restano realmente praticabili.

    Allo stesso tempo, sta emergendo un secondo fattore, meno visibile ma altrettanto rilevante: l’efficienza.

    L’utilizzo intensivo di modelli di grandi dimensioni non è sempre sostenibile — né economicamente né operativamente — soprattutto quando gli agenti entrano in cicli iterativi o in scenari ad alta frequenza di invocazione.

    Per questo motivo, iniziano a diffondersi approcci che affiancano ai modelli enterprise:

    • modelli più leggeri, specializzati e a basso consumo di token
    • esecuzioni distribuite tra cloud e ambienti locali
    • logiche di orchestrazione ibride, in cui il modello “giusto” viene scelto in funzione del contesto

    A questo punto è utile chiarire una scelta di campo.

    In questa analisi prenderemo come riferimento principale le piattaforme cloud.

    Non perché rappresentino l’unica opzione possibile, ma per alcuni motivi molto concreti:

    • una conoscenza diretta e consolidata di questi ambienti
    • il fatto che rappresentano oggi la più ampia capacità di calcolo distribuito disponibile a livello globale
    • la presenza di framework e riferimenti consolidati per la conformità normativa su scala nazionale ed europea

    Gli hyperscaler non sono solo fornitori di servizi, ma i principali punti di convergenza dove innovazione, scalabilità, integrazione e compliance vengono portate rapidamente a maturità.

    Questo non esclude — anzi, rende ancora più interessante — la valutazione di scenari ibridi, in cui capacità computazionale e servizi possono essere distribuiti tra cloud pubblici e piattaforme dedicate.

    Un esempio concreto, nel contesto italiano, è rappresentato da Intacture, piattaforma ad alta intensità computazionale sviluppata nell’ambito dell’iniziativa Trentino DataMine, fortemente voluta e supportata dal gruppo Dedagroup, che offre servizi avanzati, inclusi quelli legati alla GenAI.

    Non si tratta quindi di scegliere tra cloud o alternative locali.
    Si tratta di comprendere come queste opzioni possano coesistere in architetture ibride.

    Per questo motivo, partiremo da ciò che viene proposto dai grandi player in ambito AI agentico, per poi osservare come queste capability possano essere estese, integrate o ribilanciate in contesti più articolati.

    We can divide this history into distinct periods:

    Opera in tre atti

    Per provare a mettere ordine in questo scenario, questa Ouverture è articolata in tre atti, ciascuno osservato da una prospettiva diversa ma complementare.

    Nel primo atto analizzeremo la convergenza che sta emergendo nelle principali piattaforme cloud, osservando come gli hyperscaler stiano costruendo, con approcci differenti, una base tecnologica sorprendentemente simile per lo sviluppo di sistemi agentici.

    Nel secondo atto faremo un passo laterale, uscendo dal perimetro del cloud per osservare gli stessi pattern nel mondo dei framework open source e degli ambienti locali, dove le stesse capability emergono in forma più esplicita, meno astratta e spesso più flessibile.

    Infine, nel terzo atto, riporteremo queste osservazioni nel contesto enterprise, per comprendere come questa convergenza venga filtrata, vincolata e resa operativa attraverso architetture, processi e modelli di governance.

    La scelta di rappresentare questo percorso in tre atti non è casuale.

    È un modo per rendere leggibile un fenomeno che, osservato nel suo insieme, rischia di apparire frammentato:
    partire dall’offerta delle piattaforme, attraversare le alternative più flessibili e arrivare infine al punto in cui tutto questo deve essere governato.

    L’obiettivo non è confrontare tecnologie, ma leggere un fenomeno:
    capire se stiamo osservando una semplice evoluzione di strumenti o l’emergere di una nuova base infrastrutturale.

    🎼 Atto I – La matrice di convergenza

    Partendo da questo contesto, abbiamo provato a osservare direttamente cosa stanno proponendo le principali piattaforme cloud in ambito agentico.

    Non attraverso confronti teorici, ma guardando ai servizi reali messi a disposizione dai principali hyperscaler: Amazon Web Services, Microsoft Azure, Google Cloud e Oracle Cloud Infrastructure.

    L’analisi, almeno inizialmente, non è lineare.

    Ogni piattaforma utilizza un proprio linguaggio, propone livelli di astrazione differenti e integra queste capability in modo profondamente legato al proprio ecosistema.

    In alcuni casi si parla esplicitamente di agenti, in altri di estensioni, workflow o servizi intelligenti. Anche l’integrazione con dati e sistemi esterni viene raccontata con terminologie diverse, spesso difficili da confrontare direttamente.

    A prima vista, il panorama appare frammentato.

    Uno sguardo ai servizi

    Se però entriamo nel dettaglio, iniziano a emergere elementi interessanti. Su Amazon Web Services, servizi come Agents for Bedrock si presentano come un layer capace di orchestrare modelli, integrare basi di conoscenza e invocare servizi esterni, mantenendo uno stretto legame con l’ecosistema AWS.

    Nel caso di Microsoft Azure, le capability agentiche si distribuiscono tra Azure AI Agent Service e l’intero stack Copilot, con una forte integrazione con identità, strumenti di sviluppo e piattaforme di produttività già presenti in azienda.

    Su Google Cloud, soluzioni come Vertex AI Agents ed Extensions propongono un modello più aperto, orientato all’interoperabilità con framework esterni e alla composizione di capacità distribuite.

    Infine, Oracle Cloud Infrastructure esplicita in modo molto diretto le componenti agentiche, introducendo servizi in cui tool, dati e orchestrazione diventano primitive dichiarate della piattaforma.

    Dal catalogo dei servizi al modello

    A questo punto, qualcosa cambia.

    Al di là dei nomi e delle differenze di presentazione, osservando questi servizi in modo trasversale emerge un pattern ricorrente.

    Le stesse capability riappaiono, con forme diverse ma con responsabilità sorprendentemente simili.

     Ciò che inizialmente sembrava frammentazione inizia a rivelare una struttura.

    È proprio da questa osservazione che emerge la matrice di convergenza.

    I blocchi che si ripetono

    Analizzando le diverse piattaforme, è possibile identificare alcuni elementi fondamentali che si ripresentano sistematicamente.

    Un primo blocco è rappresentato da un runtime agentico, ovvero un componente capace di orchestrare sequenze di azioni, mantenere stato e coordinare l’interazione tra modello, strumenti e dati.

    Accanto a questo, emerge la presenza di meccanismi di tool calling, che permettono all’agente di invocare sistemi esterni — API, servizi applicativi, funzioni — in modo strutturato e controllato.

    Un terzo elemento ricorrente è rappresentato dai pattern di RAG (Retrieval-Augmented Generation), che collegano il modello a basi di conoscenza, rendendo possibile un grounding contestuale delle risposte e delle azioni.

    Infine, tutte le piattaforme si appoggiano a un data backbone ibrido, che combina dati strutturati e rappresentazioni vettoriali, spesso distribuiti su più livelli di storage.

    A questo punto emerge una prima conclusione chiave:

    • L’agente non è un chatbot avanzato.
    • È un runtime di coordinamento tra modello, strumenti e dati.

    La matrice di convergenza

    Questi elementi possono essere sintetizzati in una matrice che rende esplicita la convergenza osservata:

    La matrice di convergenza

    Questi elementi possono essere sintetizzati in una matrice che rende esplicita la convergenza osservata:

    BloccoAmazon Web ServicesMicrosoft AzureGoogle CloudOracle Cloud Infrastructure
    Agent runtimeAgents for BedrockAzure AI Agent Service / CopilotVertex AI AgentsOCI Generative AI Agents
    Tool callingLambda, API GatewayAzure Functions, Logic AppsCloud Functions, ExtensionsOCI Functions
    RAG / groundingKnowledge Bases for BedrockAzure AI SearchVertex AI Search / RAG EngineOCI Search
    Data backboneS3, DynamoDB, Vector DBData Lake, Cosmos DB, Vector SearchBigQuery, Vector SearchAutonomous DB, Vector

    Questa rappresentazione semplifica un punto fondamentale.

    Non stiamo osservando funzionalità isolate, ma un modello che si ripete.

    Un modello che emerge indipendentemente dal vendor e che tende a stabilizzarsi.

    Una lettura architetturale

    Se rileggiamo questa matrice in chiave architetturale, emerge una separazione molto netta delle responsabilità:

    • il runtime governa il flusso
    • i tool estendono le capacità operative
    • il retrieval collega il sistema al contesto informativo
    • il backbone dati garantisce consistenza e persistenza

    Emerge quindi una struttura convergente, replicabile, scalabile, governabile in contesti enterprise ed in qualche modo indipendente almeno concettualmente dalla proposta dell’hyperscaler specifico, se ben organizzata a livello architetturale

    La divergenza nella gestione della compliance

    Se la struttura tecnica tende a convergere, il tema della compliance introduce un ulteriore livello di differenziazione, meno visibile ma estremamente rilevante in contesti enterprise.

    Le normative di riferimento restano le stesse — come NIS2, DORA o gli standard emergenti come ISO/IEC 42001 — ma il modo in cui queste vengono supportate varia sensibilmente tra le piattaforme.

    In alcuni casi, i meccanismi di controllo sono profondamente integrati nei servizi: identità, autorizzazioni, logging e tracciabilità diventano parte naturale del funzionamento dei sistemi agentici. Questo rende più immediata l’adozione in contesti regolati, perché molti requisiti sono già incorporati nella piattaforma.

    In altri scenari, invece, la piattaforma mantiene un approccio più neutro e flessibile. Le stesse capability sono disponibili, ma richiedono una composizione esplicita: è l’architettura a dover costruire il livello di governance necessario, definendo regole, controlli e processi.

    Questo introduce una differenza sottile ma fondamentale.

    Non cambia la possibilità di essere compliant, ma cambia il punto in cui la responsabilità viene esercitata.

    In un caso è prevalentemente incorporata nella piattaforma.
    Nell’altro è distribuita tra architettura, processi e team.

    E questo ha un impatto diretto non solo sulla progettazione, ma anche sulla gestione operativa, sull’audit e sulla sostenibilità nel tempo delle soluzioni adottate.

    Una scelta che resta contestuale

    A questo punto, la domanda naturale non è quale piattaforma scegliere in assoluto, ma quale approfondire in relazione al contesto specifico in cui ci si muove.

    Le differenze che emergono — in termini di integrazione, apertura, gestione della compliance e modelli operativi — non definiscono una gerarchia, ma delineano scenari di adozione differenti.

    In alcuni casi, può essere naturale orientarsi verso piattaforme che offrono un elevato livello di integrazione e una maggiore aderenza ai requisiti enterprise già a livello di servizio.

    In altri, può risultare più efficace approfondire soluzioni che privilegiano flessibilità e composizione, soprattutto quando l’obiettivo è costruire architetture ibride o mantenere un maggiore controllo sui singoli componenti.

    Per questo motivo, più che cercare una scelta definitiva, ha senso affrontare il tema con un approccio progressivo:
    analizzare le proposte dei singoli hyperscaler, comprenderne i modelli operativi e valutare come questi si inseriscono nel proprio contesto architetturale, normativo e organizzativo.

    • Non esiste una piattaforma “giusta” in senso assoluto.
    • Esiste una piattaforma più coerente rispetto al problema che si sta cercando di risolvere.

    Ma questa convergenza, così evidente nel cloud, è davvero limitata a questo perimetro?

    Nel secondo atto proveremo ad allargare lo sguardo, esplorando scenari in cui queste stesse logiche vengono applicate al di fuori delle piattaforme hyperscaler.

    In particolare, analizzeremo come sia possibile costruire architetture che mantengano i requisiti normativi e di governance richiesti in ambito enterprise, introducendo al tempo stesso elementi di ottimizzazione, differenziazione e controllo.

    Scenari in cui modelli più leggeri, componenti specializzati e modalità di esecuzione locali o ibride iniziano a giocare un ruolo sempre più rilevante.

    Non come alternativa al cloud, ma come estensione naturale del modello che abbiamo appena osservato.