Slide background
NEWS

Sperimentazione in silico: brevettabilità di composti e procedimenti


I procedimenti computerizzati alla base delle moderne soluzioni di intelligenza artificiale si stanno diffondendo in maniera capillare, trovando impiego in un crescente numero di ambiti applicativi. Ad esempio, qualche giorno fa una rivista scientifica internazionale di primo livello ha pubblicato uno studio[1] sull’uso di reti neurali artificiali per generare, in via numerica, strutture di proteine plausibilmente aventi determinate proprietà: una volta riprodotte in laboratorio, tali proteine hanno poi effettivamente mostrato le proprietà precedentemente previste solo in via numerica. Questo tipo di applicazioni rientrano nell’ambito della così detta “sperimentazione in silico”, espressione coniata per indicare fenomeni di natura chimico-biologica riprodotti in una simulazione eseguita al computer, invece che “in vitro” (ossia in provetta) o “in vivo” (ossia su di un essere vivente). L’espressione “in silico” richiama il silicio impiegato nei circuiti integrati.

 

  news 2023 02
Per l’immagine si ringraziano la piattaforma web Pexels e l’utente Tara Winstead
 

 

I. Cos’è la sperimentazione in silico?

Le sperimentazioni in silico riscuotono successo in quanto sono in grado di fornire, in tempi rapidi, stime di quelle che possono essere le interazioni di nuove sostanze con il corpo umano e con agenti patogeni. Per fare questo sfruttano modelli computerizzati di una sorta di “funzione di trasferimento” del corpo umano (o parti di esso, come ad esempio una cellula) a fronte di stimoli di un certo tipo. Tale funzione di trasferimento, piuttosto che espressa in termini analitici, è basata su raccolte di dati clinici utilizzati per addestrare complesse reti neurali a riprodurre le risposte attese da stimoli noti. Una volta configurata la rete neurale a replicare fenomeni conosciuti, la rete viene considerata ragionevolmente “affidabile” nel prevedere o indovinare quelle che sarebbero le risposte (precedentemente sconosciute) a stimoli ignoti.

I principali vantaggi di uno screening molecolare in silico rispetto ad uno screening sperimentale sono la possibilità di sfruttare la velocità e l'economicità di tale approccio: il numero di molecole su cui indagare può essere esteso a migliaia di omologhi senza sintetizzarli in laboratorio per misurarne le caratteristiche. D’altra parte, le simulazioni di fenomeni complessi come quelli che coinvolgono macromolecole biologiche implicano delle semplificazioni dovute alla limitatezza della potenza di calcolo, per cui può essere difficile garantire la riproducibilità effettiva dei risultati della sperimentazione in silico.

II. Brevettabilità di composti sperimentati in silico

Dunque, i composti testati in sperimentazioni numeriche in silico soddisfano i requisiti di brevettabilità, ed in particolare quello della sufficienza di descrizione?

Il soddisfacimento del requisito della sufficienza di descrizione è normato all’art. 83 della Convenzione sul Brevetto Europeo (CBE) e afferma che un’invenzione debba essere divulgata in maniera chiara e completa, tale da consentire alla persona esperta nel ramo di riprodurla. Ciò corrisponde in larga parte con il requisito dell’art. 51 del Codice di Proprietà Industriale italiano, che recita:

“L'invenzione deve essere descritta in modo sufficientemente chiaro e completo perché ogni persona esperta del ramo possa attuarla […]”

Per le sperimentazioni in silico, sebbene i meccanismi di aggregazione tra una proteina bersaglio e un composto candidato possono essere previsti da simulazioni che coinvolgano calcoli di dinamica molecolare, esiste il rischio che l’Ufficio Brevetti consideri bassa l'affidabilità di tali previsioni per la concessione di un brevetto, a causa della mancanza di dati sperimentali a supporto. Tra l’altro, al fine di proteggere l’impiego di un composto o di una composizione nel trattamento di una specifica patologia, il requisito della sufficienza di descrizione è considerato soddisfatto se la descrizione della domanda di brevetto o la conoscenza generale comune consentono alla persona esperta del settore di ottenere il composto o la composizione da impiegare e se ci sono prove che l'effetto terapeutico desiderato possa essere raggiunto.

Una domanda di brevetto in cui si presentino dati relativi solo a sperimentazioni in silico potrebbe, di conseguenza, non risultare tale da rispettare il requisito di sufficienza di descrizione nella misura in cui essa non contenga l’evidenza sperimentale in vivo o per lo meno in vitro dell’efficacia dei composti candidati. 

Un ulteriore tema che potrebbe porsi è legato al riconoscimento dell’Inventore. Consideriamo la situazione in cui un computer suggerisca uno specifico composto candidato quale farmaco e supponiamo che vi siano sufficienti dati sperimentali a supporto dell’efficacia del composto per il deposito di una domanda di brevetto: chi dovrebbe essere riconosciuto inventore? Il data scientist che predispone un algoritmo di intelligenza artificiale per il deep learning si propone di sviluppare un programma efficiente ma non sa quali farmaci verranno suggeriti in risposta a una specifica richiesta. Il tecnico di laboratorio esegue test sperimentali con l'obiettivo di provare oppure confutare i risultati restituiti dall’algoritmo di intelligenza artificiale. Nessuna delle due parti - nonostante il ruolo giocato nell'identificazione e nell'analisi di laboratorio di specifici candidati farmaci – potrebbe essere riconosciuto inventore; ciò in quanto l'innovazione potrebbe al più risiedere nella definizione delle "regole" iniziali e nell’identificazione degli insiemi di dati da utilizzare, ad esempio forniti da un farmacologo, da parte della piattaforma di intelligenza artificiale. Si potrebbe quindi riconoscere nel farmacologo l’inventore in quanto la piattaforma di intelligenza artificiale si limita a sviluppare dati in silico affidabili seppur riducendo la quantità di lavoro da dedicare per i test sperimentali in vitro o in vivo.

III. Brevettabilità di procedimenti di sperimentazione in silico basati su intelligenza artificiale

La brevettabilità di procedimenti di simulazione implementati su elaboratori è stata riconosciuta dalla recente decisione (caso G 1/19) della Camera dei Ricorsi allargata dell’Ufficio Brevetti Europeo. Si veda a tal proposito anche l’analisi[2] pubblicata su questo sito il 16 novembre 2021.

Per quanto riguarda le simulazioni computerizzate basate su reti neurali artificiali va prestata particolare cura alla discussione dell’addestramento della rete neurale, che rileva ai fini della valutazione di sufficienza di descrizione e altezza inventiva.

Le reti neurali artificiali comprendono procedimenti computerizzati (noti anche come machine-learning) basati sulla combinazione di vari stadi di elaborazione caratterizzati da almeno due parametri di progettazione: un insieme di valori numerici denominati “pesi”, determinati in una fase di addestramento, e una funzione matematica denominata “funzione di attivazione”, che determina il tipo di elaborazione da applicare ai segnali di ingresso. Nella fase di addestramento, i pesi degli stadi di elaborazione della rete vengono variati iterativamente fino a quando la rete non risulta addestrata a riconoscere dei “dati di addestramento”, cioè segnali la cui classificazione è nota a priori. Successivamente, in una “fase di inferenza”, la rete fornisce previsioni sfruttando i pesi “appresi” durante la fase di addestramento.

Con riferimento al requisito della sufficienza di descrizione, nella decisione T 161/18[3] della Commissione dei Ricorsi dell’Ufficio Europeo dei Brevetti relativa una domanda di brevetto basata su “machine-learning” ha ritenuto insufficientemente descritta l’invenzione in quanto non riportava quali dati di ingresso fossero adatti per addestrare la rete neurale artificiale secondo l’invenzione, o almeno un insieme di dati adatto per risolvere il problema tecnico affrontato.

Per brevettare un procedimento di sperimentazione in silico basato su reti neurali artificiali può dunque essere consigliabile fornire indicazioni sull’insieme di dati utilizzati per l’addestramento della rete, come ad esempio dei campioni dei dati e indicazioni sui meccanismi di addestramento. Indicare in maniera generale che i dati di addestramento coprono un ampio insieme di casistiche potrebbe risultare insufficiente: è preferibile inserire un riferimento ad una versione scaricabile da internet dell’intero database di addestramento, nel caso sia reso disponibile al pubblico, come ad esempio il database di immagini ImageNet[4]. In alternativa, sarebbe opportuno illustrare con almeno un esempio le metodologie per la raccolta dei dati (incluse le dimensioni e la distribuzione dei campioni di dati), così da rendere la persona esperta nel ramo capace di predisporre un insieme di dati di addestramento pertinenti allo scopo.

Nella decisione T 702/20[5] pubblicata a fine gennaio 2023, la Commissione dei Ricorsi dell’Ufficio Europeo dei Brevetti sembra confermare questo approccio non solo per la valutazione della sufficienza di descrizione ma anche per la valutazione dell’attività inventiva: nella decisione si sottolinea come il contributo di una rete neurale artificiale alla risoluzione di un problema tecnico può essere considerato per la valutazione dell’altezza inventiva solo dal momento in cui la rete viene addestrata, con dati di addestramento specifici, a svolgere un compito tecnico specifico.

Giovanna Campogiani e Roberta Cesa

 

[1] Madani, A., Krause, B., Greene, E.R. et al. Large language models generate functional protein sequences across diverse families. Nat Biotechnol (2023). L’articolo è consultabile al seguente link: https://doi.org/10.1038/s41587-022-01618-2.

[2] L’articolo citato è consultabile al seguente link: https://www.bnaturin.com/it/news/la-brevettabilita-delle-invenzioni-software-l-approccio-a-due-ostacoli-dell-ufficio-europeo-dei-brevetti

[3] La decisione T 161/18 è consultabile al seguente link: https://www.epo.org/law-practice/case-law-appeals/pdf/t180116ex1.pdf

[4] Deng, J., Dong, W., Socher, R., Li, L.-J., Li, K., & Fei-Fei, L. (2009). Imagenet: A large-scale hierarchical image database. In 2009 IEEE conference on computer vision and pattern recognition (pp. 248–255). Il database è consultabile al seguente link: https://www.image-net.org/

[5] La decisione T 702/20 è consultabile al seguente link: https://www.epo.org/law-practice/case-law-appeals/pdf/t200702eu1.pdf

Contatti

Corso Vittorio Emanuele II, 6
10123 Torino, Italia

+39 011 8392911

+39 011 8392929