Revista Art-emis
Căutând calculatoare în celula biologică (6) PDF Imprimare Email
Acad. Gheorghe Păun   
Duminică, 14 Decembrie 2014 19:56
Acad. Gheorghe PăunDiscurs de recepţie la Academia Română - 24 octombrie 2014
 
La frontiera dinspre SF
 
Principala promisiune a calculului natural este eficientizarea folosirii calculatorului existent, împingerea frontierei fezabilităţii, furnizarea de soluţii, fie ele şi aproximative, la probleme care nu se pot rezolva prin tehnici tradiţionale. Calculul cu A.D.N. a venit cu un scop mai ambiţios, inedit: furnizarea unui nou tip de hardware, a unor „cipuri biologice”, „cipuri ude”, eficiente nu numai în termeni computaţionali, ci şi în ceea ce priveşte consumul de energie, sau făcând plauzibile caracteristici deosebit de atrăgătoare, cum ar fi autorepararea, adaptarea, învăţarea. Biologia poate sugera şi noi arhitecturi de calcul sau idei de realizare a altor dorinţe ale informaticii, cum ar fi calculul paralel, nesincronizat, controlul proceselor distribuite, calculul reversibil etc. Toate acestea sunt aşteptări oarecum standard, dar există şi altele care trimit spre ştiinţa de mâine, dacă nu direct spre science-fiction. Una dintre direcţii este cea care ţinteşte spre hipercalculabilitate - aşa sunt numite cercetările care vizează „calcularea necalculabilului”, trecerea dincolo de bariera Turing. Domeniul este bine dezvoltat, există vreo duzină şi ceva de idei care conduc la modele de calcul mai puternice decât maşina Turing - iar fizica nu interzice niciuna dintre acestea, ba chiar sugerează idei cu adevărat SF, cum ar fi folosirea unui timp interior modelului care să conţină bucle sau să fie bidimensional. E adevărat, Martin Davis le consideră pe toate trucuri, prin care puterea de calcul se introduce de la început, deghizată, în modelul despre care apoi se arată că trece dincolo de maşina Turing (de exemplu, sub forma unor numere reale, care pot codifica în şirul lor infinit de zecimale toate calculele posibile), dar există unele idei „mai realiste” decât altele.
 
Una este cea a accelerării, o idee discutată de mult, nu numai în informatică: B. Russell (1936), R. Blake (1926), H. Weyl (1927) şi-au imaginat procese care au nevoie de o unitate de timp (măsurată de un ceas exterior) pentru primul pas, de o jumătate de unitate de timp pentru al doilea şi aşa mai departe, la fiecare pas, pe jumătate ca la pasul dinainte. În acest fel, în două unităţi de timp (insist: exterior, măsuraţi de observator) sunt executaţi un număr infinit de paşi. O maşină Turing accelerată astfel poate rezolva problema opririi, deci este mai puternică decât maşinile Turing obişnuite. Să ne amintim acum observaţia că natura creează membrane pentru a realiza reactoare mici, în care reacţiile să fie favorizate, datorită posibilităţilor ridicate de ciocnire a moleculelor. Prin urmare, mai mic înseamnă mai repede. Biochimia dintr-o membrană interioară este mai rapidă decât cea din membrana de deasupra. Să ducem speculaţia până la capăt şi să presupunem că „viaţa” dintr-o membrană este de două ori mai rapidă decât cea din membrana care o conţine. Exact accelerarea de care vorbeam mai devreme. Se poate demonstra că, exact ca la maşina Turing accelerată, un sistem P accelerat poate decide problema opririi[1].
 
Hipercalculabilitatea poate părea doar un exerciţiu matematic, dar se estimează că trecerea dincolo de bariera Turing ar putea avea consecinţe mai importante decât găsirea unei demonstraţii, chiar eficiente, pentru egalitatea P = NP [2]. Să ne apropiem însă de laborator. Am amintit de implementarea unui automat finit, cu funcţionare autonomă. Un automat face analiza sintactică a unor şiruri. Genele sunt şiruri, viruşii sunt şiruri (de nucleotide). O speranţă a medicinii este să vindece boli prin editarea genelor, să elimine viruşii prin identificarea şi apoi tăierea lor în fragmente. O idee mult mai eficientă decât introducerea de medicamente în corp este construirea unei „maşinării” care să recunoască şi să editeze secvenţele dorite de nucleotide, fie ele gene sau viruşi, iar pentru asta e necesar un vector care să ducă editorul de gene la locul potrivit. Identificarea acestui loc poate fi asigurată de un automat, eventual finit, vectorul ca atare poate fi un fel de nano-cărăuş care poate fi construit tot din molecule de A.D.N.. Pe total, un nano-robot multiplicat corespunzător, care să umble din celulă în celulă, vindecând ce este de vindecat. Un preproiect al acestui nano-robot a fost prezentat în 2004, de Y. Benenson, E. Shapiro, B. Gill, U. Ben-Dor, R. Adar („Molecular computer. A ’smart drug’ in a test tube”), la cea de a zecea ediţie a Conferinţei DNA Computing, Milano, Italia. Era în mare măsură aceeaşi echipă care a implementat automatul finit autonom amintit într-o secţiune anterioară.
 
Mai sunt multe lucruri de pus la punct, posibilitatea de a avea corpul scanat încontinuu de un robot reparator de gene nu este deloc aproape. (Un asemenea robot ar putea avea şi sarcini malefice, ar putea fi o armă - se poate deschide aici o discuţie despre etica cercetării, există destule dezbateri de acest gen, inclusiv în bioinformatică. Despre bioetică vorbeşte şi Francis S. Collins, în „Limbajul lui Dumnezeu”, cartea citată mai la început.) Există însă numeroase nano-construcţii din A.D.N., „motoare”, „roboţi” etc., nano-tehnologia pe bază de A.D.N. este spectaculos de dezvoltată[3]. Merită amintită aici şi o observaţie făcută de Jana Horáková şi Jozef Kelemen[4], privind evoluţia calculatoarelor, oarecum în paralel cu evoluţia ideii de robot, de la organic la electromecanic, apoi la electronic şi revenirea plauzibilă la organic.
 
Alte speculaţii? Fără limite, adesea plecând de la fapte cu suport ştiinţific solid. Spre latura extremă, ar putea fi menţionat Frank Tipler, cu controversata sa viaţă eternă, în termeni informaţionali - ceea ce nu este altceva decât viaţă artificială la scara universului[5]. În orice caz, trebuie să fim conştienţi că mai toate acestea sunt planuri pentru mâine, dar formulate în limbajul de ieri, pentru a relua o spusă a lui Antoine de Saint-Exupéry. Progresele în bioinginerie ar putea să aducă surprize pe care nu ni le putem imagina acum.
 
Nu cumva sperăm prea mult?
 
Să coborâm însă cu picioarele pe pământ, la calculul natural aşa cum îl avem astăzi şi aşa cum este plauzibil să-l avem în viitorul apropiat, adoptând o poziţie lucidă, dacă nu chiar sceptică, contrară entuziasmului din secţiunea anterioară şi entuziasmului multor autori. (Nu mă refer şi la jurnalişti, care folosesc prea des cuvinte mari atunci când este vorba despre bioinformatică.) Pentru a promova o ramură ştiinţifică tânără, entuziasmul este de înţeles şi este util - dar calculul natural nu mai este deloc tânăr. Să opunem, deci, optimismului de până acum, o poziţie mai realistă, pornind de la diferenţele, numeroase şi semnificative, între informatică şi biologie, de la dificultăţile de a implementa bio-idei în informatică şi calcule în celule: scopul vieţii este viaţa, nu calculul, noi, informaticienii, vedem calcule pretutindeni şi încercăm să le folosim pentru noi; într-un anume sens, viaţa are timp şi resurse nelimitate, îşi permite să experimenteze repetat, să renunţe la rezultatele nepotrivite - toate acestea sunt greu de extins la calculatoare, fie ele şi bazate pe biomolecule. La fel, viaţa are un mare grad de redundanţă, de nedeterminism. Apoi, procesele biologice au un grad mare de complexitate, mai mult, par a folosi mai ales matematica aproximărilor, probabilităţi, mulţimi vagi, care sunt mai greu de prins într-un model de calcul, cu atât mai greu de implementat.
 
Şi mai important: poate că visăm prea mult şi la nivel teoretic. În primul rând, tranzacţionarea spaţiu-timp nu poate redefini clasele de complexitate, cel mult măreşte spaţiul fezabilităţii (a se revedea remarca lui Hartmanis cu privire la experimentul lui Adleman). Există, apoi, o teoremă a lui Michael Conrad („The price of programmability”[6] care ne spune că trei caracteristici dorite ale unui calculator, programabilitatea (universalitatea), eficienţa şi evolvabilitatea (capacitatea de adaptare şi învăţare), sunt contradictorii, nu există un calculator care să le posede pe toate trei în acelaşi timp. Putem interpreta acest rezultat ca o no free lunch theorem generală pentru calculul natural. O teoremă similară de limitare a „ceea ce se poate face în principiu” este teorema lui Robin Gandy, doctorand şi colaborator al lui Turing, care îi oferă argumente matematice generale lui Martin Davis: hipercalculabilitatea este un lucru extrem de dificil de obţinut[7]. Gandy a dorit să elibereze teza Turing-Church de orice tentă antropică (în înţelegerea lui Turing, teza spunea că „tot ce poate fi calculat de o fiinţă umană abstractă care lucrează algoritmic poate fi calculat de o maşină Turing”) şi, pentru aceasta, a definit o noţiune generală de „maşină”, descrisă de patru proprietăţi formulate matematic, pe care orice „calculator”, fizic sau teoretic, ar trebui să le aibă. El a demonstrat apoi că orice maşină cu aceste patru proprietăţi poate fi simulată de o maşină Turing.
Să trecem de la informatică la aplicaţii în biologie şi să începem tot prin a sublinia că există limitări serioase şi în această privinţă. Sunt chiar convins că, dacă s-ar face liste cu dorinţele pe care le avem de la modele şi simulări (adecvare, acurateţe, eficienţă, inteligibilitate, programabilitate, scalabilitate şi multe altele), vor apărea teoreme de imposibilitate de genul teoremelor lui Arrow, Conrad, Gödel privind modelarea celulei înseşi - spre simularea căreia ne chema M. Tomita.
 
Toate-s vechi şi nouă toate...
 
Şi totuşi, există o preocupare tot mai vizibilă privind modelarea celulei, ba chiar s-a propus o direcţie dedicată de cercetare, biologia sistemică (systems biology), cu numeroase articole programatice apărute în reviste de mare vizibilitate, precum Science şi Nature. Principalul promotor a fost H. Kitano[8], care are în vedere un model general al celulei, care să fie simulat pe calculator şi apoi folosit, în relaţie şi cu alte instrumente informatice şi biologice, până la „transformarea biologiei şi medicinei într-o inginerie precisă”. Scopul este important şi probabil fezabil pe termen mediu-lung, dar insistenţa cu care s-a vorbit despre „systems biology” ca despre o noutate l-a făcut pe Olaf Wolkenhauer să se întrebe încă din titlul articolului său din „Briefings in Bioinformatics”[9] dacă aceasta nu este cumva doar „reîncarnarea aplicării teoriei sistemelor în biologie”. Lucrarea aminteşte eforturile în acest sens din anii 1960, cu dezamăgirile apărute atunci, datorate, printre altele, limitelor calculatoarelor din acea vreme (dar şi limitelor biologiei: să ne amintim că modelul Singer-Nicolson al membranei ca „mozaic fluid” datează abia din 1972). Dar, în afară de puterea de calcul, poate că mai lipsea ceva, care probabil lipseşte şi acum, în informatică şi biologie deopotrivă. Ultimul paragraf din lucrarea lui Olaf Wolkenhauer îl invocă pe Mihailo Mesarovic, un clasic al teoriei sistemelor, care spunea, în 1968, că „în ciuda considerabilului interes şi a eforturilor, aplicarea teoriei sistemelor în biologie nu a răspuns aşteptărilor. [...] Unul dintre motivele principale pentru care există acest decalaj este că teoria sistemelor nu a abordat direct probleme de interes vital pentru biologie.” Sfatul său pentru biologi, adaugă Olaf Wolkenhauer, este că un asemenea progres se poate obţine numai printr-o mai directă şi puternică interacţiune cu cercetătorii în teoria sistemelor. „Un avans real în aplicaţiile teoriei sistemelor în biologie va apărea numai atunci când biologii vor începe să formuleze întrebări care sunt bazate pe concepte sistemice şi nu atunci când aceste concepte sunt folosite pentru a reprezenta într-un mod nou fenomene care sunt deja explicate în termeni biofizici sau biochimici. [...] În acel moment nu vom avea doar o aplicare a principiilor inginereşti la probleme biologice, ci un domeniu nou, al biologiei sistemice, cu propria-i identitate”[10]. Cuvintele lui Mesarovic pot fi luate ca motto al infobiologiei pentru care pledează întreg textul de faţă.
 
Transformarea biologiei şi medicinei într-o „inginerie precisă” poate fi pusă în legătură şi cu dificultăţile curente de a înţelege ce este viaţa, materializate, printre altele, în limitele curente ale inteligenţei artificiale şi vieţii artificiale. Se spune, de exemplu, că, până acum, calculatoarele sunt remarcabile în AI, amplificarea inteligenţei, dar nu la fel de spectaculoase în IA, inteligenţă artificială. Toate acestea sugerează, în termenii lui Rodney Brooks („The relationship between matter and life”, Nature, vol. 409, ian. 2001, pp. 409-411) că „probabil ne lipseşte ceva fundamental şi greu de imaginat la ora aceasta în modelele noastre biologice”. Calculatoarele sunt bune la a lucra cu numere, dar nu „la a modela sisteme vii, fie ele mai mici sau mai mari”. Intuiţia este că viaţa este mai mult decât biofizică şi biochimie, dar ce altceva este poate fi ceva inimaginabil, „care ne este invizibil la ora aceasta. Nu este complet imposibil că vom descoperi noi proprietăţi ale biomoleculelor sau noi ingrediente”. Un exemplu de asemenea „altceva” pot fi efectele cuantice din microtubulele celulelor nervoase, care, conform lui Penrose, „pot fi locul conştiinţei la nivelul celulei” (citat de R. Brooks).
 
O opinie similară a fost exprimată de un alt clasic al inteligenţei artificiale, John McCarthy[11]: „Inteligenţa de nivel uman este o problemă ştiinţifică dificilă şi probabil are nevoie de idei noi. Acestea sunt mai plauzibil să fie imaginate de o persoană de geniu decât ca parte a unui proiect guvernamental sau industrial.” În orice caz, progresele legate de colaborarea dintre informatică şi biologie nu trebuie subestimate. Dacă o facem, ne asumăm un risc care nu a ocolit nume mari ale ştiinţei şi culturii. Ca picanterie de final, să-l dăm ca exemplu pe Auguste Comte, cu două fraze hazardate care i se pun în seamă (datate ca fiind de pe la 1830): „Orice încercare de a folosi metode matematice în studiul chestiunilor biologice trebuie considerată profund iraţională şi contrară spiritului biologiei. Dacă matematica va avea vreodată un loc proeminent în biologie - o aberaţie care este, din fericire, aproape imposibilă - aceasta va prilejui o rapidă şi generalizată degradare a acestei ştiinţe”... Slavă Domnului, nu a avut deloc dreptate - dar ne-au trebuit aproape două sute de ani pentru a ne convinge de acest lucru...
 
Încheiere (provizorie)
 
Sper că această descriere succintă a convins că drumul de la biologie la informatică şi înapoi la biologie este fascinant intelectual şi util ambelor ştiinţe. Câteva lucruri merită reţinute:
- în toată istoria sa, informatica a încercat să înveţe din biologie;
- acest efort a adus beneficii importante informaticii şi deopotrivă biologiei;
- progresele în această direcţie nu pot fi supraestimate;
- în general, este plauzibil că aşteptăm prea multe (şi prea repede) de la simbioza informatică-biologie;
- pentru că ignorăm diferenţele esenţiale dintre cele două universuri, limitele inerente ale calculabilităţii şi faptul că biologia nu este o ştiinţă matematizată;
- cu menţiunea că este posibil să avem nevoie de o nouă matematică pentru a modela şi simula viaţa şi inteligenţa; în sfârşit.
Fie-mi permis să anticipez o nouă vârstă a biologiei, dincolo de bioinformatica şi de calculul natural de azi, şi să propun un termen care să o numească, infobiologie. Să ne dăm un răgaz de încă două decenii pentru a o vedea conturându-se?
Din punct de vedere intelectual, cei patruzeci de ani despre care a vorbit acest text i-am petrecut în preajma domnului academician Solomon Marcus, un „mare copac” care invalidează fraza cu care Brâncuşi şi-a motivat refuzul de a lucra cu Rodin: profesorul Solomon Marcus nu i-a umbrit niciodată pe mulţii studenţi şi colaboratori pe care i-a avut şi-i are în juru-i, ba dimpotrivă. Repet, pentru a întări: dimpotrivă. Depun mărturie în acest sens şi-i închin cu recunoştinţă prezentul discurs de recepţie, mulţumindu-i încă o dată.
Notă: Discursul a fost rostit în data de 24 octombrie 2014 în aula Academiei Române
--------------------------------------------------
[1] C. Calude, Gh. Păun: „Bio-steps beyond Turing”, BioSystems, vol. 77, 2004, pp. 175-194.
[2] a se vedea B.J. Copeland: „Hypercomputation”, Minds and Machines, vol. 12, 2002, pp. 461-502.
[3] A se vedea, J.H. Reif, T.H. LaBean, S. Sahu, H. Yan, P. Yin: „Design, simulation, and experimental demonstration of self-assembled DNA nanostructures and motors”, Proceedings of the Workshop on Unconventional Programming Paradigms, UPP04, Le Mont Saint-Michel, septembrie 2004, Springer, 2005.
[4] Jana Horáková şi Jozef Kelemen, „Capek, Turing, von Neumann, and the 20th century evolution of the concept of machine”, din Proceedings of the International Conference in Memoriam John von Neumann, Budapest Polytechnic, 2003, pp. 121-135
[5] A se vedea F. Tipler: The Physics of Immortality, Doubleday, New York, 1994.
[6] Michael Conrad („The price of programmability”The Universal Turing Machine: A Half-Century Survey, R. Herken, ed., Kammerer and Unverzagt, Hamburg, 1988, pp. 285-307.
[7] se vedea articolul lui Gandy „Church’s thesis and principles for mechanisms”, în volumul The Kleene Symposium, J. Barwise et al., eds., North-Holland, Amsterdam, 1980, pp. 123-148.
[8] H. Kitano, „Systems biology: A brief overview”, Science, vol. 295, martie 2002, pp. 1662-1664, „Computational systems biology”, Nature, vol. 420, nov. 2002, pp. 206-21
[9] Olaf Wolkenhauer, Briefings in Bioinformatics, vol. 2, 2001, pp. 258-270.
[10] M.D. Mesarovic: „System theory and biology - view of a theoretician”, în System Theory and Biology, M.D. Mesarovic, ed., Springer, New York, 1968, pp. 59-87.
[11] „Problems and projection in CS for the next 49 years”, Journal of the ACM, vol. 50, 2003, pp. 73-79.
footer