Група Цаикиа Гаоа на Институту за генетику и развојну биологију Кинеске академије наука је пионир у коришћењу предвиђања структуре уз помоћ вештачке интелигенције, успоставила је метод груписања протеина засновану на терцијарној структури и проширила га на нови систем рударења деаминаза и развила серија нових алата за уређивање базе са кинеским независним правима интелектуалне својине. Овај рад пружа нову стратегију за анализу функције протеина и рударење нових функционалних елемената. Новоразвијени систем за уређивање базе има кинеска независна права интелектуалне својине за прецизну технологију за уређивање гена (примењен патент за ПЦТ проналазак). Сродни резултати истраживања објављени су у Целл.
Протеини су главни носиоци животних активности. Функционално груписање протеина је важно средство за истраживање физиолошких процеса у које су укључени и за дизајнирање нових протеина, итд. Постојеће методе углавном групишу протеине на основу сличности примарних секвенци аминокиселина и користе их за закључивање њихових функција и еволуционих односа. Међутим, функција протеина је одређена његовом тродимензионалном просторном структуром, а развој високопропусних метода кластерисања протеина заснованих на тродимензионалној структури ће обезбедити директније и поузданије средство за истраживање функције протеина и промовисати функционално рударење непознатих протеина. .
Системи за уређивање базе могу постићи прецизно уређивање ДНК или РНК са прецизношћу једног нуклеотида, што је трансформативна технологија за истраживање функције гена, лечење болести и биолошки узгој. Међутим, основне компоненте постојећих система за уређивање базе, деаминазе, потичу из једне породице, што резултира многим ограничењима уређивања базе и даље, а уређивање је и даље тешко да задовољи потребе разноврсних апликација. Због тога је посебно важно иновативно истражити нове деаминазе и развити нове алате за уређивање база за различите сценарије примене.
Да би решила горе наведене проблеме, истраживачка група Цаикиа Гаоа иновативно је користила предвиђање велике протеинске структуре уз помоћ вештачке интелигенције како би успоставила нову методу кластерисања протеина велике пропусности засновану на терцијарној структури, реализовала је дубинско рударење функционалне структуре деаминаза, идентификовано потпуно нове елементе шасије који се разликују од познатих ензима алата за деаминазу, и развили смо серију нових алата за уређивање базе са нашим сопственим правима интелектуалне својине.
Истраживачи су извршили групно предвиђање 3Д структуре репрезентативних функционалних секвенци деаминазе помоћу модела за предвиђање структуре протеина АлпхаФолд2, и даље спровели иновативно вишеструко поређење протеина засновано на 3Д структури и груписање како би класификовали потенцијалне деаминазе у 20 различитих грана. Поред пријављене АПОБЕЦ/АИД цитозин деаминазе, откривено је пет структурно и секвенцијално нових активних грана цитозин деаминазе. Међу овим гранама, даље структурно груписање и функционална валидација протеина са доменом деаминације попут ДддА (дволанчане ДНК деаминазе токсина А) открило је да ова грана садржи велики број протеина са само једноланчаном активношћу деаминације ДНК, у додатак претходно претпостављеним протеинима са активношћу деаминације дволанчане ДНК, што је поништило досадашња сазнања о функцији ове класе протеина. Горња студија показује да груписање структуре протеина уз помоћ вештачке интелигенције може дати тачније резултате од традиционалне методе груписања засноване на примарним секвенцама аминокиселина када је хомологија секвенце колекције протеина ниска и функције су различите. Стога, овај метод пружа ефикасну и поуздану нову стратегију за анализу функције протеина и рударење.
На основу горе наведених резултата даљег груписања, истраживачи су недавно идентификовали 45 једноланчаних цитозин деаминаза (Сдд) и 13 дволанчаних цитозин деаминаза (Ддд). Ове деаминазе су тренутно једине деаминазе које су све прокариотског (бактеријског) порекла, док су постојећи чланови породице деаминаза АПОБЕЦ/АИД сви еукариотског порекла (углавном људи, сисари или рибе). Истраживачи су развили низ нових система за уређивање база заснованих на овим деаминазама и тестирали их у животињским и биљним ћелијама. Резултати су показали да су новоразвијени дволанчани базни системи за уређивање базирани на Ддд1 и Ддд9 деаминазама превазишли недостатке конвенционалних уређивача са значајно нижом ефикасношћу уређивања за ГЦ секвенце; једноланчани системи за уређивање базе засновани на Сдд7 и Сдд3 показали су веома високу монтажну активност и такође су имали значајну способност уређивања базе у ГЦ секвенцама; једноланчани систем за уређивање базе заснован на Сдд6 показао је изузетно Сдд6-базни једноланчани систем за уређивање базе показао је високу специфичност и скоро неприметне догађаје ван циља. Студија је даље развила нови Сдд6-ЦБЕ уређивач базе који се може инкапсулирати помоћу једног вируса повезаног са адено (ААВ) кроз рационални дизајн и функционалну валидацију протеина, и добила је ефикасност уређивања до 43,1% у ћелијска линија миша, решавајући проблем да су конвенционални основни уређивачи превелики да би их испоручиле честице аденовируса. Поред тога, да би се решио дугогодишњи проблем ниске ефикасности уређивања базе у соји, тим је недавно развио Сдд7-ЦБЕ систем и добио 34 стабилно уређене биљке са ефикасношћу уређивања до 22,1% у 154 позитивна соја саднице. Ово истраживање пробија уско грло примене постојећих деаминаза и показује обећавајућу примену новог система за уређивање базе у медицини и пољопривреди.
Истраживачки рад подржали су Национална фондација за природне науке Кине, Национални програм кључних истраживања и развоја и Стратешки пионирски специјални пројекат за науку и технологију Кинеске академије наука.