Situs pengikat DNA

Situs pengikat DNA adalah jenis situs pengikatan yang ditemukan dalam DNA tempat molekul lain dapat berikatan. Situs pengikat DNA berbeda dari situs pengikat lainnya karena:
- Situs tersebut merupakan bagian dari urutan DNA (misalnya genom)
- Situs tersebut diikat oleh protein pengikat DNA.
Situs pengikat DNA sering dikaitkan dengan protein khusus yang dikenal sebagai faktor transkripsi, dan dengan demikian terkait dengan regulasi transkripsi. Jumlah situs pengikat DNA dari faktor transkripsi tertentu disebut sebagai sisromnya. Situs pengikat DNA juga mencakup target protein lain seperti enzim restriksi, rekombinase spesifik-situs (lihat rekombinasi spesifik-situs), dan metiltransferase.[1]
Situs pengikat DNA dapat didefinisikan sebagai urutan DNA pendek (biasanya sepanjang 4 hingga 30 pasangan basa, tetapi hingga 200 bp untuk situs rekombinasi) yang secara spesifik terikat oleh satu atau lebih protein pengikat DNA atau kompleks protein. Telah dilaporkan bahwa beberapa situs pengikat memiliki potensi untuk mengalami perubahan evolusioner yang cepat.[2]
Sejarah dan teknik eksperimen utama
Keberadaan sesuatu yang mirip dengan situs pengikatan DNA diduga dari percobaan pada biologi bakteriofag lambda[3] dan regulasi operon lac Escherichia coli.[4] Situs pengurutan DNA akhirnya dikonfirmasi dalam kedua sistem[5][6][7] dengan munculnya teknik pengurutan DNA. Sejak saat itu, situs pengikatan DNA untuk banyak faktor transkripsi, enzim restriksi dan rekombinase spesifik situs telah ditemukan menggunakan banyak metode percobaan. Secara historis, teknik percobaan pilihan untuk menemukan dan menganalisis situs pengikatan DNA adalah uji jejak DNAse dan Uji Pergeseran Mobilitas Elektroforesis (EMSA). Namun, perkembangan DNA microarray dan teknik pengurutan cepat telah menghasilkan metode paralel masif baru untuk identifikasi in-vivo tempat pengikatan, seperti ChIP-chip dan ChIP-Seq.[8] Untuk mengukur afinitas pengikatan[9] protein dan molekul lain ke tempat pengikatan DNA tertentu, digunakan metode biofisika microscale thermophoresis.[10]
Jenis-jenis situs pengikatan DNA
Situs pengikatan DNA dapat dikategorikan menurut fungsi biologisnya. Dengan demikian, kita dapat membedakan antara situs pengikatan faktor transkripsi, situs restriksi, dan situs rekombinasi. Beberapa penulis telah mengusulkan bahwa situs pengikatan juga dapat diklasifikasikan menurut mode representasinya yang paling nyaman.[11] Di satu sisi, situs restriksi secara umum dapat direpresentasikan oleh sekuens konsensus. Ini karena mereka menargetkan sekuens yang sebagian besar identik dan efisiensi restriksi menurun secara tiba-tiba untuk sekuens yang kurang mirip. Di sisi lain, situs pengikatan DNA untuk faktor transkripsi tertentu biasanya semuanya berbeda, dengan berbagai tingkat afinitas faktor transkripsi untuk situs pengikatan yang berbeda. Hal ini menyulitkan untuk secara akurat merepresentasikan situs pengikatan faktor transkripsi menggunakan sekuens konsensus, dan biasanya direpresentasikan menggunakan matriks frekuensi spesifik posisi (PSFM), yang sering digambarkan secara grafis menggunakan logo sekuens. Namun, argumen ini sebagian sewenang-wenang. Enzim restriksi seperti faktor transkripsi menghasilkan rentang afinitas yang bertahap, meskipun tajam, untuk situs yang berbeda;[12] dan dengan demikian juga paling baik direpresentasikan oleh PSFM. Demikian pula, rekombinase spesifik lokasi juga menunjukkan berbagai afinitas terhadap lokasi target yang berbeda.[13][14]
Pangkalan data
Karena beragamnya teknik eksperimental yang digunakan dalam menentukan situs pengikatan dan cakupan yang tidak merata pada sebagian besar organisme dan faktor transkripsi, tidak ada pangkalan data pusat (mirip dengan GenBank di NCBI) untuk situs pengikat DNA. Meskipun NCBI mempertimbangkan anotasi situs pengikat DNA dalam urutan referensinya (RefSeq), sebagian besar pengajuan menghilangkan informasi ini. Selain itu, karena keberhasilan bioinformatika yang terbatas dalam menghasilkan alat prediksi situs pengikat DNA yang efisien (tingkat positif palsu yang besar sering dikaitkan dengan metode penemuan motif/pencarian situs in-silico), belum ada upaya sistematis untuk menganotasi fitur-fitur ini secara komputasi dalam genom yang telah diurutkan.
Namun, ada beberapa pangkalan data pribadi dan publik yang dikhususkan untuk kompilasi situs pengikatan yang dilaporkan secara eksperimental, dan terkadang diprediksi secara komputasi, untuk berbagai faktor transkripsi pada berbagai organisme. Berikut adalah tabel pangkalan data yang tersedia (data tidak lengkap):
| Nama | Organisme | Sumber | Akses | URL |
|---|---|---|---|---|
| PlantRegMap | 165 spesies tumbuhan (seperti, Arabidopsis thaliana, Oryza sativa, Zea mays, etc.) | Kurasi ahli dan proyeksi | Publik | [1] |
| JASPAR | Manusia, Vertebrata, Tumbuhan, Fungi, Lalat, dan Cacing | Kurasi ahli dengan dukungan literatur | Publik | [2] |
| CIS-BP | Semua Eukariota | Motif dan prediksi yang diperoleh secara eksperimental | Publik | [3] |
| CollecTF | Prokariota | Kurasi literatur | Publik | [4] |
| RegPrecise | Prokariota | Kurasi ahli | Publik | [5] |
| RegTransBase | Prokariota | Kurasi ahli/literatur | Publik | [6] |
| RegulonDB | Escherichia coli | Kurasi ahli | Publik | [7] Diarsipkan 2017-05-07 di Wayback Machine. |
| PRODORIC | Prokariota | Kurasi ahli | Publik | [8] Diarsipkan 2007-05-16 di Wayback Machine. |
| TRANSFAC | Manusia dan Mamalia | Kurasi ahli/literatur | Publik/Privat | [9] Diarsipkan 2008-10-23 di Wayback Machine. |
| TRED | Manusia, Mencit, Tikus | Kurasi prediksi komputer, kurasi manual | Publik | [10] |
| DBSD | Spesies Drosophila | Kurasi ahli/literatur | Publik | [11] |
| HOCOMOCO | Manusia, Mencit | Kurasi ahli/literatur | Publik | [12],[13] |
| MethMotif | Manusia, Mencit | Kurasi ahli | Publik | [14] Diarsipkan 2019-10-29 di Wayback Machine. |
Representasi situs pengikatan DNA
Kumpulan situs pengikat DNA, yang biasanya disebut sebagai motif pengikat DNA, dapat direpresentasikan oleh sekuens konsensus. Representasi ini memiliki keuntungan karena ringkas, tetapi dengan mengorbankan pengabaian sejumlah besar informasi.[15] Cara yang lebih akurat untuk merepresentasikan situs pengikatan adalah melalui Matriks Frekuensi Spesifik Posisi (PSFM). Matriks ini memberikan informasi tentang frekuensi setiap basa pada setiap posisi motif pengikatan DNA.[11] PSFM biasanya dipahami dengan asumsi implisit independensi posisi (posisi yang berbeda pada situs pengikat DNA berkontribusi secara independen terhadap fungsi situs), meskipun asumsi ini telah diperdebatkan untuk beberapa situs pengikat DNA.[16] Informasi frekuensi dalam PSFM dapat diinterpretasikan secara formal di bawah kerangka teori informasi,[17] yang mengarah ke representasi grafisnya sebagai logo sekuens.
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | |
| A | 1 | 0 | 1 | 5 | 32 | 5 | 35 | 23 | 34 | 14 | 43 | 13 | 34 | 4 | 52 | 3 |
| C | 50 | 1 | 0 | 1 | 5 | 6 | 0 | 4 | 4 | 13 | 3 | 8 | 17 | 51 | 2 | 0 |
| G | 0 | 0 | 54 | 15 | 5 | 5 | 12 | 2 | 7 | 1 | 1 | 3 | 1 | 0 | 1 | 52 |
| T | 5 | 55 | 1 | 35 | 14 | 40 | 9 | 27 | 11 | 28 | 9 | 32 | 4 | 1 | 1 | 1 |
| Sum | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 | 56 |
PSFM untuk represor transkripsi LexA yang diperoleh dari 56 situs pengikatan LexA yang tersimpan di Prodoric. Frekuensi relatif diperoleh dengan membagi jumlah di setiap sel dengan jumlah total (56)
Pencarian komputasional dan penemuan situs pengikatan
Dalam bioinformatika, seseorang dapat membedakan antara dua masalah terpisah mengenai situs pengikat DNA: mencari anggota tambahan dari motif pengikatan DNA yang diketahui (masalah pencarian situs) dan menemukan motif pengikatan DNA baru dalam kumpulan urutan yang terkait secara fungsional (masalah penemuan motif urutan).[18] Banyak metode berbeda telah diusulkan untuk mencari situs pengikat. Kebanyakan dari mereka bergantung pada prinsip-prinsip teori informasi dan memiliki server web yang tersedia (Yellaboina)(Munch), sementara penulis lain telah menggunakan metode pembelajaran mesin, seperti jaringan saraf tiruan.[11][19][20] Banyak algoritma juga tersedia untuk penemuan motif urutan. Metode-metode ini bergantung pada hipotesis bahwa sekumpulan urutan berbagi motif pengikatan untuk alasan fungsional. Metode penemuan motif pengikatan dapat dibagi secara kasar menjadi enumeratif, deterministik dan stokastik.[21] MEME[22] dan Konsensus [23] adalah contoh klasik optimasi deterministik, sementara Gibbs sampler[24] adalah implementasi konvensional dari metode stokastik murni untuk penemuan motif pengikatan DNA. Contoh lain dari kelas metode ini adalah SeSiMCMC[25] yang berfokus pada situs TFBS lemah dengan simetri. Sementara metode enumeratif sering menggunakan representasi ekspresi reguler dari situs pengikatan, PSFM dan perlakuan formalnya di bawah metode Teori Informasi adalah representasi pilihan untuk metode deterministik dan stokastik. Metode hibrida, misalnya ChIPMunk[26] yang menggabungkan optimasi greedy dengan subsampling, juga menggunakan PSFM. Kemajuan terbaru dalam pengurutan telah mengarah pada pengenalan pendekatan genomik komparatif untuk penemuan motif pengikatan DNA, seperti yang dicontohkan oleh PhyloGibbs.[27][28]
Metode yang lebih kompleks untuk pencarian situs pengikatan dan penemuan motif bergantung pada penumpukan basa dan interaksi lain antar basa DNA, tetapi karena ukuran sampel yang biasanya tersedia untuk situs pengikatan dalam DNA kecil, efisiensinya masih belum sepenuhnya dimanfaatkan. Contoh alat tersebut adalah ULPB[29]
Referensi
- ^ Halford E.S.; Marko J.F. (2004). "How do site-specific DNA-binding proteins find their targets?". Nucleic Acids Research. 32 (10): 3040–3052. doi:10.1093/nar/gkh624. PMC 434431. PMID 15178741.
- ^ Borneman, A.R.; Gianoulis, T.A.; Zhang, Z.D.; Yu, H.; Rozowsky, J.; Seringhaus, M.R.; Wang, L.Y.; Gerstein, M. & Snyder, M. (2007). "Divergence of transcription factor binding sites across related yeast species". Science. 317 (5839): 815–819. Bibcode:2007Sci...317..815B. doi:10.1126/science.1140748. PMID 17690298. S2CID 21535866.
- ^ Campbell A (1963). "Fine Structure Genetics and its Relation to Function". Annual Review of Microbiology. 17 (1): 2787–2792. doi:10.1146/annurev.mi.17.100163.000405. PMID 14145311.
- ^ Jacob F, Monod J (1961). "Genetic regulatory mechanisms in the synthesis of proteins". Journal of Molecular Biology. 3 (3): 318–356. doi:10.1016/S0022-2836(61)80072-7. PMID 13718526. S2CID 19804795.
- ^ Gilbert W, Maxam A (1973). "The nucleotide sequence of the lac operator". Proceedings of the National Academy of Sciences of the United States of America. 70 (12): 3581–3584. Bibcode:1973PNAS...70.3581G. doi:10.1073/pnas.70.12.3581. PMC 427284. PMID 4587255.
- ^ Maniatis T, Ptashne M, Barrell BG, Donelson J (1974). "Sequence of a repressor-binding site in the DNA of bacteriophage lambda". Nature. 250 (465): 394–397. Bibcode:1974Natur.250..394M. doi:10.1038/250394a0. PMID 4854243. S2CID 4204720.
- ^ Nash H. A. (1975). "Integrative recombination of bacteriophage lambda DNA in vitro". Proceedings of the National Academy of Sciences of the United States of America. 72 (3): 1072–1076. Bibcode:1975PNAS...72.1072N. doi:10.1073/pnas.72.3.1072. PMC 432468. PMID 1055366.
- ^ Elnitski L, Jin VX, Farnham PJ, Jones SJ (2006). "Locating mammalian transcription factor binding sites: a survey of computational and experimental techniques". Genome Research. 16 (12): 1455–1464. doi:10.1101/gr.4140006. PMID 17053094.
- ^ Baaske P, Wienken CJ, Reineck P, Duhr S, Braun D (Feb 2010). "Optical Thermophoresis quantifies Buffer dependence of Aptamer Binding". Angew. Chem. Int. Ed. 49 (12): 2238–41. doi:10.1002/anie.200903998. PMID 20186894. S2CID 42489892.
- "A hot road to new drugs". Phys.org. February 24, 2010.
- ^ Wienken CJ; et al. (2010). "Protein-binding assays in biological liquids using microscale thermophoresis". Nature Communications. 1 (7) 100. Bibcode:2010NatCo...1..100W. doi:10.1038/ncomms1093. PMID 20981028.
- ^ a b c Stormo GD (2000). "DNA binding sites: representation and discovery". Bioinformatics. 16 (1): 16–23. doi:10.1093/bioinformatics/16.1.16. PMID 10812473.
- ^ Pingoud A, Jeltsch A (1997). "Recognition and Cleavage of DNA by Type-II Restriction Endonucleases". European Journal of Biochemistry. 246 (1): 1–22. doi:10.1111/j.1432-1033.1997.t01-6-00001.x. PMID 9210460.
- ^ Gyohda A, Komano T (2000). "Purification and characterization of the R64 shufflon-specific recombinase". Journal of Bacteriology. 182 (10): 2787–2792. doi:10.1128/JB.182.10.2787-2792.2000. PMC 101987. PMID 10781547.
- ^ Birge, E.A. (2006). "15: Site Specific Recombination". Bacterial and Bacteriophage Genetics (Edisi 5th). Springer. hlm. 463–478. ISBN 978-0-387-23919-4.
- ^ Schneider T.D. (2002). "Consensus sequence Zen". Applied Bioinformatics. 1 (3): 111–119. PMC 1852464. PMID 15130839.
- ^ Bulyk M.L.; Johnson P.L.; Church G.M. (2002). "Nucleotides of transcription factor binding sites exert interdependent effects on the binding affinities of transcription factors". Nucleic Acids Research. 30 (5): 1255–1261. doi:10.1093/nar/30.5.1255. PMC 101241. PMID 11861919.
- ^ Schneider TD, Stormo GD, Gold L, Ehrenfeucht A (1986). "Information content of binding sites on nucleotide sequences". Journal of Molecular Biology. 188 (3): 415–431X. doi:10.1016/0022-2836(86)90165-8. PMID 3525846.
- ^ Erill I; O'Neill MC (2009). "A reexamination of information theory-based methods for DNA-binding site identification". BMC Bioinformatics. 10 (1): 57. doi:10.1186/1471-2105-10-57. PMC 2680408. PMID 19210776.
- ^ Bisant D, Maizel J (1995). "Identification of ribosome binding sites in Escherichia coli using neural network models". Nucleic Acids Research. 23 (9): 1632–1639. doi:10.1093/nar/23.9.1632. PMC 306908. PMID 7784221.
- ^ O'Neill M.C. (1991). "Training back-propagation neural networks to define and detect DNA-binding sites". Nucleic Acids Research. 19 (2): 133–318. doi:10.1093/nar/19.2.313. PMC 333596. PMID 2014171.
- ^ Bailey T.L. (2008). "Discovering Sequence Motifs". Bioinformatics (PDF). Methods in Molecular Biology. Vol. 452. hlm. 231–251. doi:10.1007/978-1-60327-159-2_12. ISBN 978-1-58829-707-5. PMID 18566768.
- ^ Bailey T.L. (2002). "Discovering novel sequence motifs with MEME". Current Protocols in Bioinformatics. 2 (4): 2.4.1–2.4.35. doi:10.1002/0471250953.bi0204s00. PMID 18792935. S2CID 205157795.
- ^ Stormo GD, Hartzell GW 3rd (1989). "Identifying protein-binding sites from unaligned DNA fragments". Proceedings of the National Academy of Sciences of the United States of America. 86 (4): 1183–1187. Bibcode:1989PNAS...86.1183S. doi:10.1073/pnas.86.4.1183. PMC 286650. PMID 2919167.
- ^ Lawrence CE, Altschul SF, Boguski MS, Liu JS, Neuwald AF, Wootton JC (1993). "Detecting subtle sequence signals: a Gibbs sampling strategy for multiple alignment". Science. 262 (5131): 208–214. Bibcode:1993Sci...262..208L. doi:10.1126/science.8211139. PMID 8211139. S2CID 3040614.
- ^ Favorov, A V; M S Gelfand; A V Gerasimova; D A Ravcheev; A A Mironov; V J Makeev (2005-05-15). "A Gibbs sampler for identification of symmetrically structured, spaced DNA motifs with improved estimation of the signal length". Bioinformatics. 21 (10): 2240–2245. doi:10.1093/bioinformatics/bti336. ISSN 1367-4803. PMID 15728117.
- ^ Kulakovskiy, I V; V A Boeva; A V Favorov; V J Makeev (2010-08-24). "Deep and wide digging for binding motifs in ChIP-Seq data". Bioinformatics. 26 (20): 2622–3. doi:10.1093/bioinformatics/btq488. ISSN 1367-4811. PMID 20736340.
- ^ Das MK, Dai HK (2007). "A survey of DNA motif finding algorithms". BMC Bioinformatics. 8 (Suppl 7) S21. doi:10.1186/1471-2105-8-S7-S21. PMC 2099490. PMID 18047721.
- ^ Siddharthan R, Siggia ED, van Nimwegen E (2005). "PhyloGibbs: A Gibbs sampling motif finder that incorporates phylogeny". PLOS Comput Biol. 1 (7): e67. Bibcode:2005PLSCB...1...67S. doi:10.1371/journal.pcbi.0010067. PMC 1309704. PMID 16477324.
- ^ Salama RA, Stekel DJ (2010). "Inclusion of neighboring base interdependencies substantially improves genome-wide prokaryotic transcription factor binding site prediction". Nucleic Acids Research. 38 (12): e135. doi:10.1093/nar/gkq274. PMC 2896541. PMID 20439311.
Pranala luar
- ENCODE threads Explorer Transcription factor motifs in Nature
- Manually Curated TF Binding Motifs for 157 plant species Diarsipkan 2016-10-19 di Wayback Machine.
Konten ini disalin dari wikipedia, mohon digunakan dengan bijak.


