Cuộc đời là những chuyến đi … dài

I go where science takes me and I lucky have a family with me all the time

Transcriptional factors in fly, Gene co-expression in plant, Reconstructing Indian-Australian phylogeny, BS-Seq Mapping

Posted by Huy Q. Dinh on July 29, 2009

Bioinformatics

Bioinformatics kỳ này đăng một nghiên cứu về gene co-expression trong Arabidopsis của một nhóm từ Nhật [2]. Điều độc đáo ở đây họ đề xuất ra một correlation đa chiều để measure gene co-expression, cái này được mô hình hóa bằng Principal Component Analysis  để rank/tính các factors này, từ đó bỏ đi những factors gây ra bias.  Cách tiếp cận này tưởng hay nhưng hóa ra khá cũ không mấy hiệu quả trong gene expression context. Cái được là câu chuyện trong Arabidopsis lần đầu tiên được để ý.

Genome Biology

Nếu được mơ, có lẽ tôi sẽ mơ mình được làm việc trong regulation network với Drosophila, loài sinh vật mẫu mà tôi cho là cực kỳ hoàn hảo cho nghiên cứu loại này. Lawrence Berkeley National Lab [1] giới thiệu  21 transcription factors trong ruồi giấm regulate (tiếng Việt : điều khiển ??) các embryonic patterning và đặc biệt chúng được bind bởi các đoạn overlap trong hàng ngàn genomic regions. Đây có lẽ là phát hiện đầu tiên về các transcription factors được multi-binded như vậy, tôi tò mò không hiểu nó giải thích tính chất combinatorial (hiển nhiên) như thế nào, và liệu có một loạt các concepts ra đời như master binding or senior binding factors hay không ? Cá nhân tôi nghĩ các phương pháp deterministic sẽ outperform trong lĩnh vực đặc biệt hay hơn là các phương pháp thống kê như thường lệ.

Một bài nữa trên Genome Biology cũng rất đáng đọc, đó là một high-throughput sequencing (again) experiment cho promoter region của người và chuột của một nhóm ở Thụy Sĩ. Tôi lại nhớ bài ca “chúng ta sẽ làm gì nếu chúng ta có thể sequencing mọi thứ“. Sinh học, đặc biệt là sequencing thật là thú vị.

Xem điểm tin trên GenomeWeb về Genome Biology tuần qua.

BMC

BMC Evolutionary tuần qua có một bài với tiêu đề rất hấp dẫn Reconstructing Indian-Australian phylogenetic link. Kết quả là họ làm sáng tỏ hơn phần nào việc khám phá Australia thông qua con đường Nam Á bằng một dẫn chứng rằng người Úc và người Ấn share nhau mtDNA lineage.  Trên Bioinformatics issue, một nhóm ở Mỹ report the first pure computational BS-Seq method (to my understanding) : BSMAP: whole genome Bisulfite Sequence MAPping program . Tôi  hầu như không có ấn tượng gì với bài này, họ dùng SOAP (một trong 3 phương pháp short-read alignment nhanh nhất hiện nay, không có gì ngạc nhiên khi các tác giả đều là người Tàu) để align tất cả các khả năng BS-converted của short reads, rồi từ đó count mismatches để xác định methylation status cho từng Cytosine tương ứng. Không quá khó để tưởng tượng ra sẽ có một phương pháp tốt hơn 😀 trong tương lai gần. Có hai bài cùng số đáng quan tâm lần này, trong đó một bài về xử lý dữ liệu khá hữu ích nhưng chán òm : TableButler – A tool for combining, handling and processing of huge data tables . May mà bài kia cũng đáng đọc: CLEAN: CLustering Enrichment ANalysis . Các tác giả đưa ra một phương pháp (pure computational) để tính enrichment level cho một clusters of genomic signal (mà ở đây họ ví dụ với biological pathway). Software có cung cấp dưới dạng add-on trên R.

1. Nếu có dịp đến California nhất định tôi sẽ đến thăm nơi mà tôi hằng ngưỡng mộ qua những câu chuyện qua ly cafe ở hồ Gươm với không dưới một người đã và đang làm việc ở đó. Hy vọng không chỉ là giấc mơ.
2. Người Nhật thường quan tâm đến gạo nhiều hơn, hầu hết các bài báo quan trọng trong nghiên cứu gạo tôi đọc qua là của đất nước mặt trời mọc.

Leave a comment