Multilateral Bioinformatics Analyses Reveal the Function-Oriented Target Specificities and Recognition of the RNA-Binding Protein SFPQ

RNA-binding proteins (RBPs) recognize consensus sequences and regulate specific target mRNAs. However, large-scale CLIP-seq revealed loose and broad binding of RBPs to larger proportion of expressed mRNAs: e.g. SFPQ binds to >10,000 pre-mRNAs but distinctly regulates <200 target genes during neuronal development. Identification of crucial binding for regulation and rules of target recognition is highly anticipated for systemic understanding of RBP regulations. For a breakthrough solution, we developed a bioinformatical method for CLIP-seq and transcriptome data by adopting iterative hypothesis testing. Essential binding was successfully identified in C-rich sequences close to the 5′ splice sites of long introns, which further proposed target recognition mechanism via association between SFPQ and splicing factors during spliceosome assembly. The identified features of functional binding enabled us to predict regulons and also target genes in different species. This multilateral bioinformatics approach facilitates the elucidation of functionality, regulatory mechanism, and regulatory networks of RBPs.

 

哺乳類の細胞において、遺伝情報は染色体DNAからRNAに転写され、さらに様々な転写・転写後制御を受けることが知られています。RNAの制御を行う分子はRNA結合タンパク質と呼ばれ、ヒトで1500種類以上が存在することが知られています。RNAの制御は、複雑な遺伝子発現制御を必要とする哺乳類で特に重要であり、その異常がさまざまな疾患を引き起こすことが知られています。一方、それぞれのRNA結合タンパク質が数万種類のRNAのうちどれをどう制御するのかが大きな謎となっています。京都⼤学大学院医学研究科 飯田慶 特定助教、武内章英 同准教授、萩原正敏 同教授らの研究グループは、RNA結合タンパク質の1つであるSFPQ(Splicing Factor Proline And Glutamine Rich)をモデルとして、「RNAの機能的制御につながる結合」を探索するバイオインフォマティクス手法を開発しました。これにより、観察されていた236,000箇所以上の結合部位のうち、標的分子を決定する際に重要な役割を持つと考えられる約200箇所の同定に成功しました。これは、複雑なRNA制御のメカニズムおよびその包括的制御の全容解明や、RNA制御異常により引き起こされる疾患の治療法開発につながる成果です。