英国の研究者は、時間の経過とともに縮小されることを期待している、一般にアクセスできる新しいデータベースを開発しました。それは、このデータベースには、ヒトゲノム内の遺伝子によってコードされ、その存在は知られているものの、その機能がほとんどわかっていない、研究が十分に進んでいない何千ものタンパク質がまとめられているからだ。

「unknome」と呼ばれるこのデータベースは、英国オックスフォード大学ダン病理学大学院のマシュー・フリーマン氏と、英国ケンブリッジのMRC分子生物学研究所のショーン・マンロー氏およびその同僚らによる研究の成果である。彼らはデータベース内のいくつかのタンパク質を研究し、そのほとんどが発生やストレス耐性などの重要な細胞機能に寄与していることを発見しました。

ヒトゲノムの配列決定により、ヒトゲノムには、今日までその正体や機能が不明のままである、考えられる数千のタンパク質配列がコードされていることが明確に示されました。この理由は、既知の標的に乏しい研究資金が集中する傾向や、細胞内のこれらのタンパク質の機能を研究するための抗体などのツールの欠如など、複数の要因が考えられます。

しかし、著者らは、これらのタンパク質を無視することは危険であると信じている。なぜなら、一部のタンパク質、おそらく多くのタンパク質が重要な細胞プロセスで重要な役割を果たしており、洞察を提供し、治療介入の標的として機能する可能性があるためである。

このクラスのタンパク質のより迅速な探索を促進するために、著者らは Unknome データベースを作成しました。このデータベースは、機能、種間の保存、細胞内区画化、およびその他の要素に関する科学文献の情報を反映する「既知」スコアを各タンパク質に割り当てます。

このシステムによれば、ゼロに近い「既知の次数」を持つタンパク質が数千個存在します。これらには、モデル生物からのタンパク質だけでなく、ヒトゲノムからのタンパク質も含まれます。このデータベースは誰でも利用でき、カスタマイズ可能であるため、ユーザーはさまざまな要素に独自の重み付けを提供し、独自の既知スコアのセットを生成して自分の研究に優先順位を付けることができます。

データベースの有用性をテストするために、著者らは、ハエに類似の遺伝子を持ち、両方の種で既知スコアが 1 以下で、それらについてほとんど何も知られていないことを示すヒトの 260 個の遺伝子を選択しました。これらの遺伝子の多くを完全にノックアウトすると、ハエの生活には適合しません。部分的または組織特異的なノックアウトにより、ほとんどの遺伝子が生殖能力、発育、組織成長、タンパク質の品質管理、またはストレス耐性に影響を与える重要な機能に寄与していることが明らかになりました。

この研究結果は、何十年にもわたる詳細な研究にもかかわらず、数千のハエの遺伝子が最も基本的なレベルでもまだ理解されていないことを示しており、同様のことが明らかにヒトゲノムにも当てはまります。 「これらの特徴づけられていない遺伝子は無視されるべきではない」とマンロー氏は語った。 「私たちのデータベースは、分析のために未知の機能を持つ重要な遺伝子を特定して選択するための強力で多用途かつ効率的なプラットフォームを提供し、それによって未知のゲノムに代表される生物学的知識のギャップの解消を加速します。」 」

マンロー教授はさらに、「何千ものヒトタンパク質の役割は依然として不明瞭だが、研究はすでによく理解されているタンパク質に焦点を当てる傾向がある。この問題の解決を支援するために、我々は『Unknome』データベースを作成した。これは、タンパク質がどれだけよく知られているかに従ってタンパク質をランク付けし、次にこれらの謎に満ちたタンパク質のサブセットを機能的にスクリーニングして、無知がどのように生物学的発見を促進するかを示すものだ。」