あるかないかわからないモノ：バイオ限界（前編）

COGNANO テックブログA, No.5

COGNANOのいむらです。

前回まで、「対象の多さに阻まれるバイオの限界」について書きました。全身４０兆個の細胞で、基本の遺伝子だけでも３万種類が働いている生物を、まるっとわかりたいんですけど、、、、しかし一気に観るのが難しく、分解して１種類の遺伝子だけ、１種類の細胞だけ、掘り下げるバイオの方法についてでした。すると膨大な時間がかかってしまう。

今回は、「因果関係というセンスが作ってしまうバイオの限界」についてお話しします。がんを例にして、、、

がん細胞

がんとは、「数と配置が無秩序になるために、不都合をもたらす細胞群」のことです。細胞の社会では「調整ルール」があるらしく、細胞たちは「行儀よく」増えたり減ったりして棲み分けているので、ぼくたちは安泰です。日常、血液や皮膚は高速で入れ替わっています。がんの場合は、「過剰増殖」で周辺を圧迫するばかりか、「転移」というロケーションミスで、制御不能になっていきます。がんは、「細胞社会のシステムエラー」であることは間違いないでしょう。本当は、がんを含む細胞社会をまるっとわかりたいわけです。

なにが原因？ここから、根深い問題になります。A→B、というのが、因果関係の基本です。がん(B)の原因は、きっと遺伝子(A)でOKだよね。「がん細胞」というワルモノの正体を知りたければ、原因の遺伝子を解明すればいいよね、、、え、ちょっと待ってください、それでいいの？

がんは必ず、本人が「知らない間」に「体のどこか」に、できますよね？

時間軸問題
空間軸問題

２つの基本問題に答えるのはとても難しいのです。

がんは、いつからできたの？１年前？５年前？まさか、産まれる時からあったの？どんなふうに「今日見えているがんのかたちになったのか？」最初からマルチな細胞の組み合わせでスタートしたかもしれないし、また、一種類の細胞から始まって分岐した可能性もあります。時系列を順番に観察できないことが、がん研究の大きなハードルです。

空間軸を考えると、もっとわからなくなります。空間的に考えると、「がん細胞」っていうけれど、本当に１種類なのか？周辺の細胞は異常状態に加担していないのか？その場合、周辺細胞は「がん」といわないのか？いずれも明確な説明はありません。写真は、乳がん細胞株（実験室で培養できる患者由来の「がん細胞」）SKBR3です。見てしまうと、「お、これががん細胞か！」と思ってしまうのが人情です。こいつをやっつければいいんだな、というわけです。しかも多くの場合、その考えは間違いではない。

f:id:CogNano:20220207101842p:plain

乳がん細胞株SKBR3の電子顕微鏡写真

COGNANOが開発した免疫細胞CAR-TがSKBR3をアタックしている

あまり仮説を広げると研究が成立しなくなるので、これまでは、「とりあえず単一種類と仮決めした、ワルそうな細胞」の研究に限定するしかありませんでした。敵兵士を一人捕まえて、敵軍の全貌を尋問するようなやり方ですね。がんの研究は、時間軸や空間軸において、じつは「仮」設定でスタートしています。これが第一の限界です。

遺伝子が原因なのか？

一般に、がんは遺伝子異常が原因だと言われますが、本当でしょうか？数十年前、ある遺伝子をゲノムに導入したらがんになることがわかり、「がんの原因がわかった！」と言われたものでした。確かに、ほとんどの場合がん細胞は遺伝子変異を伴っており、「遺伝子異常は重要だ」というのは間違いないところです。がんになりやすいか、アナタのゲノムで検査してみましょう、というキャッチフレーズの商品がありますが、この響きは「がんの原因は遺伝子だ」というゆるい了解？に基づいています。とは言え、これらの検査は「がん化アクセル」とか「がん化ブレーキ」のような影響因子を評価しているだけで、がんとは何なんだ？を指摘できたり、診断できるわけではありません。実際、次世代シークエンサが発達したこの１５年ほど、たくさんの患者細胞が遺伝子解析され、様々な異常が指摘されましたが、「これが原因だ」と断言できる統一理論はみつかっていません。この経緯は、３つの可能性を示唆しています（注：個人的考えです）

がん細胞といっても、じつは一種類ではなく、高度に多様化しているかも。知りたい要素が分散し、バックグラウンド化しているため、容易に掘り出せない？
がん患者サンプルには、初期に存在した重要な特徴がすでに消滅している？
遺伝子異常は期待したほど寄与していない。遺伝子以外の要因も大きく関与している？

これらの問題が多層構造になっているなら、容易には解明できません。これが第二の限界です。３課題に対し、次のような解決が考えられます

→がんと周辺の細胞をしらみつぶしに調べ、微小情報を拾い上げる：平均値をとるのではなく、シングルセルのゲノム解読作業を、例えば100万個の細胞に関して実行。ビッグデータで検出力をあげる
→発生時のがん細胞は残っていない：タイムマシンが発明されないかぎりお手上げ
→遺伝子以外の高分子にも調査対象を広げる：脂質や糖鎖のデータ化は大変すぎ、情報化できるカテゴリーは現状では遺伝子しかないが、、、、

f:id:CogNano:20220215094259p:plain

生命は、糖鎖、脂質、タンパク質、核酸から構成されており、物質としては、いづれかを解析することになる。それを元に現象を理解するのが分子細胞生物学の方法論。４物質のうち高速に情報化できるのは、今のところ核酸（遺伝子）だけ。一方、タンパク質の重要な特性である「構造」は難関であったが、AlphaFold2がアルゴリズム予想に到達したことは記憶に新しい。リアル構造解析はそれくらい大変だった。糖鎖や脂質はさらに困難。

因果関係という迷路

1の作戦は、これまでの方向性に間違いはなかったが、検出感度が足りなかった、という仮説に基づきます。IT系の方にはピンときますよね。「機械なら検出できるかも」です。deep miningにより、未知の「見えにくかった」ファクターが掘り出される可能性があります。すでにプログラマーがこの方面の研究を主導しています。ただし注意すべきは、「遺伝子変異が高度に寄与していた」という仮説に依存していることです。

2は苦しい課題で、過去に遡ってのリアルサンプルは入手できない。因果関係は、時系列がわからない場合、格段に難しい問題になります。初期の特性が、すでに失われていたら・・・・ほぼ現実味がない。

3、遺伝子以外を対象とするには、どうすればいいんでしょうか？それは、タンパク質や糖鎖を、がんとリンクすることを意味します。さあCOGNANOどうする？後編に続きます！