あるかないかわからないモノ:バイオ限界(前編)
COGNANO テックブログA, No.5
COGNANOのいむらです。
前回まで、「対象の多さに阻まれるバイオの限界」について書きました。全身40兆個の細胞で、基本の遺伝子だけでも3万種類が働いている生物を、まるっとわかりたいんですけど、、、、しかし一気に観るのが難しく、分解して1種類の遺伝子だけ、1種類の細胞だけ、掘り下げるバイオの方法についてでした。すると膨大な時間がかかってしまう。
今回は、「因果関係というセンスが作ってしまうバイオの限界」についてお話しします。がんを例にして、、、
がん細胞
がんとは、「数と配置が無秩序になるために、不都合をもたらす細胞群」のことです。細胞の社会では「調整ルール」があるらしく、細胞たちは「行儀よく」増えたり減ったりして棲み分けているので、ぼくたちは安泰です。日常、血液や皮膚は高速で入れ替わっています。がんの場合は、「過剰増殖」で周辺を圧迫するばかりか、「転移」というロケーションミスで、制御不能になっていきます。がんは、「細胞社会のシステムエラー」であることは間違いないでしょう。本当は、がんを含む細胞社会をまるっとわかりたいわけです。
なにが原因?ここから、根深い問題になります。A→B、というのが、因果関係の基本です。がん(B)の原因は、きっと遺伝子(A)でOKだよね。「がん細胞」というワルモノの正体を知りたければ、原因の遺伝子を解明すればいいよね、、、え、ちょっと待ってください、それでいいの?
がんは必ず、本人が「知らない間」に「体のどこか」に、できますよね?
- 時間軸問題
- 空間軸問題
2つの基本問題に答えるのはとても難しいのです。
がんは、いつからできたの?1年前?5年前?まさか、産まれる時からあったの?どんなふうに「今日見えているがんのかたちになったのか?」最初からマルチな細胞の組み合わせでスタートしたかもしれないし、また、一種類の細胞から始まって分岐した可能性もあります。時系列を順番に観察できないことが、がん研究の大きなハードルです。
空間軸を考えると、もっとわからなくなります。空間的に考えると、「がん細胞」っていうけれど、本当に1種類なのか?周辺の細胞は異常状態に加担していないのか?その場合、周辺細胞は「がん」といわないのか?いずれも明確な説明はありません。写真は、乳がん細胞株(実験室で培養できる患者由来の「がん細胞」)SKBR3です。見てしまうと、「お、これががん細胞か!」と思ってしまうのが人情です。こいつをやっつければいいんだな、というわけです。しかも多くの場合、その考えは間違いではない。
COGNANOが開発した免疫細胞CAR-TがSKBR3をアタックしている
あまり仮説を広げると研究が成立しなくなるので、これまでは、「とりあえず単一種類と仮決めした、ワルそうな細胞」の研究に限定するしかありませんでした。敵兵士を一人捕まえて、敵軍の全貌を尋問するようなやり方ですね。がんの研究は、時間軸や空間軸において、じつは「仮」設定でスタートしています。これが第一の限界です。
遺伝子が原因なのか?
一般に、がんは遺伝子異常が原因だと言われますが、本当でしょうか?数十年前、ある遺伝子をゲノムに導入したらがんになることがわかり、「がんの原因がわかった!」と言われたものでした。確かに、ほとんどの場合がん細胞は遺伝子変異を伴っており、「遺伝子異常は重要だ」というのは間違いないところです。がんになりやすいか、アナタのゲノムで検査してみましょう、というキャッチフレーズの商品がありますが、この響きは「がんの原因は遺伝子だ」というゆるい了解?に基づいています。とは言え、これらの検査は「がん化アクセル」とか「がん化ブレーキ」のような影響因子を評価しているだけで、がんとは何なんだ?を指摘できたり、診断できるわけではありません。実際、次世代シークエンサが発達したこの15年ほど、たくさんの患者細胞が遺伝子解析され、様々な異常が指摘されましたが、「これが原因だ」と断言できる統一理論はみつかっていません。この経緯は、3つの可能性を示唆しています(注:個人的考えです)
- がん細胞といっても、じつは一種類ではなく、高度に多様化しているかも。知りたい要素が分散し、バックグラウンド化しているため、容易に掘り出せない?
- がん患者サンプルには、初期に存在した重要な特徴がすでに消滅している?
- 遺伝子異常は期待したほど寄与していない。遺伝子以外の要因も大きく関与している?
これらの問題が多層構造になっているなら、容易には解明できません。これが第二の限界です。3課題に対し、次のような解決が考えられます
- →がんと周辺の細胞をしらみつぶしに調べ、微小情報を拾い上げる:平均値をとるのではなく、シングルセルのゲノム解読作業を、例えば100万個の細胞に関して実行。ビッグデータで検出力をあげる
- →発生時のがん細胞は残っていない:タイムマシンが発明されないかぎりお手上げ
- →遺伝子以外の高分子にも調査対象を広げる:脂質や糖鎖のデータ化は大変すぎ、情報化できるカテゴリーは現状では遺伝子しかないが、、、、
生命は、糖鎖、脂質、タンパク質、核酸から構成されており、物質としては、いづれかを解析することになる。それを元に現象を理解するのが分子細胞生物学の方法論。4物質のうち高速に情報化できるのは、今のところ核酸(遺伝子)だけ。一方、タンパク質の重要な特性である「構造」は難関であったが、AlphaFold2がアルゴリズム予想に到達したことは記憶に新しい。リアル構造解析はそれくらい大変だった。糖鎖や脂質はさらに困難。
因果関係という迷路
1の作戦は、これまでの方向性に間違いはなかったが、検出感度が足りなかった、という仮説に基づきます。IT系の方にはピンときますよね。「機械なら検出できるかも」です。deep miningにより、未知の「見えにくかった」ファクターが掘り出される可能性があります。すでにプログラマーがこの方面の研究を主導しています。ただし注意すべきは、「遺伝子変異が高度に寄与していた」という仮説に依存していることです。
2は苦しい課題で、過去に遡ってのリアルサンプルは入手できない。因果関係は、時系列がわからない場合、格段に難しい問題になります。初期の特性が、すでに失われていたら・・・・ほぼ現実味がない。
3、遺伝子以外を対象とするには、どうすればいいんでしょうか?それは、タンパク質や糖鎖を、がんとリンクすることを意味します。さあCOGNANOどうする?後編に続きます!