tky_cowのブログ

python + chemistry, webの技術メモ等

NIHのDELウェビナーを見た

 以前DELの総説的なウェビナーがあるということを教えてもらったのですが、遅ればせながら見てみました。ウェビナー自体は2021年にNIH主催で開催されたもので、動画のアーカイブが公開されています。二年ほど前の内容になりますが、分野の第一人者や経験豊富なメガファーマ、スタートアップの面々が演者に名を連ねており大変勉強になりました。セッションは3部制で、Chemistry, Selection, Data Analysisから成ります。私は分野的にData Analysisのパートを視聴し、参考になった点を備忘録的にメモします。フルの動画は以下サイトに公開されていますのでご参考ください。
NCATS — AGM Workshop on DNA-Encoded Libraries for Lead Discovery

Beyond the Cube: Informatics Methods for Best Practices in DEL Analysis (Day2 1:00-1:40)

Nurix社はアメリカのスタートアップで、PROTACを作る際の標的タンパク(POI)に結合する側の化合物を取得する際にDELを活用しています。かなり多くのセレクションをこなしている様子で、かなりシステム化されているように感じました。主にNGS後の解析、offDNA合成する化合物の選択についての発表でした。

  • 過去のセレクション結果を同時に可視化して、promiscousなバインダーを判定する
  • 阻害剤あり、オフターゲットとして選択性取りたいタンパクでのセレクションを行うのはよくあるパターン
  • キューブプロットのBBは類似度順でソートするとSARを把握しやすい
  • BB毎のエンリッチメント解析も有用そう
  • Read数でカットオフした後、次元削減とクラスタリングでケミカルシリーズを可視化する
  • Property filterも活用してヒット選定している模様

DEL Screen Triage Strategies Toward Tractable Chemical Matter (Day2 1:41-2:28)

 ファイザーのDELプラットフォーム責任者と思われる方の発表で、スクリーニングしてヒット候補をプロジェクトチームに引き渡すことをミッションとしているチームのようです。専門部隊がいることがメガファーマらしさを感じさせます。データをDB化してDEL_DVと名付けたSpotfireビューで可視化する流れまで構築されており、将来像として大変参考になりました。ここまでするのは専門じゃないと苦しいなあというのはありますが、、

  • ライブラリーは数を犠牲にしても物性を良くする方向に向かっている
  • MPOスコアはカットオフではなくカラーリング用途で使っている
  • 一つの標的タンパクに対して10前後のセレクションを実施して複合的に解析するのが標準的
    • ビーズのみ、ポジコンあり、複合体タンパクありなどのセレクションを加えるのが代表的
    • セレクション条件が多くなると解釈が困難になるため、プロファイルでクラスタリングする
  • 化合物レベルまたはline featureレベルでリード数/ブランクでのリード数を算出して解析する
  • Spotfireは元データが大量なためオンデマンドロードする仕様
  • ヒットからの合成展開については以下文献が参考になると紹介されていた
  • BALI-MSによるonDNAでのバインダー判定をoffDNA合成前に実施する
  • onDNAでバインダー確認できるのは43%程度で、その内74%が目的物がバインダー、26%はバイプロがバインダー

Strategies for Hit to Lead Optimization: Common Tactics Applied to DNA-Encoded Library (DEL) Derived Hits (Day2 2:30-3:06)

 GSKのDELチームのGang Yao氏から、主にoffDNA後にフォーカスし、報告されているDEL由来のヒットからリードへの軌跡を紹介する内容です。ファイザーのBALI-MS報告後に、GSKはcleavable linkerを使ったon-DNAによるヒット同定法を提唱しているそう。

  • 意外とDNAタグとBB1をtruncateしたものが初期ヒットになっている
  • 成功した最適化は全てLLEを改善する方向に向かっており、基本脂溶性を下げる
  • SARがブロードなBBは削っても良いという考えのようで、活性下がってもLLE上がれば問題なし
  • BRD4の例ではフラグメントヒットパーツとのマージも利用

MW 400-500からスタートしている例も結構あり、実質2cycleくらいのサイズでも良いのでは感は感じました。

DNA Encoded Libraries and Interpretable ML for Hit Triage (Day2 3:44-4:07)

 GSKから、毒性評価に使われているPDE3AのQSARモデルのApplicability Domainを改善できるケモタイプをDELから探す試み。DELのセレクション結果から二分類モデルを作り、Chemblのデータセットを予測したが精度は今一つな様子だった。