All Articles
    Search by

    2024年3月に見つけた情報

    ツール

    海外のyoutubeを日本語音声で再生します

    元の音声ボリュームを下げて字幕を取得して読み上げしてるだけなんだけど、使い道がありそう。個人開発のツールなので突然使えなくなる可能性あり。

    なぜかURLを張っても動画が見つからなかったが、単語を入力すれば動画の検索はできた。

    英語は仕事でめっちゃ使うようになったので日々練習しているものの、やっぱり日本語で聞ければ、ながらインプットが可能になってよい。

    Claude3

    いやもう何といっても今月はこれでしょ。Claude3 Opus、神すぎます。 特にperplexity.aiとの組み合わせが最高で、web検索とGPT-4よりも優れたLLMが提供してくれるAI体験は過去最高。Claude2.0の時に一カ月だけ課金してたサブスク、今回復活。(でもそのあとperplexityを使うことにしたのでclaudeはキャンセルして、perplexityに課金しはじめた)

    特にこのツイートをきっかけとして、わいも本格的にAmazon Bedrockにも参入。実際に仕事でも使ったりしている。 ミニマムモデルのHaikuもGPT-3.5なんかよりずっと頭いいので、てきとうな用途ならめっちゃお安く、レスポンスの早いアプリケーションを作れてしまう。本当におすすめ。

    Arc browser

    前々から気になっていたブラウザ。ようやくWindows版のインビテーションメールが来たので使えるようになった。

    結構バグが目立つのだが、SideKickのようによく開くページが左側に固定できるのがとんでもなく便利。また、新しいタブがspotlight的に開くことができるので、Ctrl+Tから即座に検索へ飛べるのが本当にいい。

    Arc browserの前にはSideKickを使っていたのだが、あれはフル版がサブスクじゃなきゃ使えないのと、勝手にGmailの署名を追加してきたり、なんかスパム感が目に付くブラウザだった。

    Obsidian Thino

    数カ月前から最高のエディタを求め歩き、結局Obsidianに落ち着いた今日この頃。Obsidian Thinoというデイリーノート taking extensionの存在を知り、嬉々としてメモを取っている。

    Thinoを使うとtweetXへの post感覚でメモを取ることができ、一日のまとめファイルが自動的に生成される。今までbioinformatics関係の仕事でlab noteをどうとるか非常に悩んでいたが、これが最適解だと思う(とりあえず今はそう思う)。なるべく些細なことでもノートを取るようにしている。

    Pythonライブラリ

    img2table

    OpenVCベースのライブラリ。画像からテーブルに起こすことができる。TesseractOCRなど、OCRでは定番のライブラリにも依存しているが、一発できれいなpd.DataFrameに変換してくれるのが素晴らしい。 解析例を見る限りかなり精度良さそう。機会あれば試す。

    BASALT

    ビニングツールのリファインメントツール。メタゲノム解析をやる予定は当分ないけど、この手のツールは貴重なのでメモ。

    論文

    Rworkflows

    Rのバージョン、依存パッケージ、LaTeXも併せて定義したDockerコンテナを作れる。

    論文

    shu

    高次元signal pathway描画ツール。pythonで書きやすくて良さそう。

    論文

    Trackplot

    使う用事ないけど、epigenomeのヒートマップ作るRスクリプト。

    プレゼン

    LLMの現在

    プリファードさんが作った超素晴らしい資料。BERT系は分類タスクならLLMより精度いい(p.21)というのは知らなかった。

    ChatGPTの衝撃

    マイクロソフトの方が作成されたChatGPTでできることのまとめ。エンジニア向きの書き方で、「今更入門するGPT-4活用術」的な内容で大変参考になった。

    仕事でRAGをちょいとばかしやっていて、色々なユーズケースを見るだけでも目の肥やしになる。ありがてえ。

    [Python, R, Juliaの仮想環境管理(env系)ツールのまとめ]

    信頼の露崎先生のプレゼン。 Pythonはpyenvでええやろって思ってたけど、ユーザー的にはそうかもしれないがdeveloper的にはそうとも限らないのだなあと勉強になった。

    AWSを9年触ってきて経験した 落とし穴、ハマったポイント

    最高。AWS初心者でAWSを一所懸命学ぶ時間が無い自分にとって最高のコンテンツ。

    終了と停止間違えるのは一回やった。。

    動画もあり

    よみもの

    論文

    腸内細菌のインドールプロピオン酸がT細胞のstem cell nessを高めて、免疫反応を強化する

    マウスの実験。よくある免疫チェックポイント阻害剤の感受性を腸内細菌に求める論文だが、代謝物まで特定してる点で解像度が高い。

    Lactobacillus johsonilがトリプトファン代謝経路を介してIPA(インドール-3-プロピオン酸)を生産。IPAがT-cellのTcf7のsuper enhancer領域アセチル化を亢進させ、progenitor exhausted CD8+T-cell(Tpex)が活性化する。IPAの産生にはClostridium sporogenesも協働しているところが腸内細菌ならではで面白い。

    この二種がICI効果を高めることは糞便移植、菌移植により実証。In vitroでIPAをCD8+ T-cellに添加してT-cellの活性化を見ている。

    Fas-L/FasがCAR-NK, CAR-Tのpersistenceを下げる

    Fasといえばがん細胞にとってはポジティブに働くという常識があるが、がん患者のシングルセル解析を行った結果、むしろT, NKではFasが高発現しておりがん細胞や間質では発現が低いことが見いだされる。実際にCAR-T治療を受けた患者のCAR-T細胞を見るとやはりFas-Lが高発現していることが判明。

    これにどのような意味があるのか?Fas-Lは抗CD3/CD28抗体、あるいは抗原刺激を加えた状態で比較するとCAR-T/NKのFas-Lは抗原刺激に応じて発現上昇した。つまり、Fas-LはCAR-NK/Tの活性化に応じて発現上昇することが分かった。

    Fasシグナルはアポトーシス経路のため、Fas KOCAR-T/NKを用いて生存率を検証するとpersistenceが上昇したとのこと。しかし、killing活性はFasの発現には影響を受けない模様。

    ここまででFasシグナルがCAR-T/NKのpersistenceに関わる、アツいpathwayであることが言える。CAR-NKのブームは完全に過ぎてしまったが、この知見が本当ならどっかで活きてきそうだなー。

    羊水から多分化能をもつ幹細胞を取得

    シンプルにすげえ。羊水検査でも流産のリスクはあるけど、産婦人科医の技量次第と聞いたことがある。これで幹細胞できるなら最小限のリスクで良い細胞とれちゃうじゃん。っていう。

    ブログ

    続・4.5SHは蜜の味(4)百折不撓の末の光明と迷走

    研究のリアルを振り返ったブログポスト。Transgenic mouseの実験はしたことが無いが、そうなのか、ノックアウトマウスは基本見かけ変化なしなのか。 RNA-seqデータの解析についても「おれがやればもっと早くその結果にたどり着ける」とも言えない話で、学びがあった。なるほどイントロンも興味深いものだ。 続ポストが楽しみ。

    医薬系”特許的”判例

    17年も続いているブログとのことだが、初めて知った。いくつかCRISPR-Cas9に関する記事を拝読したが、どれも判決が良くまとまっていてわかりやすい。メドケムが多めなのだろうか?と思いつつ面白いので今後も読む。

    (今さら)Gemini API使ってみる

    Geminiって無料でAPI公開してたのか…今度LLM用事があるときに使おう。

    統計学実勢ンワークブック完全攻略(1章~4章)

    Qiita記事。ワークブックの解説をしている人は結構貴重。 ちょっと統計学の勉強は最近できてないけど、本腰入れて試験勉強したいなあ。。

    DataArts 統計検定 1級・準1級対策のためのサイト

    前職にいたときはこういうサイト見て勉強しまくってたけど、現職だとなかなか時間つくれないなあ。。

    細胞培養「接着細胞の細胞数計測」

    ES細胞を分散させてから播種するまでの時間で形質がどう変わるか。細胞数の測定を血球計算版やコールターカウンターなどでどう結果が変わるか。検証してみたという話。

    こういう検証記事は参考になるし面白い。

    AI

    最高精度の議事録の書き方 [ZOOM+Claude3 Opus]

    Zoomの文字おこし方法、こんな機能があるなんて目から鱗だった。マジでびっくりしました。 添付されているプロンプト・GPTsも神精度で衝撃。今後Zoomの会議議事録作成がマジで楽になりそう。

    Hakky Handbook データやAIに関するナレッジシェアを目的としたポータルサイト LangChainとは?各モジュールの機能と活用事例まとめ

    LangChainの使い方について日本語でまとめているサイトがあまりないため、大変貴重。

    Qiitaとかに記事いくらでもあるやろ、とか思ったそこの貴方。いや、仰る通りなんですが、あんなの参考にできるクオリティではないですよ。

    自分は本買って読んで初めてLangChain分かってきたところあるけど、正直AIの環境は日々変わってるし、それにキャッチアップする努力を続けないと真の意味で使いこなせない気がする。

    あと、最近はAIの用途が自分の中で色々変わってきていて、最早LangChain活用するよりもperplexityとかをonlineで使う方が圧倒的に多い。

    RAGでの回答精度向上のためのテクニック集

    応用編-Aの記事が最近出た。

    この分野の最新の論文は流石にフォローしきれないのでこういうまとめは助かる。

    DB

    UCSC Xena

    色々な遺伝子発現データを含むデータセットでサクッとヒートマップをみることができるWebアプリ。 各データセットに含まれるメタデータとの対応を見れるので、性別ごとに遺伝子発現を見れたりする。

    入っているデータの量がめっちゃ多いのでうまく使えば何かの役には立ちそう。だが現状は「かっこいい図が一瞬で作れてそれっぽい気になるツール」止まりかな。。

    HEK293T細胞に発現している遺伝子

    こちらのpostが(生物界隈で)バズってた。

    How to use Ensembl

    なんだかんだ毎回調べてしまうやつ、公式がざっくばらんに解説してくれたXのthread。ありがてえ。

    Azimuth App for reference-based single-cell analysis

    GPT4でscRNA-seqデータのcell type分類をしたという最近ありがちな論文で知った。マニュアルでcell annotationをした例みたい。 こういうデータセットはscRNA-seq解析者からするといくつあっても困らん。

    その他

    デキる親友社員は知っている時短ショートカット

    なんだかんだ利用機会の多いExcel。Logomixはspread sheetもそれなりに使うが、みんな結構excelショートカットを活用しているので読んでみた。 Ctrl+dは知らなかった。

    AWSのLambdaってなんやねん ZennBook

    ちょっとしか読んでないけどエントリー記事として良さそう。後で読む(といって一カ月たってる)。

    レポジトリ

    AWS

    AWS Samples

    Amazonのソリューションアーキテクトの方からGenomics-cliやAmazon Health Omicsに関するご案内を頂いた。genomics-cliやsage makerなどが我々のユースケースには良さそうだなと思いつつ、まだ検討できていない。

    AWS Blackl Belt Online Seminar AWS Batch

    使えそう。AWS Batchでジョブ管理できないだろうか。

    Published Mar 31, 2024

    © 2020-2024 Hiroyuki Odake