All Articles
    Search by

    2024年8月にみつけた情報

    見つけた情報

    かがくイラスト

    フリーイラストでプレートとかピペットの画像とかを公開しているサイト。有償の利用は別途許可を必要とするので要注意だ。

    タスクバーからアプリを強制停止する機能、まだ有効にしていないのならオンにしよう

    これマジで知らなかった!すごく便利なので絶対やった方がいい!

    “隠し機能”とは言われているものの、複雑な手順は一切不要。「設定」の「システム」→「開発者向け」のページの中で、「タスクの終了」をオンにするだけだ。この機能は以前よりプレビュー版には実装されていたが、最近のアップデートで正式版でも実装されたようだ。

    # パワポ標準の矢印がしっくりこない!? フリー素材を探す前に試したいワザ5選

    良い感じの矢印をパワポで描く方法。月初めに知って、結構使ってる。

    VSCodeのGitHub Copilotが色々便利になっていた件

    # 個人で執筆している大学数学入門資料の配布 まい.

    最近Xでよく見かける方の数学入門資料。note200円で資料読めるのだが、微分積分の資料は結構面白かった。

    ε-N論法は全く知らなかった(大学1-2年のどこかで習ってたとしたら当時の先生スマン1)ので、古賀さんのyoutubeをみつつ理解できた。非常に面白いし、勉強になった。

    # WSLでUSBやネットワークドライブをマウントする方法

    SSDが認識されなかったので参考にした。

    sudo mount -t drvfs d: /mnt/d/

    GENIAC 松尾研コンペ終了

    Slackコミュニティで開発の模様はヲッチさせていただいていた。8Bx8Bへ舵を切った瞬間とか、精度評価方法に自作chatbot arenaみたいなシステムをスプシで作ったりとか、本当に面白い取り組みだった。

    精度面はそこまで見ていないが、体感GPT-4くらいの精度が出ているとの感想も出ている

    はた目から見ていた感想としては、ちゃんと金かけてGPU使いまくって学習させればちゃんとした精度のモデルができる(=LLMには再現性がある、誰でも作れる)ということ。「ああ、本当にできるんだ」というのが大きい。

    次のステップとして、省エネでコストを抑えつつさらに精度の高いモデルを作るにはどうしたらいいか、アラインメントでセキュリティを高めるにはどうしたらいいか、などのノウハウも得られれば日本のLLM研究は最強になりそう。OpenAIやAnthropicに負けないレベルの研究力を身に着けた組織が現れてくれたらいいなあ。

    今回のノウハウはZennで惜しげもなく公開されているので必見。

    機械学習帳

    東工大岡崎先生作成の資料。ぐりぐり動くグラフが添付されていて極めて分かりやすいのはさておき、UIが美しすぎる。JupyterBookってこんなに素晴らしいレンダーができたのか・・・?

    下記レポジトリを見るとmarkdownでもいけるらしい。いいなあ~

    大規模言語モデル(LLM)の技術と最新動向

    今年6月のDICOMO2024シンポジウムでの、Studio Ousiaの山田さんの資料。Transformerの基礎から最新のモデル学習トレンドまでまとまっていてわかりやすい。チンチラ則とかはGENIAC phase1でよく目にしたな。

    Large Language Models in Computational Biology – A Primer (2024 Update)

    20240901124000

    Biologyにおけるfoundation modelが良くまとまっている。最近intensity上げて調べていたsingle cell foundation modelについても、知らなかった最新情報がまとまってて非常にグッド。

    Although trained on millions of cells, current foundation models struggle with different assays in zero-shot settings (Kedzierska et al. bioRxiv 2023). • Pretraining often fails to separate biology from noise and sometimes has no effect (Boiarsky et al. bioRxiv 2023)

    これ致命的だよなあ。実用化への道は遠いか。。

    ソースコードをレポジトリ丸ごとLLMに読んでもらう方法

    松尾研究所のからあげさんによる記事。

    gpt-repository-loaderとDifyでお手軽RAGをしてレポジトリ丸ごと理解できるという話。

    自分が使っているcode2promptよりも出力されるテキストが若干のプロンプトを含んでいて良い。

    The following text is a Git repository with code. The structure of the text are sections that begin with ----, followed by a single line containing the file path and file name, followed by a variable amount of lines containing the file contents. The text representing the Git repository ends when the symbols —END— are encounted. Any further text beyond —END— are meant to be interpreted as instructions using the aforementioned Git repository as context. ----

    あと、Difyでお手軽RAGチャットボットが作れるのはあまり注目していなかったが面白そう。過去のLLM勉強会映像みながらやってみよう。

    とけたろう

    統計検定準1級チートシートで本サイトを知る。

    初学者向けに準1級周辺に必要な知識を数学の側面からわかりやすく、感覚的なエッセンスも入れつつ解説している。統計検定に限らずちょこちょこ参考になりそうなので今後通ってみる。

    youtubeもやってるみたい。準1級受けるときに見たかったな~

    準1級もう一回受けたい欲にめっちゃ駆られる。

    noteで教材を販売してるみたい

    今月読んだ本

    プロジェクトヘイルメアリー上・下

    映画「オデッセイ」の原作者であるアンディ・ウィアーのSF。以前コンピューター科学ラジオで堀元さんが絶賛していたのでいつか読んでやりたいな~と思っていたところ、少し前のkindleセールでめちゃめちゃ安くなっていたので買っていたが、結局積んでいた本を土日で一気読みした。

    結論、くっっっっっっそ面白かった。このSFには物理学・生物学等々のストーリーが詰め込まれているのだが、生物学者視点で見てても「十分あり得る」話ばかりで、大変面白い。この本は何を言ってもネタバレになるので、ただ一言、是非読んでいただきたい。SF好きの理系マンには超お勧め。早く映画化してほしい。

    まんがで身につく ずるい考え方

    ラテラル・シンキングという、枠にはまらない「ずるい」考え方の実践をまんがで解説した一冊。

    一見すると突飛推しもなくビジネスには受け入れがたいとすら思えるラテラル・シンキングだが、大変分かりやすく、その効果を教えてくれる。

    特に印象的だったのは「ロジカル・シンキングで解決しない問題は存在する」ということ。どれだけ頭をひねって論理的に考えてもいけない、というのは頭の良いひとこそ知るべき発想だろう。

    kindleの日替わりセールで入手。


    1. 1

    Published Sep 1, 2024

    © 2020-2024 Hiroyuki Odake