yu4uのブックマーク - はてなブックマーク

Kaggle自然言語処理コンペ向けローカルLLM活用入門

社内の技術共有会での発表資料です。ローカルLLM触ったことがない方向けに、Kaggle NLPコンペ参加にあたり最低限の知識を共有することを目的として発表になります。

yu4u 2025/03/18

llm

リンク

言語モデルの内部機序：解析と解釈

2025-03-10, 言語処理学会第31回年次大会でのチュートリアル「言語モデルの内部機序：解析と解釈」のスライドです。

yu4u 2025/03/18

リンク

貸せ、RunpodはKaggleでこう使う - 学習する天然ニューラルネット

Kaggle - Qiita Advent Calendar 2024 - Qiita 25日目の記事です。はじめに: Kaggleにおける計算リソースの重要性 Kaggleでは、データサイエンスのコンペティションが開催されており、その多くはGPUを使った計算が必要だ。例えば、画像認識のコンペティションでは、画像データを学習するために、大量の画像データをGPUで学習する必要がある。これらの計算は、ローカルのPCでは難しいため、クラウド上の計算リソースを利用することが一般的だ。そして、Kaggleのコンペティションにおいては、計算リソースの性能が勝敗を分けることが多い。ぶっちゃけ私のようなセンスのない人間でも、多くの計算リソースを確保し、試行回数をとにかく増やせば、上位に入る確率が高まるのである。 (競プロや数学オリンピックではこうはいかない。資本主義バンザイ。) 計算リソースとし

yu4u 2025/01/08

kaggle
gpu

リンク

vLLMを利用したLLM推論高速化テクニック - Taste of Tech Topics

皆さんこんにちは Acroquestのデータサイエンスチーム「YAMALEX」のチームリーダ、@tereka114です。 YAMALEXチームでは、コンペティションへの参加や自社製品開発、技術研究などに日々取り組んでいます。大規模言語モデル（通称：LLM）は近年、非常に注目される技術となりました。ただ、7Bや13Bといった巨大モデルのパラメータは推論時間も長時間で計算時間の面からも運用が非常に難しいです。しかし、vLLMを使えば、高速化できます。本記事では、推論をどこまで高速化できるのかを検討したいと思います。 ※本記事はLLM・LLM活用のAdvent Calendar 24日目の記事です。 qiita.com vLLMとは？ vLLMによる高速化実践 vLLMを利用しない場合 vLLMを利用する vLLMに加えてAWQを利用して量子化する Auto Prefix Caching

yu4u 2024/12/25

vllm

リンク

Large Vision Language Model (LVLM) に関する最新知見まとめ (Part 1)

本資料では、大規模視覚言語モデル (LVLM) に関する最新の知見を包括的にまとめて紹介しています。 Part 1 では、「画像エンコーダ」と「大規模言語モデル (LLM)」の接続方法及び、画像のエンコード方法に焦点を当てて解説しています。（続編の Part 2 では、学習データに焦点を当てて解説…

yu4u 2024/11/19

lvlm

リンク

2024年版のDockerfileの考え方＆書き方 | フューチャー技術ブログ

最近はお客さんとの勉強会でDockerのドキュメントをつまみ食いして読むというのをやっていますが、改めて最新版を読んでみて、いろいろ思考が整理されました。2020年の20.10のマルチステージビルドの導入で大きく変わったのですが、それ以前の資料もweb上には多数あり「マルチステージビルドがよくわからない」という人も見かけるので過去の情報のアンラーニングに使っていただけるように改めて整理していきます。仕事でPythonコンテナをデプロイする人向けのDockerfile (1): オールマイティ編で触れた内容もありますが改めてそちらに含む内容も含めて書き直しています。本エントリーの執筆には@tk0miya氏から多大なフィードバックをいただきました。ありがとうございます。基本的なメンタルモデル現代的な使い方を見ていくために「Dockerを使ってビルドする」というのはどのようなものか考えを整

yu4u 2024/07/26

docker

リンク

VSCodeで生産性を上げる

はじめにこんなツイートを見て執筆をしようと思いました。実際に、VSCodeは機能の追加や拡張機能の開発が活発に行われており、かつUIもユーザーフレンドリーであるため人気のエディターだと思います。VSCodeを使いこなせるのとそうでないのではエンジニアリングの生産性に大きな差が出てしまうと思います。パンくずの設定 '>' を入力します。 '>' preferences: Open User Settings (JSON)を入力します。僕のsettings.jsonは以下です。 { "workbench.colorTheme": "GitHub Dark", "terminal.integrated.fontFamily": "MesloLGM Nerd Font", "terminal.integrated.profiles.osx": { "fish": { "path": "/o

yu4u 2024/06/25

vscode

リンク

自然言語とVision&Language

東京大学大学院の2024年度講義「知能情報論」で使用した資料です． Vision&Language関連の研究について，深層学習初期から大規模モデルにいたるまでを概観しています．なお，資料作成時期は2024年5月下旬であり，内容はその時点で発表されていた研究等に基づいています．

yu4u 2024/06/10

vlm

リンク

Python + VSCode の環境構築 20240604

作業メモ。モダン Python 速習。 AI 周りのツールを動かしていたら TypeScript だけでやるには無理が出てきたので、久しぶりに Python の環境構築をする。具体的には TestGen LLM を動かしたい。 Python はたまに触るけど、基本 2.x 時代の知識しかない。基本的にこの記事を読みながら、細かいアレンジをしている。追記 rye が ruff と pytest を同梱してるので rye fmt, rye check, rye test で良かった uvicorn を叩くより、 fastapi-cli を使って起動したほうが良さそうので変更基本方針: Rye に全部任せる良く出来てると噂に聞いたので、 rye に任せる。自分が Python が苦手な点は pip を下手に使うと環境が汚れていく点で、基本的に rye で閉じて管理させる。システムの

yu4u 2024/06/06

python

リンク

CyberAgent AI事業本部2024年度MLOps研修基礎編 / MLOps Basic

同年度のMLOps研修資料はこちらです。 (1/4) CyberAgent AI事業本部2024年度MLOps研修Container編: https://speakerdeck.com/szma5a/container-for-mlops (2/4) CyberAgent AI事業本部2024年度M…

yu4u 2024/06/03

mlops

リンク

大規模言語モデルの開発

2024年度人工知能学会全国大会（第38回）チュートリアル講演１本講演では、大規模言語モデルの開発に必要な基礎および最新動向を概観する。その後、東京工業大学情報理工学院の岡崎…

yu4u 2024/06/03

llm

リンク

Zodスキーマでプロンプト生成を行い構造化データを自由自在に扱えて、LLMプロダクト開発が圧倒的に効率化した話 - Algomatic Tech Blog

最近はAI エンジニアを名乗ってるerukitiです。フロントエンドもバックエンドも、LLMを触るあれこれもやってるので、「AI エンジニア」くらいを名乗るとちょうどよさそうだなと思ってます。いずれLLM自体の開発なんかもやってるかもしれません。 LLMプロダクトを開発していると、構造化データを作りたいのに、Anthropic ClaudeのAPIにはJSONモードが無いことや、なんならJSONモードやfunction callingを使っても、データが正しい形式に従ってることは保証しがたい、みたいな自体に遭遇することがあります。 JSONが出力できたとしても、構造化データをうまく吐き出させるのは難しいものです。文字列を出力させたいけど、複数あるときは、配列なのか、それともカンマ区切りなのか？項目がオプショナルの場合はどうするか？項目が存在しない、空文字や 0 や undefined や nu

yu4u 2024/05/23

llm

リンク

複数の企業でデータエンジニアとして求められたスキル - yasuhisa's blog

最近「ああ、これ前職でも前々職でもやったことあるなぁ」という仕事があった。データエンジニア(やその関連職種)として働き始めて約5年、3社でフルタイムとして働いてきて「このスキルは業界や組織規模が変わってもデータエンジニアとしてスキルを求められることが多いな」と感じたものをまとめてみることにした。棚卸し的な意味はあるが、特に転職用などではないです。前提どこでも必要とされたスキルデータマネジメントに関する概要レベルの知識と実行力セキュリティや法令に関する知識事業ドメインに関する興味関心他職種とのコミュニケーション能力コスト管理 / コスト削減のスキルソフトウェアエンジニアとしてのスキル DataOpsやアラートのハンドリング能力分析用のSQLを書く力古いテーブルやデータパイプラインを置き換えていくスキルや胆力あるとやりやすいスキル関連部署の動きを何となく把握しておく力

yu4u 2024/05/22

データエンジニア

リンク

OKRと「測りすぎ」〜なりたい姿を、「測りすぎ」ないようにしながらどう追いかけるか〜/OKR and the tyranny of metrics

yu4u 2024/05/16

okr

リンク

1on1ガイドについて

1on1ミーティングガイド (1on1ガイド)は組織で働く個人のパフォーマンス向上・維持のために実施する1on1ミーティングの実践的なガイドを目指し、コミュニティメンバーによって、パターンランゲージの形式を取り入れ執筆しています。本書はコミュニティのメンバーが共同で執筆しており特定の人によって完成されたものではなく、常に更新されるものです。また、出版される書籍の文章に比べて足りないと思うところはあるかもしれません。よりよい内容となる記載のアイデアがあれば1on1 guide.orgにご連絡ください。

yu4u 2024/05/16

one on one

リンク

Kaggleで学ぶ系列データのための深層学習モデリング

最近は画像コンペではモデリングの余地があまりないことが多いが、系列データのコンペはデファクトの（pretrain）モデルが確立しておらずモデリングで勝敗が分かれることが多い。ここで系列データとは、時系列データ、センサデータ、RNA等のシーケンスデータのようなデータを意図している。このような背景の…

yu4u 2024/05/11

これまでの系列データを扱ったKaggleコンペティションを振り返りながら、系列データの深層学習モデリングを俯瞰してみました

リンク

実例で紹介するRAG導入時の知見と精度向上の勘所

2024/04/24に開催したセミナーで登壇した際に、使用した資料です https://dev.classmethod.jp/news/240424-ai-rag-webinar/

yu4u 2024/05/02

rag

リンク

競技としてのKaggle、役に立つKaggle

Kaggle Masterが語るMachineLearning - TechLovers #1 https://sony.connpass.com/event/315090/ での登壇資料です。コンペの流れとtips的な情報を主観強めで紹介しています。

yu4u 2024/04/26

Kaggle Masterが語るMachineLearning - TechLovers #1 https://sony.connpass.com/event/315090/ での登壇資料です。

リンク

「脳波は下処理しない方がいい」という衝撃の論文が出ていた件｜deriba | 脳と学習

EEG is better left alone (脳波はそのままが良い）というタイトルの論文が2023年にScientific Reportsに出ていた。つまり、「脳波の下処理はしない方がいいよ」という衝撃的なメッセージだ。しかも著者は脳波処理の王道EEGLABを開発したDelorme氏であり、つまり脳波のスペシャリストだ。その彼が「脳波の下処理なんてしない方がいい」という論文を出したという点に、とてつもないインパクトがある。この記事ではその内容を整理し、関連する議論を整理していきたい。結論結構長くなるので結論を先にまとめておく。「ハイパスフィルタやチャンネルの補完を除き、下処理に関するほとんどの処理（自動ノイズ区間除去、ICAによるノイズ除去、ラインノイズ除去、再基準化）をしても脳波解析の精度は上がらなかった」と主張しているただし、使用されている「脳波解析の精度」の指標が不適