kazuph1986のブックマーク - はてなブックマーク

ai/demos/remote-mcp-server at main · cloudflare/ai

kazuph1986 2025/05/30

一番ミニマムにClaudeのremote mcp連携が可能な実装これだった。

リンク

Claude Codeの使用料金を可視化するCLIツール「ccusage」を作った

はじめにみなさん、Claude Code使ってますか？私は毎日使っています。 Vibe Codingガチアンチだったのですが、Claude Code + Sonnet 4の組み合わせがあまりにも強力すぎて、今では手放せません。ところで Claude Max プラン、最高ですよね。月額$100で使い放題。でも、ふと思いませんか？「これ、従量課金だったらいくらかかってたんだろう...？」そんな疑問を解決し、「Maxプランでこんなに得してる！」とニヤニヤするためのCLIツール「ccusage」を作りました。きっかけこのツールを作るきっかけになったのは、@milliondevさんの以下の記事です。この記事では、Claude Codeがローカルに保存しているJSONLファイルをDuckDBで分析する方法が紹介されています。ただ、毎回DuckDBでクエリを書くのは少し面倒ですし、サク

kazuph1986 2025/05/30

これ使ってます！めっちゃ便利！

リンク

【“隠れたソフトウェア”で赤字爆増】気鋭の経産官僚が警鐘／背景にハードとソフトの“主従逆転”／自動車産業すら“瓦解”の懸念／次の焦点「量子技術」でも米中に遅れ？【エコラボ】

https://youtube.com/@tbs_bloomberg 👆チャンネル登録・高評価をよろしくお願いします広義のデジタル赤字は2035年までに最大45兆円に達する可能性がある。そんな衝撃的な内容が書かれた経産省のレポートが注目されています。レポートを執筆した異色の経歴を持つ若手の経産官僚と、レポートの校閲に携わったみずほ銀行･唐鎌大輔さんと共に、100ページ超に及ぶレポ－トの中身を読み解きます。（収録日は2025年5月13日）【ゲスト】・津田通隆| 経済産業省情報経済課アーキテクチャ戦略企画室室長補佐／大臣官房新政策若手プロジェクトPIVOT デジタル経済プロジェクトリーダー【解説】・唐鎌大輔 | みずほ銀行チーフマーケット・エコノミスト note:「唐鎌Labo」　https://note.com/dkarakama 【MC】・竹下隆一郎 |

kazuph1986 2025/05/26

ありがとう。

リンク

【初心者でも】ロボットアーム SO-101組み立てレポート【ロボット作りたい】 - ABEJA Tech Blog

はじめに先にまとめ事前準備パーツの入手 uvのインストール組み立て手順 LeRobotのインストールモーターの設定電源の接続各モーターバスに関連付けられたUSBポートを見つける設定ファイルの更新モーターIDの設定ジョイントの組み立てファームウェアの更新(Windows PCのみで可能) キャリブレーションフォロワーアーム/リーダーアームの手動キャリブレーションロボットの制御テレオペレーションおわりに We Are Hiring! はじめにこんにちは。株式会社ABEJAのシステム開発部でエンジニアをしている中島です。最近ではAIの発展はもちろんのこと、現実世界に作用するロボット分野も発展がめざましいように感じます。個人でも簡単に触れることができる環境が整ってきているので、これからロボットに興味を持つ方も多いのではないでしょうか？私自身、ロボットに関しま

kazuph1986 2025/05/24

自分も早く作りたいな

リンク

Scientific Diagrams

kazuph1986 2025/05/23

Cetz & TikZ 等の作図例。めっちゃテンション上がる。めっちゃ大好き。

リンク

ロボティクス領域の VLA モデル「π0」の仕組みを理解する - ABEJA Tech Blog

こんにちは！ABEJA で ABEJA Platform 開発を行っている坂井（@Yagami360）です。近年の ChatGPT 等の LLM の飛躍的な発展とマルチモーダル化の流れに伴い、ロボティクス領域においても LLM を活用して、テキストでロボット制御できるようになってきているようです。 LLM に対して画像を入力もできるようにして｛画像・テキスト｝でのマルチモーダル化したモデルを VLM [Vision-Language Model] といいますが、ロボティクス制御等で LLM を活用できるように更にこれを拡張して、ロボットのアーム制御などの行動ベクトルも入力できるようにして｛行動・画像・テキスト｝でのマルチモーダル化したモデルを VLA [Vision-Language-Action] モデルといいます。本記事では、そんな VLA モデルの中でもロボティクス領域におけるツ

kazuph1986 2025/05/17

リンク

AWSの安価でスケーラブルなウェブアプリ構成 2025年度版 - maybe daily dev notes

3年前、趣味で開発するウェブアプリ向けの安価なAWSアーキテクチャについて記事を書きました。当時流行りの話題だった記憶です。趣味 Webサービスをサーバーレスで作る ― 格安編 - maybe daily dev notes 最近はAWSにも新たに色々なサービスが出てきて、以前とは一味違う構成を取れるようになっています。この記事では、アップデートされた格安かつスケーラブルなウェブアプリ向けAWSアーキテクチャを紹介します。コード本記事で紹介するアーキテクチャのリファレンス実装は、以前と同じリポジトリに公開しています。 github.com 主な機能は下記です: Next.js App RouterをAWS Lambda上にデプロイ CloudFront + Lambda関数URLによるレスポンスストリーミング対応クライアントからサーバー、DBまでの型安全性 Aurora Server

kazuph1986 2025/05/16

“Next.js App RouterとCognitoログインの統合” "100ユーザーで月額8.5ドル" お〜ここまでできるものだったのね！！

リンク

On the Biology of a Large Language Model

Large language models display impressive capabilities. However, for the most part, the mechanisms by which they do so are unknown. The black-box nature of models is increasingly unsatisfactory as they advance in intelligence and are deployed in a growing number of applications. Our goal is to reverse engineer how these models work on the inside, so we may better understand them and assess their fi

kazuph1986 2025/05/05

これすごいな。

リンク

フロントエンドのリプレイスに、いつまでかけるんだ？

一時期Ruby on RailsのERB + jQueryベースのフロントエンドをReactやVueのモダンフロントエンドにリプレイスするのが流行りました。私も現場でこういう例を複数見ています。しかしどれも途中で止まっています。半分にも届かないぐらいのところで "ERB + jQuery"だったものが "ERB + jQuery + React + Next.js"とか"ERB + jQuery + Vue"になっています。複雑度はむしろ明確に増していますそこで、こういう結末が一般的なのかどうか、ウェブを検索して調べてみました。タイミー社の例 Rails (多分ERB) + jQueryが出発点 30画面 Next.jsのSPAに移行 3年間かかった（2年弱の時点で一回中断）クックパッド社の例 2020年にRails (多分ERB) + CoffeeScript/jQueryを

kazuph1986 2025/04/24

フロントエンド移行に数年かかるとういデータを複数集めた記事。そういう会社はある意味、雇用の枠を増やしてくれている余裕のある会社。社会貢献。

リンク

OpenAI の gpt-image-1 を試す｜npaka

OpenAIの「gpt-image-1」を試したので、まとめました。・Image generation - OpenAI API 1. OpenAIの画像生成「gpt-image-1」は、OpenAIで最も高度な画像生成モデルで、テキストプロンプトから画像生成および編集できます。高品質な画像生成と、画像作成における世界知識の活用能力を備えています。現在、「Image API」のみで利用可能です。近日「Responses API」もサポートします。 2. 使用料金2-1. 使用料金テキストトークンと画像トークンには個別の料金が適用されます。・テキスト入力トークン (プロンプトテキスト) : 100万トークンあたり5ドル・画像入力トークン (入力画像) : 100万トークンあたり10ドル・画像出力トークン (生成画像) : 100万トークンあたり40ドル実際には、低品質、中品質、高

kazuph1986 2025/04/24

API経由でもやっぱりセピア色にはなりますね。

リンク

OpenAI、o3とo4-miniは「従来モデルよりハルシネーション率が高い」

米OpenAIが4月16日（現地時間）に新たなAIモデル「o3」と「o4-mini」の公開に合わせて公開したこれらのモデルのSystem Card（PDF）によると、o4-miniのハルシネーション（幻覚）率は、o1およびo3と比較して高いという。ハルシネーションの評価には、質問応答データセットである「PersonQA」を用いた。この評価では、モデルが質問に対して正確に回答できたか（精度）と、事実に基づかない情報を生成した頻度（ハルシネーション率）が測定される。評価の結果、o4-miniの精度は0.36と低く、ハルシネーション率は0.48と高い数値を示した。OpenAIは、小型のモデルは一般的に知識量が少なく、ハルシネーションを起こしやすい傾向があるためと説明している。また、o3はo1と比較して、全体的により多くの主張を行う傾向が見られた。その結果、正確な主張の数が増加する一方で、不

kazuph1986 2025/04/20

o3はo1の倍のハルシネーションを起こすというのは自分が感じたそのままだった。

リンク

GitHub - hand-dot/supabase-rls-checker: Supabase RLS Checker is a Chrome extension that automatically verifies Row Level Security (RLS) settings for Supabase databases used by websites. It detects tables with disabled RLS settings that should be protectin

With the growing popularity of vibe coding, more people are now able to participate in service development. However, over the past few months, I've discovered and reported vulnerabilities across more than five websites, leading to the exposure of over 10,000 pieces of personal information, such as em ail addresses. During this process, it became clear that many services are being released without s

kazuph1986 2025/04/18

リンク

OpenAI Codex CLIの仕組み

OpenAIからCodex CLIというOSSがリリースされました。Codex CLIは、Claude Codeのようなコマンドラインで利用するコーディングエージェントのTUIツールです。Node.jsで実装されており、使用しているnpmパッケージからして構造はClaude Codeと類似していますが、設計に違いがあります。 GitHub - openai/codex: Lightweight coding agent that runs in your terminalLightweight coding agent that runs in your terminal - openai/codexGitHub openai OpenAI Codex CLIの概要あなたは、OpenAIによって構築されたターミナルベースのエージェント型コーディングアシスタントであるCodex CLIとして、そ

kazuph1986 2025/04/18

apply_patchがshellコマンドとして定義されてるのオモローって思って見てましたが、shellに全振りしてたんですね。

リンク

https://platform.openai.com/docs/guides/flex-processing

kazuph1986 2025/04/18

OpenAIでもEC2のスポットインスタンスみたいな？考えでとりあえず投機して、実際に実行できたらレスポンスするくらいな利用ができる。コストが半額になる。

リンク

GitHub - berkeley-hipie/segllm: Code release for "SegLLM: Multi-round Reasoning Segmentation"

kazuph1986 2025/04/18

リンク

イベント駆動AIエージェント - AIエージェントのトリガー方法を分類・考察したらイベント駆動型にも目を向ける必要があると気付いた話｜gura105

イベント駆動AIエージェント - AIエージェントのトリガー方法を分類・考察したらイベント駆動型にも目を向ける必要があると気付いた話 TL;DRAIエージェントの起動方式を「チャット駆動型」「ワークフロー駆動型」「イベント駆動型」に分類した。チャット駆動型はユーザー指示待ちで受動的になりがちで、スケーラビリティを人間の入力能力が制約してしまうイベント駆動型AIエージェント（EDA）は、環境変化やイベント情報などをトリガーに自律的に動作し、先回りした対応が可能 MCPとの組み合わせにより、外部システムとの連携が円滑になり、さらに高度な自動化を実現する可能性がある。ただしEDAは万能ではなく、チャット駆動型やワークフロー駆動型と相補的に使うことが重要はじめにAlgomaticの山中(@gura105)です。 AIエージェント、業務で使ってますか？最近Deep ResearchやCli

kazuph1986 2025/04/15

実は最近、というか去年ぐらいから稼働はしてますが、Event Driven Agentを開発しているので、体系的にまとめてもらってとてもためになる記事でした。

リンク

LLMの使い分けは大体Geminiでいい（2025年4月時点）｜erukiti

3ヶ月経って、いくつか新しいモデルが登場したことでごっそり事情が変わりました。 ChatGPT Pro使ってましたが解約しました。o3が登場したらまた考えます。一時期解約していたGemini Advanced（Google AI Oneプレミアム？）を契約しなおしました。Claudeの年契約をしたんですがすこーし後悔しています。追記: Gemini 2.5 Pro は今までのGemini シリーズとは明確に違うコメントとかでGeminiアレルギーの人が多そうなので追記します。実際のところ僕もそうでしたよ。過去のGeminiは、特に1.5 Proが論外なくらいハルシネーションも多く馬鹿で、使い物にならないおもちゃでした。それは事実です。2.0 Proで状況が変わり始めたものの実験モデルが続いてて、結局コイツの真価がよくわからんってなってました。 Gemini 2.5 Proを触ったことがな

kazuph1986 2025/04/14

Claudeの良いところはDesktop + MCPと美的センスなので同意。パープレはGemini 2.5 Pro Deep Researchに破壊されたかなと思ってますが、最近使ってないのでわかりません。

リンク

フェロー就任と独立のお知らせ | おそらくはそれさえも平凡な日々

2025年4月より、所属していた株式会社ヘンリーは非常勤となり、フェローという肩書きを拝命しました。フェローとしては技術広報や採用広報の支援を中心に活動します。ヘンリー理想駆動ラジオというポッドキャストを始めたのもその一環で、今後書き起こしなども出していく予定です。背景としては、プライベートの状況や色々もあってフルタイムで働くのは辞めようと考え、そういう状況でVPoEの責務を果たすのが難しくなったというのがあります。元々は退職予定でしたが、パートタイムで在籍を残させてもらうことになりました。独立元々個人事業主ではありましたが、フリーランスとしても正式に(?)独立となります。しばらくあまり稼働時間は増やさず、自分がやりたいことにもう少しフォーカスしたいとは思っています。やりたいこととしては、今、本を書いているのですが、そういう文筆業だったり、OSSやBlog、ポッドキャストを含め

kazuph1986 2025/04/11

お疲れ様でした！

リンク

[LeRobot]#1 人間の動作を覚える4万円ロボットアーム"SO-100"の概要編 - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 模倣学習とは模倣学習(Imitation Learning)とは、人間の操作データを用いて、現在の状態を入力、次のステップの行動を出力として教師あり学習を行う手法です。[1] つまるところ、人間が物の掴み方などを教えることで、ロボットが掴み方を覚えその後は人間の補助なしに自動でものをつかめるようになるということです。人間がロボットに直接正解の動作を教え込むため、一般的な機械学習の手法より成功率が高くなるとされます。また、一度動作を覚えると物の位置が変わったり、物自体が変わっていても柔軟に対応してくれます。[1] 昨今界隈で話題になっ

kazuph1986 2025/04/10

リンク

【実験】 Google OAuth2 付きMCPサーバーを作って、Claude Desktopから呼んでみる（Cloudflare）

はじめに LLMと外部データソースを統合する際、ツールの認証をどうするのか悩みます。たとえば、MyGPTsのActionsではOAuth 2.0による認証[1]が実装されています。 MyGPTsではこのようにOAuth設定が可能これは結構便利で、Google Apps Scriptを作り、組織内ユーザーにアクセスを限定した形でデプロイすれば、スプレッドシートやGmailとのセキュアな連携が、認証フロー含めてMyGPTs上で完結します。 Apps Scriptは呼び出し元を制限できる。呼び出しにはOAuth2が必要。一方でClaude Desktopも使えるGoogle Workspace連携MCPサーバーの作例を見ると、APIキー認証のものか、手元で認証フローを走らせるもので、Claude Desktop上で認証・認可できるものは管見の限りありません。この記事は、Claude Des

kazuph1986 2025/04/08

例えば権限を制限しているスプレッドシートをMCPを使ってOAuth認証してアクセスできるようになるらしい。

リンク

はてなブックマーク

タグ

kazuph1986のブックマーク (14,387)

お知らせ

今週のはてなブックマーク数ランキング（2025年5月第4週）

今週のはてなブックマーク数ランキング（2025年5月第3週）

今週のはてなブックマーク数ランキング（2025年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス