はじめに みなさん、Claude Code使ってますか?私は毎日使っています。 Vibe Codingガチアンチだったのですが、Claude Code + Sonnet 4の組み合わせがあまりにも強力すぎて、今では手放せません。 ところで Claude Max プラン、最高ですよね。月額$100で使い放題。 でも、ふと思いませんか? 「これ、従量課金だったらいくらかかってたんだろう...?」 そんな疑問を解決し、「Maxプランでこんなに得してる!」とニヤニヤするためのCLIツール「ccusage」を作りました。 きっかけ このツールを作るきっかけになったのは、@milliondevさんの以下の記事です。 この記事では、Claude Codeがローカルに保存しているJSONLファイルをDuckDBで分析する方法が紹介されています。 ただ、毎回DuckDBでクエリを書くのは少し面倒ですし、サク
https://youtube.com/@tbs_bloomberg 👆チャンネル登録・高評価をよろしくお願いします 広義のデジタル赤字は2035年までに最大45兆円に達する可能性がある。そんな衝撃的な内容が書かれた経産省のレポートが注目されています。レポートを執筆した異色の経歴を持つ若手の経産官僚と、レポートの校閲に携わったみずほ銀行・唐鎌大輔さんと共に、100ページ超に及ぶレポ-トの中身を読み解きます。(収録日は2025年5月13日) 【ゲスト】 ・津田通隆| 経済産業省 情報経済課 アーキテクチャ戦略企画室 室長補佐 /大臣官房 新政策若手プロジェクトPIVOT デジタル経済プロジェクトリーダー 【解説】 ・唐鎌大輔 | みずほ銀行 チーフマーケット・エコノミスト note:「唐鎌Labo」 https://note.com/dkarakama 【MC】 ・竹下隆一郎 |
はじめに 先にまとめ 事前準備 パーツの入手 uvのインストール 組み立て手順 LeRobotのインストール モーターの設定 電源の接続 各モーターバスに関連付けられたUSBポートを見つける 設定ファイルの更新 モーターIDの設定 ジョイントの組み立て ファームウェアの更新(Windows PCのみで可能) キャリブレーション フォロワーアーム/リーダーアームの手動キャリブレーション ロボットの制御 テレオペレーション おわりに We Are Hiring! はじめに こんにちは。 株式会社ABEJAのシステム開発部でエンジニアをしている中島です。 最近ではAIの発展はもちろんのこと、現実世界に作用するロボット分野も発展がめざましいように感じます。 個人でも簡単に触れることができる環境が整ってきているので、これからロボットに興味を持つ方も多いのではないでしょうか? 私自身、ロボットに関しま
こんにちは!ABEJA で ABEJA Platform 開発を行っている坂井(@Yagami360)です。 近年の ChatGPT 等の LLM の飛躍的な発展とマルチモーダル化の流れに伴い、ロボティクス領域においても LLM を活用して、テキストでロボット制御できるようになってきているようです。 LLM に対して画像を入力もできるようにして{画像・テキスト}でのマルチモーダル化したモデルを VLM [Vision-Language Model] といいますが、ロボティクス制御等で LLM を活用できるように更にこれを拡張して、ロボットのアーム制御などの行動ベクトルも入力できるようにして{行動・画像・テキスト}でのマルチモーダル化したモデルを VLA [Vision-Language-Action] モデルといいます。 本記事では、そんな VLA モデルの中でもロボティクス領域におけるツ
3年前、趣味で開発するウェブアプリ向けの安価なAWSアーキテクチャについて記事を書きました。当時流行りの話題だった記憶です。 趣味Webサービスをサーバーレスで作る ― 格安編 - maybe daily dev notes 最近はAWSにも新たに色々なサービスが出てきて、以前とは一味違う構成を取れるようになっています。この記事では、アップデートされた格安かつスケーラブルなウェブアプリ向けAWSアーキテクチャを紹介します。 コード 本記事で紹介するアーキテクチャのリファレンス実装は、以前と同じリポジトリに公開しています。 github.com 主な機能は下記です: Next.js App RouterをAWS Lambda上にデプロイ CloudFront + Lambda関数URLによるレスポンスストリーミング対応 クライアントからサーバー、DBまでの型安全性 Aurora Server
Large language models display impressive capabilities. However, for the most part, the mechanisms by which they do so are unknown. The black-box nature of models is increasingly unsatisfactory as they advance in intelligence and are deployed in a growing number of applications. Our goal is to reverse engineer how these models work on the inside, so we may better understand them and assess their fi
一時期Ruby on RailsのERB + jQueryベースのフロントエンドをReactやVueのモダンフロントエンドにリプレイスするのが流行りました。私も現場でこういう例を複数見ています。 しかしどれも途中で止まっています。半分にも届かないぐらいのところで "ERB + jQuery"だったものが "ERB + jQuery + React + Next.js"とか"ERB + jQuery + Vue"になっています。 複雑度はむしろ明確に増しています そこで、こういう結末が一般的なのかどうか、ウェブを検索して調べてみました。 タイミー社の例 Rails (多分ERB) + jQueryが出発点 30画面 Next.jsのSPAに移行 3年間かかった (2年弱の時点で一回中断) クックパッド社の例 2020年にRails (多分ERB) + CoffeeScript/jQueryを
OpenAIの「gpt-image-1」を試したので、まとめました。 ・Image generation - OpenAI API 1. OpenAIの画像生成「gpt-image-1」は、OpenAIで最も高度な画像生成モデルで、テキストプロンプトから画像生成および編集できます。高品質な画像生成と、画像作成における世界知識の活用能力を備えています。 現在、「Image API」のみで利用可能です。近日「Responses API」もサポートします。 2. 使用料金2-1. 使用料金テキストトークンと画像トークンには個別の料金が適用されます。 ・テキスト入力トークン (プロンプトテキスト) : 100万トークンあたり5ドル ・画像入力トークン (入力画像) : 100万トークンあたり10ドル ・画像出力トークン (生成画像) : 100万トークンあたり40ドル 実際には、低品質、中品質、高
米OpenAIが4月16日(現地時間)に新たなAIモデル「o3」と「o4-mini」の公開に合わせて公開したこれらのモデルのSystem Card(PDF)によると、o4-miniのハルシネーション(幻覚)率は、o1およびo3と比較して高いという。 ハルシネーションの評価には、質問応答データセットである「PersonQA」を用いた。この評価では、モデルが質問に対して正確に回答できたか(精度)と、事実に基づかない情報を生成した頻度(ハルシネーション率)が測定される。 評価の結果、o4-miniの精度は0.36と低く、ハルシネーション率は0.48と高い数値を示した。OpenAIは、小型のモデルは一般的に知識量が少なく、ハルシネーションを起こしやすい傾向があるためと説明している。 また、o3はo1と比較して、全体的により多くの主張を行う傾向が見られた。その結果、正確な主張の数が増加する一方で、不
With the growing popularity of vibe coding, more people are now able to participate in service development. However, over the past few months, I've discovered and reported vulnerabilities across more than five websites, leading to the exposure of over 10,000 pieces of personal information, such as email addresses. During this process, it became clear that many services are being released without s
OpenAIからCodex CLIというOSSがリリースされました。Codex CLIは、Claude Codeのようなコマンドラインで利用するコーディングエージェントのTUIツールです。Node.jsで実装されており、使用しているnpmパッケージからして構造はClaude Codeと類似していますが、設計に違いがあります。 GitHub - openai/codex: Lightweight coding agent that runs in your terminalLightweight coding agent that runs in your terminal - openai/codexGitHubopenaiOpenAI Codex CLIの概要あなたは、OpenAIによって構築されたターミナルベースのエージェント型コーディングアシスタントであるCodex CLIとして、そ
イベント駆動AIエージェント - AIエージェントのトリガー方法を分類・考察したらイベント駆動型にも目を向ける必要があると気付いた話 TL;DRAIエージェントの起動方式を「チャット駆動型」「ワークフロー駆動型」「イベント駆動型」に分類した。 チャット駆動型はユーザー指示待ちで受動的になりがちで、スケーラビリティを人間の入力能力が制約してしまう イベント駆動型AIエージェント(EDA)は、環境変化やイベント情報などをトリガーに自律的に動作し、先回りした対応が可能 MCPとの組み合わせにより、外部システムとの連携が円滑になり、さらに高度な自動化を実現する可能性がある。 ただしEDAは万能ではなく、チャット駆動型やワークフロー駆動型と相補的に使うことが重要 はじめにAlgomaticの山中(@gura105)です。 AIエージェント、業務で使ってますか? 最近Deep ResearchやCli
3ヶ月経って、いくつか新しいモデルが登場したことでごっそり事情が変わりました。 ChatGPT Pro使ってましたが解約しました。o3が登場したらまた考えます。一時期解約していたGemini Advanced(Google AI Oneプレミアム?)を契約しなおしました。Claudeの年契約をしたんですがすこーし後悔しています。 追記: Gemini 2.5 Pro は今までのGemini シリーズとは明確に違うコメントとかでGeminiアレルギーの人が多そうなので追記します。実際のところ僕もそうでしたよ。過去のGeminiは、特に1.5 Proが論外なくらいハルシネーションも多く馬鹿で、使い物にならないおもちゃでした。それは事実です。2.0 Proで状況が変わり始めたものの実験モデルが続いてて、結局コイツの真価がよくわからんってなってました。 Gemini 2.5 Proを触ったことがな
2025年4月より、所属していた株式会社ヘンリーは非常勤となり、フェローという肩書きを拝命しました。フェローとしては技術広報や採用広報の支援を中心に活動します。 ヘンリー理想駆動ラジオ というポッドキャストを始めたのもその一環で、今後書き起こしなども出していく予定です。 背景としては、プライベートの状況や色々もあってフルタイムで働くのは辞めようと考え、そういう状況でVPoEの責務を果たすのが難しくなったというのがあります。元々は退職予定でしたが、パートタイムで在籍を残させてもらうことになりました。 独立 元々個人事業主ではありましたが、フリーランスとしても正式に(?)独立となります。しばらくあまり稼働時間は増やさず、自分がやりたいことにもう少しフォーカスしたいとは思っています。 やりたいこととしては、今、本を書いているのですが、そういう文筆業だったり、OSSやBlog、ポッドキャストを含め
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 模倣学習とは 模倣学習(Imitation Learning)とは、人間の操作データを用いて、現在の状態を入力、次のステップの行動を出力として教師あり学習を行う手法です。[1] つまるところ、人間が物の掴み方などを教えることで、ロボットが掴み方を覚えその後は人間の補助なしに自動でものをつかめるようになるということです。 人間がロボットに直接正解の動作を教え込むため、一般的な機械学習の手法より成功率が高くなるとされます。また、一度動作を覚えると物の位置が変わったり、物自体が変わっていても柔軟に対応してくれます。[1] 昨今界隈で話題になっ
はじめに LLMと外部データソースを統合する際、ツールの認証をどうするのか悩みます。たとえば、MyGPTsのActionsではOAuth 2.0による認証[1]が実装されています。 MyGPTsではこのようにOAuth設定が可能 これは結構便利で、Google Apps Scriptを作り、組織内ユーザーにアクセスを限定した形でデプロイすれば、スプレッドシートやGmailとのセキュアな連携が、認証フロー含めてMyGPTs上で完結します。 Apps Scriptは呼び出し元を制限できる。呼び出しにはOAuth2が必要。 一方でClaude Desktopも使えるGoogle Workspace連携MCPサーバーの作例を見ると、APIキー認証のものか、手元で認証フローを走らせるもので、Claude Desktop上で認証・認可できるものは管見の限りありません。 この記事は、Claude Des
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く