« 前のひとこと | トップページ | 次のひとこと »

cocolog:95518231

Gemini CLI が出て Claude Code に興味を持っていた私はさっそく Google Colab 上で触ってみることにした。Google Cloud Platform の課金も受け容れて。mcp-imagen-go のデバッグに苦労した。 (JRF 0903)

JRF 2025年7月 1日 (火)

Gemini CLI が出たので Claude Code に興味を持っていた私は早速触ってみることにした。ローカルに Node.js、npm を入れるのは、今後の管理が難しそうなので、Google Colab 上で触ろうということに。

JRF2025/7/17718

Google Colab は、期間限定サービスを受けられるためのブラウザを通じた Google Login が使えず GEMINI_API_KEY を使うしかなく。それを使うために GCP (Google Cloud Platform) に課金をはじめた。ただ、今は、GCP の 300ドル分の無料トライアル期間中のため、実際にお金が使われていることはない。が、いずれ使われることになる。

JRF2025/7/16618

やや苦労しながら、Gemini CLI (gemini-cli) を使えるようにはなった。ただ、mcp-imagen-go を使った実験をはじめたところハマってしまった。いろいろうまくいかない。それもなんとか制限された条件で画像が生成されるようになったのだが、問題は多く残されて、そこでギブアップ。

JRF2025/7/16376

ただ、これでいろいろやったのが Google 様に評価されたのか Trial credit for GenAI App Builder といって1年有効の 1000ドル分のクレジット…奨学金みたいなものをもらえた。ありがたい。

内部の技術に興味があったので、他の方がやっていたのをマネして、Gemini CLI の機能を Gemini CLI に解説させるようなこともやってみた。将来、拙作の jrf_pdb_agent_lib や simlest-pal が活かせないかと思って、プロンプト設計まわりを特に聞いたみた。

JRF2025/7/14668

《Gemini CLI 解析レポート - GitHub Gist》
https://gist.github.com/JRF-2018/92a982b67bfa70c6f578b2f6adceecc5

以上なのであるが、様々な苦労をしながらそれを「グローバル共有メモ」または Twitter (X) に書いていたので、ここからはそれをコピペしておく。お目汚し失礼します。

JRF2025/7/14605

……。

……。

○ 2025-06-25T16:55:51Z

まず、Google Colab にターミナルが付いたね! やったねたえちゃん。でも、ed は標準では入ってなかった orz。そしてそこで gemini-cli も一応使えた。ブラウザがないから Google Login ではだめなので、/root/.env に GEMINI_API_KEY を指定する方向で。

ただ、ed がはいってないのは、apt install ed すればいいだけの話だが。

JRF2025/7/17513

gemini-cli は npx https://github.com/google-gemini/gemini-cli ではインストールというか、そのままそこで実行になりはした。「gemini cliについてwebで調べてください」は Gemini 2.5 Flash に変えたせいか、消費トークンが多すぎるらしくてうまくいかなかったがただの挨拶だけならなんとかうまくいった。でも、それを終了しても gemini コマンドをできなかったので、npm install -g @google/gemini-cli したら、なんかエラーでうまくいかなかった。

JRF2025/7/18373

まだ本調子じゃない感じかな? でも、使えはしたのでちょっと感動!

参考:

《Gemini CLI の使い方》
https://zenn.dev/mafukuda/articles/gemini-cli-usage

《Gemini CLI の簡単チュートリアル》
https://zenn.dev/schroneko/articles/gemini-cli-tutorial

JRF2025/7/19782

…….

○ 2025-06-25T18:23:08Z

時間がたっただけで npm install -g @google/gemini-cli もうまくいった。

ターミナルで apt install emacs したら、emacs 動いてるね。ちゃんとチェックしてないけど。

これまで Firefox で試してたけど、Chrome でやったら、そのほうが表示がキレイだね。gemini-cli からブラウザは相変わらず使えないけど。この辺 Chrome 作ってる Google なんだからなんとかならないのかな…。

JRF2025/7/17533

…….

○ 2025-06-25T18:50:34Z

ずっと以前、ブラウザがあれば何でもできるようになる…という方向があった。でもスマホの登場でなぁなぁになった。でも、それをもう一度追及できるんじゃないか? Google Colab みたいなクラウド系サービスから、Chrome などの「ブラウザ」をユーザー側に開けるようになるようなプロトコルができれば。

JRF2025/7/17663

…….

○ 2025-06-25T18:54:16Z

Gemini:> クラウドサービスが直接ユーザーのローカルマシンにアクセスするのではなく、ブラウザというサンドボックスを介してプロトコルレベルで連携することで、セキュリティリスクをコントロールしやすくなる可能性があります

jrf:> サンドボックス化は AI がらみで強く求められていて時代にマッチしている気がします。

JRF2025/7/19535

…….

○ 2025-06-25T19:11:39Z

そんなに難しくないのかな? gradio みたいにサーバーを起動して、そこへアクセスすると、ページの中にアドレスバーと「ブラウザ」がある感じ。なんかすでにありそうだな…。

JRF2025/7/15828

…….

○ 2025-06-25T21:56:24Z

やっぱりダメだな。Google Colab 上の gemini-cli、ほとんど「リソースを食いつくした」みたいなエラーが出て、その後なぜか思考が続くんだけど、出力はない。無料では限界あるのかな…。

JRF2025/7/16869

…….

○ 2025-06-25T22:10:12Z

その後、思考が続いているという様子からすると、1日のリソース制限に触れたというのではなく瞬間的なリソース制限なのではないか。Gemini 2.5 Flash なので応答が速すぎて、そういうことが想定外に起こっているのでは? だから gemini-cli 側でウェイトを入れるとかしてくれないといけないように思う。

JRF2025/7/11025

…….

○ 2025-06-25T22:25:05Z

いや、リトライは自動的にやってくれてるみたいだから、単純に1日の制限に引っ掛かっているのかもしれない。orz

JRF2025/7/18290

…….

○ 2025-06-25T23:59:21Z

Google AI Studio から Gemini API トークンをはじめて(無料で)手に入れたので、ちょっと思い立って昔やった熊剣迷路問題([cocolog:94293132](2023年7月))を Gemini さんで初めて動かしてみた。動いたけど制限がしわくてゴールまでたどり着けそうにない orz。

JRF2025/7/13150

…….

○ 2025-06-26T04:27:31Z

なるほど。Colab のターミナル。これまでも有料ユーザーは使えたのか。最近ずっと無料版だったから知らなかった(忘れてた)。無料版で使えるようになったのが新しいんだね。あと、npm とか勉強してないので知らなかったけど、npx はもとからインストールせずに実行…なんだね。

JRF2025/7/16679

…….

○ 2025-06-26T19:04:22Z

Google Colab にデフォルトで gemini-cli が入ってるね。すでにインストールされてる。ターミナルで export GEMINI_API_KEY=... やってれば gemini コマンドが動く。が、Gemini が無料版だと制限があるからか、まともに動かない orz。

JRF2025/7/16583

…….

○ 2025-06-26T19:18:11Z

うーん、GCP は使いたくないんだよな。以前、だいたいアングラの Bard API を使うしかなかったころ、GCP で類似のサービスがはじまるというので期待して問い合わせたら、全く何も返答がなかった…ということがあって、全く信頼できないサービスという印象がある。 法人相手のサービスで個人を相手にしてなかった…ということなのかもしれないが。

JRF2025/7/19531

…….

○ 2025-06-26T21:21:20Z

《Google AI Studio / Gemini CLIに見る AIサービスの『課金障壁』という巧妙な罠:無料は危険、有料は困難という現代版厚黒学|平岡憲人(ノーリー)》
https://note.com/norito_hiraoka/n/n014de9e6ff87

JRF2025/7/11037

…….

○ 2025-06-27T05:16:31Z

Colab 上で gemini-cli。腹をくくって課金したった。が、Exhausted とか Too Many Requests とかのエラーがまだ出る。どうもこれは向こうのエラーだったらしく↓を参考に最新の gemini-cli にしたらこのエラーは出なくなった。課金いらなかったんや…。orz

JRF2025/7/17194

《gemini-2.5-pro is [API Error: got status: 429 Too Many Requests. · Issue #1502 · google-gemini/gemini-cli》
https://github.com/google-gemini/gemini-cli/issues/1502

JRF2025/7/10222

Colab で最新にするときはターミナルで npm install -g --force @google/gemini-cli@latest をすればよいようだ。

ちなみに課金したので熊剣迷路問題([cocolog:94293132](2023年7月))をやらせてみたら、若干迷ったが、100点でクリアできた(gemini-1.5-flash で)。すごいね! AI の進歩を感じるね。

JRF2025/7/17909

…….

○ 2025-06-27T05:22:12Z

あ、そうそう。あと Gemini Advanced と Gemini API の課金は別らしい。私は Gemini API の課金(GCP での課金)設定をした。

JRF2025/7/19235

…….

○ 2025-06-27T11:33:17Z

ダメだ↓がうまくいかない。Colab 上の gemini-cli。go の 1.24.3 のインストールとか、export GOOGLE_APPLICATION_CREDENTIALS=/content/.config/application_default_credentials.json とかいろいろ解決したんだが、最後が Internal error。私にも Gemini さんにもどうしようもない。

JRF2025/7/14531

《Gemini CLI 入門 (5) - MCP Servers for Google Cloud Genmedia APIs|npaka》
https://note.com/npaka/n/n50cacd92648f

JRF2025/7/11121

…….

○ 2025-06-27T16:22:51Z

なぞだ。↓によってローカルにも生成できるのを知って試してみたら、プロンプトが「Create an image of a cat flying around space」なら通るのに「かわいい猫耳メイドの絵を描いてください。」だと gemini-2.5-flash だと無限ループっぽくなる。gemini-2.5-pro なら後者も通った! やったー!

でも、なんでバケットを指定したのが Internal error になるのかはまだわからない orz。

JRF2025/7/16319

《Gemini CLI から Imagen を呼び出し! MCPサーバー経由で画像生成 #GoogleCloud - Qiita》
https://qiita.com/te_yama/items/db572cad90a3ae221847

JRF2025/7/12538

…….

…….

○ 2025-06-27T17:10:54Z

Colab 上 で gemini-cli。Imagen で絵を生成。ポイントを書いておくと、↓の手順通りなのだが、

《Gemini CLI から Imagen を呼び出し! MCPサーバー経由で画像生成 #GoogleCloud - Qiita》
https://qiita.com/te_yama/items/db572cad90a3ae221847

JRF2025/7/17313

GEMINI_API_KEY をまず設定する。gemini が起動して挨拶を返せるようになったら…。

gcloud auth application-default login

…する。Colab 上では --no-launch-browser が自動で指定されてる感じ。

gcloud auth application-default set-quota-project $PROJECT_ID

JRF2025/7/18576

export GOOGLE_APPLICATION_CREDENTIALS=/content/.config/application_default_credentials.json

add-apt-repository -y ppa:longsleep/golang-backports

apt install golang

JRF2025/7/11644

export PATH=$PATH:/root/go/bin

あとは↑の記事の手順通り。GCP で Imagen API の許可(Vertex AI の許可)とかはやっておくように。$PROJECT_ID は↑の記事のようにしても設定されないから、自分で設定してください。

JRF2025/7/18592

…….

…….

○ 2025-06-27T17:35:40Z

「Create an image of a cat flying around space」なら生成できるのに「Create an image of a dog flying around space」だと無限ループっぽい。謎だ orz。

JRF2025/7/15526

…….

○ 2025-06-28T10:00:18Z

gemini-cli さわってほぼ徹夜して、そのこと考えて頭カッとしてなかなか寝れなかったけど、さっきやっと眠れた。いやぁ、このトシで徹夜はダメだね。体にこたえる。前、フジの会見遅くまでやってたりしたけど、あの人ら体力すごいよ。その点は尊敬する。

JRF2025/7/18395

…….

○ 2025-06-28T10:56:52Z

あれ? ダメだ。昨日の方法では Imagen が常に無限ループに入っている感じ。原因がわからない。昨日も無限ループっぽい挙動があったのだがたまたまかと思っていたら…。ちなみにそうなったらセルから !ps -ef して node /tools/node/bin/gemini の PID を !kill -9 PID するしかない感じだけど…。

JRF2025/7/10789

…….

○ 2025-06-28T11:22:24Z

GCP。300ドル分の無料トライアルとは別に Trial credit for GenAI App Builder といって1年有効の 1000ドル分のクレジットが付加された。メールとか何の説明もないのだが Gemini さんによるとそういうことがあるらしい。ありがたい! これで実験しまくれる! 気力・体力持つかな…。

JRF2025/7/19759

…….

○ 2025-06-28T18:42:17Z

gemini-cli で GoogleCloudPlatform/vertex-ai-creative-studio の mcp-imagen-go を使った画像生成。無限ループになる(スタックする)件。Colab の問題かと思って、GCP の Cloud Shell でもやってみたらやっぱりスタックした。でも Issue にはない感じなんだよね。この症状…。

…と思ったら、止まってるように見えただけで、Cloud Shell のほうでは生成されてた。指定しないとローカルにセーブはされてなかったけど。

JRF2025/7/17991

…….

○ 2025-06-28T18:50:32Z

gemini-cli で GoogleCloudPlatform/vertex-ai-creative-studio の mcp-imagen-go を使った画像生成。無限ループになる(スタックする)件。Colab の問題のようだ。GCP の Cloud Shell で試してみたら、ちゃんと成功したから。Issue にも上がってなさそうな問題なんだよな…。

JRF2025/7/11159

…….

○ 2025-06-28T19:08:46Z

あ、Colab の gemini-cli で Imagen。「Create "an image of a cat flying around space" and save it locally.」ならうまくいった! 「Create an image of a cat flying around space」だとスタックするのに! なにゆえ…。

JRF2025/7/12118

…….

○ 2025-06-28T22:04:20Z

gemini-cli のプロンプト設計などについて gemini-cli (gemini-2.5-pro) にお願いしてレポートを作ってもらった。共有しておく。

《Gemini CLI 解析レポート - GitHub Gist》
https://gist.github.com/JRF-2018/92a982b67bfa70c6f578b2f6adceecc5

JRF2025/7/15824

…….

○ 2025-06-29T01:50:54Z

バージョンアップ。前のバージョンは mcp のコードがないといわれていたが、それはおかしいので、再生成を試みた。今度は少しだけ説明してくれた。

《Gemini CLI 解析レポート - GitHub Gist》
https://gist.github.com/JRF-2018/92a982b67bfa70c6f578b2f6adceecc5

JRF2025/7/14108

…….

○ 2025-06-28T23:03:27Z

gemini-cli のシステムプロンプトを読むと、基本的に React のプログラムを作るようになってるんだよね。私は React とかわからないんで、Python をメインにしてほしいのだが。もちろん、Python で…と言えば追従してはくれるのだろうけど。

Python がメインでないとすると gemini-cli から ASI にいたる道はやや困難なのかも。

JRF2025/7/17882

…….

○ 2025-06-29T05:04:48Z

Colab の gemini-cli で Imagen。デバッグオプション(-d)付きで起動したところ、イメージの生成は成功していて、その後、(base64?)文字列で返そうとするところでスタックしている。ところが、gemini --model=gemini-2.5-pro -d -p "Create an image of a cat flying around space" ならばスタックしない。

JRF2025/7/19717

どうも gemini の CUI が悪さをしているようだ。Gemini さんに相談すると、そういっている。ただし、スタックはしないが、画像はセーブもされない。文字列を受け取ってそのままのようだ。

JRF2025/7/10139

…….

○ 2025-06-29T06:25:54Z

Colab の gemini-cli で Imagen。mcp-imagen-go の handler.go が telemetry に接続しようとして、gemini -p 起動でもだいたいスタックする感じがある。これは何だろう? telemetry を使えとはどこにも指定していないのに。gemini-cli は telemetry を使うこと自体はできるようだが。試しているコマンドは↓。

JRF2025/7/18076

gemini --model=gemini-2.5-pro -d -p "Create 'an image of a cat flying around space' and get the output and decode it"

JRF2025/7/10634

…….

○ 2025-06-29T18:51:38Z

gemini-cli と mcp-imagen-go を使った実験。疲れたからもうしないが、得たものは何だろう? gemini-cli と MCP で何ができるのだろう、私に?

JRF2025/7/13577

« 前のひとこと | トップページ | 次のひとこと »