AI/Machine Learning」カテゴリーアーカイブ

世はまさにAI戦国時代

もうすっかり年末に近づいており、Xを見るとひたすらにアドベントカレンダーっぽい記事を”有用!”、”これが無償で公開されるとは!”とかインプレッション重視な感じのツィートが多すぎて目移りしてしまう今日このごろです

いかがお過ごしでしょうか

確かに有用で、無償で後悔してくれているのはありがたいことこの上ないのですが、あまりにも多すぎる。
そして、半分くらいはAIの利活用に関するものなのでとてもじゃないけれど見切ることが出来ません。

Xでも社内でもどこもかしこもAIのオンパレードになっているので、この熱がどこまで言って何を生み出すのか。
2026年も面白い年になりそう

仕事的にはある程度ノウハウを貯めるうえでも利用するツールやモデルは固定させたほうが良いって話になりつつあるけれど、これだけ色々と出てきているので固定させるほうがもったいないというのが個人的な意見。

思わず上司に「まぁ、硬いこと言わずにいいじゃないですか」って言いそうになったけれど、そうも行かないのもわかるのであくまで個人的に遊ぶにとどめておこうかと。
多く出ているときに企業の動きが制約多いとなかなか中の人としては辛いものがありますね。。。

Geminiでインフォグラフィックに挑戦してみた

GitLab Handbookで1on1を学んでいる際にはNotebookLMを使ってみました。
普段、英語の翻訳にはChromeの機能を使っているのですが、翻訳の精度は物によって悪く、Handbookはあまり向いていない印象。

NotebookLMに翻訳を依頼すると丁寧に翻訳してくれました。
いいじゃないか。

で、見ていたら

インフォグラフィックの機能が付いているのに気づきました。

Geminiが誇るNanoBananaでしょうか。もはやワクワクが止まりません。
早速1on1に関してのインフォグラフィックを作ってみました

思ったより美しい!!!
ただ、私がHandbookを読んで思った、シーン別に関しての情報がバッサリと抜け落ちてしまって1on1としては、なんだかありきたりな内容に見えてしまいます。
ちょっと残念です

どうやら、チャット部分の会話の内容をインフォグラフィックにしてくれるわけではなく、ソースからインフォグラフィックを作っているようですね。

それを考えると、NotebookLMではなく普通にGeminiにやってもらったほうが良いような気がします。

Geminiに作ってもらった。。。けど、ちょっと違う感じ。
うーん、インフォグラフィックって難しいな

GitLab 1-1 ガイドライン | インフォグラフィック

GitLab 1-1 ガイドライン

チームメンバー主導の、コーチングと成長のための専用時間

🗓️ 毎週開催 ⏱️ 50分間 📝 非同期推奨

1. ミーティングの核となる目的

1-1は単なる状況報告の場ではありません。以下の4つの柱を中心に、チームメンバーの成功を支援する時間です。

🔮

コーチング

答えを与えるのではなく、質問を通じて内省と成長を促します。

🚧

ブロッカー解消

仕事の障害を特定し、マネージャーが迅速に取り除きます。

権限付与

チームメンバーに自律性と責任を与え、自走を促します。

🤝

関係構築

信頼と心理的安全性を築き、本音で話せる関係を作ります。

2. 議論の黄金比率 (25%ルール)

GitLabでは、1-1の時間を意識的に配分することを強く推奨しています。特に「キャリア開発」は後回しにされがちですが、必ず25%の専用時間を確保する必要があります。

  • キャリア開発 (25%)

    長期的なスキル習得と将来の役割についての対話。この時間は他のトピックに譲ってはいけません。

  • 幸福度・ウェルビーイング (25%)

    燃え尽き症候群の防止、ワークライフバランス、メンタルヘルスの確認。

  • フィードバック・承認 (25%)

    最近の成果への賞賛と、改善のための建設的なフィードバックの交換。

  • ブロッカー・組織課題 (25%)

    日々の業務進捗ではなく、構造的な障害や組織的なフラストレーションの解消。

3. 会話の主導権と責任

1-1はマネージャーのための時間ではなく、チームメンバーのための時間です。発言量のバランスが重要です。

🧑‍💻 チームメンバー (75%)

役割: 議題の所有者・推進役

  • 議題を事前に準備する
  • 懸念や成功を率直に共有する
  • 必要なアクションを明確に要求する

🧑‍💼 マネージャー (25%)

役割: 傾聴者・コーチ・ブロッカー解消人

  • 話すよりも聞くことに集中する
  • 質問を通じて解決策を引き出す
  • 約束したアクションをフォローアップする

4. 推奨されるプロセスフロー

効果的な1-1のための理想的なサイクル

📝

事前準備 (非同期)

共同編集ドキュメントに議題を記入。軽い話題はSlack等で事前に解決。

🗣️

ミーティング (50分)

重要なトピック(キャリア・幸福度)に集中して議論。

アクション定義

誰が、いつまでに、何をするかを明確にし、ドキュメントに記録。

🔄

フォローアップ

次回の1-1で進捗を確認。継続的なサポート。

💡 深い議論のための質問集

🚀 キャリア開発

  • 今後6〜12ヶ月でマスターしたい新しいスキルは何ですか?
  • 次に目指したい役割のために、今何を準備すべきでしょうか?

❤️ ウェルビーイング

  • 今週、最もエネルギーを消耗したことは何ですか?
  • 現在のワークロードは持続可能だと感じますか?

💬 フィードバック

  • 私(マネージャー)が改善できる点やサポート不足な点はありますか?
  • まだ十分に評価されていないと感じるあなたの成果はありますか?

🏢 組織課題・ブロッカー

  • あなたの生産性を著しく妨げている最大のブロッカーは何ですか?
  • もっと権限を持つべき、あるいは自律的に動けるべきだと感じる分野は?

Source: GitLab Handbook | Leadership | 1-1

AI-DLC Whitepaper を読んだ

Amazonが出していたWhitepaper「AI-Driven Development Lifecycle (AI-DLC) Method Definition」を読んだ

AI-Driven Development Lifecycle

Whitepaper自体がAmplifyで提供されているというのに少しクスッとした。

DLCってなんじゃろ、ダウンロードコンテンツかしらと思ったけれど、開発サイクルのこと。要するにAI駆動開発ですね

今もすでにAI使い始めているよって言うのは、大抵は既存の開発スタイルに対してAIを組み込んでいるものであって、それは、あくまで人間がソフトウェアを開発する前提にたった開発手法であることに変わりがない。

でも、AIを基軸に考えた場合にそれだと色々と無駄が生じてしまい、本来のAIの良さというものを活かしきれていない。
そこで、AIを中心とした開発スタイルを模索するべきというところから来ている。

また、本ホワイトペーパーでは、現状でAIが手放しにものを作る精度にはなっていない点も上げており、それに対してはMob Elaboration(モブ エラボレーション)という形で対応をしようとしている。

このモブ エラボレーション。
多分ここで作った造語ではないかとは思うけれど、要するに複数人で同時にAIが出してきたもののレビューをするという、AIをDriverとしたモブプロのようなやり方を提唱している。

AIを中心に物事を動かした場合に、人間側がレビューをするということで足かせになってしまうことが多いと思うが、このモブエラボレーションは更に大変になるのではないかと思ってしまった。

Whitepaperの最後には、実際にこのAI-DLCをやろうとした場合のプロンプト例までつけてくれている。
このあたりは面白そうなのでどこかで試してみたいところ。

あれ、、、kiroどこいった。。。

壁打ち、壁打ち、壁打ちぃぃぃ

ここのところ、Claude先生に対してひたすら壁打ちに付き合ってもらっています。
仕事に関してですが。。。

どうしても一般的な内容で返答は返ってくるので、前提条件などを正しく認識してもらわないと、現実的ではない答えが返ってくるのですが、逆にその一般的な回答を見て現状の問題点や課題に気づくこともしばしば。

AIに対して壁打ちすることの良さというのは、ちょくちょく話として聞いていましたが面白いなと思いながら続けています。

それにしても、やればやるほど考えさせられたり、自分の視点が足りなかったり、ジャーどうするの?ってところで動きが鈍かったり、悲しくなるところです。

最終的に「覚悟を決めるときです」とか言われる始末。。。

誰かと会話していく中で、自分の中の思考が整理されていく感覚はこれまでもよくありましたが、適切な質問や意図しないところからの指摘を受けると非常に頭を使います。
そして楽しいです。

お陰でじっくり考えるモードがすぐに制限に引っかかってしまい、休日でも続けている羽目に。。うーん
それでも、こういうことを考えるのは嫌いじゃないんだなぁと改めて思います。
考えたことを実行するのが一番の課題ではあるんですけどね。。。

Chrome DevTools MCPを何に使うか

先日知った、Windows上でWSLを介さずにClaude Codeが起動できることによって、Chrome DevTools MCPをClaude Code経由で動かしやすくなりました。

Claudeデスクトップもインストールしているので、本来であればそちら経由でできるはずなのですが、うまく認識してくれなかったのですよね。。。

Webアプリケーション開発においては、パフォーマンスの調査などの領域でChrome DevTools MCPは重宝しそうですが、一般的な利用用途で何に使えるかな~と思っていたところで、来年の台湾で開催予定の萬金石マラソンの募集が開始!!

2026新北市萬金石馬拉松 – 台灣第一場標籤賽事

ページの作りがよくわからないので早速試してみることに

ちゃんとdevtoolsを使ってページを開いてくれます。

この萬金石マラソンのホームページ、言語としては中国語と英語だけなのですが、至る所のリンクは外部サイトに行ってしまいますし、参加登録ページがイマイチよくわかりません。

Claudeも混乱中
ただ、Chromeの翻訳機能と異なり、Snapshotを取って解析してくれるので、画像に埋め込まれた文字も読んでくれているようです。

ただ、そもそもの作りが分かりづらかったりするので、辛いものがありますね。

おそらくは
新北市政府、中華民國田徑協會 – 2026新北市萬金石馬拉松

上記のページの”Sign Up”が会員登録で、そこからレース参加登録するのではないかと思うのですが、ちょっと確証が持てません

新北市政府、中華民国陸上競技協会 – 2026年新北市万進士マラソン

行ってみるとRegistrant Formと書かれており、参加のカテゴリなどが選択肢として出てきたので、これで申し込むようですね。

今回はあまりうまく行ったようないかないような結果となりましたが、画像が多用されているようなサイトの解析をさせながらページを操作するという使い方もできなくはなさそう?
いずれにしても、Devtools MCPがちゃんと動くことは確認できたので、面白おかしく遊べそうです

Claude CodeがWSL不要になっていた

最近、話題のChrome-devtools-mcpを試してみようとWSL起動させてClaude Codeから予防としても、WSL経由なので思うようにうまくいかずに、やっぱりこういうときにMac欲しくなるなーって思っていたのですが、いつの間にかWindowsネイティブ対応がしていたようです

Claude Codeのセットアップ – Claude Docs

オペレーティングシステム: macOS 10.15+、Ubuntu 20.04+/Debian 10+、またはWindows 10+(WSL 1、WSL 2、またはGit for Windowsを使用)

試したところ、サクッとインストールも完了。
ちょっと別件でゴタゴタしていたのでそれ以上は試すことができていませんがこれはかなり使いやすくなるのでは、、、と期待。

俄然やる気が出てきますね

Snowflake World Tour Tokyo に行ってきた

9/11, 12の日程で行われたSnowflake World Tour Tokyoに行ってきた。
本当は2日とも参加するつもりではあったけれど、業務の都合で初日だけ。。。

Snowflakeはだいぶ知名度が上がってきたけれど、最初に私が知ったのは3年ほど前。
案件で使う話があって、話を聞いたり調べたりもした。

ただ、最終的に紆余曲折の末、案件自体を離れることになったので実際に使うところまでいかなかったんですよね。
今回、また機会あってSnowflakeを使った案件に首突っ込むことになって、カンファレンスがあるということでせっかくなので参加してみた形です。

データウェアハウスやデータレイクの領域は、アプリケーションに携わっていることがメインの今の立ち位置だとなかなか馴染みが薄く、話を聞く中で知らない単語や新しい知識が多く色々と刺激をいただきました。

純粋に楽しかった。

ただ、これこの先どうだろうな~と思うと、正直どうなんだろう?と思ってしまうのも事実なんですよね。

streamlitを用いることで手軽に社内に対して情報を展開することができるというのはわかるのだけれど、自社でそういうことをやるのはわかれど、案件でとなるとDWHの導入プロジェクトとかそういうものになりそうな気がしてならない。

それか、やはりこれらデータを用いたAIか。

いずれにしても、せっかく参加したこの機会を利用して、色々と聞いてきた話をまとめて振り返っていかないとな、と思った次第です。

v0を触ってみた

Vercel社が提供しているv0というサービスを触ってみました

v0はClaudeCodeとはちょっと立ち位置が違う。
プロンプトを用いてアプリケーションを作ってくれるといえばそうなのだが、ClaudeCodeが開発者向きで、生成したコードを見ることが想定されている用に感じる。

それに対してv0は非エンジニアやちょっとしたプロトタイプを作成したい際に、アプリケーションを作ってデプロイまでしてしまう。
ClaudeのArtifactのようにも思えるが、Supabaseなどと連携してVercelの環境で動かすことができてしまう。

今回、こんなプロンプトでクイズアプリケーションを作ってもらった

早押しクイズを提供するサイトを作ってください。
問題出題者はクイズとしてクイズの名前、問題数、カテゴリを登録。
さらに問題とその答えの選択肢、答えと回答時間を設定することが可能です。
クイズをオープンすると、回答者を待つ状態になり、クイズの回答者が参加することが可能になります。
出題者がスタートさせると、回答者の受付は終了し、各回答者のブラウザにクイズの問題と選択肢が提供され、回答を選択することができます。
全員の回答が出揃ったらその問題の答えが出て、正解・不正解と回答の時間によって得点が割り当てられます。
一定時間経つと次の問題が始まります。
最後の問題が終わった段階で、各回答者の得点が表示され、順位が決定します。

結果からすると、思った以上に考えられたものが出来上がったと思う。もちろん、作ってもらうものの参考とするアプリケーション・サービスがそれなりにあるはずで、そういったニーズのものであれば「こういう機能がついている」というセオリーも学びやすいのだろう。

Supabaseと組み合わせることで、ユーザ認証・DBを含めたアプリケーションが出来上がってしまった。
詳しくテストまではできていないのだけど、簡単なものであればそのまま使えるんじゃないかな?と思えてしまった。

技術スタック

v0が生成してくれるコードの技術スタックはVercel提供だけあってNext.jsになる。
Tailwind.cssなどNext.jsを用いる場合に、モダンとされている組み合わせを提供してくれるので、それに関してはこだわりがなければ良さそう。

ちなみに今回作成したUIはpackage.jsonを見るとradix-uiが主に使われているよう。
フロントエンドは不勉強すぎて、radix-uiというものを初めてしった。

Radix UI

Radix-UIは機能のみを提供してスタイルは提供せず自由にカスタマイズ可能というコンセプトのようで、プロジェクトとしては、Radix-UI+TailwindCSSなんですね。

作るものの技術スタックを自分で選びたい。もしくは、すでに決まってしまっている場合には全く使えないものになってしまいそう。
このあたりはプロンプトの指示でどうにでもなるのかもしれない

料金プラン

料金プランはFreeの上はPremiumになっていて、最近多くなってきた月$20というところ。
Freeプランだと$5分が毎月割り当てられる

今回、試しに作ってみたクイズアプリケーション。
中身的にはいい感じだが、これを作るのに・・・

だいたい$3くらいですね。
Claudeへ課金していることを考えると、安く感じてしまうけれど、Supabaseの料金もこれにかかってくるんですよね。

とはいえ、コードはダウンロードして取得したりGithubにそのままコードをPushできるので、Supabaseへの接続部分を変えてしまえば自前で環境は構築できるんじゃないかな・・・。
そのあたりが実は面倒だと、使うのはちょっとためらってしまいそうですね。

感想

どの程度のものが出来上がるかな?と軽い気持ちで試してみたけれど、それなりのものが出来上がってしまってびっくりしている。

恐ろしい子。。。

プロジェクトとしては今回のようにプロンプト初めてもいいし、Githubのリポジトリから持ってくることもできる

ここで見てみると、TemplateにFrameworkの指定をすることができる。
現時点での選択肢としてはこのようだ

機能やコードに対しての品質的なところまではまだ見切れていないので、CloneしてきてClaudeCodeに評価させるなりしたり、実際にPublishしたりして動かしてみたいですね。

また、Supabaseなど今まで自分が知らなかったサービスやFrameworkを知る機会としてもこういうものが利用できると改めて思いました。

ちょっと楽しくなってきたぞ!

Kiro

AWSが2025年7月に公開した新しいIDEのKiro。ウェイティングリストに登録していたのですが、ようやく使えるようになりました

Kiro
https://kiro.dev

セットアップ

こちらはIDEなので、ダウンロードして使います。
例によってベースはVSCodeとなります

基本的にはポチポチと進んでいきます

拡張子への関連付けだけはちょっとどうかな?と思いチェックを外しています

何事もなくインストールが終わりました

複数のログインメソッドがありますが、IDEとして考えるのであれば?と思い、Githubを選びましたが特に関係ないとは思います。
AWSのIDEなので強制的にAWSアカウントというわけではないんですね

こちらで、メールで通知されているAccessCodeを入力します

VSCodeからPluginを取り込みます。

シェルをセットアップするかを聞いてきますが、ちょっとイマイチピンときませんでした。

設定はここまでのようで、Kiroが立ち上がります。
右下に日本語化するかを聞いてきているのでやってみると

確かにメニューは日本語になったのですが、正面のダイアログはそのままですね。。。
まぁ、こんなものでしょう。

適当なフォルダを作って、そこをプロジェクトフォルダとして指定すると

それっぽくなってきました!
Kiroでは「Vibe」モードと「Spec」モードがあり、手早く作るかしっかりと要件を検討して作るかを選ぶことができます。

せっかくなので、Specを選ぶことで要件定義っぽいことをAIにしっかりと考えてもらいたいですし、どんなものを吐き出すのかをしっかりと読み込みたいところです。

というわけで続きはまた今度

FLUX.1 Krea

Krea 1のオープンウェイトバージョンがリリースされました

Releasing Open Weights for FLUX.1 Krea
https://www.krea.ai/blog/flux-krea-open-source-release

このモデルは、「AIルック」と呼ばれる、ぼやけた背景や不自然な肌の質感といった、AI生成画像にありがちな問題に対処するために、特定の美的嗜好に合わせて調整されましたとありますので、早速使ってみることに

お題は「パソコンを前にプログラミングするヒキガエル」

4つ出てきたのですが、3番目は正直意味がわかりませんし、4番目はカエルがいません。

もう一度やってみると2番目からはカエルがいなくなりました。

そして4番目はちょっとうーんという感じです

もう一度やると、急にリアルになりました。

1番目はちょっといい感じ。
ただ、よくよく見てみるとキーボードは逆さまですし、手が変なところから変な角度で出ています。

そういう意味では3番目がいい感じかもしれませんね。

ちょこちょこ中国語っぽい画像が混ざってくるのですが、これは日本語でプロンプトを書いている影響なのかもしれません。

そこで英語でプロンプトを書いてみると

うーん、謎のおじいちゃんが出てきました。

このあたりは不思議だなぁ。。。

確かに過度なぼかしみたいなのはないんですけどね。

謎に頭からも湯気が出ているのがフットーしていそうでいい感じかもしれません。

このあたりの画像生成でバチッと思ったような画像が出てくるプロンプトをどう書くのか、なかなか指定が難しそうですね。。