AI/Machine Learning」カテゴリーアーカイブ

Kindle + Obsidian + NotebookLM でまとめる

NotebookLMいいですね。
生成されるもののコントロールが難しいところではありますが、それでもいい感じにまとめてくれることが多いような印象です。

最近試してみているのが、読んだ書籍のまとめスライドの作成です。
会社で読んだ本に対して紹介をしようと思ったので作ってみました

Kindleでハイライトする

Kindle本であれば、ハイライトを積極的に利用します。
出来れば、ハイライトにメモを追加するとよいとは思うのですが、私が使っているWhitePaperの反応速度がいまいちなので、メモはあまり使いません。

気になった言葉や残しておきたい言葉を、できるだけ前後の文脈がわかるようにハイライトします。
後から見返したときに、そのものずばりの言葉だけを見ても意味が分からないことが多いので、ハイライトだけでわかるようにしておくといいと思います。

Obsidianにハイライトを取り込んでメモする

ObsidianにはKindle Highlightsという、ハイライトを同期してくれるプラグインがあるので、これでハイライト情報を取り込みます。

ハイライトした文章とそこへのリンクが張られますので、意味が分からない場合は確認をすることが出来ます。

そのうえで、Obsidian上でメモをしていきます。

本を読み終えた後、記憶がある程度残っている状態で反芻するようなイメージですね。

NotebookLMでスライドにする

Obsidianのいいところは、ただのMarkdwonファイルだというところです。
なので、このファイル自体をNotebookLMにソース登録をしてスライド作成を依頼します。

クルーシャルカンバセーションで、自分が興味を持ったところを中心にまとめてくれました。

ここから

今一度これを読み返してみると、なんかすごいまとまっているような気がする。。。
いいではないか。

インフォグラフィックにするのもよいのですが、それなりの分量のある本を対象にしたインフォグラフィックは、かなり当たりはずれある印象です。

スライドでは、形式や説明文などを指定することが出来ます。
この辺りで、発表想定時間など指示を出すことでもう少しカスタマイズすることが出来そうですね。

面白い!

DeNAのAI活用100本ノックで気になった

年末辺りにX界隈で色々と取り上げられていたDeNAさんのAI活用100本ノック。

AI_100tips_slide.pdf

さらっと見て、X上でよく見る内容だな~と思ってそのままにしていたのですが、知っているのと実際にやってみるのとではやはり違うだろうと。
いくつかの中身に関して向き合いたいと思った

No.04 ビジネス職でも安心!プログラミング知識ゼロから Chrome拡張を開発!

直接的に関係ないが、Chrome拡張は気になっていて手を出していない領域なので手を出したい。
どこまでのことが出来てどういう系統には向いていないのか?というところが把握できると楽しそうだ

No.20 ネットワーク障害アラートの初動対応を自動化 するエージェント開発

LangChainを使った障害対応の自動化で、このあたりは開発者側でワークフローを構築して、各ノードの判断はLLMに任せるというところの一例なのかと。
これはちょっとやってみたいところではある

運用保守的なものになるので、どこまで出来るのかはやってみてから考えるでも良いかもしれない

No.021 Obsidianでのタスク管理をCursorに任せて、
 更新漏れなし

ObsidianとCursorを組み合わせる話は聞いていたが、実際には試していない。
Cursorが有料だったような気がするのが一つのネックだったような。今見てみると、少なくともHobbyプランというものが用意されているので、試してみても良いかもしれない。

ただ、紙面の関係上か具体的にCursorとObsidian連携でどうやったのかがよくわからなかった。

obsidianの運用はそろそろ見直したいとも思っていたので、手を付けていきたいところ。
このあたりを参考にしたい

単なるメモから知的資産へ:Obsidian in Cursorで構築する知的生産システム|松濤Vimmer

No.37 社内ミーティングの議事録を
 AIが再要約→Slack共有まで自動で

文字起こし機能はこれまでも使ってきているけれど、組織的な制限が走ってしまい使いづらいことが多い

  • Teams会議の場合、文字起こしのDLが会議オーナーになる
  • 社内の会議であればTeamsになるが、MeetやZoomなど様々な選択肢がある

これを考えると、ゲームキャプチャ機能で録画をして解析して文字起こしする形が一番適切な気がする。
そういう流れをLangChainなどで構築してしまったらどうだろうか。

このあたりは若干切実な問題になりつつあるので近日中には試してみたいところ

まとめ

改めて見返してみて、直接的にその事例があてはまるというよりは、その構成要素は使えるはずで、知ってはいたけれどやってないよね?というものが多かった。

そう考えてみると、全然LLM使いこなしてないというのがよく分かる。
使いこなした先に生産性として何が待っているのかは必ずしも明るいとは限らないけれど、エンジニアの美徳を忠実に追いかけていくべく取り組んでいきたい

Generative UIってなんだ

先日、こんな記事を見かけました

Generative UI: A rich, custom, visual interactive user experience for any prompt

Googleが少し前にブログに投稿した記事で、生成AIではなく生成UI。
人それぞれに合わせてUIを作る。
つまり、このアプリケーションのこの画面はこういうUIで、、って世界が無くなる感じのよう。

これは、これまでの「全ユーザに同一のUI」からある程度の「カスタマイズ可能なUI」とは根本的に異なっていて、「そもそも何を表示するのかすらシステム側手動で決める」という方向性に向かうという話。

確かに、現時点でClaudeのアーティファクトもそうですが、なかなかのスピードでフロントエンドを構築していくことが可能になっています。
それを考えると技術的にはできるのかもしれない

ただ、何を表示するのかをどう決めるのかがピンとこない。

何を表示するのかは、AI側がユーザのコンテキストを把握している必要がある。
ユーザがそのアプリケーションで達成したいことはなにか?というのも、日々の中でそのアプリケーションを使っている以外を含めてコンテキストを収集して渡すことができれば可能になりそうな気もする。
そうなると、アプリケーション横断でAIを持つ必要が出てくるのではないか。

となると、OS側。
それもできれば個人でポータブルなものがそれらを決定することができるというのが最終地点になるのだろうか。
セキュリティやプライバシーなど超えるべきハードルは高そうだけれど、ここまで情報の有用性が高まると、情報を提供する価値のフィードバックが高まってどこかのしきい値を超えた段階でその抵抗も薄くなるのかもしれない。
というより、守るべき情報と公開するべき情報の線引が見直されるという言い方のほうが正しいのかもしれない。

アプリケーションの開発・提供としてはどういうものづくりだろうか。
AI側がコンテキストを理解した際に、その要求に答える。MCPのような情報を提供するツールとしての存在。言ってしまうとAPIのような形だろうか。

もちろん、一足飛びにそこに行き着くことはないだろうから代替手段としてのUIの提供はしばらくは亡くならないだろうけれど、より、外部への情報を提供するAPIを作成する必要性は増してくるのではないだろうか。

そんな妄想を抱かせる話だった

世はまさにAI戦国時代

もうすっかり年末に近づいており、Xを見るとひたすらにアドベントカレンダーっぽい記事を”有用!”、”これが無償で公開されるとは!”とかインプレッション重視な感じのツィートが多すぎて目移りしてしまう今日このごろです

いかがお過ごしでしょうか

確かに有用で、無償で後悔してくれているのはありがたいことこの上ないのですが、あまりにも多すぎる。
そして、半分くらいはAIの利活用に関するものなのでとてもじゃないけれど見切ることが出来ません。

Xでも社内でもどこもかしこもAIのオンパレードになっているので、この熱がどこまで言って何を生み出すのか。
2026年も面白い年になりそう

仕事的にはある程度ノウハウを貯めるうえでも利用するツールやモデルは固定させたほうが良いって話になりつつあるけれど、これだけ色々と出てきているので固定させるほうがもったいないというのが個人的な意見。

思わず上司に「まぁ、硬いこと言わずにいいじゃないですか」って言いそうになったけれど、そうも行かないのもわかるのであくまで個人的に遊ぶにとどめておこうかと。
多く出ているときに企業の動きが制約多いとなかなか中の人としては辛いものがありますね。。。

Geminiでインフォグラフィックに挑戦してみた

GitLab Handbookで1on1を学んでいる際にはNotebookLMを使ってみました。
普段、英語の翻訳にはChromeの機能を使っているのですが、翻訳の精度は物によって悪く、Handbookはあまり向いていない印象。

NotebookLMに翻訳を依頼すると丁寧に翻訳してくれました。
いいじゃないか。

で、見ていたら

インフォグラフィックの機能が付いているのに気づきました。

Geminiが誇るNanoBananaでしょうか。もはやワクワクが止まりません。
早速1on1に関してのインフォグラフィックを作ってみました

思ったより美しい!!!
ただ、私がHandbookを読んで思った、シーン別に関しての情報がバッサリと抜け落ちてしまって1on1としては、なんだかありきたりな内容に見えてしまいます。
ちょっと残念です

どうやら、チャット部分の会話の内容をインフォグラフィックにしてくれるわけではなく、ソースからインフォグラフィックを作っているようですね。

それを考えると、NotebookLMではなく普通にGeminiにやってもらったほうが良いような気がします。

Geminiに作ってもらった。。。けど、ちょっと違う感じ。
うーん、インフォグラフィックって難しいな

GitLab 1-1 ガイドライン | インフォグラフィック

GitLab 1-1 ガイドライン

チームメンバー主導の、コーチングと成長のための専用時間

🗓️ 毎週開催 ⏱️ 50分間 📝 非同期推奨

1. ミーティングの核となる目的

1-1は単なる状況報告の場ではありません。以下の4つの柱を中心に、チームメンバーの成功を支援する時間です。

🔮

コーチング

答えを与えるのではなく、質問を通じて内省と成長を促します。

🚧

ブロッカー解消

仕事の障害を特定し、マネージャーが迅速に取り除きます。

権限付与

チームメンバーに自律性と責任を与え、自走を促します。

🤝

関係構築

信頼と心理的安全性を築き、本音で話せる関係を作ります。

2. 議論の黄金比率 (25%ルール)

GitLabでは、1-1の時間を意識的に配分することを強く推奨しています。特に「キャリア開発」は後回しにされがちですが、必ず25%の専用時間を確保する必要があります。

  • キャリア開発 (25%)

    長期的なスキル習得と将来の役割についての対話。この時間は他のトピックに譲ってはいけません。

  • 幸福度・ウェルビーイング (25%)

    燃え尽き症候群の防止、ワークライフバランス、メンタルヘルスの確認。

  • フィードバック・承認 (25%)

    最近の成果への賞賛と、改善のための建設的なフィードバックの交換。

  • ブロッカー・組織課題 (25%)

    日々の業務進捗ではなく、構造的な障害や組織的なフラストレーションの解消。

3. 会話の主導権と責任

1-1はマネージャーのための時間ではなく、チームメンバーのための時間です。発言量のバランスが重要です。

🧑‍💻 チームメンバー (75%)

役割: 議題の所有者・推進役

  • 議題を事前に準備する
  • 懸念や成功を率直に共有する
  • 必要なアクションを明確に要求する

🧑‍💼 マネージャー (25%)

役割: 傾聴者・コーチ・ブロッカー解消人

  • 話すよりも聞くことに集中する
  • 質問を通じて解決策を引き出す
  • 約束したアクションをフォローアップする

4. 推奨されるプロセスフロー

効果的な1-1のための理想的なサイクル

📝

事前準備 (非同期)

共同編集ドキュメントに議題を記入。軽い話題はSlack等で事前に解決。

🗣️

ミーティング (50分)

重要なトピック(キャリア・幸福度)に集中して議論。

アクション定義

誰が、いつまでに、何をするかを明確にし、ドキュメントに記録。

🔄

フォローアップ

次回の1-1で進捗を確認。継続的なサポート。

💡 深い議論のための質問集

🚀 キャリア開発

  • 今後6〜12ヶ月でマスターしたい新しいスキルは何ですか?
  • 次に目指したい役割のために、今何を準備すべきでしょうか?

❤️ ウェルビーイング

  • 今週、最もエネルギーを消耗したことは何ですか?
  • 現在のワークロードは持続可能だと感じますか?

💬 フィードバック

  • 私(マネージャー)が改善できる点やサポート不足な点はありますか?
  • まだ十分に評価されていないと感じるあなたの成果はありますか?

🏢 組織課題・ブロッカー

  • あなたの生産性を著しく妨げている最大のブロッカーは何ですか?
  • もっと権限を持つべき、あるいは自律的に動けるべきだと感じる分野は?

Source: GitLab Handbook | Leadership | 1-1

AI-DLC Whitepaper を読んだ

Amazonが出していたWhitepaper「AI-Driven Development Lifecycle (AI-DLC) Method Definition」を読んだ

AI-Driven Development Lifecycle

Whitepaper自体がAmplifyで提供されているというのに少しクスッとした。

DLCってなんじゃろ、ダウンロードコンテンツかしらと思ったけれど、開発サイクルのこと。要するにAI駆動開発ですね

今もすでにAI使い始めているよって言うのは、大抵は既存の開発スタイルに対してAIを組み込んでいるものであって、それは、あくまで人間がソフトウェアを開発する前提にたった開発手法であることに変わりがない。

でも、AIを基軸に考えた場合にそれだと色々と無駄が生じてしまい、本来のAIの良さというものを活かしきれていない。
そこで、AIを中心とした開発スタイルを模索するべきというところから来ている。

また、本ホワイトペーパーでは、現状でAIが手放しにものを作る精度にはなっていない点も上げており、それに対してはMob Elaboration(モブ エラボレーション)という形で対応をしようとしている。

このモブ エラボレーション。
多分ここで作った造語ではないかとは思うけれど、要するに複数人で同時にAIが出してきたもののレビューをするという、AIをDriverとしたモブプロのようなやり方を提唱している。

AIを中心に物事を動かした場合に、人間側がレビューをするということで足かせになってしまうことが多いと思うが、このモブエラボレーションは更に大変になるのではないかと思ってしまった。

Whitepaperの最後には、実際にこのAI-DLCをやろうとした場合のプロンプト例までつけてくれている。
このあたりは面白そうなのでどこかで試してみたいところ。

あれ、、、kiroどこいった。。。

壁打ち、壁打ち、壁打ちぃぃぃ

ここのところ、Claude先生に対してひたすら壁打ちに付き合ってもらっています。
仕事に関してですが。。。

どうしても一般的な内容で返答は返ってくるので、前提条件などを正しく認識してもらわないと、現実的ではない答えが返ってくるのですが、逆にその一般的な回答を見て現状の問題点や課題に気づくこともしばしば。

AIに対して壁打ちすることの良さというのは、ちょくちょく話として聞いていましたが面白いなと思いながら続けています。

それにしても、やればやるほど考えさせられたり、自分の視点が足りなかったり、ジャーどうするの?ってところで動きが鈍かったり、悲しくなるところです。

最終的に「覚悟を決めるときです」とか言われる始末。。。

誰かと会話していく中で、自分の中の思考が整理されていく感覚はこれまでもよくありましたが、適切な質問や意図しないところからの指摘を受けると非常に頭を使います。
そして楽しいです。

お陰でじっくり考えるモードがすぐに制限に引っかかってしまい、休日でも続けている羽目に。。うーん
それでも、こういうことを考えるのは嫌いじゃないんだなぁと改めて思います。
考えたことを実行するのが一番の課題ではあるんですけどね。。。

Chrome DevTools MCPを何に使うか

先日知った、Windows上でWSLを介さずにClaude Codeが起動できることによって、Chrome DevTools MCPをClaude Code経由で動かしやすくなりました。

Claudeデスクトップもインストールしているので、本来であればそちら経由でできるはずなのですが、うまく認識してくれなかったのですよね。。。

Webアプリケーション開発においては、パフォーマンスの調査などの領域でChrome DevTools MCPは重宝しそうですが、一般的な利用用途で何に使えるかな~と思っていたところで、来年の台湾で開催予定の萬金石マラソンの募集が開始!!

2026新北市萬金石馬拉松 – 台灣第一場標籤賽事

ページの作りがよくわからないので早速試してみることに

ちゃんとdevtoolsを使ってページを開いてくれます。

この萬金石マラソンのホームページ、言語としては中国語と英語だけなのですが、至る所のリンクは外部サイトに行ってしまいますし、参加登録ページがイマイチよくわかりません。

Claudeも混乱中
ただ、Chromeの翻訳機能と異なり、Snapshotを取って解析してくれるので、画像に埋め込まれた文字も読んでくれているようです。

ただ、そもそもの作りが分かりづらかったりするので、辛いものがありますね。

おそらくは
新北市政府、中華民國田徑協會 – 2026新北市萬金石馬拉松

上記のページの”Sign Up”が会員登録で、そこからレース参加登録するのではないかと思うのですが、ちょっと確証が持てません

新北市政府、中華民国陸上競技協会 – 2026年新北市万進士マラソン

行ってみるとRegistrant Formと書かれており、参加のカテゴリなどが選択肢として出てきたので、これで申し込むようですね。

今回はあまりうまく行ったようないかないような結果となりましたが、画像が多用されているようなサイトの解析をさせながらページを操作するという使い方もできなくはなさそう?
いずれにしても、Devtools MCPがちゃんと動くことは確認できたので、面白おかしく遊べそうです

Claude CodeがWSL不要になっていた

最近、話題のChrome-devtools-mcpを試してみようとWSL起動させてClaude Codeから予防としても、WSL経由なので思うようにうまくいかずに、やっぱりこういうときにMac欲しくなるなーって思っていたのですが、いつの間にかWindowsネイティブ対応がしていたようです

Claude Codeのセットアップ – Claude Docs

オペレーティングシステム: macOS 10.15+、Ubuntu 20.04+/Debian 10+、またはWindows 10+(WSL 1、WSL 2、またはGit for Windowsを使用)

試したところ、サクッとインストールも完了。
ちょっと別件でゴタゴタしていたのでそれ以上は試すことができていませんがこれはかなり使いやすくなるのでは、、、と期待。

俄然やる気が出てきますね

Snowflake World Tour Tokyo に行ってきた

9/11, 12の日程で行われたSnowflake World Tour Tokyoに行ってきた。
本当は2日とも参加するつもりではあったけれど、業務の都合で初日だけ。。。

Snowflakeはだいぶ知名度が上がってきたけれど、最初に私が知ったのは3年ほど前。
案件で使う話があって、話を聞いたり調べたりもした。

ただ、最終的に紆余曲折の末、案件自体を離れることになったので実際に使うところまでいかなかったんですよね。
今回、また機会あってSnowflakeを使った案件に首突っ込むことになって、カンファレンスがあるということでせっかくなので参加してみた形です。

データウェアハウスやデータレイクの領域は、アプリケーションに携わっていることがメインの今の立ち位置だとなかなか馴染みが薄く、話を聞く中で知らない単語や新しい知識が多く色々と刺激をいただきました。

純粋に楽しかった。

ただ、これこの先どうだろうな~と思うと、正直どうなんだろう?と思ってしまうのも事実なんですよね。

streamlitを用いることで手軽に社内に対して情報を展開することができるというのはわかるのだけれど、自社でそういうことをやるのはわかれど、案件でとなるとDWHの導入プロジェクトとかそういうものになりそうな気がしてならない。

それか、やはりこれらデータを用いたAIか。

いずれにしても、せっかく参加したこの機会を利用して、色々と聞いてきた話をまとめて振り返っていかないとな、と思った次第です。