たねやつの木

Photographs, Keyboards and Programming

AI

Ollamaと連携してOpenAI Codex CLIをローカルで試す

こんにちは、たねやつです。 OpenAIが開発したCodex CLIは、自然言語で指示を出すだけでコマンドライン操作を実行してくれる便利なツールです。通常はOpenAIのAPIを利用しますが、今回はローカル環境で動作するOllamaと連携させることで、APIキーなしでCodex…

GitHubの新ツールspec-kitを実際に動かしてできたことと、注意点など

こんにちは、たねやつです。 GitHubが開発したAIエージェント向けのフレームワーク「spec-kit」が面白そうだったので、実際に触ってみて簡単なTODOアプリの仕様を作成してみました。 今回はその手順と使ってみた感想をまとめていきます。 この記事でできるこ…

AIとの協業を加速する!GitHubの新ツール「spec-kit」で始める仕様駆動開発

AI

こんにちは、たねやつです。 GitHubが新たに公開した「spec-kit」というツールキットが、開発の未来を垣間見せてくれるようで、非常に興味深いものだったのでご紹介します。 リポジトリによると、これはAIコーディングエージェントと連携し、「仕様」からコ…

Gemini CLIと共に「成長」するということ - 最高のAIパートナーと未来を創るための心構え

今回は、具体的なテクニックから少し視点を引き上げ、私たちがAIと共に「成長」していくために、どのような心構えを持つべきか、そしてその先にある未来の働き方について、私なりの考えを述べたいと思います。

中国がGPU市場に本格参入?NVIDIAの独占を崩す刺客は現れるか

こんにちは、たねやつです。 AIや大規模言語モデル(LLM)の世界で、NVIDIAのGPUが圧倒的なシェアを誇っているのはご存知の通りです。しかし、その牙城を崩そうと、ついに中国企業が本格的にGPU市場へ参入するというニュースが海外の掲示板Redditで話題にな…

41個のオープンソースLLMをローカル環境でベンチマークした猛者が登場!その結果は?

こんにちは、たねやつです。 最近、オープンソースのLLM(大規模言語モデル)がすごい勢いで増えていて、どれを使えばいいのか迷ってしまいますよね。そんな中、海外の掲示板Redditで、なんと41個ものオープンソースLLMを個人のローカル環境でベンチマークし…

Gemini CLIでPC操作を自動化!ターミナル作業を高速化するシェルコマンド連携術

Gemini-CLIには、`run_shell_command`という、AIとの対話を通じてパソコンに直接命令(シェルコマンド)を送ることができる強力な機能が備わっています。これを使いこなせば、これまでマウスやキーボードでちまちま行っていた定型的なPC操作を、AIとの自然な…

Gemini-CLIを「プロジェクトマネージャー」に昇格させる超整理術

こんにちは、たねやつです。 これまでのシリーズで、私たちはGemini-CLIを「個人の執筆アシスタント」として、思考や文体をインストールし、最強のパートナーへと育て上げてきました。しかし、そのポテンシャルはまだまだ底が見えません。 今回から始まる【…

ただのメモがプロの記事に。Gemini CLIと創る「AI時代の新しい執筆ワークフロー」の完成形

こんにちは、たねやつです。 全8回にわたってお届けしてきた「Gemini-CLIを最強の執筆アシスタントにする」シリーズも、いよいよ最終回を迎えました。私たちはGemini-CLIをインストールし、GEMINI.mdで思考と文体をインストールし、アイデア出しから情報収集…

【ネタ切れ対策】海外の話題をAIでキャッチ!Gemini CLIを活用したブログネタ自動リサーチ術

そこで今回は、その壁を打ち破るためのテクニックとして、Gemini-CLIを使ってオンライン上の膨大な情報――特に海外の掲示板サイトなど――から、新鮮なブログ記事のアイデアを発掘する方法を解説します。

まるで魔法!Qwen-Image-Editプロンプトガイド7選

こんにちは、たねやつです。 AIによる画像編集・インペインティングで、「マスクした部分が思ったように補完されない…」という悩みは尽きません。しかし、Alibaba社が開発した「Qwen-Image-Edit」モデルは、プロンプト(指示文)を深く理解し、まるで魔法の…

VRAM不足はもう怖くない!ComfyUI-MultiGPU DisTorch 2.0で大規模モデルを動かす方法

画期的なカスタムノード「ComfyUI-MultiGPU DisTorch 2.0」を紹介します。このツールを使えば、複数のGPUや、なんとシステムRAM(メインメモリ)まで動員してモデルを分散させ、VRAM使用量を劇的に削減できるんです!

Gemini 2.5 Flash Image(nano-banana)を試す!キャラクターの一貫性と合成写真がすごい

こんにちは、たねやつです。 Googleから新しい画像生成AI「Gemini 2.5 Flash Image」(通称:nano-banana)が発表されたので、早速試してみました。 特に、生成したキャラクターデザインの一貫性を保ったまま修正を加えたり、写真の合成を手軽に行えたりする…

【ComfyUI x Qwen】プロンプトだけで激変!ゴッホやジブリ風の画像を作るAIアートレシピ

手持ちの画像をまるで芸術の巨匠が描いたような作品にしたり、懐かしいアニメーション風に変換したりするための、具体的なプロンプト(呪文)をいくつか紹介します!

アイデアの壁を破壊せよ!Gemini CLIと始める「ゼロから1を生み出す」ブログ執筆フロー革命

育て上げたパートナーと共に、ブログ執筆の具体的なプロセス――アイデア出しから下書き作成まで――をいかに効率化し、加速させていくかをご紹介します。

Gemini CLI v0.2.0がリリース!会話の自動保存やZedエディタ連携など注目の新機能まとめ

こんにちは、たねやつです。 Google製のAIチャットインターフェース「Gemini CLI」が、v0.2.0にアップデートされました。 今回のリリースでは、待望の会話自動保存機能や、人気のテキストエディタ「Zed」との連携、多数の機能改善とバグ修正が含まれています…

【ComfyUI】AIで画像編集が劇的に変わる!Qwen Image Editの簡単な使い方とLoRA高速化設定を解説

こんにちは、たねやつです。 今回は、Alibabaが公開している高性能な画像編集モデル「Qwen Image Edit」をComfyUIで使う方法について解説します。 このモデルを使うと、好きな画像をゴッホ風にしたり、ジブリ風にしたり、昼間の情景を夜に変えたりと、プロン…

AIがゴーストライターに? 過去記事を学習させてGemini CLIにあなたの「文体」を完全再現させる方法

今回は、Gemini-CLIにあなたの「執筆スタイル」を学習させ、文章のトーン、言葉選び、表現のクセまでを再現させる方法を掘り下げます。これができれば、Gemini-CLIは単なるアシスタントではなく、あなたのゴーストライター、あるいは「もう一人の自分」とし…

AIを「もう一人の自分」に育てる。Gemini CLIにあなたの思考パターンをインストールする高度な方法

今回はさらに一歩踏み込み、単なる「応答」のカスタマイズから、Gemini-CLIの「思考プロセス」そのものをあなたに近づける、驚くべき方法について解説します。`GEMINI.md`にあなたの考え方のクセや手順を書き込むことで、Geminiはあなたと同じ視点で物事を捉…

【ComfyUI初心者向け】最新画像生成モデル「Qwen-Image」を使ってみよう!

こんにちは、たねやつです。 前回ComfyUIのインストールが完了した皆さん、おめでとうございます!早速ですが、今回は新しい画像生成モデル「Qwen-Image」をComfyUIで使う方法を解説していきます。 「モデルって何?」という方もご安心ください。この記事を…

ComfyUIを始めよう!Windows & Mac対応のインストールガイド

今回は、画像生成AIで注目されているComfyUIのインストール方法について、初心者にも分かりやすく解説していきます。ComfyUIはノードベースのUIが特徴で、自由度の高い画像生成が可能です。この記事を参考に、ぜひComfyUIの世界に足を踏み入れてみてください…

AIの「脳」を書き換える!Gemini CLIをあなた専用機に育てるGEMINI.md設定の基本

今回は、Gemini-CLIの人格や挙動をあらかじめ設定できる魔法のファイル、「GEMINI.md」について詳しく解説します。このファイルを使いこなせば、Gemini-CLIを単なるツールから、あなただけの最強パーソナルアシスタントへと進化させることができます。

なぜあなたのAI動画は素人っぽい?『wan2.2』を"映画監督"に変えるカメラワーク設計術

この記事では、あなたのwan2.2を凡庸な記録係から才能ある"映画監督"に変えるための、カメラワークに特化したプロンプト設計術を解説します。

【NVIDIA論文】大きいだけがAIじゃない?「小さな言語モデル」がAIエージェントの未来を担う理由

AI

こんにちは、たねやつです。 AIの世界では「モデルは大きければ大きいほど性能が良い」という考え方が主流でした。しかし、最近NVIDIAが発表した新しい論文が、その常識に一石を投じています。「Small Language Models are the Future of Agentic AI(小規模…

xAIのLLM「Grok-2」がオープンソース化!ローカルではまだ動かせない大きさかも

AI

xAIが開発した最新の大規模言語モデル(LLM)「Grok-2」がオープンソースとして公開され話題となっています。総パラメータ数3140億という驚異的な規模を誇るこのモデルは、Mixture-of-Experts(MoE)アーキテクチャを採用しており、その性能とオープンなライ…

もうググらない?Gemini CLI基本活用術:AIとの対話でリサーチとファイル作成を自動化する方法

こんにちは、たねやつです。 前回の導入編では、Gemini-CLIのインストールとObsidianとの連携方法について解説しました。最強の執筆アシスタントを手に入れたところで、今回はその基本的な使い方をマスターしていきましょう。 Gemini-CLIの操作は、人間と会…

【初心者歓迎】Gemini CLI導入ガイド:あなたのObsidianが「最強の執筆脳」に変わる第一歩

今回は、Googleが提供するコマンドラインツール「Gemini-CLI」を、文章執筆や日々の作業を効率化するための超優秀なパーソナルアシスタントとして活用する方法について、シリーズ形式で詳しく解説していきます。

【ComfyUI】複数GPUで画像生成を高速化!新カスタムノード「Raylight」登場

こんにちは、たねやつです。 Stable DiffusionのワークフローUIとして人気の「ComfyUI」に、複数GPUを持つユーザーにとって待望の機能が登場しました。 Redditでアルファ版が公開されたカスタムノード「Raylight」は、Split Tensor GPU Parallelという技術を…

NPU専用LLM「OmniNeural-4B」登場?AIは”GPU要らず”の時代へ?

こんにちは、たねやつです。 これまで、高性能なAIをローカル環境で動かすには、高価で電力消費の大きいGPUが必須というのが常識でした。しかし、その常識を覆すかもしれない、新しいAIモデルが登場しました。 Redditの r/LocalLLaMA サブレディットにて、開…

X上のGrokの使い方完全ガイド!無料版と有料版の違い、画像生成も解説

AI

こんにちは、たねやつです。 イーロン・マスク氏が率いるxAIが開発した「Grok」、皆さんはもう使ってみましたか?X(旧Twitter)と統合され、リアルタイム情報に強いという特徴を持つこのAIは、他のAIアシスタントとは一味違った魅力を持っています。 この記…