AI
こんにちは、たねやつです。 OpenAIが開発したCodex CLIは、自然言語で指示を出すだけでコマンドライン操作を実行してくれる便利なツールです。通常はOpenAIのAPIを利用しますが、今回はローカル環境で動作するOllamaと連携させることで、APIキーなしでCodex…
こんにちは、たねやつです。 GitHubが開発したAIエージェント向けのフレームワーク「spec-kit」が面白そうだったので、実際に触ってみて簡単なTODOアプリの仕様を作成してみました。 今回はその手順と使ってみた感想をまとめていきます。 この記事でできるこ…
こんにちは、たねやつです。 GitHubが新たに公開した「spec-kit」というツールキットが、開発の未来を垣間見せてくれるようで、非常に興味深いものだったのでご紹介します。 リポジトリによると、これはAIコーディングエージェントと連携し、「仕様」からコ…
今回は、具体的なテクニックから少し視点を引き上げ、私たちがAIと共に「成長」していくために、どのような心構えを持つべきか、そしてその先にある未来の働き方について、私なりの考えを述べたいと思います。
こんにちは、たねやつです。 AIや大規模言語モデル(LLM)の世界で、NVIDIAのGPUが圧倒的なシェアを誇っているのはご存知の通りです。しかし、その牙城を崩そうと、ついに中国企業が本格的にGPU市場へ参入するというニュースが海外の掲示板Redditで話題にな…
こんにちは、たねやつです。 最近、オープンソースのLLM(大規模言語モデル)がすごい勢いで増えていて、どれを使えばいいのか迷ってしまいますよね。そんな中、海外の掲示板Redditで、なんと41個ものオープンソースLLMを個人のローカル環境でベンチマークし…
Gemini-CLIには、`run_shell_command`という、AIとの対話を通じてパソコンに直接命令(シェルコマンド)を送ることができる強力な機能が備わっています。これを使いこなせば、これまでマウスやキーボードでちまちま行っていた定型的なPC操作を、AIとの自然な…
こんにちは、たねやつです。 これまでのシリーズで、私たちはGemini-CLIを「個人の執筆アシスタント」として、思考や文体をインストールし、最強のパートナーへと育て上げてきました。しかし、そのポテンシャルはまだまだ底が見えません。 今回から始まる【…
こんにちは、たねやつです。 全8回にわたってお届けしてきた「Gemini-CLIを最強の執筆アシスタントにする」シリーズも、いよいよ最終回を迎えました。私たちはGemini-CLIをインストールし、GEMINI.mdで思考と文体をインストールし、アイデア出しから情報収集…
そこで今回は、その壁を打ち破るためのテクニックとして、Gemini-CLIを使ってオンライン上の膨大な情報――特に海外の掲示板サイトなど――から、新鮮なブログ記事のアイデアを発掘する方法を解説します。
こんにちは、たねやつです。 AIによる画像編集・インペインティングで、「マスクした部分が思ったように補完されない…」という悩みは尽きません。しかし、Alibaba社が開発した「Qwen-Image-Edit」モデルは、プロンプト(指示文)を深く理解し、まるで魔法の…
画期的なカスタムノード「ComfyUI-MultiGPU DisTorch 2.0」を紹介します。このツールを使えば、複数のGPUや、なんとシステムRAM(メインメモリ)まで動員してモデルを分散させ、VRAM使用量を劇的に削減できるんです!
こんにちは、たねやつです。 Googleから新しい画像生成AI「Gemini 2.5 Flash Image」(通称:nano-banana)が発表されたので、早速試してみました。 特に、生成したキャラクターデザインの一貫性を保ったまま修正を加えたり、写真の合成を手軽に行えたりする…
手持ちの画像をまるで芸術の巨匠が描いたような作品にしたり、懐かしいアニメーション風に変換したりするための、具体的なプロンプト(呪文)をいくつか紹介します!
育て上げたパートナーと共に、ブログ執筆の具体的なプロセス――アイデア出しから下書き作成まで――をいかに効率化し、加速させていくかをご紹介します。
こんにちは、たねやつです。 Google製のAIチャットインターフェース「Gemini CLI」が、v0.2.0にアップデートされました。 今回のリリースでは、待望の会話自動保存機能や、人気のテキストエディタ「Zed」との連携、多数の機能改善とバグ修正が含まれています…
こんにちは、たねやつです。 今回は、Alibabaが公開している高性能な画像編集モデル「Qwen Image Edit」をComfyUIで使う方法について解説します。 このモデルを使うと、好きな画像をゴッホ風にしたり、ジブリ風にしたり、昼間の情景を夜に変えたりと、プロン…
今回は、Gemini-CLIにあなたの「執筆スタイル」を学習させ、文章のトーン、言葉選び、表現のクセまでを再現させる方法を掘り下げます。これができれば、Gemini-CLIは単なるアシスタントではなく、あなたのゴーストライター、あるいは「もう一人の自分」とし…
今回はさらに一歩踏み込み、単なる「応答」のカスタマイズから、Gemini-CLIの「思考プロセス」そのものをあなたに近づける、驚くべき方法について解説します。`GEMINI.md`にあなたの考え方のクセや手順を書き込むことで、Geminiはあなたと同じ視点で物事を捉…
こんにちは、たねやつです。 前回ComfyUIのインストールが完了した皆さん、おめでとうございます!早速ですが、今回は新しい画像生成モデル「Qwen-Image」をComfyUIで使う方法を解説していきます。 「モデルって何?」という方もご安心ください。この記事を…
今回は、画像生成AIで注目されているComfyUIのインストール方法について、初心者にも分かりやすく解説していきます。ComfyUIはノードベースのUIが特徴で、自由度の高い画像生成が可能です。この記事を参考に、ぜひComfyUIの世界に足を踏み入れてみてください…
今回は、Gemini-CLIの人格や挙動をあらかじめ設定できる魔法のファイル、「GEMINI.md」について詳しく解説します。このファイルを使いこなせば、Gemini-CLIを単なるツールから、あなただけの最強パーソナルアシスタントへと進化させることができます。
この記事では、あなたのwan2.2を凡庸な記録係から才能ある"映画監督"に変えるための、カメラワークに特化したプロンプト設計術を解説します。
こんにちは、たねやつです。 AIの世界では「モデルは大きければ大きいほど性能が良い」という考え方が主流でした。しかし、最近NVIDIAが発表した新しい論文が、その常識に一石を投じています。「Small Language Models are the Future of Agentic AI(小規模…
xAIが開発した最新の大規模言語モデル(LLM)「Grok-2」がオープンソースとして公開され話題となっています。総パラメータ数3140億という驚異的な規模を誇るこのモデルは、Mixture-of-Experts(MoE)アーキテクチャを採用しており、その性能とオープンなライ…
こんにちは、たねやつです。 前回の導入編では、Gemini-CLIのインストールとObsidianとの連携方法について解説しました。最強の執筆アシスタントを手に入れたところで、今回はその基本的な使い方をマスターしていきましょう。 Gemini-CLIの操作は、人間と会…
今回は、Googleが提供するコマンドラインツール「Gemini-CLI」を、文章執筆や日々の作業を効率化するための超優秀なパーソナルアシスタントとして活用する方法について、シリーズ形式で詳しく解説していきます。
こんにちは、たねやつです。 Stable DiffusionのワークフローUIとして人気の「ComfyUI」に、複数GPUを持つユーザーにとって待望の機能が登場しました。 Redditでアルファ版が公開されたカスタムノード「Raylight」は、Split Tensor GPU Parallelという技術を…
こんにちは、たねやつです。 これまで、高性能なAIをローカル環境で動かすには、高価で電力消費の大きいGPUが必須というのが常識でした。しかし、その常識を覆すかもしれない、新しいAIモデルが登場しました。 Redditの r/LocalLLaMA サブレディットにて、開…
こんにちは、たねやつです。 イーロン・マスク氏が率いるxAIが開発した「Grok」、皆さんはもう使ってみましたか?X(旧Twitter)と統合され、リアルタイム情報に強いという特徴を持つこのAIは、他のAIアシスタントとは一味違った魅力を持っています。 この記…