たねやつの木

Photographs, Keyboards and Programming

AI

Anthropicの新モデル「Sonnet 4.5」登場!海外Redditでの反応まとめ

Anthropicが新しいAIモデル「Sonnet 4.5」をリリースしました。このニュースは海外の技術コミュニティで早速話題となっています。 この記事では、特に海外掲示板RedditのAI関連コミュニティで、Sonnet 4.5がどのように受け止められているのか、その初期評価…

【ComfyUI x Qwen-Image-Edit-2509】まるで本物?AIで作るミニチュア風カーフォトの世界

こんにちは、たねやつです。 「もし自分の愛車が、書斎に飾れるくらい精巧なミニカーだったら…」 車好きなら、一度はそんな夢想をしたことがあるのではないでしょうか。自分の車が、まるでコレクションの一つであるかのように、小さな世界に存在する様子を想…

【AI画像編集】ComfyUIとQwen-Image-Edit-2509で適当な写真をキレイな商品画像に仕上げる!

AI画像編集モデル「Qwen-Image-Edit-2509」を使い、自宅で撮影したごく普通の写真を、プロ品質のECサイト向け画像に加工する手順を解説します。

Qwen-Image-Edit-2509活用術!フィギュア化・双子生成・食べ物復元まで試してみた

この記事では、実際に使用したプロンプトを全て公開し、その成功例と失敗例から見えてきた「Qwen-Image-Edit-2509」を使いこなすためのコツを共有します。

ComfyUIで「Qwen-Image-Edit-2509」を試す!RTX3060でも余裕で動く nano-banana相当のオープンモデル

この記事では、ComfyUIを使って「Qwen-Image-Edit-2509」の真価を引き出す方法を、具体的な作例とともに解説します。

Qwen-Image-Edit-2509発表!nano-bananaのように高度な画像編集・複数画像の組み合わせを実現

こんにちは、たねやつです。 Alibaba CloudのQwenチームが、画像編集の新たなスタンダードとなりうる強力なモデル「Qwen-Image-Edit-2509」をリリースしました。 このモデルは、単なるオブジェクトの置き換えや背景変更にとどまらず、複数画像の合成、画像内…

Qwen3-Omni登場!GPT-4oに匹敵する性能を持つマルチモーダルモデルを徹底解説

こんにちは、たねやつです。 Alibaba CloudのQwenチームが、オープンソースAIの世界に新たな金字塔を打ち立てました。新しいオムニモーダルモデルQwen3-Omniがリリースされ、その性能がGPT-4oやGemini 2.5 Proといった最先端のプロプライエタリモデルに匹敵…

gemini-cli v0.6.0 がリリース!UI/UXの進化点を中心に解説

こんにちは、たねやつです。 Google製のAIチャットCLIツールであるgemini-cliの新しいバージョン、v0.6.0がリリースされました。 このアップデートでは、入力体験の向上、表示とフィードバックの改善、新しいショートカットキーの追加など、UI/UXに焦点を当…

ロマンの塊!中国・深圳で改造された「48GB版 RTX 4090」購入レポートが話題に

こんにちは、たねやつです。 PCパーツ、特にグラフィックボードの進化にはいつも驚かされますが、時としてその進化の枠を飛び越えるようなクレイジーな試みが現れます。今回、AI開発者や研究者が集う海外の掲示板Redditのコミュニティ「/r/LocalLLaMA」で、…

GoogleのオンデバイスAIアプリ「AI Edge Gallery」を試す!使えるモデルや機能、制約を解説

こんにちは、たねやつです。 Googleが、AIモデルをスマートフォンなどの端末上で直接動かすためのデモアプリ「Google AI Edge Gallery」を公開しました。 早速、どのようなアプリなのか、どんな機能が使えるのか、そして気になる制約は何か、試してみました…

Qwen3-NextのGGUF版がリリースされない理由とは?技術的な課題とコミュニティの反応

こんにちは、たねやつです。 新しいLLM「Qwen3-Next」が注目されていますが、多くのローカルLLMユーザーが利用するGGUF版がなかなかリリースされず、心待ちにしている方も多いのではないでしょうか。 今回は、なぜQwen3-NextのGGUF版が登場しないのか、その…

Nano Bananaの意外な才能?写真が一瞬で「説明書風イラスト」になる線画生成がすごい

Nano Bananaの隠れた魅力である、この驚くべき線画生成機能の使い方と可能性について、詳しくご紹介します。

Qwen3-Next、実際に使った人々の反応は?Redditの感想まとめ

こんにちは、たねやつです。 先日、Alibabaの次世代LLM「Qwen3-Next」が正式リリースされたことをお伝えし、その驚異的なスペックを解説しました。 理論上はすごいと分かっていても、やはり気になるのは「実際に使ってみてどうなのか?」という点ですよね。 …

噂の超効率LLM「Qwen3-Next」がついに登場!その性能をについて

こんにちは、たねやつです。 先日、当ブログでAlibaba Cloudが開発する新しい大規模言語モデル(LLM)「Qwen3-Next」に関するリーク情報をお伝えし、その驚異的な効率性について深掘りしました。 www.taneyats.com そして先日、ついにHugging Faceにて公式に…

SLM(小規模言語モデル)がAIエージェントの未来を創る?Redditでの議論

こんにちは、たねやつです。 最近、AI界隈ではLLM(大規模言語モデル)に代わる新しい主役として「SLM(小規模言語モデル)」が注目を集めています。これまで「大きいことは良いことだ」とされてきた言語モデルの世界に、どのような変化が起きているのでしょ…

Alibabaの新世代モデル「Qwen3-Next」の噂。アクティブ3B/80Bの超効率モデルはローカルLLMを変えるか?

こんにちは、たねやつです。 先日、ローカルLLMのコミュニティサイトであるRedditのr/LocalLLaMAにて、Alibaba Cloudが開発する新しい大規模言語モデル(LLM)「Qwen 3-Next」シリーズが発見され、大きな話題を呼んでいます。 特に注目を集めているのがQwen3…

gemini-cli v0.4.0 がリリース!新機能や改善点を詳しく解説

こんにちは、たねやつです。 Google製のAIチャットCLIツールであるgemini-cliの新しいバージョン、v0.4.0がリリースされました。 このアップデートでは、セキュリティ機能の強化、CLIの使いやすさの向上、UI/UXの改善など、多くの新機能や改善、バグ修正が含…

EmbeddingGemmaでRAG構築! (応用編) ~育児記録ボットでメタデータを扱う~

応用編として、単なるテキスト検索から一歩進み、育児記録のような「日付」というメタデータを持つデータに対応した、より賢く、より実用的なRAGボットの構築に挑戦します。

UAEから「世界最先端」を謳うオープンソースLLM「K2 Think」が登場か?コミュニティの反応まとめ

こんにちは、たねやつです。 中東UAE(アラブ首長国連邦)を拠点とする研究機関から、「世界で最も先進的なオープンソース推論モデル」を謳う「K2 Think」が間もなくリリースされるというニュースが飛び込んできました。 Local LLM界隈では、過去にもUAEから…

AnythingLLMで始めるローカル版「NotebookLM」構築

こんにちは、たねやつです。 Googleが提供する「NotebookLM」は、ドキュメントをアップロードするだけで、その内容についてAIと対話できる非常に強力なツールです。しかし、「手元のプライベートな文書をクラウドにアップロードするのは少し不安…」「インタ…

EmbeddingGemmaでRAG構築! (第3回) ~Ollama連携とQ&Aシステムの完成~

このRetrieverとOllamaで動かすLLM(大規模言語モデル)を連携させ、ついに質問応答(Q&A)システムを完成させます。

AIの「嘘」の原因は評価方法にあった?OpenAIの論文を元にハルシネーションの謎に迫る

こんにちは、たねやつです。 AIがもっともらしい嘘をつく「ハルシネーション」現象。その原因について、OpenAIが発表した論文がRedditで話題になっていました。今回はその論文の内容と、コミュニティでの反応をまとめてみます。 ✅ この記事でわかること Ope…

EmbeddingGemmaでRAG構築! (第2回) ~FAISSで作るカスタム検索エンジン~

今回はそのデータベースを使い、ユーザーからの質問に最も関連性の高い文書を検索してくる「Retriever(レトリーバー)」を実装します。RAGの「R」、すなわちRetrieval(検索)を担う重要な部分です。

ローカルLLMはコーディングに使える?クラウドAIとの性能・コストをRedditで徹底議論!

こんにちは、たねやつです。 最近、ローカルで動作する大規模言語モデル(LLM)の進化が目覚ましいですね。クラウドのAPIを使わなくても、手元のマシンで十分に高性能なAIが動く時代になりつつあります。特にプログラマーにとっては、コーディング作業をどこ…

EmbeddingGemmaでRAG構築! (第1回) ~FAISSによるベクトルデータベース入門~

この連載では、3回にわたってRAGによるQ&Aシステムをローカル環境に構築する方法を解説します。第1回となる今回は、RAGの心臓部である「知識源(ベクトルデータベース)」の構築に挑戦します。

【性能比較】EmbeddingGemma vs multilingual-e5-large!最新埋め込みモデルを徹底検証

今回は、この注目の「EmbeddingGemma」の実力をさらに深掘りするため、人気の多言語埋め込みモデル`intfloat/multilingual-e5-large`と比較しながら、その性能や傾向の違いを探っていきます。

【Ollama】Codex CLIでgpt-oss:20bを動かす!コンテキストサイズ拡張編

こんにちは、たねやつです。 ローカルLLM環境のOllamaと、自然言語でCLI操作ができるOpenAIの「Codex CLI」の組み合わせは非常に強力です。しかし、gpt-oss:20bのような比較的高性能なモデルをそのまま使おうとすると、モデルが一度に読み取れる情報量(コン…

Gemini CLI v0.3.0 がリリース!新機能やバグ修正をまとめてみた

こんにちは、たねやつです。 Googleが開発するコマンドラインインターフェースツール「Gemini CLI」の新しいバージョンv0.3.0がリリースされました! 今回のアップデートでは、拡張機能の管理が容易になる新機能や、IDE連携の強化、多数のバグ修正、パフォー…

【試してみた】Googleの新型埋め込みモデル「EmbeddingGemma」の使い方と性能

こんにちは、たねやつです。 Googleから新しいテキスト埋め込みモデル「EmbeddingGemma」がリリースされ、その軽量さと性能の高さで話題になっています。 今回は、この注目の「EmbeddingGemma」の概要と、sentence-transformersライブラリを使って簡単にその…

Ollamaでモデルのコンテキストサイズを拡張する方法

今回は、Ollamaで既存モデルのコンテキストサイズを拡張し、長文のプロンプトを扱うツールでも快適に動作させるための方法を紹介します。