AI
Anthropicが新しいAIモデル「Sonnet 4.5」をリリースしました。このニュースは海外の技術コミュニティで早速話題となっています。 この記事では、特に海外掲示板RedditのAI関連コミュニティで、Sonnet 4.5がどのように受け止められているのか、その初期評価…
こんにちは、たねやつです。 「もし自分の愛車が、書斎に飾れるくらい精巧なミニカーだったら…」 車好きなら、一度はそんな夢想をしたことがあるのではないでしょうか。自分の車が、まるでコレクションの一つであるかのように、小さな世界に存在する様子を想…
AI画像編集モデル「Qwen-Image-Edit-2509」を使い、自宅で撮影したごく普通の写真を、プロ品質のECサイト向け画像に加工する手順を解説します。
この記事では、実際に使用したプロンプトを全て公開し、その成功例と失敗例から見えてきた「Qwen-Image-Edit-2509」を使いこなすためのコツを共有します。
この記事では、ComfyUIを使って「Qwen-Image-Edit-2509」の真価を引き出す方法を、具体的な作例とともに解説します。
こんにちは、たねやつです。 Alibaba CloudのQwenチームが、画像編集の新たなスタンダードとなりうる強力なモデル「Qwen-Image-Edit-2509」をリリースしました。 このモデルは、単なるオブジェクトの置き換えや背景変更にとどまらず、複数画像の合成、画像内…
こんにちは、たねやつです。 Alibaba CloudのQwenチームが、オープンソースAIの世界に新たな金字塔を打ち立てました。新しいオムニモーダルモデルQwen3-Omniがリリースされ、その性能がGPT-4oやGemini 2.5 Proといった最先端のプロプライエタリモデルに匹敵…
こんにちは、たねやつです。 Google製のAIチャットCLIツールであるgemini-cliの新しいバージョン、v0.6.0がリリースされました。 このアップデートでは、入力体験の向上、表示とフィードバックの改善、新しいショートカットキーの追加など、UI/UXに焦点を当…
こんにちは、たねやつです。 PCパーツ、特にグラフィックボードの進化にはいつも驚かされますが、時としてその進化の枠を飛び越えるようなクレイジーな試みが現れます。今回、AI開発者や研究者が集う海外の掲示板Redditのコミュニティ「/r/LocalLLaMA」で、…
こんにちは、たねやつです。 Googleが、AIモデルをスマートフォンなどの端末上で直接動かすためのデモアプリ「Google AI Edge Gallery」を公開しました。 早速、どのようなアプリなのか、どんな機能が使えるのか、そして気になる制約は何か、試してみました…
こんにちは、たねやつです。 新しいLLM「Qwen3-Next」が注目されていますが、多くのローカルLLMユーザーが利用するGGUF版がなかなかリリースされず、心待ちにしている方も多いのではないでしょうか。 今回は、なぜQwen3-NextのGGUF版が登場しないのか、その…
Nano Bananaの隠れた魅力である、この驚くべき線画生成機能の使い方と可能性について、詳しくご紹介します。
こんにちは、たねやつです。 先日、Alibabaの次世代LLM「Qwen3-Next」が正式リリースされたことをお伝えし、その驚異的なスペックを解説しました。 理論上はすごいと分かっていても、やはり気になるのは「実際に使ってみてどうなのか?」という点ですよね。 …
こんにちは、たねやつです。 先日、当ブログでAlibaba Cloudが開発する新しい大規模言語モデル(LLM)「Qwen3-Next」に関するリーク情報をお伝えし、その驚異的な効率性について深掘りしました。 www.taneyats.com そして先日、ついにHugging Faceにて公式に…
こんにちは、たねやつです。 最近、AI界隈ではLLM(大規模言語モデル)に代わる新しい主役として「SLM(小規模言語モデル)」が注目を集めています。これまで「大きいことは良いことだ」とされてきた言語モデルの世界に、どのような変化が起きているのでしょ…
こんにちは、たねやつです。 先日、ローカルLLMのコミュニティサイトであるRedditのr/LocalLLaMAにて、Alibaba Cloudが開発する新しい大規模言語モデル(LLM)「Qwen 3-Next」シリーズが発見され、大きな話題を呼んでいます。 特に注目を集めているのがQwen3…
こんにちは、たねやつです。 Google製のAIチャットCLIツールであるgemini-cliの新しいバージョン、v0.4.0がリリースされました。 このアップデートでは、セキュリティ機能の強化、CLIの使いやすさの向上、UI/UXの改善など、多くの新機能や改善、バグ修正が含…
応用編として、単なるテキスト検索から一歩進み、育児記録のような「日付」というメタデータを持つデータに対応した、より賢く、より実用的なRAGボットの構築に挑戦します。
こんにちは、たねやつです。 中東UAE(アラブ首長国連邦)を拠点とする研究機関から、「世界で最も先進的なオープンソース推論モデル」を謳う「K2 Think」が間もなくリリースされるというニュースが飛び込んできました。 Local LLM界隈では、過去にもUAEから…
こんにちは、たねやつです。 Googleが提供する「NotebookLM」は、ドキュメントをアップロードするだけで、その内容についてAIと対話できる非常に強力なツールです。しかし、「手元のプライベートな文書をクラウドにアップロードするのは少し不安…」「インタ…
このRetrieverとOllamaで動かすLLM(大規模言語モデル)を連携させ、ついに質問応答(Q&A)システムを完成させます。
こんにちは、たねやつです。 AIがもっともらしい嘘をつく「ハルシネーション」現象。その原因について、OpenAIが発表した論文がRedditで話題になっていました。今回はその論文の内容と、コミュニティでの反応をまとめてみます。 ✅ この記事でわかること Ope…
今回はそのデータベースを使い、ユーザーからの質問に最も関連性の高い文書を検索してくる「Retriever(レトリーバー)」を実装します。RAGの「R」、すなわちRetrieval(検索)を担う重要な部分です。
こんにちは、たねやつです。 最近、ローカルで動作する大規模言語モデル(LLM)の進化が目覚ましいですね。クラウドのAPIを使わなくても、手元のマシンで十分に高性能なAIが動く時代になりつつあります。特にプログラマーにとっては、コーディング作業をどこ…
この連載では、3回にわたってRAGによるQ&Aシステムをローカル環境に構築する方法を解説します。第1回となる今回は、RAGの心臓部である「知識源(ベクトルデータベース)」の構築に挑戦します。
今回は、この注目の「EmbeddingGemma」の実力をさらに深掘りするため、人気の多言語埋め込みモデル`intfloat/multilingual-e5-large`と比較しながら、その性能や傾向の違いを探っていきます。
こんにちは、たねやつです。 ローカルLLM環境のOllamaと、自然言語でCLI操作ができるOpenAIの「Codex CLI」の組み合わせは非常に強力です。しかし、gpt-oss:20bのような比較的高性能なモデルをそのまま使おうとすると、モデルが一度に読み取れる情報量(コン…
こんにちは、たねやつです。 Googleが開発するコマンドラインインターフェースツール「Gemini CLI」の新しいバージョンv0.3.0がリリースされました! 今回のアップデートでは、拡張機能の管理が容易になる新機能や、IDE連携の強化、多数のバグ修正、パフォー…
こんにちは、たねやつです。 Googleから新しいテキスト埋め込みモデル「EmbeddingGemma」がリリースされ、その軽量さと性能の高さで話題になっています。 今回は、この注目の「EmbeddingGemma」の概要と、sentence-transformersライブラリを使って簡単にその…
今回は、Ollamaで既存モデルのコンテキストサイズを拡張し、長文のプロンプトを扱うツールでも快適に動作させるための方法を紹介します。