たねやつの木

Photographs, Keyboards and Programming

NPU専用LLM「OmniNeural-4B」登場?AIは”GPU要らず”の時代へ?

こんにちは、たねやつです。

これまで、高性能なAIをローカル環境で動かすには、高価で電力消費の大きいGPUが必須というのが常識でした。しかし、その常識を覆すかもしれない、新しいAIモデルが登場しました。

Redditの r/LocalLLaMA サブレディットにて、開発チームが自らAMA(Ask Me Anything - 質問ある?)スレッドを立てて紹介した、世界初のNPU専用マルチモーダルモデル「OmniNeural-4B」です。

この記事では、そのAMAの内容を基に、OmniNeural-4Bがどのようなモデルで、私たちの未来にどのような変化をもたらす可能性があるのかを詳しく解説していきます。

この記事でできること

  • NPUがどのようなハードウェアか理解できる
  • 新しいAIモデル「OmniNeural-4B」の主な特徴がわかる
  • AIがGPUを必要としない未来の可能性について知れる

NPUとは?AIの未来を担う新しい頭脳

まず、このモデルを理解する上で欠かせないのがNPU(Neural Processing Unit)です。

NPUは、AIの計算、特にニューラルネットワークの処理に特化したプロセッサです。GPUが画像処理全般を得意とするのに対し、NPUはAIタスクに的を絞っているため、より少ない消費電力で高いパフォーマンスを発揮できるのが最大の特徴です。

最近のスマートフォンやPC、自動車などにも搭載され始めており、私たちの身の回りで静かに普及が進んでいます。

世界初のNPU専用モデル「OmniNeural-4B」

今回発表された「OmniNeural-4B」は、このNPU上で動作することを前提に設計された、画期的なマルチモーダルAIです。

GPU不要で、CPUより高速・省電力

開発者によると、専用GPUがないデバイスにおいて、NPUはCPUで実行するよりも最大1.5倍高速でありながら、消費電力は2倍から8倍も効率的であるとされています。

これにより、これまで性能やバッテリーの問題で難しかった、スマートフォンやノートPC上での本格的なAIの常時稼働が現実的になります。

マルチモーダルに対応

OmniNeural-4Bはテキストだけでなく、視覚(Vision)や音声(Audio)も扱うことができるマルチモーダルモデルです。

ベンチマークでは、視覚関連のタスクでApple FoundationやGemma-3n-E4Bといったモデルに対して約75%の確率で勝利または引き分け、音声タスクでは明確なリードを示しているとのことです。

コミュニティの反応とQ&A

AMAスレッドでは、多くの興味深い質問が寄せられていました。

  • Q. Google Playストアでアプリはリリースされる?

      1. 将来的にリリース予定です。
  • Q. デバイス上でのファインチューニングは可能?

      1. 重要な焦点であり、小規模なLoRA(追加学習手法)のトレーニングは実現可能だと考えています。
  • Q. Raspberry Pi AI HAT+のようなハードウェアでも動く?

      1. 現在はQualcomm製のNPUのみをサポートしていますが、需要に応じて他のプラットフォームも検討します。

このように、将来的にはより多くのデバイスで、ユーザーが自分用にカスタマイズしたAIを動かせるようになる可能性が示唆されています。

最後に

NPU専用モデル「OmniNeural-4B」の登場は、AIが特別なサーバーや高価なGPUの上だけでなく、私たちの手元にあるあらゆるデバイスで当たり前に動く未来の幕開けを感じさせます。

省電力で高性能なNPUが普及し、それに対応したモデルが増えていけば、AIはよりパーソナルで、私たちの生活に密着した存在になっていくでしょう。今後の動向から目が離せませんね!

参考・引用