NPU専用LLM「OmniNeural-4B」登場？AIは”GPU要らず”の時代へ？

こんにちは、たねやつです。

これまで、高性能なAIをローカル環境で動かすには、高価で電力消費の大きいGPUが必須というのが常識でした。しかし、その常識を覆すかもしれない、新しいAIモデルが登場しました。

Redditの r/LocalLLaMA サブレディットにて、開発チームが自らAMA（Ask Me Anything - 質問ある？）スレッドを立てて紹介した、世界初のNPU専用マルチモーダルモデル「OmniNeural-4B」です。

この記事では、そのAMAの内容を基に、OmniNeural-4Bがどのようなモデルで、私たちの未来にどのような変化をもたらす可能性があるのかを詳しく解説していきます。

まず、このモデルを理解する上で欠かせないのがNPU（Neural Processing Unit）です。

NPUは、AIの計算、特にニューラルネットワークの処理に特化したプロセッサです。GPUが画像処理全般を得意とするのに対し、NPUはAIタスクに的を絞っているため、より少ない消費電力で高いパフォーマンスを発揮できるのが最大の特徴です。

最近のスマートフォンやPC、自動車などにも搭載され始めており、私たちの身の回りで静かに普及が進んでいます。

今回発表された「OmniNeural-4B」は、このNPU上で動作することを前提に設計された、画期的なマルチモーダルAIです。

開発者によると、専用GPUがないデバイスにおいて、NPUはCPUで実行するよりも最大1.5倍高速でありながら、消費電力は2倍から8倍も効率的であるとされています。

これにより、これまで性能やバッテリーの問題で難しかった、スマートフォンやノートPC上での本格的なAIの常時稼働が現実的になります。

OmniNeural-4Bはテキストだけでなく、視覚（Vision）や音声（Audio）も扱うことができるマルチモーダルモデルです。

ベンチマークでは、視覚関連のタスクでApple FoundationやGemma-3n-E4Bといったモデルに対して約75%の確率で勝利または引き分け、音声タスクでは明確なリードを示しているとのことです。

AMAスレッドでは、多くの興味深い質問が寄せられていました。

Q. Google Playストアでアプリはリリースされる？
- 1. 将来的にリリース予定です。
Q. デバイス上でのファインチューニングは可能？
- 1. 重要な焦点であり、小規模なLoRA（追加学習手法）のトレーニングは実現可能だと考えています。
Q. Raspberry Pi AI HAT+のようなハードウェアでも動く？
- 1. 現在はQualcomm製のNPUのみをサポートしていますが、需要に応じて他のプラットフォームも検討します。