Altera FPGA AIスイート
Altera FPGA AIスイートは、FPGAにおけるAI推論ソリューションの構築を効率化するように設計された包括的な開発プラットフォームです。このプラットフォームは、TensorFlowおよびPyTorchのような主要なAIフレームワーク、ならびにOpenVINOツールキットとシームレスに統合されており、効率的なモデルの最適化と実装が実現します。このスイートは、Intel® Quartus Primeソフトウェアを活用することで、FPGAデザインへのAI推論IPの統合を促進し、高パフォーマンスかつ低レイテンシを実現します。さらに、Open Model Zooの幅広い学習済みモデルをサポートしており、迅速で容易なモデルの変換と展開が可能です。これにより、Altera FPGA AIスイートは、通信、データセンター、産業用オートメーションなどの分野でAIアプリケーションにFPGAの力を活用したい開発者にとって理想的な選択肢となります。特徴
- ハイパフォーマンス - Agilex™ 7 FPGA Mシリーズは、最大理論性能88.5 INT8 TOPS、または90%のFPGA使用率で3,679フレーム/秒のResNet-50処理能力を実現できます。
- 簡単なシステム統合による低い総所有コスト - AI IPを他のシステムレベルのコンポーネントと統合することで、より小さなフットプリント、低い消費電力、そして低遅延を実現します。
- AIフロントエンドサポート - TensorFlow、Caffe、PyTorch、MXNet、Keras、ONNX などのAIフロントエンドフレームワークを活用できます。
- シンプルで標準的なフロー - Quartus PrimeソフトウェアやPlatform Designerを使用して、既存または新しいFPGA設計にAI推論IPを簡単に作成し、統合できます。
- 事前学習済みモデルへのアクセス - FPGA AIスイートは、Open Model Zooから提供される多くのモデルに対応しています。
- シームレスな事前学習済みモデルの変換 - OpenVINO Toolkitは、ほとんどの標準フレームワークからモデルを中間表現に変換します。
- ワンクリックで最適化されたAI IP生成 - 事前学習済みのAIモデルから最適なAI推論IPをシームレスに生成し、リソースとパフォーマンス目標の最適なバランスを達成するために設計空間を探索します。
- ハードウェア不要の早期モデル検証 - OpenVINOプラグインインターフェイスを通じて、AI推論IPのビット精度のソフトウェアエミュレーションが提供され、ハードウェアなしでモデルの精度を迅速に評価することができます。
アプリケーション
- コンピュータビジョン
- 医療画像処理と診断
- 産業
- データセンター
- 産業用オートメーション
- 電気通信
- 軍事関連
- ブロードキャスト
推論開発フロー
開発フローは、ハードウェアとソフトウェアのワークフローをシームレスに統合し、汎用的なエンドツーエンドのAIワークフローを実現します。ステップは以下のとおりです。
1. OpenVINO Model Optimizerは、事前にトレーニングしたモデルを中間表現ネットワークファイル(.xml)およびウェイト、バイアスファイル(.bin)に変換します。
2. FPGA AI Suiteコンパイラの使用目的:
- 指定されたアーキテクチャファイルの推定面積または性能指標を提供するか、最適化されたアーキテクチャファイルを生成します。(アーキテクチャは、PE 配列のサイズ、精度、活性化関数、インターフェイス幅、ウィンドウサイズなど、推論IPパラメータを指します。)
- ネットワークファイルを.binファイルにコンパイルし、FPGAおよび CPU(または両方)のネットワークパーティションとともに、ウェイトとバイアスを含めます。
3.コンパイルされた .bin ファイルは、ユーザーの推論アプリケーションによって実行時にインポートされます。ランタイム・アプリケーション・プログラミング・インターフェイス (API) には、推論エンジンAPI(ランタイム・パーティションCUPとFPGA、推論のスケジュール)および、FPGA AI (DDRメモリ、FPGAハードウェアブロック) が含まれます。
4. FPGAでの.binのインポートおよび推論の実行に関する基本動作の実証に、リファレンスデザインを利用できます。また、ホストCPU(x86およびArm®プロセッサ)、ならびにホストレス推論動作もサポートしています。
5. FPGA AIスイートIPのソフトウェアエミュレーションは、OpenVINOプラグインインターフェースからアクセスできます。これにより、ハードウェアへのアクセスなしでもFPGA AI IPの精度を迅速に評価できます(ただし、Agilex™ 5 FPGA限定)。
