ハイパフォーマンス・ソフトウェア・カンファレンス・オンライン 2021 【春】コンテンツ

ハイパフォーマンス・ソフトウェア・
カンファレンス・オンライン 2021 【春】

インテル^® ソフトウェア開発製品によるパフォーマンスの最適化を学べる
開発者向け期間限定イベントサイト

本サイト公開期間:

2021 年 4 月 1 日 (木) ～ 2021 年 7 月 30 日 (金)

オンライン講演:

Day 1 - 2021 年 5 月 19 日 (水) 13:00 ～
Day 2 - 2021 年 6 月 11 日 (金) 13:00 ～
Day 3 - 2021 年 6 月 22 日 (火) 13:00 ～
Day 4 - 2021 年 7 月 9 日 (金) 13:00 ～

並列化に関する最新技術やインテル^® ソフトウェア開発製品を紹介するマガジン

The Parallel Universe 44 号

PDF

【注目記事】

データ並列 C++ のリダクション操作

【掲載記事】

The Parallel Universe の過去号はこちらからご覧ください。

PDF

The Parallel Universe 43 号

PDF

The Parallel Universe 42 号

PDF

The Parallel Universe 41 号

PDF

The Parallel Universe 40 号

PDF

The Parallel Universe 39 号

PDF

The Parallel Universe 38 号

▶▶ 上記に掲載されていないバックナンバーにつきましては、こちらからご覧ください。

ページトップへ

ヘテロジニアス環境での開発方法を紹介するオンライン・トレーニング

ハイパフォーマンス・ソフトウェア・カンファレンス・オンライン 2021 にて先行公開中の資料

ハイパフォーマンス・ソフトウェア・カンファレンス・オンライン 2021【春】にて、サイト公開期間中に限り、インテル^® oneAPI ツールキットや同梱コンポーネントに関する最新のオンライン・トレーニング向けの資料のみを先行公開しています。

日本語音声付きのオンライン・トレーニング動画につきましては、ハイパフォーマンス・ソフトウェア・カンファレンス・オンライン 2021【春】公開期間終了後、インテル^® oneAPI、インテル^® Parallel Studio XE、インテル^® System Studio、およびこれらの同梱コンポーネントを含む、インテルソフトウェア開発製品の有償ライセンスに対する有効なサポートサービスをお持ちのお客様を対象に提供させていただきます。

【先行公開中のオンライン・トレーニング一覧】

CUDA* から DPC++ へ移行してエッジの計算パフォーマンスを最適化 (インテル^® oneAPI ベース & HPC ツールキット)
インテル^® VTune™ プロファイラー・サーバーによる容易なプロファイル (インテル^® VTune™ プロファイラー)
ヘテロジニアス・ハードウェアの可視化とチューニング (インテル^® Advisor : フローグラフ・アナライザー)
クロスアーキテクチャーのタスクベースのプログラミングの最適化 (インテル^® oneAPI スレッディング・ビルディング・ブロック)

PDF 資料のダウンロード

CUDA* から DPC++ へ移行してエッジの計算パフォーマンスを最適化

PDF 資料のダウンロード

インテル^® VTune™ プロファイラー・サーバーによる容易なプロファイル

PDF 資料のダウンロード

ヘテロジニアス・ハードウェアの可視化とチューニング

PDF 資料のダウンロード

クロスアーキテクチャーのタスクベースのプログラミングの最適化

データ並列 C++ (DPC++) プログラミング・セミナー・シリーズ

― iSUS 編集長 / テクニカルライターすがわらきよふみ ―

このセッションでは、インテル^® oneAPI でダイレクト・プログラミングを実現するためのデータ並列 C++ (DPC++) プログラミング・モデルについて紹介します。DPC++ の動作の仕組みをはじめ、DPC++ によるプログラミング方法、インテル^® ライブラリーからインテル^® oneAPI ライブラリーへの移行方法、ヘテロジニアス環境への移行方法、パフォーマンス・チューニングの取り組み方、C および Fortran ユーザー向けのプログラミング方法について説明します。

【各セッションの概要】

パート 1 「さあはじめよう! データ並列 C++ の動作の仕組み」

このセッションでは、コンパイルの手順をはじめ、レガシーコンパイル、JIT コンパイル、AOT コンパイル、ファットバイナリー等、データ並列 C++ (DPC++) コンパイラーがどのように動作するかについて説明します。
パート 2 「さあはじめよう! データ並列 C++ プログラミング」

このセッションでは、インテル^® Parallel Studio XE に同梱されるコンパイラーとの比較をはじめ、データ並列 C++ の概念や対象となるユーザー、C / C++ および SYCL* におけるベクトル加算、SYCL* キューやバッファー等、実行例とともに説明します。
パート 3 「さあはじめよう! データ並列 C++ コンパイラーを使用した USM のサンプルコード」

このセッションでは、データ並列 C++ (DPC++) プログラミング言語の基本機能を紹介します。バッファーに代わって統合共有メモリー (USM) を使用して、ホストとデバイスのメモリーの管理とアクセスを行います。
パート 4 「さあはじめよう! DPC++ とインテル^® oneMKL を使ってみよう」

このセッションでは、インテル^® oneMKL の概要や新機能をはじめ、並列正弦、マルチデバイス FFT、行列乗算といったインテル^® oneMKL の利用法のほか、C / C++ や従来のインテル^® MKL、バッファーによるインテル^® oneMKL、USM によるインテル^® oneMKL などのサンプルコードについて説明します。
パート 5 「さあはじめよう! インテル^® oneAPI へのポーティングのガイド－ ICC / ICL から ICX / DPCPP へ移行する」

新しい dpcpp / icx / ifx は全く新しいコンパイラーであり、既存のソースやプロジェクトを移行する際に、オプション、マクロ、プラグマ、警告やメッセージに戸惑うかもしれません。このセッションでは、クラシック・コンパイラーを使用するプロジェクトを新しいコンパイラー環境に移行する際の注意点や問題点を解説します。
パート 6 「さあはじめよう! クラシック・コンパイラー (ICC/ICL) と新しい LLVM ベース・コンパイラー (ICX/DPCPP) のパフォーマンスを比較する」

クラシック・コンパイラー (ICC/ICL) および新しい LLVM ベース・コンパイラー (ICX/DPCPP) を使用して、実際にパフォーマンスの比較や検証を行います。また、インテル oneAPI C++ コンパイラーにおける疑問点についても紹介します。

PDF 資料のダウンロードはこちら

パート 1 「さあはじめよう! データ並列 C++ の動作の仕組み」

PDF 資料のダウンロードはこちら

パート 2 「さあはじめよう! データ並列 C++ プログラミング」

PDF 資料のダウンロードはこちら

パート 3 「さあはじめよう! データ並列 C++ コンパイラーを使用した USM のサンプルコード」

PDF 資料のダウンロードはこちら

パート 4 「さあはじめよう! DPC++ とインテル^® oneMKL を使ってみよう」

PDF 資料のダウンロードはこちら

パート 5 「さあはじめよう! インテル^® oneAPI へのポーティングのガイド ― ICC / ICL から ICX / DPCPP へ移行する」

PDF 資料のダウンロードはこちら

パート 6 「さあはじめよう！クラシック・コンパイラー (ICC/ICL) と新しい LLVM ベース・コンパイラー (ICX/DPCPP) のパフォーマンスを比較する」

DPC++ と GPU ワークロードのパフォーマンスをプロファイル

― インテルコーポレーションテクニカル・コンサルティング・エンジニア Vladimir Tsymbal / 日本語訳エクセルソフト株式会社 ―

CPU から GPU へアプリケーションをオフロードする場合、パフォーマンスを最適化するため、どこを、どのように変更すれば効果的かを特定することは容易ではありません。このセッションでは、インテル^® VTune™ プロファイラーを使用してこの作業を簡素化する方法を紹介します。

【各セッションの概要】

パート 1 「DPC++ と GPU ワークロードのパフォーマンスをプロファイル」 (講演)

このセッションでは、GPU プログラミング・モデルとインテル^® VTune™ プロファイラーの GPU 解析について説明します。
パート 2 「DPC++ と GPU ワークロードのパフォーマンスをプロファイル」 (デモ 1)

このセッションでは、実際にインテル^® VTune™ プロファイラーを操作しながら GPU オフロード解析の利用方法を紹介します。
パート 3 「DPC++ と GPU ワークロードのパフォーマンスをプロファイル」 (デモ 2)

このセッションでは、実際にインテル^® VTune™ プロファイラーを操作しながら GPU 計算/メディア・ホットスポット解析の利用方法を紹介します。

PDF 資料のダウンロードはこちら

パート 1 「DPC++ と GPU ワークロードのパフォーマンスをプロファイル」 (講演)

PDF 資料のダウンロードはこちら

パート 2 「DPC++ と GPU ワークロードのパフォーマンスをプロファイル」 (デモ 1)

PDF 資料のダウンロードはこちら

パート 3 「DPC++ と GPU ワークロードのパフォーマンスをプロファイル」 (デモ 2)

コードを GPU にオフロードする

― インテルコーポレーションシニア・テクニカル・コンサルティング・エンジニア Kevin O'Leary / 日本語訳エクセルソフト株式会社 ―

ボトルネックの特定と排除は、すべての開発者が避けて通れない課題です。アプリケーションを新しいプラットフォームに移行する場合、例えば CPU から GPU へ移行する場合、この作業はさらに複雑になります。その場合、開発者はボトルネックを特定するだけでなく、まずオフロードにより利点が得られるコード領域を特定する必要があります。

インテル^® oneAPI ベース・ツールキットに含まれるインテル^® Advisor の GPU 向けの新しい機能は、ボトルネックの特定だけでなく、オフロードにより利点が得られるコード領域の特定を支援します。

【各セッションの概要】

パート 1 「コードを GPU にオフロードする」 (講演)

このセッションでは、oneAPI とインテル^® Advisor の概要、インテル^® oneAPI ベース・ツールキットに含まれる新しいインテル^® Advisor の GPU サポートについて説明します。
パート 2 「コードを GPU にオフロードする」 (デモ)

このセッションでは、インテル^® Advisor を実際に操作しながら、オフロードのモデル化、GPU ルーフライン、およびフローグラフ・アナライザー機能を使用してオフロード領域を特定し、ボトルネックを特定して排除する方法を説明します。

PDF 資料のダウンロードはこちら

パート 1 「コードを GPU にオフロードする」 (講演)

PDF 資料のダウンロードはこちら

パート 2 「コードを GPU にオフロードする」 (デモ)

インテル^® oneMKL を使用したヘテロジニアス環境での開発 (資料のみ)

― インテルコーポレーションソフトウェア・デベロッパー Peter Caday、インテルコーポレーションプロダクト・マーケティング・エンジニア Tim Allen、インテルコーポレーションシニア・テクニカル・コンサルティング・エンジニア Khang T. Nguyen / 日本語訳エクセルソフト株式会社 ―

このセッションでは、GPU および CPU 向けに一度開発することで数学ライブラリーのエクスペリエンスを向上するための方法、業界をリードするインテル^® oneMKL で従来の CPU のみのサポートを超えて GPU でプログラミングする方法、データ並列 C++ (DPC++) 言語からのインテル^® oneMKL API 呼び出しの GPU 固有の例などについて紹介します。

このセッションでは、資料のみ日本語で提供しています。トレーニング動画 (英語) は、Tech.Decoded で公開されている「Developing in a Heterogeneous Environment with Intel^® oneAPI Math Kernel Library」からご視聴いただけます。

PDF 資料のダウンロードはこちら

「インテル^® oneMKL を使用したヘテロジニアス環境での開発」(資料)

MPI と DPC++ を使用したハイブリッド並列プログラミング (資料およびデモ動画のみ)

― インテルコーポレーションソフトウェア・アプリケーション・エンジニア Loc Q. Nguyen、oneAPI テクニカル・エバンジェリスト Karl Qi / 日本語訳エクセルソフト株式会社 ―

このセッションでは、データ並列 C++ (DPC++) と MPI といった 2 つの異なる標準を効果的に組み合わせて使用して、ノード間、ノード内、および CPU や GPU 等のアクセラレーター・デバイス・レベルの並列処理を最大限に活用するためのハイブリッド・プログラミングについて紹介します。

このセッションでは、資料およびデモ動画の字幕のみ日本語で提供しています。全体のトレーニング動画 (英語) は、Tech.Decoded で公開されている「Hybrid Parallel Programming for HPC Clusters with MPI and DPC++」からご視聴いただけます。

PDF 資料のダウンロードはこちら

「MPI と DPC++ を使用したハイブリッド並列プログラミング」(資料およびデモ動画)

ページトップへ

インテル^® oneAPI 各ツールキットの製品カタログ

PDF

インテル^® oneAPI ベース・ツールキット

CPU、GPU、FPGA 向けのクロスアーキテクチャー・アプリケーションを開発

PDF

インテル^® oneAPI HPC ツールキット

クロスアーキテクチャーのハイパフォーマンスなアプリケーションを開発

PDF

インテル^® oneAPI IoT ツールキット

スマート・コネクテッド・デバイスの開発を高速化

PDF

インテル^® oneAPI レンダリング・ツールキット

スケーリングする写実的なレンダリング

ページトップへ

oneAPI 仕様

PDF

ソースレベルの互換性、パフォーマンスの透過性、およびソフトウェア・スタックの移植性の提供を目標とする oneAPI や対応するツールの仕様について紹介します。

【目次】

パート 1: 第 1 章～第 8 章
- 第 1 章 ― はじめに
- 第 2 章 ― ソフトウェア・アーキテクチャー
- 第 3 章 ― DPC++
- 第 4 章 ― oneDPL
- 第 5 章 ― oneDNN
- 第 6 章 ― oneCCL
- 第 7 章 ― レベルゼロ
- 第 8 章 ― oneDAL

ページトップへ

oneAPI DPC++ 導入ガイド

PDF

CPU とさまざまなコンピューティング・アクセラレーター (GPU や FPGA など) の両方のコードを含む C++ と SYCL* ソースファイルをコンパイルする DPC++ コンパイラーについて以下の情報を提供します。

【目次】

要件
- DPC++ ワークスペースの作成
DPC++ ツールチェーンのビルド
- libc++ ライブラリーを使用して DPC++ ツールチェーンをビルド
- NVIDIA CUDA* をサポートする DPC++ ツールチェーンをビルド
- Doxygen ドキュメントのビルド
DPC++ ツールチェーンを使用する
- 低レベルランタイムのインストール
- 事前（AOT）コンパイルの前提条件を取得
- DPC++ ツールチェーンのテスト
- 簡単な DPC++ アプリケーションを実行
- 特定の GPU 向けにプログラムを記述
- CUDA* プラットフォームで DPC++ ツールチェーンを使用する
C++ 標準
既知の問題と制限事項
CUDA* バックエンドの制限
関連情報

ページトップへ

oneAPI GPU 最適化ガイド

PDF

GPU 上で oneAPI プログラムのパフォーマンスを最大限に引き出すヒントを提供します。

【目次】

はじめに
導入ガイド
並列化
インテル^® UHD グラフィックスを搭載するインテル^® プロセッサー
DPC++ スレッド階層のマッピング
カーネル
メモリー
ホスト / デバイスの調整
複数の異種デバイスを使用
コンパイル
デバッグとプロファイル

ページトップへ

SYCL* 2020 API リファレンス・ガイド

PDF

SYCL* でクロスアーキテクチャー向けに開発して、さまざまなデバイスでカーネルコードを高速に実行するために必要なインターフェイス、各種クラス、アクセサーなどの基本情報を提供するクイック・リファレンスです。

ページトップへ

インテル^® oneAPI プログラミング・ガイド

PDF

インテル^® oneAPI のプログラミングに関する以下の事項について説明します。

【目次】

インテル^® oneAPI プログラミングの概要
oneAPI プログラミング・モデル
oneAPI 開発環境の設定
oneAPI プログラムのコンパイルと実行
API ベースのプログラミング
ソフトウェア開発手順

ページトップへ

インテル^® oneAPI ポーティング・ガイド

PDF

新しい LLVM ベースのインテル^® oneAPI DPC++ / C++ コンパイラー (dpcpp および icx) に移行するインテル^® C++ コンパイラー・クラシック (icc / icl) ユーザー向けに、以下を含む情報と提案を提供します。

【目次】

用語
ICX に対する指針
コンパイラーのデフォルトに関する大きな変更
重要な新しいオプション
コンパイラー・バージョン
重要なコンパイラー・オプションの対応付け
プラグマのサポート
事前定義マクロのサポート
ビルトイン関数
プリコンパイルされたヘッダーファイルのサポート
診断オプションと診断メッセージ番号の変更
リンク、IPO、PGO に関する変更
言語機能
組込み関数の使用モデルに関する変更
インテル固有のプロセッサー・ターゲット・プラグマと関数のサポート
浮動小数点結果の再現性の制御
ブルータスまたはバイセクション最適化のサポート
付録: ICC / ICL クラシック・コンパイラーのオプション実装状況

ページトップへ

インテル^® Fortran コンパイラー・クラシック / ベータ版インテル^® Fortran コンパイラー

PDF

OpenMP* による並列処理やその他のコンパイラーの使用をはじめ、インテル^® Fortran コンパイラー・クラシック 2021.1 およびベータ版インテル^® Fortran コンパイラーにおける OpenMP* サポートについて説明します。

ページトップへ

インテル^® Advisor ユーザーガイド

WEB

インテル^® Advisor の起動方法、プロジェクトの設定、CPU 使用の最適化、GPU オフロード向けの設計、フローグラフ・アナライザーの概要、解析のオーバーヘッドの最小化、結果の管理、コマンドライン・インターフェイスのリファレンス等について紹介します。

ページトップへ

インテル^® oneAPI DPC++ / C++ コンパイラー導入ガイド

WEB

準備
SYCL* コードのコンパイルと実行
SYCL* デバイスの指定方法 (オプション)
コンパイラーの起動
コマンドラインの使用 (Windows*)
コマンドラインの使用 (Linux*)
Microsoft* Visual Studio* の使用 (Windows*)
オプション 2: Eclipse* CDT の使用 (Linux*)
次のステップ
関連情報

ページトップへ

インテル^® oneAPI DPC++ / C++ コンパイラー・デベロッパー・ガイドおよびリファレンス

WEB

インテル^® oneAPI ベース・ツールキット、インテル^® oneAPI HPC ツールキット、インテル^® oneAPI IoT ツールキットの一部、またはスタンドアロンとして提供されるインテル^® oneAPI DPC++ / C++ コンパイラー (icx / icpx または dpcpp) とランタイム環境について以下の情報を提供します。

インテル^® oneAPI DPC++ / C++ コンパイラーについて
コンパイラーのセットアップ
コンパイラー・リファレンス
コンパイル
最適化およびプログラミング・ガイド
互換性と移植

ページトップへ

インテル^® oneAPI DPC++ ライブラリー・ガイド

WEB

インテル^® oneAPI DPC++ / C++ コンパイラーとの連携により、開発者に生産性の高い API を提供することを目的として、さまざまなデバイスにわたるハイパフォーマンス並列アプリケーションのデータ並列 C++ (DPC++) プログラミング作業を最小限に抑えるライブラリーについて以下の情報を提供します。

はじめに
Parallel STL の概要
- DPC++ ポリシーの使用方法
- マクロ
拡張 API
検証済み標準 C++ API
乱数ジェネレータ―

ページトップへ

データ並列 C++ (DPC++) プログラミングの紹介資料

パート 1: 新しいプログラミング・モデルの紹介

データ並列 C++、コードの構造、およびコードをすぐに記述するための以下の主要概念が紹介された Webinar の資料を日本語化しました。

PDF

【目次】

データ並列 C++ とは?
プログラミング構造と実行モデル
コードのコンパイル
キューとデバイスの選択
データとタスクグラフの管理
インテルによる DPC++ の拡張

パート 2: プログラミングのベストプラクティス

oneAPI アプリケーションをプログラムする言語であるデータ並列 C++ (DPC++) を使用するためのベストプラクティスを紹介します。

PDF

【目次】

DPC++ への移行
- インテル^® DPC++ 互換性ツール
- オフロードのモデル化 (旧: オフロード・アドバイザー)
DPC++ コードの記述
- DPC++ の基本的なビルディング・ブロック
- 同期
- カスタム・デバイス・セレクター
- エラー処理
- 統合共有メモリー
- インテル^® oneAPI DPC++ ライブラリー (インテル^® oneDPL)

ページトップへ

最新情報

並列化に関する最新技術やインテル® ソフトウェア開発製品を紹介するマガジン

The Parallel Universe 44 号

【注目記事】

【掲載記事】

The Parallel Universe の過去号はこちらからご覧ください。

ヘテロジニアス環境での開発方法を紹介するオンライン・トレーニング

ハイパフォーマンス・ソフトウェア・カンファレンス・オンライン 2021 にて先行公開中の資料

【先行公開中のオンライン・トレーニング一覧】

データ並列 C++ (DPC++) プログラミング・セミナー・シリーズ

【各セッションの概要】

DPC++ と GPU ワークロードのパフォーマンスをプロファイル

【各セッションの概要】

コードを GPU にオフロードする

【各セッションの概要】

インテル® oneMKL を使用したヘテロジニアス環境での開発 (資料のみ)

MPI と DPC++ を使用したハイブリッド並列プログラミング (資料およびデモ動画のみ)

インテル® oneAPI 各ツールキットの製品カタログ

oneAPI 仕様

【目次】

oneAPI DPC++ 導入ガイド

【目次】

oneAPI GPU 最適化ガイド

【目次】

SYCL* 2020 API リファレンス・ガイド

インテル® oneAPI プログラミング・ガイド

【目次】

インテル® oneAPI ポーティング・ガイド

【目次】

インテル® Fortran コンパイラー・クラシック / ベータ版インテル® Fortran コンパイラー

インテル® Advisor ユーザーガイド

インテル® oneAPI DPC++ / C++ コンパイラー導入ガイド

インテル® oneAPI DPC++ / C++ コンパイラー・デベロッパー・ガイドおよびリファレンス

インテル® oneAPI DPC++ ライブラリー・ガイド

データ並列 C++ (DPC++) プログラミングの紹介資料

パート 1: 新しいプログラミング・モデルの紹介

【目次】

パート 2: プログラミングのベストプラクティス

【目次】

関連資料紹介

iSUS 提供資料

技術記事

オンライン・トレーニング

関連製品

インテル® ソフトウェア開発ツール

特殊なワークロード向けのドメイン固有のツールキット

インテル® VTune™ プロファイラー

インテル® Inspector

インテル® Advisor

インテル® ディストリビューションの OpenVINO™ ツールキット

並列化に関する最新技術やインテル^® ソフトウェア開発製品を紹介するマガジン

インテル^® oneMKL を使用したヘテロジニアス環境での開発 (資料のみ)

インテル^® oneAPI 各ツールキットの製品カタログ

インテル^® oneAPI プログラミング・ガイド

インテル^® oneAPI ポーティング・ガイド

インテル^® Fortran コンパイラー・クラシック / ベータ版インテル^® Fortran コンパイラー

インテル^® Advisor ユーザーガイド

インテル^® oneAPI DPC++ / C++ コンパイラー導入ガイド

インテル^® oneAPI DPC++ / C++ コンパイラー・デベロッパー・ガイドおよびリファレンス

インテル^® oneAPI DPC++ ライブラリー・ガイド

インテル^® ソフトウェア開発ツール

インテル^® VTune™ プロファイラー

インテル^® Inspector

インテル^® Advisor

インテル^® ディストリビューションの OpenVINO™ ツールキット