ハイパフォーマンス・ソフトウェア・カンファレンス
多様化するアーキテクチャーで最大限のパフォーマンスに挑む
2023/4/17 (月) ~ 2023/6/30 (金)
2023/6/7 (水) ~ 2023/6/9 (金)
2023/6/12 (月) ~ 2023/6/30 (金)
HPSC 2023 で公開された日本語コンテンツは、エクセルソフトのインテル® ソフトウェア開発製品向けドキュメント・ページ (一般公開向け)、インテル® ソフトウェア開発製品 購入者限定サイト※ (限定公開向け / ユーザー登録必須)、または iSUS (一般公開 / 一部申し込み必須) のいずれかのサイトにて引き続き公開しています。
こちらのアーカイブサイトでは、HPSC 2023 で公開されたコンテンツの一覧と、イベント期間外に利用可能な通常のアクセス先を掲載しています。
※ 購入者限定サイトは、インテル® ソフトウェア開発製品における有償サポート製品をご購入いただき、有効なサポートサービスをお持ちの方を対象に提供されるサポートサービスの一環となります。有償サポート製品のご購入や、購入者限定サイトへのアクセスに関するご質問につきましては、エクセルソフトのお問合せフォームよりご連絡ください。
エクセルソフトでは、インテル社が提供するインテル® oneAPI ツールキット関連のさまざまな最新のドキュメントやウェビナーを日本語化し、インテル® oneAPI ツールキットの有償サポートをご利用いただいている方にいち早く限定公開しております。HPSC サイト公開期間に限り、普段は一般公開されていないドキュメントやオンデマンド・トレーニングをはじめとした、さまざまな日本語版の技術リソースにアクセスいただけます。
- エクセルソフト株式会社 テクニカル・サポート・エンジニア 中村 弘志 -
2 部構成でお届けするこのワークショップでは、SYCL* の基本的な要素と概念をハンズオン形式にて紹介し、開発者にとってより自然な形で行えるようになった、高負荷な計算処理を効率よくハードウェアに実行させる異種 (ヘテロジニアス) コンピューティングのプログラミングについて、ハンズオン形式で分かりやすく解説します。
- iSUS 編集長 / テクニカルライター 菅原 清文 -
このセッションでは、インテル® oneAPI でダイレクト・プログラミングを実現するためのデータ並列 C++ (DPC++) プログラミング・モデルについて紹介します。DPC++ の動作の仕組みをはじめ、DPC++ によるプログラミング方法、インテル® ライブラリーからインテル® oneAPI ライブラリーへの移行方法、ヘテロジニアス環境への移行方法、パフォーマンス・チューニングの取り組み方、C および Fortran ユーザー向けのプログラミング方法について説明します。
- インテル コーポレーション テクニカル・コンサルティング・エンジニア Jon Kim & Sofea Azrina Azizan / 日本語訳 エクセルソフト株式会社 -
インテル® oneAPI ベース・ツールキットに含まれるインテル® DPC++ 互換性ツールを使用することで、CUDA* コードからデータ並列 C++ (DPC++) コードへ容易に移行できます。このセッションでは、開発者、研究者、システム・インテグレーター、学生向けに、CUDA* から DPC++ へ移行する方法と役立つ情報を提供します。
― インテル コーポレーション PSG HLD エンジニア Tanner Young-Schultz / 日本語訳 エクセルソフト株式会社 ―
oneAPI を使用して FPGA をターゲットにしようとしている開発者を対象に、完全なハードウェア・コンパイルを行わずに高位設計 (HLD) コードで FPGA ハードウェア・レベルの最適化をたった数分で評価する方法や、高位設計において RTL とのパフォーマンス・ギャップを埋めるための手法を紹介します。
― インテル コーポレーション シニア・テクニカル・コンサルティング・エンジニア Kevin O'Leary、インテル コーポレーション テクニカル・コンサルティング・エンジニア Anoop Madhusoodhanan Prabha / 日本語訳 エクセルソフト株式会社 ―
インテル® Advisor は、インテル® oneAPI スイートに含まれるツールです。FGA は、DPC++ (略称 DPC++) プログラムのトレースを収集して、FGA GUI で表示して、アプリケーションのチューニングと最適化を行うための機能を提供します。このセッションでは、インテル® Advisor のフローグラフ・アナライザー (略称 FGA) 機能を使用して、ヘテロジニアス・ハードウェアを可視化してチューニングする方法を紹介します。
― インテル コーポレーション テクニカル・コンサルティング・エンジニア Vladimir Tsymbal / 日本語訳 エクセルソフト株式会社 ―
CPU から GPU へアプリケーションをオフロードする場合、パフォーマンスを最適化するため、どこを、どのように変更すれば効果的かを特定することは容易ではありません。このセッションでは、インテル® VTune™ プロファイラーを使用してこの作業を簡素化する方法を紹介します。
― インテル コーポレーション テクニカル・コンサルティング・エンジニア Jennifer DiMatteo & Cory Levels、インテル コーポレーション 製品マーケティング・マネージャー Dick Kaiser / 日本語訳 エクセルソフト株式会社 ―
インテル® VTune™ プロファイラー・サーバーを使用することで、ウェブブラウザーからターゲットをプロファイルして、どこからでも結果にアクセスできます。サーバーへの一度のインストールで多くのユーザーが利用でき、頻繁なターゲット変更にも対応し、結果をほかのユーザーと共有できます。
インテル® oneAPI は、オープンな標準ベースのマルチアーキテクチャー・プログラミング・モデルを作成し、さまざまなアーキテクチャーにわたって幅広いデータセントリックなワークロードの開発を簡素化する業界イニシアチブです。
インテル® oneAPI ツールキットは、オープンなマルチアーキテクチャー言語である C++ with SYCL* に加えて、高度なライブラリーやパフォーマンス解析ツールを提供することで、開発者による生産性とパフォーマンスに優れたヘテロジニアス・プログラミングを支援します。
インテル® DPC++ 互換性ツールは、言語カーネルやライブラリー API 呼び出しを含む CUDA* ソースコードから、移植性の高いマルチアーキテクチャー言語である C++ with SYCL* コードへ移行するのを支援します。準備、移行、レビューの 3 ステージに分かれたワークフローに沿って、約 90% ~ 95% の CUDA* コードを自動的に C++ with SYCL* コードへ移行することで、コードの移行時間を大幅に短縮します。開発者は、残りのコーディングを手動で行い、ターゲット・アーキテクチャーで求められるパフォーマンスを達成できるようにチューニングします。
ストックホルム大学の GROMACS 2022 (英語) をはじめ、多くの研究機関やインテルのお客様が、インテル® DPC++ 互換性ツールを使用して、複数のベンダーのアーキテクチャー上で CUDA* コードから SYCL* (または oneAPI の SYCL* 実装であるデータ並列 C++) への移行に成功しています。
インテル® DPC++ 互換性ツールは、すべてのツールキットに同梱されています。
C++ with SYCL* は、ハードウェア・ターゲット間でコードを再利用し、CPU、GPU、および FPGA アーキテクチャーで高い生産性とパフォーマンスを実現する一方、アクセラレーター固有のチューニングも可能にするオープンなマルチアーキテクチャー言語です。
インテル® oneAPI DPC++/C++ コンパイラーは、C++、C、SYCL*、および OpenMP* をサポートし、完全な最新の C++ を含む標準ベースのクロスアーキテクチャー・コンパイラーです。
インテル® oneAPI DPC++/C++ コンパイラーは、すべてのツールキットに同梱されています。
インテル® Fortran コンパイラーは、Fortran と OpenMP* をサポートする標準ベースの CPU および GPU コンパイラーです。現行バージョンである 2023.0.0 では、FORTRAN 77、Fortran90/95、Fortran 2003、Fortran 2008 および Fortran 2018 言語標準を完全に実装しているほか、ほとんどの OpenMP* 4.5、OpenMP* 5.0/5.1 ディレクティブおよびオフロード機能をサポートし、OpenMP* 6.0 の一部の機能も追加しています。また、オフロード並列処理を簡単に表現できるように、DO CONCURRENT GPU オフロードもサポートしています。
インテル® Fortran コンパイラーは、インテル® oneAPI ベース & HPC ツールキットに同梱されています。
インテル® VTune™ プロファイラーは、C/C++、Fortran、Python*、Go*、Java* を使用する開発者向けのパフォーマンス/スレッド・プロファイラーです。
現在および将来にわたるプロセッサーを最大限に活用するように、アプリケーションを簡単にチューニングすることができます。CPU と GPU パフォーマンス、スレッドのパフォーマンスとスケーラビリティー、バンド幅、キャッシュ利用など、パフォーマンス向上のための豊富な情報を収集します。シングルコード・プロファイラーとは異なり、C/C++、Fortran、Python*、Go*、Java* が混在したコードの hotspot を正確に特定します。
インテル® VTune™ プロファイラーは、すべてのツールキットに同梱されています。
インテル® DevCloud は、最新のインテル® ハードウェアのリモートクラスターを利用して、ワークロードを無料で開発、テスト、実行できる開発サンドボックス環境を提供しています。インテル® oneAPI ツールキットをはじめ、インテル® ディストリビューションの OpenVINO™ ツールキットや OpenCL* などのツールを使用して、クロスアーキテクチャー対応のアプリケーションを開発するための手法を紹介します。
無料で利用可能なインテル® DevCloud には、開発者向けのトレーニング・コースが各種用意されており、ブラウザー経由で技術セッションを受講しながら、実際にソースをコンパイルして実行することができます。