講演会・勉強会・シンポジウム

第30回AT研究会オープンアカデミックセッション(ATOS30)

日時:2024年10月21日(月)16:00〜17:30
会場:山梨大学 甲府東キャンパスT1号館3F T1-32教室

題目:行列積に対する高精度数値計算法:内積ベースかgemmベースか?

講演者:尾崎 克久(芝浦工大)

概要:

浮動小数点演算による数値計算結果は、丸め誤差の影響で精度が満足できない場合がある。この問題に対して、数を複数の浮動小数点数の和で表現し、その演算を定義することで、疑似的に仮数部を拡張し、高信頼な計算結果を得る方法がある。BaileyによるDouble-word演算がその好例である。本研究では、この方向性に基づき、内積計算における積和計算の構造をうまく活用した新しい高精度計算アルゴリズムを提案する。さらに、行列積の高精度化を行う「尾崎スキーム」と呼ばれるgemmベースの手法についても取り上げ、内積ベースの高精度計算とgemmベースの高精度計算について、性能を含めた比較結果を紹介する。

題目:GPUコンピューティングにおけるベンダーロックイン緩和に向けての試み

講演者:三木 洋平(東大)

概要:

GPUが演算加速器としてスパコンに搭載されるようになってから10年以上に渡り、国内外を問わずGPUスパコンといえばNVIDIA製GPUを搭載したものがほとんどであった。しかし、2024年6月版のTOP500リストで1位を獲得したFrontierはAMD製GPUを、2位のAuroraはIntel製GPUを、3位のEagleはNVIDIA製GPUを搭載するなど、GPUベンダー間の競争が活性化している。GPU向けにデバイス組み込み関数まで使用できるコード開発環境だけでも、NVIDIA製GPUのみを対象とするCUDAだけではなく、NVIDIA製GPUとAMD製GPU両方に対応できるHIPや、より多様なデバイスに対応できるSYCLといった様々なプログラミングモデルが提供されている。そこで本研究では、NVIDIA製GPU向けにCUDAで実装された既存のN体計算コードを、HIPやSYCLを用いて移植・最適化して各開発環境の評価を行った。NVIDIA/AMD/Intel製のデータセンターGPU上での性能評価を行った結果、SYCLで実装したコードが全GPU上で高い性能を発揮できることが分かったので紹介する。また、簡易なGPUオフローディング手法としては指示文を用いるOpenACCやOpenMPのtarget指示文といった選択肢もある。OpenACCの方が機能や資料が充実しているが、実質的にNVIDIA製GPUのみを対象とした指示文になりつつあり、ベンダーロックインに陥るリスクもある。OpenMP targetはNVIDIA/AMD/Intel全社のGPUに対応しているためベンダーロックインに陥ることはないが、OpenACCと機能的に完全対応はしていないという弱点もある、そこで我々は。GPU向け指示文をプリプロセッサマクロ化したヘッダーオンリーライブラリSolomonを開発し、バックエンドで使用する指示文としてOpenACCとOpenMP targetを簡易に切り替える機能を実現したので紹介する。

参加申込:

参加される方は以下のURLから参加登録をお願いします。

https://forms.gle/bF2yc8iDb5Sj72dF8


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS