[[イベント情報]]

*第12回AT研究会オープンアカデミックセッション(ATOS12) [#f43bff49]

 日時:2015年10月19日(月) 15:00~17:30 (14:45より開場)
 会場:山梨大学甲府キャンパス 情報メディア館4階会議室
http://sojo.yamanashi.ac.jp/facilities/facil-kofu/media-4froom/

http://www.yamanashi.ac.jp/modules/footer_menu/index.php?content_id=5


**講演1. 京・FX10におけるChebyshev基底共役勾配法の性能分析 [#p3cdd7d3]

***講演者: *熊谷洋佑(工学院大),藤井昭宏(工学院大),田中輝雄(工学院大), 廣田 悠輔(理研),深谷猛(北大),今村 俊幸(理研),須田礼仁(東大) [#ba3a5d31]

***概要: [#u58f4ca5]

コア数の増大により,スーパーコンピュータの性能は著しく向上している. 大規模な連立一次方程式を解く反復解法である共役勾配法(CG 法)は高並列な環境では演算処理にかかる時間は減少する.それに対して, 集団通信による時間が増大し,問題となっている.近年,集団通信の回数を削減する手法が提案され,その中でもCG法と同等の反復回数で収束するChebyshev 基底共役勾配法(CBCG 法)がある.本研究では,CG 法とCBCG法の性能モデル構築し,一定のコア数以上でスーパーコンピュータ「京」を想定したモデル上でCBCG法が高速になることを示した.また,実際に「京」及びFX10上での計測を行い,実際に,コア数の増大に伴い,CBCG法が一定のコア数以上で高速となることを確認した. 

** 講演2. 三重対角化に対するDongarra--Wilkinson法の実装と性能解析 [#u0fc4437]

*** 講演者:工藤周平(電気通信大学) [#xb02dd30]

*** 概要: [#t695bab9]

三重対角化は、実対称行列の固有値計算に使われる処理であり、量子化学や信号処理などの応用がある。本発表では、三重対角化に対する2つの高速化手法、Dongarraのブロック化手法と、Wilkinsonのループ融合技法を組み合わせた、新手法(D--W法)を示す。D-W法は既存手法でボトルネックとなっていた行列ベクトル積の回数を削減するため、高性能化が期待される。本発表では、D-W法についてルーフラインモデルを用いた性能解析を行い、既存手法と比較する。また、Sparc64 VIIIfx上で性能測定を行った結果を示し、D-W法の性能改善効果について検証する。

** 講演3. 多次元パラメタ空間に向けた標本点逐次追加型性能パラメタ推定法の拡張 [#y9f672e2]

*** 講演者:*村田陸(工学院大),藤井昭宏(工学院大),田中輝雄(工学院大), 片桐孝洋(東大) [#se3086e7]

*** 概要: [#ta8df62e]

性能パラメタを最適化する自動チューニング手法として, 標本点逐次追加型性能パラメタ推定法の研究を進めている.いままで,本手法で用いる近似関数d-Splineを二次元空間へ拡張し,自動チューニング基盤ソフトウェアppOpen-AT上に実装してきた.d-Splineは最小二乗問題を解くことで求められる.パラメタ空間の次元が大きくなると,この最小二乗問題の構造は複雑になる.本研究では,多次元パラメタ空間上の自動チューニングに向けた効率的なd-Splineの実装手法として,問題の構造を利用して正規方程式を構成し,CG法を用いて解く手法を提案する.実験から,QR分解を用いる手法と比較して,メモリ使用量を大きく削減でき,同等の計算量となることを示した.また,実際に,FX10上でのAMG-BiCGStab法のオンライン自動チューニングに適用し,総当り法と比較して推定コストを含めた総実行時間を50%以下に削減できたことを確認した.

** 講演4. CUDA-BLASの自動チューニングについて [#nb169910]

*** 講演者:今村俊幸(理化学研究所) [#he25f0dd]

***概要: [#rc6835b1]

複数のパラメタで構成されるGPUカーネルプログラムの中で、性能チューニングによる高速化と性能安定化が必須なものとしてCUDA-BLASが挙げられる。CUDA-BLASは特にスレッド形状の選択によって性能が変化することが知られており、問題サイズ、使用されるGPU世代、GPUの構成によって最適なスレッド形状が異なる。我々は段階的なパラメータ探索を行い、チューニングに要する時間の削減の研究を進めている。少数サンプリングデータからの情報の内挿にd-Splineを使用しつつ、パラメタの篩い分けを併用した探索による静的な自動チューニング手法で準最適パラメタを決定する。本報告では、次期リリース予定のバージョン(ASPEN.K2-1.5p6)に取り込まれる自動チューニング手法について解説する。



トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS