

【公報種別】特許法第17条の2の規定による補正の掲載

【部門区分】第6部門第3区分

【発行日】令和3年9月9日(2021.9.9)

【公表番号】特表2020-530175(P2020-530175A)

【公表日】令和2年10月15日(2020.10.15)

【年通号数】公開・登録公報2020-042

【出願番号】特願2020-529105(P2020-529105)

【国際特許分類】

G 06 F 15/80 (2006.01)

G 06 F 8/65 (2018.01)

H 01 L 21/82 (2006.01)

H 03 K 19/17756 (2020.01)

【F I】

G 06 F 15/80

G 06 F 8/65

H 01 L 21/82 A

H 03 K 19/17756

【手続補正書】

【提出日】令和3年7月29日(2021.7.29)

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

少なくとも1つの計算装置によって、プログラムコードの複数の部分を含むソフトウェアプログラムを実行するためのシステムであって、

少なくとも1つの計算デバイスに接続された計算グリッドであって、データ入力メッシュネットワーク、複数の論理要素、および複数のマルチプレクサ、を有し、前記複数の論理要素および前記複数のマルチプレクサは、複数の計算グループを形成し、前記論理要素の少なくとも1つおよび複数のマルチプレクサの少なくとも1つは、複数の計算グループのそれぞれを形成する、前記計算グリッドと、

複数の構成反復のそれぞれにおいて、

プログラムコードの前記複数の部分のうち、プログラムコードの2つ以上の部分を含むプログラムコードパターンであって、各パターンは、前記ソフトウェアプログラムを実行するときにプログラムコードの前記2つ以上の部分のそれぞれの出現における関連性を示している少なくとも1つの前記プログラムコードパターンにアクセスし、

前記少なくとも1つのプログラムコードパターンのそれぞれに対し、前記少なくとも1つのプログラムコードに従って、プログラムコードの前記2つ以上の部分のそれぞれのうち、1つの少なくとも一部をそれぞれ実行するように、前記複数の計算グループの少なくともいくつかを構成し、

少なくとも1つの計算装置の代わりに、前記計算グリッドによって少なくとも1つのプログラムコードパターンを計算する、

ことにより、前記プログラムコードの複数の部分の少なくともいくつかを実行するよう前記計算グリッドを構成するために適合された少なくとも1つの処理回路と、  
を備える、システム。

【請求項2】

前記少なくとも 1 つの計算装置によって前記ソフトウェアプログラムを実行することは、前記計算グリッドがプログラムコードの前記複数の部分から選択されたプログラムコードの部分の第 2 のセットを実行する間に前記プログラムコードの複数の部分から選択されたプログラムコードの部分の第 1 のセットをそれによって実行することを含む、

請求項 1 に記載のシステム。

**【請求項 3】**

前記少なくとも 1 つの処理回路は、

前記複数の構成反復の少なくとも 1 つにおいて、少なくとも 1 つの他の処理回路から前記少なくとも 1 つのプログラムコードパターンを受信すること、および、

前記複数の構成反復の他の少なくとも 1 つにおいて、

プログラムコードの前記複数の部分のうちの 1 つをそれが実行するための複数の呼び出しを受信し、

前記複数の呼び出しにおいて、前記少なくとも 1 つのプログラムコードパターンを識別する、

ことにより、前記少なくとも 1 つのプログラムコードパターンを計算すること、の少なくとも 1 つのためにさらに適合されている、

請求項 1 に記載のシステム。

**【請求項 4】**

前記少なくとも 1 つのプログラムコードパターンは、

プログラムコードの前記 2 つ以上の部分のそれぞれのうちのコードの第 1 の部分およびコードの 2 つ以上の部分のそれぞれのうちのコードの第 2 の部分であって、前記複数の呼び出しにおいて、プログラムコードの前記第 1 の部分およびプログラムコードの前記第 2 の部分が次々に出現する第 1 の頻度が所定のしきい値頻度を越えているような、前記第 1 の部分および前記第 2 部分を有している、第 1 のプログラムコードパターンと、

プログラムコードの前記 2 つ以上の部分のそれぞれのうちのコードの第 3 の部分およびコードの前記 2 つ以上の部分のそれぞれのうちのコードの第 4 の部分であって、前記複数の呼び出しにおいて、コードの前記第 3 の部分がコードの前記第 4 の部分を呼び出す第 2 の頻度が所定のしきい値頻度を越えているような、前記第 3 の部分および前記第 4 の部分を有している、第 2 のプログラムコードパターンと、

プログラムコードの前記 2 つ以上の部分のそれぞれのうちのコードの第 5 の部分をそれ有している、第 3 のコードパターンおよび第 4 のコードパターンと、

の少なくとも 1 つを備える、

請求項 3 に記載のシステム。

**【請求項 5】**

前記複数の計算グループの少なくともいくつかを構成することは、前記第 1 のプログラムコードパターンのために、プログラムコードの前記第 1 の部分を実行するように、前記複数の計算グループのうちの少なくとも 1 つの第 1 の計算グループを構成することを含んでおり、

前記少なくとも 1 つの第 1 の計算グループは、プログラムコードの前記第 2 の部分を実行するように構成された前記少なくとも 1 つの第 2 の計算グループに位相的に近接している前記少なくとも 1 つの計算グリッド内に配置されている、

請求項 4 に記載のシステム。

**【請求項 6】**

前記複数の計算グループの少なくともいくつかを構成することは、前記第 2 のプログラムコードパターンのために、プログラムコードの前記第 3 の部分を実行するように、前記複数の計算グループのうちの少なくとも 1 つの第 3 の計算グループを構成することを含んでおり、

前記少なくとも 1 つの第 3 の計算グループは、プログラムコードの前記第 4 の部分を実行するように構成された前記少なくとも 1 つの第 4 の計算グループに位相的に近接している前記少なくとも 1 つの計算グリッド内に配置されている、

請求項 4 に記載のシステム。

**【請求項 7】**

前記複数の計算グループの少なくともいくつかを構成することは、プログラムコードの前記第5の部分を実行するように、前記複数の計算グループのうちの少なくとも2つの計算グループを構成することを含む、

請求項 4 のシステム。

**【請求項 8】**

前記複数の計算グループの少なくともいくつかを構成することは、前記少なくとも1つのプログラムコードパターンの少なくとも1つに対して、

プログラムコードの前記2つ以上の部分のそれぞれのうちの1つの少なくとも一部を実行するようにそれぞれ構成された前記複数の計算グループの少なくとも2つを識別すること、

少なくとも2つの他の計算グループが互いに位相的に近接した状態で前記計算グリッド内に配置されるように、前記複数の計算グループの少なくとも2つの他の計算グループを選択すること、および、

前記少なくとも2つの計算グループが実行されたプログラムコードの前記2つ以上の部分のそれぞれのうちの1つの少なくとも一部を実行するように、前記少なくとも2つの他の計算グループのそれぞれを構成すること、

を含む、請求項1に記載のシステム。

**【請求項 9】**

前記複数の計算グループの少なくともいくつかを構成することは、前記少なくとも1つのプログラムコードパターンの少なくとも1つのために、

プログラムコードの前記2つ以上の部分のそれぞれのプログラムコードの第1の部分を実行するように構成された前記複数の計算グループのうちの少なくとも1つの第1の計算グループを識別すること、および、

プログラムコードの前記2つ以上の部分のそれぞれのプログラムコードの第2の部分を実行するように、前記複数の計算グループのうちの少なくとも1つの第2の計算グループであって、前記少なくとも1つの計算グループに位相的に近接している前記計算グループ内に配置されている前記第2の計算グループを構成すること、

を含む、請求項1に記載のシステム。

**【請求項 10】**

前記複数の計算グループの少なくともいくつかを構成することは、

前記複数の計算グループのいずれにもアクセスされておらず、かつ前記計算装置にもアクセスされていない前記複数の計算グループのうちの少なくとも1つの計算グループを解放すること、

をさらに含む、請求項1に記載のシステム。

**【請求項 11】**

前記少なくとも1つの処理回路は、前記ソフトウェアプログラムが前記少なくとも1つの計算装置および前記計算グリッドによって実行されている間、前記計算グリッドを構成するために適合される、

請求項1に記載のシステム。

**【請求項 12】**

前記少なくとも1つの計算装置は、

マルチコア中央処理装置(CPU)、フィールドプログラマブルゲートアレイ(FPGA)、グラフィック処理装置(GPU)、粗粒度再構成可能アーキテクチャ(CGRA)、ニューラルネットワークアクセラレータ、インテリジェンス処理ユニット(IPU)、特定用途向け集積回路(ASIC)、量子コンピュータ、

のいずれか1つである、

請求項1に記載のシステム。

**【請求項 13】**

少なくとも 1 つの計算装置によって、プログラムコードの複数の部分を含むソフトウェアプログラムを実行するための方法であって、

プログラムコードの前記複数の部分のうちの少なくともいくつかを実行するように、データ入力メッシュネットワーク、複数の論理要素、および複数のマルチプレクサを有する計算グリッドの少なくとも一部分を構成するステップを備え、

前記複数の論理要素および前記複数のマルチプレクサは、複数の計算グループを形成してあり、

前記論理要素の少なくとも 1 つおよび複数のマルチプレクサの少なくとも 1 つは、複数の計算グループのそれぞれを形成してあり、

前記計算グリッドの前記少なくとも一部分を構成するステップは、複数の構成反復のそれれにおいて、

プログラムコードの前記複数の部分のうち、2 つ以上を有するプログラムコードパターンであって、各パターンは、前記ソフトウェアプログラムを実行するときにプログラムコードの前記 2 つ以上の部分のそれぞれの出現における関連性を示している少なくとも 1 つの前記プログラムコードパターンにアクセスするステップと、

前記少なくとも 1 つのプログラムコードパターンのそれぞれについて、前記少なくとも 1 つのプログラムコードに従って、プログラムコードの前記 2 つ以上の部分のそれぞれのうち、1 つの少なくとも一部をそれぞれ実行するように、複数の計算グループの少なくともいくつかを構成するステップと、

前記少なくとも 1 つの計算装置の代わりに、前記計算グリッドによって少なくとも 1 つのプログラムコードパターンを計算するステップと、

を含む、

方法。

#### 【請求項 1 4】

プログラムコードの複数の部分を有するソフトウェアプログラムを少なくとも 1 つの計算装置によって実行するプロセスを処理ユニットに実行させる命令を格納している非一過性のコンピュータ可読媒体であって、前記プロセスは、

プログラムコードの前記複数の部分のうちの少なくともいくつかを実行するように、データ入力メッシュネットワーク、複数の論理要素、および複数のマルチプレクサを有する計算グリッドの少なくとも一部分を構成するステップを備え、

前記複数の論理要素および前記複数のマルチプレクサは、複数の計算グループを形成してあり、

前記論理要素の少なくとも 1 つおよび複数のマルチプレクサの少なくとも 1 つは、複数の計算グループのそれぞれを形成してあり、

前記計算グリッドの前記少なくとも一部分を構成するステップは、複数の構成反復のそれれにおいて、

プログラムコードの前記複数の部分のうち、2 つ以上を有するプログラムコードパターンであって、各パターンは、前記ソフトウェアプログラムを実行するときにプログラムコードの前記 2 つ以上の部分のそれぞれの出現における関連性を示している少なくとも 1 つの前記プログラムコードパターンにアクセスするステップと、

前記少なくとも 1 つのプログラムコードパターンのそれぞれについて、前記少なくとも 1 つのプログラムコードに従って、プログラムコードの前記 2 つ以上の部分のそれぞれのうち、1 つの少なくとも一部をそれぞれ実行するように、複数の計算グループの少なくともいくつかを構成するステップと、

前記少なくとも 1 つの計算装置の代わりに、前記計算グリッドによって少なくとも 1 つのプログラムコードパターンを計算するステップと、

を含む、

非一過性のコンピュータ可読媒体。

#### 【請求項 1 5】

計算装置の動作を加速させる装置であって、

プログラムを記憶しているメモリと、

複数の論理素子、および複数のマルチプレクサを有し、前記プログラムを実行する計算要素と、

を備え、

前記計算要素は、前記計算装置において実行される演算のための複数の呼出しの間で少なくとも 1 つのパターンが識別された場合、識別されたパターンに基づいて、前記複数の論理素子の少なくとも 1 つと前記複数のマルチプレクサの少なくとも 1 つの組み合わせを最適化する、

装置。

**【請求項 1 6】**

前記計算要素は、前記パターンが前記演算の実行に用いられる少なくとも 1 つの関数の再出現を示している場合、当該関数に対応付けられている前記組み合わせを複製する、

請求項 1 5 に記載の装置。

**【請求項 1 7】**

前記計算要素は、前記パターンが、第 1 の関数を用いた演算と、前記第 1 の関数を呼び出す第 2 の関数を用いた演算との実行を示している場合、前記第 1 の関数に対応付けられている第 1 の組み合わせと前記第 2 の関数に対応付けられている第 2 の組み合わせとを、前記パターンに基づいて再配置する、

請求項 1 5 または 1 6 に記載の装置。