Способ организации выполнения операции умножения двух чисел в модулярно-позиционном формате представления с плавающей точкой на универсальных многоядерных процессорах

Патент 2509345

Авторы

Правообладатели

Федеральное государственное бюджетное образовательное учреждение Высшего профессионального образования Вятский государственный университет ФГБОУ ВПО "ВятГУ" (RU)

Классы МПК

G06F7/72 - с помощью арифметического остатка

Способ организации выполнения операции умножения двух чисел в модулярно-позиционном формате представления с плавающей точкой на универсальных многоядерных процессорах

Иллюстрации

Показать все

Изобретение относится к вычислительной технике и может быть использовано для выполнения операции умножения чисел, представленных в модулярно-позиционном формате с плавающей точкой на универсальных многоядерных процессорах. Техническим результатом является повышение скорости вычисления за счет замены операции умножения t-разрядных позиционных мантисс сомножителей n параллельно выполняемыми операциями умножения q-разрядных знакопозиций чисел в системе счисления в остаточных классах. Способ реализуется на универсальном многоядерном вычислителе, содержащем g k-разрядных вычислительных ядер, каждое из которых обеспечивает выполнение системы из f операций, в состав которых входят операции алгебраического умножения и алгебраического сложения над числами, представленными в позиционных целочисленных форматах данных. При организации выполнения операций умножения каждое число, множитель и множимое, представляется в модулярно-позиционном формате с плавающей точкой в виде (1+k+q·n) - элементного вектора.

Реферат

Изобретение относится к вычислительной технике и предназначено для выполнения операции умножения чисел, представленных в модулярно-позиционном формате с плавающей точкой на универсальных многоядерных процессорах.

Известен итерационный способ умножения чисел, представленных в одном из позиционных двоичных форматов с плавающей точкой, определенных стандартом IEEE-754. В этом способе умножение состоит из последовательности сложений с накоплением мантисс сомножителей, которые выполняются последовательно, сложения порядков и сложения по модулю два знаков сомножителей. Последовательность сложений с накоплением мантисс сомножителей выполняется следующим образом. При сдвигах мантиссы множителя освободившиеся разряды заполняются нулями. Если первый бит t-разрядной позиционной мантиссы множителя равен единице, то первое слагаемое является мантиссой множимого, иначе первое слагаемое равно нулю. Если второй бит мантиссы множителя равен единице, то второе слагаемое является мантиссой множимого, сдвинутой на один разряд влево, иначе второе слагаемое равно нулю. К сумме первого и второго слагаемого прибавляется мантисса множимого, сдвинутая на два разряда влево, если второй бит мантиссы множителя равен единице, иначе прибавляется нуль. Затем к полученной сумме прибавляется мантисса множимого, сдвинутая на три разряда влево, если третий бит мантиссы множителя равен единице, иначе прибавляется нуль. И так далее до t-го разряда мантиссы множителя, к накопленной сумме прибавляется мантисса множимого, сдвинутая на v разрядов влево, если t-ый бит мантиссы множителя равен единице, иначе прибавляется нуль. В итоге накопленная сумма является искомым произведением мантисс сомножителей. Далее выполняется сложение смещенных позиционных порядков сомножителей, тем самым получается порядок результата. Знак результата определяется сложением по модулю два знаков сомножителей.

Недостаток итерационного способа умножения позиционных двоичных чисел с плавающей точкой состоит в том, что, во-первых, при умножении мантисс выполняется t-1 операций суммирования t-разрядных операндов. Если принять, что операция суммирования t-разрядных операндов выполняется за t тактов процессора, то общее время выполнения операции умножения мантисс позиционных операндов с плавающей точкой составит t·(t-1) тактов. Во-вторых, процесс формирования суммы является последовательным процессом.

Техническим результатом применения способа организации выполнения операции умножения двух чисел в модулярно-позиционном формате представления с плавающей точкой на универсальных многоядерных процессорах является повышение скорости вычисления за счет замены операции умножения t-разрядных позиционных мантисс сомножителей n параллельно выполняемыми операциями умножения q-разрядных знакопозиций чисел в системе счисления в остаточных классах, причем q≈t/n. Если принять за время суммирования пары t-разрядных чисел t тактов работы процессора, а за время суммирования пары q-разрядных чисел q тактов работы процессора, то, при условии, что число вычислительных ядер универсального многоядерного процессора не меньше n, а операция умножения q-разрядных чисел может быть выполнена посредством q-1 операции сложения q-разрядных чисел, то предельное ускорение вычислений S составляет: S ≈ t ⋅ ( t − 1 ) q ⋅ ( q − 1 )

Описание способа организации выполнения операции умножения двух чисел в модулярно-позиционном формате представления с плавающей точкой на универсальных многоядерных процессорах: реализация способа осуществляется посредством подачи набора электрических, нейронных либо других сигналов на устройства управления каждого вычислительного ядра многоядерного процессора универсального назначения, которые, в соответствии с данными сигналами, формируют управляющие команды для операционных устройств соответствующих вычислительных ядер.

В позиционных двоичных форматах с плавающей точкой стандарта IEEE-754 любое вещественное число представляется трехэлементным набором:

[M,e,S|M∈[0,2),е∈[е_min,e_max],S∈{0,1}],

(1)

где М- рациональная мантисса, е - порядок числа, е_min=2-2^w-1 и е_max=2^w-1-1, s - знак числа.

Величина чисел, записанных в таком формате, выражается формулой -1^s·М·2^е. Машинными представлениями чисел вида (1) являются (w+t+1) - разрядные двоичные векторы 〈sr_w…r₂r₁d_t…d₂d₁〉, где разряды c d₁ по d_t отводятся под представление рациональных двоичных мантисс М=d_t·d_t-1…d₂d₁, разряды с r₁, по r_w отводятся под представление целочисленных двоичных порядков е, записанных в форме с избытком Е=r_wr_w-1…r₂r₁=е+е_max, разряд s выражает знак числа.

Определим целочисленную мантиссу М'=d_td_t-1…d₂d₁ как t-разрядное неотрицательное целое двоичное число, такое что М=М'·2^1-t. Определим перемещенный порядок λ как целое двоичное число со знаком, такое, что λ=е-t+1, где е-w-разрядный порядок числа, представленного в двоичном формате (1).

Зададим n целочисленных положительных q-разрядных оснований системы остаточных классов Р₁,Р₂,…,Р_n таких, что ∀i₁,i₂∈{l,2,…,n},i₁≠i₂:gcd( p i 1 , p i 2 )=1, q<k, где gcd( p i 1 , p i 2 ) - наибольший общий делитель для p i 1 и p i 2 , k - размер разрядной сетки процессора.

Целочисленную мантиссу М'=d_td_t-1…d₂d₁ преобразуем в систему остаточных

классов с заданными основаниями р₁,р₂,…,р_n, получая тем самым модулярную мантиссу M ˜ =〈m₁,m₂,…,m_n〉:

M ˜ = 〈 m 1 , m 2 , … m n 〉 = 〈 | M ' | p 1 , | M ' | p 2 , … , | M ' | p n 〉 ,

где m_i∈[0,p_i-1], i=1,2,…,n - q-разрядные цифры (модулярные разряды) модулярной мантиссы M ˜ , q - разрядность оснований р₁,р₂,…,р_n, | M ' | p i - операция получения остатка от деления M' на i-ое основание р_i.

Таким образом, число с плавающей точкой вида (1) можно преобразовать к следующему модулярно-позиционному формату:

[ 〈 m 1 , m 2 , … m n 〉 , λ , s | , m i ∈ [ 0, p i − 1 ] , λ ∈ [ λ ' min , λ ' max ] , s ∈ { 0,1 } ] . (2)

где (m₁,m₂,…,m_n) - набор знакопозиций (модулярных разрядов) модулярной мантиссы M ˜ , λ - позиционный перемещенный порядок, представляющий собой целое двоичное число со знаком.

Диапазон допустимых значений модулярных мантисс M ˜ =〈m₁,m₂,…,m_n〉 в системе остаточных классов с основаниями р₁,р₂,…,р_n определяется интервалом [ 0, P = ∏ i = 1 n p i ) , таким образом, t-разрядная позиционная мантисса М=d₁.d_t-1…d₂d₁ может быть представлена в системе остаточных классов набором из n взаимно независимых q-разрядных знакопозиций 〈m₁,m₂,…,m_n〉, причем q≈t/n (для случая, если все основания р₁,р₂,…,р_n q-разрядные).

Примеры преобразования позиционных чисел с плавающей точкой в модулярно-позиционный формат: пусть числа представлены в 10-разрядном двоичном формате вида (1), в котором под смещенный порядок Е отводится четыре бита (максимальный порядок е_max=2^4-1-1=7, соответственно е=Е-7), под дробную часть мантиссы - пять бит (т.е. t=6, причем целая часть d₆ рациональной мантиссы М в явном виде не записана) и под знак числа - один бит. Пусть для представления модулярных мантисс в модулярно-позиционном формате [〈m₁,m₂,…,m_n〉,λ,s] используется три основания: p₁=3=2²-1, p₂=7=2³-1, p₃=31=2⁵-l.

Пример 1: необходимо перевести число Х=[1.5,-1,0]=-1°·1.5·2^-1, представленное в двоичном формате [М,е,s], в модулярно-позиционный формат [〈m₁,m₂,…,m_n〉,λ,s].

С учетом принятых характеристик двоичного формата [М,е,s], число Х будет записано в памяти ЭВМ в виде двоичного вектора 〈0011010000〉. Для его преобразования в модулярно-позиционный формат (2) необходимо выполнить следующие действия:

1. Выделить составные части числа X: знак числа s=0, дробная часть рациональной мантиссы d₅…d₂d₁=10000₂, смещенный (избыточный) порядок Е=0110₂=6.

2. Восстановить целую часть d₆ мантиссы M=d₆.d₅…d₂d₁: d₆=1, т.к. Е>0, следовательно М=1.10000₂.

3. Определить порядок е: е=Е-е_max=6-7=-1, т.к. Е>0.

4. Определить перемещенный позиционный порядок λ и целочисленную мантиссу M':λ=e-t+1=-1-6+1=-6,M'=d₆d₅…d₂d₁=110000₂=48.

5. Найти модулярную мантиссу M ˜ =〈m₁,m₂,m₃〉: M ˜ =〈|48|₃,|48|₇,|48|₃₁〉=〈0,6,17〉.

В результате получается число X, представленное в модулярно-позиционном формате с плавающей точкой: X=[〈0,6,17〉,-6,0]=-1⁰·〈0,6,17〉·2^-6.

Пример 2: необходимо перевести число X=[0.625-6,1]=-1¹·0.625·2^-6 из двоичного формата [М,е,s] в модулярно-позиционный формат [〈m₁,m₂,…,m_n〉,λ,s].

С учетом принятых характеристик двоичного формата [М,е,s], число Х будет записано в памяти ЭВМ в виде двоичного вектора 〈1000010100〉. Для его преобразования в модулярно-позиционный формат (2) необходимо выполнить следующие действия:

1. Выделить составные части числа X: знак числа s=1, дробная часть d₅…d₂d₁=10100₂, смещенный порядок Е=0000₂=0.

2. Восстановить целую часть d₆ мантиссы M=d₆·d₅…d₂d₁: d₆=0, т.к. Е=0, следовательно М=0.10100₂.

3. Определить порядок е: е=е_min=2-2^4-1=-6, т.к. Е=0.

4. Определить перемещенный порядок λ и целочисленную мантиссу М': λ=e-t+1=-6-6+1=-11, M'=d₆d₅…d₂d₁=010100₂=20.

5. Найти модулярную мантиссу M ˜ =〈m₁,m₂,m₃〉: M ˜ =〈|20|₃,|20|₇,|20|₃₁〉=(2, 6, 20). В результате получается число X, представленное в модулярно-позиционном формате с плавающей точкой: X=[〈2, 6, 20〉,-11,1]=-1¹·〈2, 6, 20〉·2^-11.

Пусть A=[〈 m 1 A , m 2 A , … m n A 〉],λ_A,S_A], B=[〈 m 1 B , m 2 B , … m n B 〉],λ_B,S_B] - числа, представленные в модулярно-позиционном формате с плавающей точкой, где M ˜ A =[〈 m 1 A , m 2 A , … m n A 〉],λ_A,S_A], M ˜ B =[〈 m 1 B , m 2 B , … m n B 〉],λ_B,S_B] - модулярные мантиссы чисел А и В соответственно. Тогда способ умножения С=А·В чисел А и В, представленных в модулярно-позиционном формате с плавающей точкой (2), на универсальном k-разрядном процессоре, содержащем g вычислительных ядер, определяется следующим образом.

1. Множитель A=[〈 m 1 A , m 2 A , … m n A 〉],λ_A,S_A] и множимое B=[〈 m 1 B , m 2 B , … m n B 〉],λ_B,S_B], представленные в модулярно-позиционном формате с плавающей точкой, загружают в универсальный k-разрядный процессор, содержащий g вычислительных ядер, следующим образом:

1.1. Если число g вычислительных ядер процессора превышает число n оснований р₁,р₂,…,р_n системы остаточных классов, используемых для представления модулярных мантисс M ˜ A =〈 m 1 A , m 2 A , … m n A 〉 и M ˜ B =〈 m 1 B , m 2 B , … m n B 〉 чисел А и В соответственно, то:

- в первое ядро универсального многоядерного процессора загружают q-разрядные двоичные представления первых знакопозиций m 1 A и m 1 B модулярных мантисс M ˜ A =〈 m 1 A , m 2 A , … m n A 〉, и M ˜ B =〈 m 1 B , m 2 B , … m n B 〉 чисел А и В соответственно, а также

основание системы остаточных классов pi, разрядность q которого не превышает размер k разрядной сетки процессора;

- параллельно с этим, во второе ядро универсального многоядерного процессора загружают q-разрядные двоичные представления вторых знакопозиций m 2 A и m 2 B модулярных мантисс M ˜ A и M ˜ B чисел А и В соответственно, а также основание системы остаточных классов р₂, разрядность q которого не превышает размер k разрядной сетки процессора; и т.д.;

- параллельно с этим, в n-ое ядро универсального многоядерного процессора загружают q-разрядные двоичные представления n-ых знакопозиций m n A и m n B модулярных мантисс M ˜ A и M ˜ B чисел А и В соответственно, а также основание системы остаточных классов р_n, разрядность q которого не превышает размер k разрядной сетки процессора;

- параллельно с этим, в (n+1)-ое ядро универсального многоядерного процессора загружают k-разрядные двоичные порядки λ_A и λ_B, а также знаки s_A и s_B чисел А и В соответственно.

1.2. Если число n оснований p₁, p₂,…,p_n системы остаточных классов используемых для представления модулярных мантисс M ˜ A =〈 m 1 A , m 2 A , … m n A 〉 и M ˜ B =〈 m 1 B , m 2 B , … m n B 〉 равно числу g вычислительных ядер универсального вычислителя, либо превышает его, то:

- q-разрядные двоичные представления первых знакопозиций m 1 A и m 1 B модулярных мантисс M ˜ A и M ˜ B чисел А и В соответственно, а также q-разрядное основание системы остаточных классов р₁ загружают в первое ядро универсального многоядерного процессора;

- параллельно с этим, q-разрядные двоичные представления вторых знакопозиций m 2 A и m 2 B модулярных мантисс M ˜ A и M ˜ B чисел А и В соответственно, а также q-разрядное основание системы остаточных классов p₂ загружают во второе ядро универсального многоядерного процессора; и т.д.;

- параллельно с этим, q-разрядные двоичные представления (g-1)-ыx знакопозиций m g − 1 A и m g − 1 B модулярных мантисс M ˜ A и M ˜ B чисел А и В соответственно, а также q-разрядное основание системы остаточных классов p_g-1 загружают в (g-1)-ое ядро универсального многоядерного процессора;

- q-разрядные двоичные представления g-ых знакопозиций m g A и m g B модулярных мантисс M ˜ A и M ˜ B чисел А и В соответственно, а также q-разрядное основание системы остаточных классов p_g загружают в первое ядро универсального многоядерного процессора;

- q-разрядные двоичные представления (g+1)-ыx знакопозиций m g + 1 A и m g + 1 B модулярных мантисс M ˜ A и M ˜ B чисел А и В соответственно, а также q-разрядное основание системы остаточных классов p_g+1 загружают во второе ядро универсального многоядерного процессора;

- и т.д., пока не будут загружены n-ые знакопозиций m n A и m n B модулярных мантисс M ˜ A =〈 m 1 A , m 2 A , … m n A 〉 и M ˜ B =〈 m 1 B , m 2 B , … m n B 〉 чисел А и В соответственно;

- параллельно с этим, k-разрядные двоичные порядки λ_А и λ_B, а также знаки s_A и s_B чисел А и В соответственно загружают в g-oe ядро универсального многоядерного процессора.

2. После того как множитель A=[〈 m 1 A , m 2 A , … m n A 〉,λ_A,S_A] и множимое B=[〈 m 1 B , m 2 B , … m n B 〉,λ_B,S_B], представленные в модулярно-позиционном формате с плавающей точкой, загружены в универсальный k-разрядный процессор, содержащий g вычислительных ядер, операция их умножения выполняется следующим образом:

2.1. Если число g вычислительных ядер процессора превышает число n оснований p₁,p₂,…;p_n системы остаточных классов, используемых для представления модулярных мантисс M ˜ A =〈 m 1 A , m 2 A , … m n A 〉 и M ˜ B =〈 m 1 B , m 2 B , … m n B 〉 чисел А и В соответственно, то:

- в первом вычислительном ядре процессора выполняется операция целочисленного умножения m 1 C = | m 1 A ⋅ m 1 B | p 1 по модулю р₁ q-разрядных двоичных представлений знакопозиций m 1 A и m 2 B модулярных мантисс M ˜ A =〈 m 1 A , m 2 A , … m n A 〉 и M ˜ B =〈 m 1 B , m 2 B , … m n B 〉 чисел А и В соответственно, путем нахождения значения

m 1 C = | m 1 A ⋅ m 1 B | p 1 = m 1 A ⋅ m 1 B − ⌊ m 1 A ⋅ m 1 B p 1 ⌋ ⋅ p 1 , где ⌊ m 1 A ⋅ m 1 B p 1 ⌋ - наибольшее целое, не превышающее m 1 A ⋅ m 1 B p 1 ; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим, во втором вычислительном ядре процессора выполняется m 2 C = | m 2 A ⋅ m 2 B | p 2 по модулю р₂ q-разрядных двоичных представлений знакопозиций m 2 A и m 2 B модулярных мантисс M ˜ A и M ˜ B чисел А и В соответственно; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления; и т.д.;

- параллельно с этим, в n-ом вычислительном ядре процессора выполняется операция умножения m n C = | m n A ⋅ m n B | p n по модулю р_n q-разрядных двоичных представлений знакопозиций m n A и m n B модулярных мантисс M ˜ A и M ˜ B чисел А и В соответственно; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим, в (n+1)-м вычислительном ядре процессора выполняется сложение двоичных порядков λ_A и λ_B, а также сложение по модулю два s_C=|s_A+s_B|₂ знаков s_A и S_B чисел А и В соответственно.

2.2. Если число n оснований р₁,p₂,…,p_n системы остаточных классов используемых для представления модулярных мантисс M ˜ A =〈 m 1 A , m 2 A , … m n A 〉 и M ˜ B =〈 m 1 B , m 2 B , … m n B 〉 равно числу g вычислительных ядер универсального вычислителя, либо превышает его, и в каждое j-oe вычислительное ядро из первых (g-1) вычислительных ядер процессора загружено w_j знакопозиций

m i ⋅ ( g − 1 ) + j A и m i ⋅ ( g − 1 ) + j B , i=0,1,…,w₁-1, то:

- в первом вычислительном ядре процессора последовательно выполняются операции умножения m i ⋅ ( g − 1 ) + 1 C = | m i ⋅ ( g − 1 ) + 1 A ⋅ m i ⋅ ( g − 1 ) + 1 B | p i ⋅ ( g − 1 ) + 1 по модулям p_i·(g-1)+1, i=0,1,…,w₁-1, g-разрядньгх двоичных представлений всех w₁ загруженных в него знакопозиций m i ⋅ ( g − 1 ) + 1 A и m i ⋅ ( g − 1 ) + 1 B , i=0,1,…,w₁-1 модулярных мантисс M ˜ A =〈 m 1 A , m 2 A , … m n A 〉 и M ˜ B =〈 m 1 B , m 2 B , … m n B 〉 чисел А и В соответственно, путем нахождения значений | m i ⋅ ( g − 1 ) + 1 A ⋅ m i ⋅ ( g − 1 ) + 1 B | p i ⋅ ( g − 1 ) + 1 = m i ⋅ ( g − 1 ) + 1 A ⋅ m i ⋅ ( g − 1 ) + 1 B − ⌊ m i ⋅ ( g − 1 ) + 1 A ⋅ m i ⋅ ( g − 1 ) + 1 B p i ⋅ ( g − 1 ) + 1 ⌋ ⋅ p i ⋅ ( g − 1 ) + 1 , i = 0,1, … , w 1 − 1, г д е ⌊ m i ⋅