Устройство для выполнения матричных операций
Иллюстрации
Показать всеРеферат
Изобретение относится к области вычисТгительной техники и может быть использовано в специализированных вычислительных машинах и устройствах обработки данных. Цель изобретения - расширение функциональных возможностей устройства за счет вьтолнения дополнительных операций и повьш1ение быстродействия . Цель достигается тем, что в устройстве, содержащем тр однотипных процессорных элементов, где m и р - размерность матриц А и В соответственно , имеющих три perHctpa, умножитель и сумматор, в каждый процессорный элемент введены два регистра, ;три триггера, элемент И и элемент . И-НЕ. Особенностью функционирования устройства являются параллельно-поточная организация вычислений, синхронность исполнения различных частей алгоритма. 3 ил. с ю (Л
СОЮЗ СОВЕТСКИХ
СОЦИАЛИСТИЧЕСКИХ
РЕСПУБЛИК и9> SU ru) 1 11 y G 06 F 15/347
ОПИСАНИЕ ИЗОБРЕТЕНИЯ
К А ВТОРСНОМУ СВИДЕТЕЛЬСТВУ
ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССР
ПО ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТКРЫТИЙ (21) 4134886/24-24 (22) 15.10.86 (46) 15.04,88. Бюл. - 14 (72) В.П. Якуш, С.Г. Седухин, В.А. Мищенко, Л.Б. Авгуль и О. В ° Подрубный (53) 681.325(088.8) (56) Авторское свидетельство СССР и 1236500, кл. G 06 F 15/347, 1984.
Заявка Великобритании Ф 2144245, кл. G 06 F 7/52, опублик. 1985. (54) УСТРОЙСТВО ДЛЯ ВЫПОЛНЕНИЯ МАТРИЧНЫХ ОПЕРАЦИЙ (57) Изобретение относится к области
:вычислительной техники и может быть использовано в специализированных вычислительных машинах и устройствах обработки данных. Цель изобретения расширение функциональных возможностей устройства за счет выполнения дополнительных операций и повышение быстродействия. Цель достигается тем, что в устройстве, содержащем mp однотипных процессорных элементов, где m и p — размерность матриц А и В соответственно, имеющих три регистра, умножитель и сумматор, в каждый процессорный элемент введены два регистра,,три триггера, элемент И и элемент .
И†HE. Особенностью функционирования устройства являются параллельно-поточная организация вычислений, синхронность исполнения различных частей алгоритма ° 3 ил.
13888
I i- m, о
dn =сц +ацЬ„.
Изобретение относится к вычислительной технике и может быть использовано в специализированных вьтчислительных машинах и устройствах обработки данных для выполнения над мат5 рицами операции С + АВ.
Цель изобретения — расширение функциональных возможностей устройства за счет выполнения дополнительных операций и повышение его быстродействия.
На фиг.! представлена структурная схема устройства для выполнения матричной операции С + АВ с размерностью !5 матриц: А-(Зх2); В-(2х4); С-(3х4), для т = 3, п = 4 и р = 2; на фиг,2 функциональная схема. соединенных 4 процессорных элементов; на фиг. 3 временные диаграммы работы устройст- 20 ва.
Устройство для выполнения над матрицами операции С + АВ (фиг.l) для
m = 3, n = 4 и р = 2 содержит информационные входы 1,, и 1 первой группы, информационные входы 2„
2,, 2, и 2э, второй группы, информационные входы 3, и 3 третьей группы, вход 4 синхроимпульсов, процессорные элементы 5ц, 5lt ...;,53с и информационные выходы 6,, 6 и бз группы устройства., Процессорный элемент (фиг.2) содержит первый 7., второй 8 и третий 9 информационные входы, регистр 10-14, триггеры 15-17, умножитель 18, сумматор 19, элемент И 20, элемент НЕ 21 а также первый 22, второй 23 и третий
24 выходы.
В основу работы ус..тройства положен алгоритм умножения (mxp) — матрицы
А = (а;!). на (pxn) — матрицу В =(b;I), который определяет результирующую матрицу 0 = (d;;)
diI = С;;+, а;„Ь„;, к= о
Если d; = с;;, то на каждом следующем рекуррентном шаге k = l,р выполняется множество вычислений
97 2 к
d;> на очередном такте работы из
5<> -ro процессорного элемента в
5;, „ -й процессорный элемент (i-=l,m
z--l,р-1) и запись элементов а;; в соответствующий !1-й процессорный элемент °
Устройство работает следующим образом.
В исходном состоянии регистры 1014 и триггеры 15-17 устанавливаются в нулевое состояние. Элементы (Ь;;,1) е и (c;, 1) подаются на входы на е-м такте вместе с дополнительным единичным разрядом. Очередность подачи элементов матриц В и С показаны в форме параллелограммов на фиг.l. Элементы е в;. подаются на входы процессорных элементов без дополнительного разря— да, очередность подачи элементов матрицы А показана в форме треугольника на фиг.l.
На нулевом такте элементы а, о ц (Ьц, 1) и (сц, 1) подаются на соответствующие входы элементов 5<, . По переднему фронту тактового импульса о (фиг.3). элемент а ц записывается в регистры 11 и 12, так как регистры ll и 12 реализованы на однотактных триггерах, а триггер 16 в исходном состоянии разрешает запись в регистр 12.
По заднему фронту тактового импульса триггер 16 изменяет свое состояние на противоположное и запрещает запись в регистр 12. На выходе элемента НЕ 21 формируется единичный сигнал, который разрешает запись элемено та ац в регистр 13, который также реализован на однотактных триггерах.
Регистры 10 и 14 реализованы на двухтактных триггерах, следовательно, по заднему фронту тактового импульса в них записываются соответственно элео о менты сц и Ъц . Аналогично двухтактные триггеры 15 и 17 дополнительными единичными разрядами устанавливаются в единичное состояние. С выхода умножителя 18 произведение а „ bö подается на вход сумматора 19, на вто— рой вход которого подается с« . Ha выходе сумматора формируется
Особенностями функционирования устройства являются параллельно-по- 55 точная организация вычислений, синхронность исполнения различных частей алгоритма, сдвиг накапливаемых сумм
На первом такте на соответствую.щие входы элемента 5ц подаются элеI I 1 менты а, (btt, 1) и (c., 1) на соответствующие входы элемента 5„
a
В элементе 5<, в регистр 13 запи-! сывается элемент а, в регистр 10—
22 элемент с<, в регистр 14 — элемент
Ь,2, на выходе сумматора формируется
d, =с +а Ь, . В элементе 5«в регистр 12
12 |2- << <2 записывается элемент а«, в регистр 10— о
d,„, в регистр 14 — Ь,, на выходе о сумматора формируется d„ = d„ + а, Ь„.
В элементе 5„ в регистр 12 записываI ется элемент а | 9 в регистр 10 — зле| | мент с < 9 в регистр 14 — Ъ|,, на вы| ходе сумматора формируется d = с„ +
+ a2< b«
На втором такте в элементе 5 2 в регистр 12 записывается элемент а2
22 9 а триггер 16 изменяет свое состояние и запрещает запись в регистр 12, на выходе сумматора формируется d
= d2, + а Ь, . В элементах 5; на последующих тактах аналогичным образом формируются д;„, показанные на временных диаграммах (фиг.3).
Значения соответствующих элементов
d; результирующей матрицы D формируются на соответствующих выходах элементов 5 . Количество тактов работы устройства равно (m+n+p-2). Длитель30 ность такта работы устройства определяется выражением
Т =.t + t + где t — время записи в регистр t
S время умножения; t — время суммиро- 35 вания.
Для выполнения матричной операции
С + АВ над новым потоком данных на соответствующих тактах подаются нулевые дополнительные (К + 1)-е разряды на входы 1 и 3 элементов 5" для
Для выполнения операции АВ< 9 АВ
АВ и т,д. в элементах 5," регистры
12 содержат соответствующие элементы а;;, на входы 1 подаются с"=О, а
9 на входы 3 — Ь; .
Таким образом, предлагаемое устройство обладает более широкими функциональными возможностями по сравнению с известным, так как в последнем выполняется только перемножение двух ээ патриц, а в предлагаемом устройстве реализуются матричные операции: матричное накопление С + АВ; определяются цепочки матриц АВ,, АВ, AB и т.д.
Кроме того, предлагаемое устройство обладает структурой с произвольной размерностью m п и р, формула и з обретения
Устройство для выполнения матричных операций, где А — матрица размерности (mxp),  — матрица (pxn), С вЂ” матрица (mxn), содержащее mxp однотипных процессорных элементов, содержащих три регистра, умножитель< суммаrop причем первый информационный вход i ° 1-го процессорного элемента (i=1,m) соединен с информационным входом первой группы устройства, вторые информационные входы.:i ° 1-го и l.j-го процессорных элементов (3=19р) соединены соответственно с
i.1-м и l..j-м информационными входами второй группы устройства, третий информационный вход l.j-го процессорного элемента (3=19р) соединен с 1-м информационным входом третьей группы устройства, вход синхроимпульсов которого соединен с синхровходами 2,j-х процессорных элементов, первый выход
i.z-го процессорного элемента (z=l р-1) соединен с первым информационным входом (i.z l)-ro процессорного элемента, второй выход i j-ro процессорного элемента соединен с вторым информационным входом (i+1
j+1) -го процессорного элемента, третий выход fj-го процессорного элемента (f=l, m-1) соединен с третьим информационным входом (f+1, j)-го процессорного элемента, первый выход
i.p-ro процессорного элемента подключен к i-му выходу группы устройства, о т л и ч а ю щ е е с я тем, что, с целью расширения функциональных возможностей за счет выполнения дополнительных операций и повышения быстродействия, в каждый процессорный элемент введены два регистра, три триггера, элемент И и элемент
HE причем информационный вход первого регистра и информационный вход первого триггера соединены соответственно с разрядами с первого по
K-й и (К + 1)-м разрядом первого информационного входа процессорного элемента, где К - разрядность элементов матриц, выход первого регистра соединен с первым входом сумматора, выход сумматора и выход первого триг)388897 гера соединены соответственно с разрядами с первого по К-й и (К + 1)-м разрядом первого выхода процессорно- го элемента, информационный вход
Второго регистра соединен с вторым информационным входом процессорного элемента, вход разрешения записи вто" рого регистра соединен с входом элеМента НЕ, выход которого соединен с
Входом разрешения записи четвертого регистра, информационный вход которо го объединен с информационным входом третьего регистра и соединен с
Выходом второго регистра, выход четвертого регистра соединен с вторым выходом процессорного элемента, Вход разрешения записи третьего ре истра соединен с выходом элемента
И, первый вход которого соединен с О информационным входом первого триг1 ера, а второй вход — с информационным входом третьего триггера, информационный вход пятого регистра и информационный вход третьего тригге" ра соединен соответственно с разрядами с первого по К-й и (К + l)-м разрядом третьего информационного входа процессорного элемента, выхо" ды третьего и пятого регистров соединены соответственно с первым и вторым входами умножителя, выход которого соединен с вторым входом сумматора, выход пятого регистра и выход третьего регистра соединены с ютветственно с разрядами с первого по
К-й и (К + 1)-м разрядом третьего выхода процессорного элемента, входы разрешения записи первого, второго и пятого регистров, первого, второго и третьего триггеров объединены и соединены с синхровходом процессорного элемента.
1388897 рие. 2
) 388897
Составитель М, Силин
Техред N.Õîäàíè÷ Корректор Г Решетник
Редактор А. Огар
Заказ 1582/5! Тираж 704 Подпис ное
ВНИИИИ Государственного комитета СССР по делаи изобретений и открытий
113035, Москва, Ж-35, 2аушская наб., д. 4/5
Производственно-полиграфическое предприятие, г. Ужгород, ул. Проектная, 4