1774348 - Устройство для перемножения ленточных матриц

Устройство для перемножения ленточных матриц

Иллюстрации

Показать все

Реферат

Изобретение относится к вычислительной технике и может быть использовано в высокопроизводительных специализированных вычислительных машинах и устройствах обработки сигналов для перемножения двух ленточных матриц А и 8. Цель изобретения - повышение быстродействия устройства. Цель достигается тем, что устройство содержит pa+qa-1 вычислительных модулей, где ра и qa - соответственно число ненулевых элементов в первой строке и первом столбце ленточной матрицы А, причем каждый вычислительный модуль содержит три регистра, два узла задержки на Л-2 такта, где Л 2ра+2да+рь+дь-6/рь и дь число ненулевых элементов соответственно в первой строке и первом столбце ленточной матрицы В/, умножитель, сумматор, Л-1 триггеров и элемент И. В основу работы устройства положена параллельно-поточная организация вычислений. 2 ил. сл

COI03 СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК (я) 5 G 06 F 15/347

ГОСУДАРСТВЕ! 1Н6!Й КОМИТЕТ

ПО ИЗОБРЕТЕНИЯМ И ОТКРЫТИЯМ

ПРИ ГКНТ СССР

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ (21) 4819893/24 (22) 28.04.90 .„.(46) 07.11.92. Бюл. N 41 ° (72) В,П.Якуш, В.В.Косьянчук, Н.А,Лиходед и П,И,Соболевский (56) Н.T.Kung, С.Е Lelserson. Slstollc Arrays (for VLSI), Sparse Matrix Proc. 1978, Society

for Industr. and Applied Math. 1979, р. 266, fig. 2-4, Авторское свидетельство СССР

N. 1677709, кл. G 06 F 15/347, 1986. (54) УСТРОЙСТВО ДЛЯ ПЕРЕМНОЖЕНИЯ

ЛЕНТОЧНЫХ МАТРИЦ (57) Изобретение относится к вычислительной технико и может быть использовано в высокопроизводительных специализированных вычислительных машинах и устройИзобретение относится к вычислительной технике и может быть использовано в высокопроизводительных специализированных вычислительных машинах и устройствах обработки сигналов для перемножения двух ленточных матриц.

Цель изобретения вЂ” повышение быстродействия устройства.

На фиг. 1 представлена структурная схема устройства для перемножения ленточных матриц; «а фиг. 2 вЂ” пример схемы вычислительного модуля.

Устройство для перемножения ленточных матриц (фиг. 1) содержит группу 1 информационных входов, первый 2 и второй 3 информационные входы, вход 4 задания реЫ2 1774348 А1 ствах обработки сигналов для перемножения двух ленточных матриц А и 8. Цель изобретен ия вЂ” повышен ие быстродействия устройства. Цель достигается тем, что устройство содержит pa+qa-1 вычислительных модулей, где ра и qa вЂ” соответственно число ненулевых элементов в первой строке и первом столбце ленточной матрицы А, причем каждый вычислительный модуль содержит три регистра. два узла задержки на A-2 такта, где Л=2ра+2ца+рь+ць-6/рь и оь вЂ число ненулевых элементов соответственно в первой строке и первом столбце ленточной матрицы В/, умножитель, сумматор, Л-1 триггеров и элемент И. В основу работы устройства положена параллельно-поточная организация вычислений. 2 ил. жима, синхровход 5, вычислительные модулй 6i (i=1, paiq 1) и Выход 7 Ды

Вычислительный модуль 6 (фиг; 2) со- (1 держит первый 8, второй 9 и третий 10 ин- р формационные входы, вход 11 задания режима, синхровход 12, умножитель 13, сумматор 14, регистр 15, 16 и 17, злы 18 и

19 задержки, регистры 20i (1=1, Л-2) узла 18 задержки, регистры 21i (1=1, Л -2) узла 19 задержки, триггеры 22l (l=1, Л-1), элемент

И 23, первый 24, второй 25. третий 26 и четвертый 27 информационные выходы.

В основу работы устройства положен алгоритм перемножения двух (nxn) ленточных матриц А и В с шириной лент соответственно Ia=pa+qa-1 и !ь=pb+qь-1, где ра и рьвЂ” число ненулевых элементов в первой строке C

1774348

СООтВЕтСтВЕННО МатрИц А И В; qa И qb вЂ” ЧИСЛО ненулевых элементов в первом столбце соответственно матриц А и В, основанный HQ рекуррентных соотношениях

cij(o)=0; с) ) )=сг()<" +a;kbkj; k=1, а)1;

ajj=min(n,i+Pa-1: j+qb-1)-min(0,j-Рь; I-qa);

)Я

c)j=c)j

Вычислительный модуль 6 обладает возможностью реализации функции

1+Л вЂ” Z

aBIJIX aBX ° (+1 l.

Ьаых = Ьах

) +P„â€” 1 i свих = свх + авх Ьех

i вЂ” 1 l вЂ” л =1 (Tax ех " тех ) (+Л вЂ” 1 теых вЂ” tax где а ax, b ах и с ех вЂ” значения соответствен1 i I

)(о на первом, втором и третьем информационных входах вычислительного модуля на

i-м такте;

zIÄx вЂ” значение на настроечном входе вычислительного модуля на I-м такте;

i+1 тец, вЂ” значение на втором информационном выходе вычислительного модуля на (i+1)-м такте; а еых, с еых вЂ” значение соответственно

i на первом и третьем информационных выходах вычислительного модуля íà i-м такте;

1+Л-)

ТЕЕ(Х вЂ” ЗНаЧЕНИЕ На НаетРОЕь)НОМ ВЫходе вычислительного модуля на (i+ A-1)-м такте; ра и рь вЂ” число ненулевых элементов в первой строке соответственно. матриц А и В;

qa u qb вЂ” ЧИСЛО НЕНУЛЕВЫХ ЭЛЕМЕНТОВ В ПЕРвом столбце соответственно матриц А и В, (О, если то=1

1, если То=О, 2 1=1, f(УО 71 " ZA)

2,если г2=. F1=0,тг=1

Л,если то =т1 =... =т -1 =0,,вЂ” вЂ” 1.

Вычислительный модуль 6 работаетследу)ощим образом.

На I-м такте элементы а, Ь и с матриц подаются соответственно на входы 8, 9 и 10 и записываются соответственно в регистры

201, 16 и 17, Кроме того, при подаче на вход

11 единичного сигнала т открывается элемент И 23, который разрешает запись элемента а в регистр 15. На выходе сумматора

5 14 формируется значение (с)-а Ь), которое выдается на выход 26 с задержкой на Л-2 такта, Элемент а выдается «а выход 24 с задержкой на Л-2 такта, элемент b выдается на выход 25 с задержкой на один такт, а

10 управляющий сигнал выдается на выход 27 с задержкой на Л-1 такт.

Организация потоков входных элеглен(о) тов aii<, bkj и сц, управля)ощих сигналов и выходных элементов с() следующая.

Элементы а()< подаются на вход 1 в мо менты времени

to+k+1(A-1)-(A -2)(ц,-t)+I I=1äÿ "ць-t, (<=1+1-ца, I+pa-1;

20 taik=

to+It+I аЬ-(A -t)(q t)-цьаt, I=ci+o,o, k=i+1-qa, i+pa-1, в остальные моменты времени на вход 1 подаются нулевые значения (полагаем a)k=0

25 в слУчае k О и k>n), Возьмем t0= A(qa-2)-qa.

Элементы Ь)<1 подаются на вход 2 в моменты времени

tbkj = Ak+j-pa+1. t0, !<=1,п, j=k+1-qb, k+pb-1, в остальные моменты времени на вход 2

30 подаются нулевые значения.

Элементы cij подаются iia вход 3 в мо. менты времени (о) ьц) =A.Ic)(A-I)(q,-1)+to,I=I,o,)=аа2qаЦь, 35 (+ра+рь-2, На выходе 7 устройства формируются яij) элементы c)j-с) в моменты времени

1с)) = Л.l+j+pa(Л-1)+10-1;

i=1,п, j=i+2-qa-qi), i+Pa+Pb-2.

На вход 4 управляющий сигнал г=1 подается в моменты времени .t=t0+ Л 1+2-(Л-1)(qa 2), I=O, qa+qb-2

t=tO+(A+t)I+ Л(ЦЬ.а1)+ЦаЬ1, 1.=6; O-Ца-аЬ, 45 а в остальные моменты времени на вход 4 подается x=0, Рассмотрим работу устройства для случая п=5, ра=<1ь=3, pb=qa=2 и A=9, Запись соответствуюших значений в триггеры и регистры, формируемые значения на выходе сумматора в вычислительных модулях, осуществляется в соответствии с выполняемыми функциями вычислительными модулями и заданной организацией входного потока элементов а))<, bkj, сц и управляющих сигналов т. Формируемые

IttI )11 значения с))=с)) " на выходе 26 вычислительного модуля 64 подаются на выход 7 устройства, Последний элемент спп формируется в момент времени, определяемый выражением.1774348

4иг.1

Т= Л(п+ра)+и ра" (0-1.

В данном случае последний элемент се формируется на 72-м такте.

Время перемножения двух ленточных матриц предлагаемым устройством равно 5 (Л -1)(п+ра+цд-2)+2(п-1}, Период подачи элементов для очередного перемножения матриц равен (Л4-1)(п-1) тактов.

Формула изобретения 10

Устройство для перемножения ленточных матриц, содержащее (p+q 1) вычислительных модулей (р и q вЂ” соответственно число ненулевых элементов в первой строке и первом столбце матрицы), причем первый 15 информационный вход устройства подключен к первому информационному входу первого вычислительного модуля, первый выход

i-ro вычислительного модуля (где i=1,... ..., p+q-2) подключен к первому информаци- 20 онному входу (i+1)-го вычислительного модуля, второй информационный вход устройства подключен к второму информационному входу (p+q-1)-го вычислительного модуля, второй информационный вход I-ro 25 вычислительного модуля подключен к второму выходу (i+1)-ro вычислительного модуля. синхровход устройства подключен к синхровходам всех вычислительных модулей, о т л и ч а ю щ е е с я тем, что, с целью 30 повышения быстродействия, третий информационный вход устройства подключен к третьему информационному входу первого вычислительного модуля, третий выход i-го вычислительного модуля подключен к треть- 35 ему информационному входу (i+1)-ro вычислительного модуля, вход задания режима устройства подключен к входу задания режима первого вычислительного модуля, четвертый выход I-го вычислительного модуля 40 подключен к входу задания режима (i+1)-го вычислительного модуля, причем каждый вычислительный модуль содержит три регистра, умножитель, сумматор, элемент И и три сдвигающих регистра, причем в каждом вычислительном модуле первый информационн ы и вход вы числ ител ь ного модуля подключен к информационным входам первого регистра и первого сдвигающего регистра. выход переноса которого подключен к первому выходу вычислительного модуля, второй информационный вход которого подключен к информационному входу второго регистра, выход которого подключен к первому информационному входу умножителя и к второму выходу вычислительного модуля, третий информационный вход которого подключен к информационному входу третьего регистра, выход которого подключен к первому информационному входу сумматора, второй информационный вход и выход которого подключены соответственно к выходу умножителя и K информационному входу второго сдвигающего регистра, выход переноса которого подключен к третьему выходу вычислительного модуля, вход задания режима которого подключен к информационному входу третьего сдвигающего регистра и к первому входу элемента И, выход которого подключен к входу записи/считывания первого регистра, выход которого подключен к второму информационному входу умножителя, выход переноса третьего сдвигающего регистра подключен к четвертому выходу вычислительного модуля, синхровход которого подключен к входам сдвига всех сдвигающих регистров, к входам записи/считывания второго и третьего регистров и к второму входу элемента И.

1774348.ти

i а с+Л-4 6

Г, з

ТР

è,,Г2() Ж л) giA-7

Фиг.2

Составитель В. Якуш

Техред М,Моргентал

Редактор

Корректор И. Шмакова

Производственно-издательский комбинат "Патент", r. Ужгород, ул.Гагарина, 101

Заказ 3928 Тираж Подписное

ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СССР

113035, Москва, Ж 35, Раушская наб., 4/5

Устройство для перемножения ленточных матриц

Патент 1774348