spamsink: (Default)
[personal profile] spamsink posting in [community profile] besm6
Мне удалось избавиться от сравнения абсолютных величин мантисс в первом такте деления (путем дополнительного такта с пробным вычитанием) и от сравнения полноразрядной мантиссы с величиной -0.25; также мне удалось ликвидировать регистр inc2. Это делает алгоритм деления чуть ближе к аутентичному (close, but no cigar, still).

Тест АУ по-прежнему проходит, разумеется, но на тактовую частоту эти изменения повлияли негативно (в частности, раз стало меньше регистров, то увеличилась глубина логики на оставшихся). Несильно, конечно - всё равно больше 120 МГц, но вы мне скажите, имеет ли еще смысл возиться и коммитить, или оставим детям для развлечения?

Использованный в БЭСМ-6 алгоритм деления - двоичный SRT. Тест АУ не видит разницы между выбором 0 в качестве очередной цифры частного при значении остатка в диапазоне -0.25 < x < 0.25 (для строгого сравнения отрицательного числа нужны все разряды) и при -0.125 <= x < 0.25 (тут в обоих случаях достаточно сравнивать 3-4 старших бита мантиссы).

Upd: Проверка случайным тестом показывает, что есть разница между исходным и упрощенным сравнением, которая ухудшает сбалансированность округления, но, увы, тестом АУ не ловится. Так что оставляем как было до поры.

Date: 2019-04-12 07:43 pm (UTC)
vak: (Default)
From: [personal profile] vak
Залез в исходники выяснить детали, но inc2 всё ещё здесь. Ты не заслал правки пока, наверное.

120 МГц вполне достаточно для наших целей, я считаю. Надо оставить поле деятельности для энтузиастов.

Мне тут Джером дал книжку по архитектуре CDC 6600. Это был первый в мире суперскалярный процессор. В первом приближении всё то же самое, но есть одно важное отличие. У нас одно АУ, выполняющее все операции. Там несколько независимых АУ, но специализированные: одно для сложения, два для умножения, одно для деления, и отдельно для прочих операций. Каждая операция занимает несколько тактов, как и у нас, но все АУ могут работать одновременно. очередная машинная команда поступает в то АУ, которое ей подходит, и при этом свободно. В результате много команд модут выполняться одновременно.

Можно поставить отдельную задачу переделать мэсм6 на суперскалярную микроархитектуру.

Date: 2019-04-12 11:52 pm (UTC)
vak: (Default)
From: [personal profile] vak
Действительно, стековая архитектура сильно ограничивает возможности распаралелливания. Вот почему БЭСМ-10 планировалась больше как регистровая машина, хотя и с сохранением совместимости.

Date: 2019-04-13 01:47 am (UTC)
x86128: (Default)
From: [personal profile] x86128
Тоже как-то давно читал про CDC-шный scoreboard штука интересная. Я думаю её можно сделать когда сделаем для МЭСМ6 "аппаратную" многопотоковость, что-то типа hyperthreading.

Думаю, что из-за того что практически всегда каждая следующая арифметическая операция зависит от результата предыдущей, суперскалярность просто не получить. Видимо, поэтому ушли в векторность на том этапе развития машин. А с изобретением RISC уже ушли в суперскалярность.

Date: 2019-04-13 01:51 am (UTC)
x86128: (Default)
From: [personal profile] x86128
В БЭСМ-6 без серьёзного переименования регистров, т. е. без фактической двоичной компиляции в регистровую архитектуру в хардвере, так не выйдет.

Тоже интересная мысль. Надо обязательно и её подумать, например, в качестве backend взять самое минимальное ядро типа MIPS/RISC-V (контрольную часть без арифметики) и на базе этого сделать что-то типа core i7 с набором команд БЭСМ :)

Date: 2019-04-15 06:31 pm (UTC)
vak: (Default)
From: [personal profile] vak
В этом главная проблема стековой архитектуры, что все вычисления проходят через аккумулятор, и поэтому каждая операция зависит от следующей. Лебедев это осознавал, поэтому в проекте БЭСМ-10 ввели восемь регистров данных (вместо аккумулятора и РМР).

Вот тут на странице 135: https://drive.google.com/drive/u/0/folders/1qILSqIlTt3nIS07JFQjvd2SF_6GpDUYi

Позже придумали переименование регистров, и с ним оказалось возможным совместить суперскалярность с регистровой архитектурой. Тот же Интел так делает.
Edited Date: 2019-04-15 06:32 pm (UTC)

Date: 2019-04-16 08:56 pm (UTC)
vak: (Default)
From: [personal profile] vak
Неплохо.
Количество регистров в АУ уменьшилось до практического минимума.
Из широких регистров остались только сумматор, РМР и рельса.

Date: 2019-04-16 11:02 pm (UTC)
vak: (Default)
From: [personal profile] vak
При синтезе mesm6_cpu.sv частота получается в районе 50-60 МГц. Можешь глянуть, где там затык?

Date: 2019-04-17 12:14 am (UTC)
vak: (Default)
From: [personal profile] vak
Спасибо!
Кажется, я вижу циклическую зависимость в комбинационной логике.
В этом всё дело.

assign Uaddr = Mi + (r_add ? Mr : Vaddr);

assign Mr = M[m_ra];

wire [14:0] m_ra = ... (sel_mr == `SEL_MR_UA) ? Uaddr : ...;

Команда J+M нехорошо сделана. Надо подумать.
Edited Date: 2019-04-17 12:19 am (UTC)

Date: 2019-04-17 01:26 am (UTC)
vak: (Default)
From: [personal profile] vak
Переделал, и кое-что даже упростилось.
Попробуй сейчас глянуть критический путь.

Date: 2019-04-17 04:35 am (UTC)
x86128: (Default)
From: [personal profile] x86128
Любопытно, но квартус тоже ругался на наличие циклической зависимости, но я значения не придал. Ввиду неопытности подумал, что такие зависимости всё равно разрываются Д-треиггерами по клоку. И в этом нет ничего страшного, кроме удлинения пути сигнала.

Date: 2019-04-17 05:44 am (UTC)
vak: (Default)
From: [personal profile] vak
Ага, совсем другое дело. Посмотрю, может ещё можно ускорить.

Я сделал c_active из соображения, что сбрасывать один бит легче, чем все пятнадцать. Но может быть это копеечная экономия.

Profile

Сообщество любителей БЭСМ-6

January 2026

S M T W T F S
    123
45678910
11121314151617
18192021222324
2526272829 3031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 3rd, 2026 06:15 pm
Powered by Dreamwidth Studios