Ви є тут

Високопродуктивні спеціалізовані обчислювальні структури для обробки даних

Автор: 
Синельніков Олексій Олексійович
Тип роботи: 
Дис. канд. наук
Рік: 
2007
Артикул:
0407U004081
129 грн
Додати в кошик

Вміст

РАЗДЕЛ 2
ОРГАНИЗАЦИЯ ВЫЧИСЛИТЕЛЬНЫХ СТРУКТУР ФУНКЦИОНАЛЬНО-
ОРИЕНТИРОВАННЫХ БЛОКОВ
2.1. Функциональная и структурная организация специализированных процессоров
В настоящее время идея проблемной ориентации ЭВМ, специализированных
процессоров и вычислителей на определенный класс решаемых задач получает новое
развитие, так как за счет этой основы можно повысить производительность и
точность обработки дан­ных при снижении аппаратных затрат [24, 25].
Использование специализированных процессоров является одной из характерных
особенностей современного этапа развития вычислительных машин. Необходимость
использования этих процессоров объясняется тем, что они позволяют существенно
увеличить эффективность (особенности архитектуры, набора структурных блоков,
системы команд и конструктивно-технологического исполнения) решения
определенных классов задач, связанных с массовой обработкой информации, причем
одновременно облегчаются требования к математическому обеспечению ВС.
Достижения микроэлектроники (увеличение степени интеграции, снижение стоимости
интегральных схем, повышение их надежности) делают реальной возможность
промышленного производства высокопроизводительных специализированных
процессоров самого различного назначения [26].
Один из современных специализированных процессоров NP4SG3 выпускает IBM. По
числу команд, выполняемых в секунду, процессор превосходит выпущенный Intel
процессор IXP1200. Характеристики NP4SG3 дают возможность устанавливать его в
сетевые устройства не только для выполнения базовых сетевых функций, но и для
поддержки дополнительных возможностей, таких как информационная безопасность,
качество обслуживания (Quality of Service – QoS) и балансировка нагрузки,
позволяя обойтись без потерь производительности, связанных с передачей пакетов
по всей сети. Процессор содержит 12 устройств обработки пакетов, которые
используют единую, размещаемую на плате центральную память емкостью 32 Кбайт.
Поскольку IBM использует архитектуру, действующую по принципу «выполнять до
завершения», а не конвейерную модель, новую функцию следует разместить в одном
месте. Конвейерная модель требует, реализации новой функции по частям в
различных исполнительных устройствах, после чего постоянно требуется вести
балансировку нагрузки между ними. Применение разделяемой памяти уменьшает
вероятность того, что каждое исполнительное устройство превысит доступные ему
ресурсы памяти в момент пиковой потребности.
Каждое из 12 устройств имеет по несколько сопроцессоров, которые могут
выполнять дополнительную обработку, поэтому сам механизм может
концентрироваться на основных сетевых функциях, таких как обработка протоколов
и управление очередями. NP2G обеспечивает поддержку пропускной способности
около 2 Гбит/с. Существует возможность подключать два интерфейса OC-12 (622
Мбит/с), два интерфейса Gigabit Ethernet или 20 интерфейсов Ethernet на 100
Мбит/с к каждому из процессоров и будут устанавливать несколько процессоров в
одном большом устройстве. Этот процессор может применяться в настольных
коммутаторах на предприятиях, краевых коммутаторах на базе шасси и станциях
беспроводной связи третьего поколения.
Специализированные процессоры относятся к факторам стратегического потенциала.
Назовем наиболее интересные специализированные процессоры существующие
сегодня.
- NeuroMatrix NM6404 представляет собой высокопроизводительный
DSP-ориентированный RISC-процессор. В его состав входят два основных блока:
32-разрядное RISC-ядро и 64-разрядный векторный сопроцессор для поддержки
операций над векторами с элементами переменной разрядности. NM6404 по системе
команд совместим с NM6403. Имеются два идентичных программируемых интерфейса
для работы с внешней памятью различного типа и два коммуникационных порта,
аппаратно совместимых с портами TMS320C4x, для возможности построения
многопроцессорных систем.
- Neural Networks Processor (НТЦ «Модуль»). Процессор построен по архитектуре
MIMD и состоит из нескольких миниатюрных процессоров, работающих параллельно.
Каждый из этих процессоров представляет собой быстрый 16-разрядный вычислитель
с памятью для хранения синаптических весов. Процессор имеет всего 9 простых
команд. Процессоры на кристалле связаны друг с другом локальной шиной.
- Нейропроцессор МА16 (Siemens). Изготовлен по технологии КМОП на 1 мкм,
состоит из 610 тыс. транзисторов и выполняет до 400 млн. операций умножения и
сложения в секунду. Используется в качестве элементной базы нейрокомпьютера
Synaps 1 и нейроускорителей Synaps 2 и Synaps 3. Представляет собой
программируемый каскадируемый процессор для векторных и матричных операций.
Коммерчески доступен с 1995 года.
- MD1220 (Micro Devices). Цифровой нейрочип MD1220 содержит восемь нейронов с 8
связями и 16-разрядные сумматоры. Во внутрикристальной памяти хранятся
16-разрядные веса. Входы имеют одноразрядные последовательные умножители с
продолжительностью такта 7,2 мкс. Средняя производительность — около 9 MCPS.
- L-Neuro (Philips). Один из первых нейропроцессоров; широко известны две его
модификации L-Neuro 1.0 и L-Neuro 2.3. Вторая модификация имеет 12 слоев, а
первая — один слой из шестнадцати одноразрядных, или двух восьмиразрядных, или
четырех 4-разрядных, или двух 8-разрядных процессорных элементов, т.е. имеет
возможность работать мультиразрядном режиме. На кристалле предусмотрен 1 Кбайт
памяти для хранения 1024 8-разрядных или 512 16-разрядных весов. Гибкая
каскадируемая структура нейрочипа позволяет его использовать при реализации
различных нейросетевых парадигм. При реализации 64 8-разрядных процессорных