Digitaler Signalprozessor

kontinuierliche Bearbeitung von digitalen Signalen durch digitale Signalverarbeitung.

Ein digitaler Signalprozessor (engl. digital signal processor, DSP) ist ein elektronischer Baustein und dient der kontinuierlichen Bearbeitung digitaler Signale, z. B. Audiosignale oder Videosignale. Zur Verarbeitung analoger Signale wird der DSP in Verbindung mit Analog-Digital-Umsetzern und Digital-Analog-Umsetzern eingesetzt. Einige DSP-Chips enthalten bereits A/D- und D/A-Wandler. Der Begriff DSP wird darüber hinaus auch nur für die rechnende Komponente innerhalb einer Software und Elektronik verwendet.

Der Motorola XSP56001 ist ein DSP aus der 56K-Familie.

FunktionsweiseBearbeiten

DSPs dienen nicht nur als Ersatz für aufwendige analoge Filtertechnik, sondern können darüber hinaus Aufgaben ausführen, die analog nur schwer oder überhaupt nicht lösbar wären:

DSPs sind spezialisierte Prozessoren, die für die Ausführung von DSP-Funktionen in Echtzeit optimiert sind, die auf sich wiederholenden Multiply-Accumulate (MAC) Operationen basieren, die häufig bei der digitalen Filterung, z. B. Filter mit endlicher Impulsantwort, und der schnellen Fourier-Transformation (FFT) verwendet werden. Die DSPs integrieren einen programmierbaren Mikroprozessor, der normalerweise in eine Harvard-Architektur integriert ist. Sie bieten eine schnelle Datenverarbeitung durch Implementierung von Einzelbefehlen, SIMD-Operationen (siehe Single Instruction, Multiple Data), speziellen Befehlen für Kerne mit superskalaren Architekturen, MAC-Berechnungen mit einem Zyklus oder Fused Multiply-Add, parallele Berechnung in mehreren MAC-Einheiten und schnelles Data Streaming mit Speicherdirektzugriff, digitale Ringspeicher, hardwaregesteuertem Loop ohne Overhead und schnellen und erweiterten Präzisionsberechnungen in Festkomma- oder Gleitkommaoperationen. Sie integrieren auch einige Peripheriegeräte und Datenspeicher auf dem Chip für einen eigenständigen Betrieb.

Es gibt viele DSPs auf dem aktuellen Markt, die aufgrund der Fortschritte und Verbesserungen der Halbleitertechnologie in den DSP-Architekturen eine hohe Leistung liefern. Preise und Leistung variieren stark zwischen den wichtigsten DSP-Herstellern und IP-Core-Anbietern.[1]

EchtzeitfähigkeitBearbeiten

Ein DSP muss eine bestimmte Datenmenge pro Zeiteinheit sicher verarbeiten können. Dies ergibt sich aus der Forderung einer meist fixen und von außen vorgegebenen Datenrate, mit der die Eingangsdaten in den DSP gelangen bzw. die verarbeiteten Daten wieder ausgegeben werden müssen. Eine Art Handshake oder zeitliches Anhalten bei der Datenverarbeitung ist bei dieser echtzeitfähigen Verarbeitung meistens nicht möglich.

Folgende Maßnahmen dienen dem Erhöhen der Verarbeitungsgeschwindigkeit:

BefehlssatzBearbeiten

ZahlenformateBearbeiten

Unterteilt werden Signalprozessoren und deren Befehlssatz nach der Fähigkeit, Rechenoperationen

ausführen zu können.

Signalprozessoren mit Festkommaarithmetik sind im Aufbau meist einfacher und haben einen geringeren Stromverbrauch. Dafür ist das Implementieren bestimmter Algorithmen komplizierter, da bei jeder Berechnung vom Programmierer bedacht werden muss, ob es möglicherweise zu Überläufen in der Zahlendarstellung kommen kann und auf welcher Stelle sich das Binärkomma befindet. Ein typisches Anwendungsfeld von Festkomma-DSPs ist beispielsweise das Verarbeiten von Audiosignalen. Typische Vertreter von Signalprozessoren mit Festkommaarithmetik ist die DSP-Serie ADSP218x und Blackfin BF53x von Analog Devices sowie die TMS320VC5x von Texas Instruments.

Signalprozessoren mit Gleitkommaarithmetik sind komplexer im Aufbau, da ihre Rechenwerke die kompliziertere Darstellung der Gleitkommazahlen verarbeiten können. Damit ist bei gleicher Rechenleistung meist ein höherer Stromverbrauch verbunden. Der Vorteil liegt in der meist einfachen Implementierung komplizierter Algorithmen. Ein typisches Anwendungsfeld von Gleitkomma-DSPs ist beispielsweise das Verarbeiten von Videosignalen. Typische Vertreter von Signalprozessoren mit Gleitkommaarithmetik sind die als SHARC bezeichneten Bausteine von Analog Devices und die TMS320VC67x von Texas Instruments.

OperationenBearbeiten

  • Es existieren mehrere Rechenwerke (ALUs), darunter ein Multiply-Accumulate-Rechenwerk (MAC). Dieses Rechenwerk ermöglicht die Operation A* = A + B · C in einem einzigen Prozessorzyklus und dient vornehmlich der Geschwindigkeitserhöhung der für spektrale Operationen – etwa der für die schnelle Fourier-Transformation oder der Faltung – erforderlichen Berechnungen.
  • Auf Boolesche Operationen beschränkte Rechenwerke werden in einigen DSPs (z. B. TI TMS320Cxx) zur unabhängigen Datenmanipulation eingesetzt (PLU = Parallel Logic Unit).
  • Es werden auch Address Generation Units (AGU) eingesetzt. Die AGU besteht aus programmierbaren Zählern (Counters), Shiftern und anderen logischen Elementen. Dadurch können die Adressberechnungen zum Beispiel für die Operanden parallel zu arithmetischen Operationen ausgeführt werden, um die Speichertransferrate nicht zu verkleinern. Einige AGU unterstützen die Register-indirekte Adressierung mit nachträglicher Inkrementierung. Anwendung finden sie bei Berechnungen, wo Daten wiederholt berechnet werden, die sequentiell im Speicher angeordnet sind. Für den Algorithmus zur schnellen Fourier-Transformation (FFT) wird auch eine Bitreversed-Adressierung eingesetzt.
  • Die Execution Unit (EXU) hat die Aufgabe der Datenmanipulation. Jeder Cluster darf die Register des Nachbarclusters auslesen. Beispiel: TI TMS320C6201

ProgrammablaufBearbeiten

  • Verschachteltes No-overhead-Hardware-Looping mittels eines dedizierten Loop-Stacks.
  • Die heutigen DSP sind darüber hinaus oft massiv-parallel programmierbar, das heißt in einem einzigen Prozessorzyklus können mehrere Rechen- und/oder Speichertransferoperationen gleichzeitig durchgeführt werden.
  • Prefetch und Predecoding der Instruktionen (Pipelining) für eine sehr hohe Ausführungsgeschwindigkeit der Befehle.
  • Schleifenbefehle beschleunigen die Ausführung von Schleifen. Diese werden hardwarekontrolliert ausgeführt. Einige DSPs verwenden Pipelines (Pipelining) und Instruction Caches, um die Ausführung von Schleifen zu beschleunigen. Man unterscheidet zwei Arten von Schleifenbefehlen:
    • Single Instruction Hardware Loop – Wiederholung einer Operation
    • Multi Instruction Loop – Wiederholung eines ganzen Anweisungsblockes

BeispielBearbeiten

Der SHARC ADSP-21065L von Analog Devices erlaubt etwa folgenden einzyklischen Assemblersprachen-Befehl:

F0=F3*F7, F1=F11+F15, F2=F11–F15, DM(I0,M1)=F2, F3=PM(I8,M9);

in dem quasi-gleichzeitig eine Gleitkomma-Multiplikation, eine Gleitkomma-Addition, eine Gleitkomma-Subtraktion, ein Schreibzugriff auf den Speicher mit modulo-zyklischem Postincrement/-decrement sowie ein Lesezugriff auf den Speicher mit modulo-zyklischem Postinkrement/-dekrement stattfindet.

KommunikationBearbeiten

GeschichteBearbeiten

In den frühen 1970ern entstand in den Lincoln Laboratories der Lincoln FDP (Fast Digital Processor) mit Von-Neumann-Struktur als der erste dedizierte digitale Signalprozessor. Anschließend wurde mit der besser geeigneten Harvard-Architektur der LSP/2 gefertigt. Allerdings bestand dieser Rechner noch aus mehreren 1000 diskreten ICs. Die ersten Einzelchip-DSPs kamen in den frühen 1980ern auf den Markt. Typische Vertreter waren der Intel 2920, TMS32010 von Texas Instruments oder der NEC µPD7720.

GegenwartBearbeiten

Elemente von DSPs finden sich auch zunehmend in Desktop-CPUs wieder, wie zum Beispiel in den AltiVec-Erweiterungen des PowerPC oder (abgeschwächt) in den SIMD-Erweiterungen von Intel und AMD. Dies liegt an der zunehmenden Verbreitung von Multimedia-Inhalten; Datenformate wie das JPEG-Format, MP3 oder MPEG2 erfordern eine DCT-Kodierung beziehungsweise -Dekodierung, deren Berechnung eigentlich eine klassische DSP-Aufgabe ist. Auch die Berechnung der immer weiter verbreiteten Verschlüsselung profitiert von diesen Befehlssatz-Erweiterungen. Auch im Bereich der Embedded Systeme werden die Microcontroller durch DSP-Funktionalitäten ergänzt, wodurch die Rechenleistung gesteigert und der Stromverbrauch gesenkt werden kann. Typische Beispiele sind der ARM Cortex M4, die Erweiterung NEON bei den großen ARM-Cortex-Cores, der dsPIC von Microchip sowie die XS1-Serie von XMOS.

ZukunftBearbeiten

Der generische DSP bekommt zusehends Konkurrenz durch RISC/CISC-CPUs, die mit speziellen Erweiterungen komplexe Rechenaufgaben wie RSA/AES/3DES hoch optimiert abarbeiten können. Darüber hinaus werden Aufgaben zur schnellen Signalverarbeitung vermehrt in flexible parallele digitale Strukturen verlagert, wie sie z. B. in immer leistungsfähigeren Field Programmable Gate Arrays (FPGAs) zunehmend und kostengünstig zur Verfügung stehen.

AnwendungsgebieteBearbeiten

Digitale Signalprozessoren finden heute unter anderem in den folgenden Bereichen bzw. Geräten Anwendung:

LiteraturBearbeiten

WeblinksBearbeiten

EinzelnachweiseBearbeiten

  1. Arnaldo Mendez, Mohamad Sawan, in Implantable Biomedical Microsystems, 2015, ScienceDirect: Signal processing hardware
  2. Modem Data Pump DSP Software. AlgoTron, abgerufen am 8. Mai 2013 (englisch).