Die meisten modernen Systeme verwenden das NUMA-(Non-Uniform Memory Access-)Design beim Multiprocessing. Bei NUMA-Systemen sind Speicher und Prozessoren so angeordnet, dass bei einem bestimmten Prozessor einige Teile des Speichers näher bei ihm liegen (d.h. über einen direkteren Pfad verbunden sind), während andere Teile weiter entfernt liegen. Ein Prozessor kann wesentlich schneller auf einen Speicher zugreifen, der näher bei ihm liegt, als auf einen weiter entfernten Speicher. Die Latenzzeit zwischen den Prozessoren und verschiedenen Teilen des Speichers in einem NUMA-Rechner kann sich stark unterscheiden.
Der neue Befehl numatop(1M) ist ein Tool zur Beobachtung der Charakterisierung des Laufzeitspeicherorts und zur Analyse von Prozessen und Threads, die in einem NUMA-System ausgeführt werden. Dieses Tool unterstützt die Charakterisierung des NUMA-Behaviors von Prozessen und Threads und die Identifizierung der Stellen, an denen es zu NUMA-bezogenen Performanceengpässen kommt.