Eine Command-Rate von 2T gegenüber 1T führt zu weniger Durchsatz. Soweit ich das verstanden habe, schickt die CPU dem Speicher Kommandos über einen eigenen Command-Bus, so ein Befehl kann entweder 1T oder 2T Zeit in Anspruch nehmen, nach dem Verstreichen dieser Zeit wird die eigentliche Speicher-Aktion ausgeführt, welche bis über 10T dauern kann.
Gemessen daran ist der Unterschied zwischen 1T und 2T nicht so groß, kann allerdings dann eine Rolle spielen, wenn Daten aus der gleichen Speicherzeile gelesen werden. Die gesamte Speicher-Aktion dauert dann deutlich kürzer (beschränkt sich auf den Spaltenzugriff), entsprechend größer ist der Anteil der Command-Rate an der Gesamtdauer.
Bei Dual-Channel sollte die Command-Rate weniger ausmachen, da auf zwei Kanäle gleichzeitig zugegriffen wird (während auf den einen gewartet wird, arbeitet der andere bereits). Das hängt aber von der aktuellen Aufgabe ab.
Außerdem gehe ich davon aus, dass die CPU Daten bereits vom Speicher anfordert, während sie noch evtl. vorhandenen Daten aus dem eigenen Cache-Speicher bearbeitet, die "Wartezeit" würde also sinnvoll genutzt. Das geht natürlich nur, wenn ein brauchbarer Teil der benötigten Daten im Cache liegt.