Vergiss es. Um das Problem zu lösen, welches du ansprichst müsstest du die einzelnen Streams decodieren und dann selektiv die Lautstärke der entsprechenden Kanäle reduzieren bevor du sie wieder synchronisierst und als Stereo-Signal encodierst. Wenn du einfach das 5.1 in Stereo umwandelst, dann klingt das höchstwahrscheinlich genau gleich wie das bei deinem Player/TV klingt, denn haargenau das machen sie ja. Die Bitrate ist nur die Qualität des Sound, nicht dessen Lautstärke und erst recht nicht die Lautstärke der einzelnen 5.1 Kanäle.
Du willst ja die relative Lautstärke von Sprache zu Musik ändern. Wenn du das einfach in Stereo umwandelst und dann leiser machst ist das genau dasselbe, wie wenn du bei deinem TV die Lautstärke runterdrehst. Die Musik wird immer in der genau gleichen Relation zur Sprache sein, es sei denn du nimmst das Signal wirklich auseinander, veränderst es in Teilen und setzt es dann wieder zusammen.
Vielleicht gibt es ja Tools, welche das alles vollautomatisch machen aber ich bezweifle das irgendwie und wenn, dann sicher nicht günstig.