Это классический подход к построению программных систем ВКС, по такому принципу, например, работает Skype. В отличие от MCU, сервер ВКС в данном случае не утруждает себя перекодированием, создает копии входящих потоков и пересылает их другим участникам “как есть”. Выходит, что каждый из терминалов получает сразу несколько видеопотоков в полном качестве, которые он просто не может отобразить одновременно. Терминалу приходится уменьшать разрешение каждого входящего видео от каждого из участников на своей стороне, либо просить уменьшать его перед отправкой, что ухудшает качество видео для всех остальных участников.
Плюс у этой схемы один: инфраструктура не требовательна к ресурсам и даже рядовой ПК может выдержать сотни таких конференций одновременно. Но вот минусов значительно больше: терминалу (обычно это простой ПК) приходится декодировать не один, а сразу несколько потоков, а серверу ВКС требуется в несколько раз большая исходящая ширина канала, чтобы вместить в себя все созданные им копии потоков.
Добавим к этому реальные условия, и получим систему, с трудом "переваривающую" кол-во участников больше, чем 3, и резко ухудшающую качество видео для всех, при присоединении к ней мобильного абонента, не способного “переварить” исходное качество картинки, отправляемое другими абонентами.