Боюсь, Вы меня превратно поняли, по-видимому я не совсем точно высказал свою просьбу. Дело в том, что я не собираюсь прямо сейчас, не умея двух строчек кода правильно сложить, писать программу видеозахвата или трансляции видео в сеть. Отлично понимаю, что курить COM объекты для меня сейчас дело пустое, не осилить мне пока таких страшно непонятных вещей. Меня интересует лишь форма реализации кода программы, то, каким образом создаются программы такого рода, самый общий принцип.
По моим догадкам COM представляет из себя набор (библиотеку) подпрограмм входящих в состав операционной системы, доступ к которым осуществляется через стандартный программный интерфейс. То есть, в нужном месте исходного текста программы вставляется какой-то стандартный кусок кода (рекомендованный производителем операционной системы), посредством которого и происходит обращение приложения к функциям операционной системы (в частности к DirectX), которая в свою очередь рулит драйверами устройств, а те уже обращаются к железу, засылая в регистры чипа TV карты (или CPU, или GPU, или звуковой карты) нужные двоичные комбинации и заставляя их производить необходимые действия (захват, фильтрацию, сжатие, вывод на экран).
Сильно ли я ошибаюсь, рассуждая таким образом? Действительно ли существуют стандартные "куски" кода помещаемые в текст программы для выполнения операционной системой тех или иных действий? Упомянутый компонент в Дельфи и Builder - инструмент, позволяющий "воткнуть" нужный "кусок" стандартного кода в нужном месте?
За книгу спасибо, нашел, полистал, положил в папку с литературой, которая на мой взгляд может пригодится в будущем (сейчас вряд ли, пока только пытаюсь освоить хотя бы азы программирования на C++).