Для этого надо учитывать точное расстояние до предмета, угол обзора камеры и её оптическое искажение. Если со вторым и третьим - уже проблема (для каждого устройства придётся в программе хранить свои настройки), то с первым вообще беда: чуть не то расстояние или угол - все измерения в помойку.
Впрочем, про что-то подобное я слышал (вроде для составления схемы ДТП по фото), только там должен в определённом месте кадра присутствовать калибратор - некая трёхмерная фиговина, по искажению изображения которой программа высчитывает все остальные размеры... Программно-аппаратный комплекс, короче