Сотовые операторы объяснили ФАСу размер кириллицы
Цитата:
Федеральная антимонопольная служба (ФАС) сообщила в пятницу о своем запросе в адрес сотовых операторов, в котором просит объяснить, почему длина SMS-сообщений на кириллице более чем в два раза меньше, чем на латинице. Начальник управления контроля транспорта и связи Дмитрий Рутенберг объяснил заинтересованность ФАС жалобами абонентов.
Согласно стандарту, SMS должно быть объемом не более 163 байт, из которых 23 байта - это техническая информация (отметка смс-центра, источник сообщения, схема кодировки и пр), и собственно пользовательский текст - 140 байт, объясняет представитель оператора связи МТС Валерия Кузьменко.
7-битная кодировка (латинский алфавит и цифры) позволяет отправлять сообщения длиной до 160 символов, 8-битная (немецкий, французский язык) - до 140 символов.
Для поддержки других национальных алфавитов, включая русский, используется 2-байтовая (16-битная) кодировка UTF-16 (международный стандарт, который гарантирует корректную передачу русского текста в сети любого оператора). "Таким образом, SMS, написанное кириллицей, не может превышать 70 знаков", - рассказала Кузьменко корреспонденту РИА Новости.
8-битные кодировки для русского языка существуют, - это, например, KOI8 и CP1251 (Windows), которые используются в интернете, однако стандарт GSM не подразумевает их использование для кодирования SMS.
Надо заметить, что, помимо кодировки UTF-16, которая используется для отправки кириллических сообщений, существуют и более экономные, хотя и не универсальные, альтернативы. Например, Windows-1251 и KOI-8R, хорошо известные пользователям персональных компьютеров, отводят по 8 бит на каждую букву (а можно ещё вспомнить и какую-нибудь CP866). Но к технологии SMS-сообщений эти кодировки не имеют никакого отношения.
Эксперты однако, отмечают, что антимонопольщикам не мешало бы вместо подсчёта байтов поинтересоваться вопросами ценообразования на отправку SMS-сообщений — неважно, с латиницей или с кириллицей. Потому что брать в XXI веке, скажем, рубль за каких-то 140 байт, пусть даже и "по воздуху" — явно многовато.
|
источник
|