Что первично 1251 или UTF8
23 сообщения
#15 лет назад
По-моему все очень просто.Если, например, сайт англоязычный и не предполагается ввода информации в неподдерживаемом кодировкой 1251 виде, то использовать UTF глупо, поскольку ее расширенные возможности использоваться не будут, а будет только лишний вес. В остальных случаях - я выбираю UTF-8.
1649 сообщений
#15 лет назад
Тоже работал с 1251 для руских сайтов. Сейчас перешел на utf-8 для всех сайтов. Пришлось для одного сайта делать копию на другом языке, со спец символами. Надоело менять кодировку всем страницам 
3240 сообщений
#15 лет назад
Цитата ("MaxF"):По-моему все очень просто.
Если, например, сайт англоязычный и не предполагается ввода информации в не поддерживаемом кодировкой 1251 виде, то использовать UTF глупо, поскольку ее расширенные возможности использоваться не будут, а будет только лишний вес. В остальных случаях - я выбираю UTF-8.
Английский текст в UTF-8 и в Windows-1251 "весит" абсолютно одинаково. Так что использовать UTF-8 вовсе не глупо.
Вот где не рекомендуется использовать UTF-8, так это в полях таблиц баз данных, где никогда не будет нелатинских символов. Например, какие-нибудь коды.
По поводу того, что первично... UTF-8 и 1251 создали примерно в одно и то же время, в начале 90х годов. Возможно, 1251 даже немного раньше.
Но в то время как UTF-8 долго-долго никто не использовал, национальные кодировки типа 1251 мгновенно заполнили весь рынок, прежде всего из-за нашествия MS-DOS, а затем и Windows, которые поначалу работали только с однобайтовыми кодировками.
После того, как разработчики операционных систем поняли, что однобайтовые кодировки это тупик, они пошли в другую сторону, и начали поддерживать "wide characters". Думаю, многие помнят, когда в Windows API появились функции с суффиксом W на конце. Интересно, что в Windows под "wide characters" понимается UTF-16, а в юниксах — UTF-32.
И только последние лет 10 наконец-то постепенно пришли к повсеместному использованию UTF-8.
Причины такой задержки в развитии две:
— первое время компы были недостаточно мощными, и была очень заметна потеря производительности при обработке строк с более сложной структурой (плавающим размеров символов).
— работать с UTF-8 на низком уровне намного сложнее, и переход на UTF-8 занял значительное время, пока разработчики написали достаточно либ и прикладного софта. Даже сейчас еще поддержка UTF-8 в ряде языков программирования не стопроцентная, например тот же PHP 5.
В любом случае, на данный момент не использовать в своих проектах UTF-8 считается плохим тоном. )
23 сообщения
#15 лет назад
Цитата ("tvv"):Английский текст в UTF-8 и в Windows-1251 "весит" абсолютно одинаково. Так что использовать UTF-8 вовсе не глупо.
Вот где не рекомендуется использовать UTF-8, так это в полях таблиц баз данных, где никогда не будет нелатинских символов. Например, какие-нибудь коды.
Согласен, про вес я не точно высказался. Я имел в виду не вес