RTFM.WIKI

Ordnung muß sein. Ordnung über alles (18+)

Инструменты пользователя

Инструменты сайта


Боковая панель


Навигация

Линкшэринг

ALARM!

Добавить новую страницу

You are not allowed to add pages
linux:mysql:utf-8_vs_cp1251


MySQL - charset FAQ

utf_general_ci или utf_unicode_ci в MySQL

Источник: http://yan-kos.blogspot.com/2010/09/utfgeneralci-utfunicodeci-mysql.html

Еще во время перевода программ на юникод (как раз вышел MySQL 5) задался этим вопросом. Но как то сортировка по буквам во всех проектах была не критична потому использовался utf_general_ci. Через н-ное время в одном проекте это стало важно, так как данные там сортировались исключительно по буквам. Данные были на украинском языке котором есть три специфические буквы і, ї и ґ. Сортировка данных давала не верные результаты. Сервер не понимал разницу между специфическими и некоторыми другими буквами. Нужно было найти решение, первое временное решение было явно указывать какая буква идет за какой. После его реализации появилось время на поиск нормально решения проблемы так как сортировка была слишком долгой. Вообщем за короткое время было найдено решение. Кстати при поиске я поразился на сколько же атрофировано украинское сообщество разработчиков. Вообщем оказалось все интересно

utf8_general_ci не различает некоторые буквы, в том числе специфические

utf8_unicode_ci различает но видимо в этом причина медленной выборки. разница точно не измерял но говорят не критична, кстати надо будет как то попробовать, как раз есть подходящая база.

Кстати utf8_bin видит каждый символ по отдельность, с таким колейтом хорошо делать поиск но сортировка ясно по коду, что не подходит.

Так что если Вам нужна сортировка берем utf8_unicode_ci если нужен поиск то наш выбор utf8_bin.

Ссылки

This website uses cookies. By using the website, you agree with storing cookies on your computer. Also you acknowledge that you have read and understand our Privacy Policy. If you do not agree leave the website.More information about cookies

Discussion

Enter your comment. Wiki syntax is allowed:
 
linux/mysql/utf-8_vs_cp1251.txt · Последнее изменение: 2017/12/03 15:26 (внешнее изменение)