robot-piglet ecf3635d74 Intermediate changes | 1 year ago | |
---|---|---|
.. | ||
generated | 2 years ago | |
lite | 1 year ago | |
ut | 1 year ago | |
CMakeLists.darwin-x86_64.txt | 1 year ago | |
CMakeLists.linux-aarch64.txt | 1 year ago | |
CMakeLists.linux-x86_64.txt | 1 year ago | |
CMakeLists.txt | 1 year ago | |
CMakeLists.windows-x86_64.txt | 1 year ago | |
README.md | 1 year ago | |
ci_string.cpp | 2 years ago | |
ci_string.h | 2 years ago | |
ci_string_ut.cpp | 2 years ago | |
codepage.cpp | 1 year ago | |
codepage.h | 2 years ago | |
codepage_ut.cpp | 1 year ago | |
cp_encrec.cpp | 2 years ago | |
decodeunknownplane.cpp | 1 year ago | |
doccodes.cpp | 2 years ago | |
doccodes.h | 2 years ago | |
iconv.cpp | 1 year ago | |
iconv.h | 2 years ago | |
iconv_ut.cpp | 2 years ago | |
recyr.hh | 2 years ago | |
recyr_int.hh | 2 years ago | |
recyr_int_ut.cpp | 1 year ago | |
wide.cpp | 2 years ago | |
wide.h | 2 years ago | |
wide_ut.cpp | 1 year ago | |
ya.make | 1 year ago |
Здесь представлены функции и enum'ы для работы с кодировками.
Наиболее полезные конструкции этой библиотеки:
enum ECharset
- перечень кодировок, которые умеет определять детектор кодировок.inline TString Recode(ECharset from, ECharset to, const TString& in)
для преобразования кодировок.Функция inline TUtf16String UTF8ToWide(const char* text, size_t len, const CodePage& cp)
, пытающаяся построить широкую строку из UTF-8, а если не получается - с помощью кодировки cp
.
Класс TCiString
- аналог TString
, но использующий case-insensitive-компаратор и хеш и поддерживающий разные кодировки.
В комплекте есть ещё много функций для работы со старой однобайтной Yandex-кодировкой. Не рекомендуется к использованию. Для преобразования из UTF-8 в TUtf16String
и для работы с Unicode используйте функции из arcadia/util/charset.
Библиотека library/cpp/charset/lite - содержит часть функциональности, не зависящей от libiconv (e.g. пункты 2 и 3 из основной библиотеки)